DE60317139T2 - Integriertes Design für eine omnidirektionale Kamera- und Mikrophonanordnung - Google Patents

Integriertes Design für eine omnidirektionale Kamera- und Mikrophonanordnung Download PDF

Info

Publication number
DE60317139T2
DE60317139T2 DE60317139T DE60317139T DE60317139T2 DE 60317139 T2 DE60317139 T2 DE 60317139T2 DE 60317139 T DE60317139 T DE 60317139T DE 60317139 T DE60317139 T DE 60317139T DE 60317139 T2 DE60317139 T2 DE 60317139T2
Authority
DE
Germany
Prior art keywords
camera
microphone array
computer
microphones
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60317139T
Other languages
English (en)
Other versions
DE60317139D1 (de
Inventor
Ross Duvall Cutler
Anoop Woodinville Gupta
Ivan Kirkland Tashev
Yong Sammamish Rui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Application granted granted Critical
Publication of DE60317139D1 publication Critical patent/DE60317139D1/de
Publication of DE60317139T2 publication Critical patent/DE60317139T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/58Means for changing the camera field of view without moving the camera body, e.g. nutating or panning of optics or image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Electrostatic, Electromagnetic, Magneto- Strictive, And Variable-Resistance Transducers (AREA)

Description

  • HINTERGRUND
  • Technisches Gebiet:
  • Diese Erfindung betrifft ein integriertes omnidirektionales Kamera- und Mikrofonarray. Im Besonderen betrifft diese Erfindung ein integriertes omnidirektionales Kamera- und Mikrofonarray, das für Telefonkonferenz- und Telefonsitzungs-Aufzeichnung verwendet werden kann.
  • Stand der Technik:
  • Videokonferenzsysteme hatten einen begrenzten kommerziellen Erfolg. Dies ist auf viele Faktoren zurückzuführen. Insbesondere weisen diese Systeme typischerweise zahlreiche technische Mängel auf. Schlechte Kamera-Blickwinkel und mangelhafte Bildauflösung erschweren es den Sitzungsteilnehmern, die sprechende Person zu sehen. Dies wird durch die ungenaue Sprechererkennung verstärkt (insbesondere bei Systemen mit PTZ-(Pan-Tilt-Zoom [Schwenken-Neigen-Zoomen])Kameras), wodurch bewirkt wird, dass die Kamera nicht auf die sprechende Person gerichtet wird. Darüber hinaus haben schlechte Videokomprimierungstechniken häufig eine schlechte Videobildqualität und eine „abgehackte" Bildanzeige zur Folge.
  • Die Erfassungseinrichtungen der Systeme, die für Telefonkonferenzen verwendet werden, tendieren dazu, sich auf einige Hauptdatenquellen zu konzentrieren, die nützlich für das Anschauen von Videokonferenzen und Videositzungen sind. Diese schließen Videodaten, Audiodaten sowie elektronische Dokumente oder Präsentationen ein, die auf einem Computermonitor angezeigt werden. Angesichts der Tatsache, dass es zahlreiche Softwarelösungen zur gemeinsamen Nutzung von Dokumenten und Präsentationen gibt, ist das Erfassen von Audio- und Videodaten auf eine verbesserte Art und Weise von besonderem Interesse.
  • Es gibt drei verschiedene Verfahren zum Erfassen von Videodaten: PTZ-(Pan/Tilt/Zoom)Kameras, spiegelbasierte omnidirektionale Kameras sowie Kameraarrays. PTZ-Kameras sind derzeit die beliebteste Wahl, sie weisen jedoch zwei wesentliche Beschränkungen auf. Erstens können sie nur ein begrenztes Bildfeld erfassen. Wenn sie zu nah heranzoomen, geht der Kontext des Sitzungsraumes verloren; wenn sie zu weit herauszoomen, ist die Mimik der Menschen nicht erkennbar. Zweitens ist die Reaktion der Kamera auf die Sitzung (beispielsweise beim Umschalten zwischen den Sprechern) langsam, da der Steuerungsmotor Zeit benötigt, um die Kamera zu bewegen. Tatsächlich können sich die PTZ-Kameras nicht allzu viel oder allzu schnell bewegen, da ansonsten die Personen, die sich die Sitzung anschauen, ziemlich abgelenkt werden können.
  • Angesichts dieser Nachteile und der neuesten technologischen Fortschritte bei spiegel-/prismabasierten omnidirektionalen Vision-Sensoren haben Wissenschaftler damit begonnen, die Art und Weise des Erfassens und Analysierens von Video zu überdenken. Beispielsweise stellt die BeHere Corporation eine 360°-Internetvideotechnologie in Unterhaltungs-, Nachrichten- und Sportwebcasts bereit. Mit ihrer Schnittstelle können dezentrale Benutzer unabhängig von anderen Zuschauern individuell festgelegte Kamerawinkel von 360° steuern, um ein „Vor Ort"-Erlebnis zu erhalten. Diese Methode überwindet zwar die beiden Schwierigkeiten bezüglich des begrenzten Bildfeldes sowie der langsamen Kamerareaktion der PTZ-Kameras, jedoch tendieren diese Typen angesichts der heutigen Technologie und Marktnachfrage dazu, teuer in der Fertigung zu sein. Darüber hinaus weisen diese spiegel-/prismabasierten omnidirektionalen Kameras nur eine geringe Auflösung (selbst mit 1MP-Sensoren) sowie Defokussierprobleme auf, wodurch eine minderwertige Videoqualität bewirkt wird.
  • Bei einer weiteren Methode werden mehrere preiswerte Kameras oder Videosensoren zusammengebaut, um ein omnidirektionales Kameraarray zu bilden. Beispielsweise verwendet ein bekanntes System vier NTSC-(National Television System Committee)Kameras, um einen Rundblick von einem Sitzungsraum zu konstruieren. Es gibt jedoch Nachteile mit diesem Design. Erstens stellen NTSC-Kameras ein Videosignal einer relativ schlechten Qualität bereit. Darüber hinaus erfordern die vier Kameras vier Videoerfassungsboards, um das Signal zu digitalisieren, bevor es analysiert, gesendet oder aufgezeichnet werden kann. Aufgrund der Notwendigkeit von 4 Videoerfassungsboards erhöhen sich die Kosten und die Komplexität eines solchen Systems und es wird schwieriger, dieses herzustellen und zu warten.
  • Zusätzlich zu den im Zusammenhang mit der Videoerfassung erwähnten Problemen ist die Erfassung von hochqualitativem Audio ebenfalls schwierig. Das Audioerfassungssystem muss eine Vielzahl von Geräuschen sowie Hall entfernen. Es muss ferner die Verstärkung für unterschiedliche Eingangssignalpegel regeln. Im Allgemeinen gibt es drei Methoden, um diese Anforderungen zu erfüllen. Die einfachste Methode ist die Verwendung von Nahmikrofonen (wie beispielsweise über ein Headset), was jedoch lästig und umständlich für den Benutzer/Sprecher ist. Eine zweite Methode ist das Platzieren eines Mikrofons auf dem Sitzungsraumtisch. Dies verhindert mehrere Schallwege und ist derzeit die bekannteste Methode zum Aufzeichnen von Sitzungs-Audio. Diese Systeme verwenden mehrere (normalerweise drei) Hyperkardioid-Mikrofone, um omnidirektionale Charakteristiken bereitzustellen. Die dritte Methode wird in einem Desktop-Telefonkonferenzsystem bereitgestellt. Bei dieser Methode wird ein unidirektionales Mikrofon auf einer PTZ-Kamera montiert, des auf den Sprecher gerichtet ist. Die Kamera/Mikrofongruppe wird durch einen Comuputer gesteuert, der eine separate Gruppe von Mikrofonen verwendet, um die Schallquellenlokalisierung durchzuführen. Diese Methode erfordert zwei separate Mikrofonsets.
  • Ein dem Stand der Technik entsprechendes System zum Erfassen von Audio- und Videodaten, das ein Freibereich-Sicherheitssystem betrifft, wird in dem Dokument WO 97/08896 beschrieben. Darüber hinaus betreffen die Dokumente US-A-4.658.425 und WO 98/47291 ein Telefonkonferenzsystem und das Dokument US 2002/0057279 betrifft ein Telepresence-Robotersystem.
  • ZUSAMMENFASSUNG
  • Die Erfindung wird in den unabhängigen Patentansprüchen dargelegt.
  • Die vorliegende Erfindung betrifft ein System und ein Verfahren, das die vorstehend genannten Beschränkungen bei Videokonferenz- und Videositzungs-Aufzeichnungssystemen überwindet. Speziell verwenden das erfindungsgemäße Sys tem und Verfahren ein integriertes omnidirektionales Kamera- und Mikrofonarray, um diese Aufgabe erfüllen.
  • Im allgemeinsten Sinne besteht die Erfindung aus einer zylindrischen Stange, die dünn genug ist, um für die Frequenzbereiche der menschlichen Stimme (50–4000 Hz) akustisch unsichtbar zu sein, und ein Kameraarray mit einem Mikrofonarray verbindet. Als ein Ergebnis werden Schallbeugung und Shadowing eliminiert.
  • Das integrierte Kamera- und Mikrofonarray verwendet eine 360 Grad-Kamera, die zur Lösung jedes der vorangehend genannten Probleme in Bezug auf Videokonferenzen konzipiert ist. Die 360 Grad-Kamera kann in der Mitte eines Konferenztisches positioniert werden, wodurch ein ausgezeichneter Kamerablickwinkel der Teilnehmer im Vergleich zu einem herkömmlichen Videokonferenzsystem erhalten wird (bei dem die Kamera an einem Ende des Raumes platziert ist). Die Kamera ist von dem Tisch erhoben, um einen nahen frontalen Blickwinkel der Sitzungsteilnehmer bereitzustellen. Darüber hinaus stellt das integrierte Kamera- und Mikrofonarray eine ausreichende Auflösung für einen dezentralen Zuschauer bereit, um die Mimik der Sitzungsteilnehmer zu sehen (beispielsweise weist es in einer Arbeitsausführungsform eine Auflösung von 3000 × 480 auf). Die Kamera kann von jeglichem omnidirektionalen Typ sein, der entweder ein Kameraarray oder einen einzigen Videosensor mit einem hyperbolischen Spiegel verwendet.
  • Das Mikrofonarray weist eine ebene Konfiguration auf. Die Mikrofone sind vorzugsweise an einer Mikrofonarraybasis angebracht, so dass sie so nahe wie möglich an dem Desktop angeordnet sind, um mögliche Schallreflexionen von dem Tisch zu eliminieren. Wie vorangehend erwähnt wurde, ist die Kamera mit der Mikrofonarraybasis mit Hilfe einer dünnen zylindrischen Stange verbunden, die akustisch unsichtbar für das Mikrofonarray für den Frequenzbereich der menschlichen Stimme (das heißt, ungefähr 50–4000 Hz) ist. Dadurch wird ein direkter Weg von der sprechenden Person zu sämtlichen der Mikrofone in dem Array bereitgestellt, wodurch es die Schallquellenlokalisierung (Bestimmen der Position des Sprechers) sowie das Beamforming (Verbessern der Schallqualität des Sprechers durch das Herausfiltern des Schalls, der nicht aus der Richtung des Sprechers kommt) ausgezeichnet durchführen kann. Das integrierte Mikrofonarray wird verwendet, um eine Echtzeit-Schallquellenlokalisierung durchzuführen, und das Kame raarray wird mit der Computer-Vision-basierten Menschenerkennung und -verfolgung verwendet, um fehlerfrei zu erkennen, wo die Sprecher in dem Bild positioniert sind. Die audio- und videobasierte Sprechererkennung kann für das automatische Kameramanagement sowie für die in hohem Maße verbesserte Videokomprimierung (beispielsweise durch Verwenden von mehr Bits in den Gesichtsbereichen als für den Hintergrund) verwendet werden.
  • Der Ausgang des integrierten Kamera- und Mikrofonarrays ist vorzugsweise mit dem PC verbunden, wo derartige Anwendungen, wie das Zusammenheften und Komprimieren von Bildern, die Schallquellenlokalisierung, das Beamforming und das Kameramanagement erfolgen können.
  • Eine Arbeitsausführungsform des integrierten Kamera- und Mikrofonarrays verwendet einen 1394 Bus, um Videosignale zu dem PC zu übertragen, sowie Analogkabel, um Audiosignale zu einem Personalcomputer (PC) zu übertragen. Fünf IEEE 1394 Kameras, die eine ausgezeichnete Videoqualität bieten und lediglich eine einzige 1394 Karte erfordern, werden in dieser Ausführungsform eingesetzt. Eine weitere alternative Ausführungsform verwendet eine einzige Leiterplatte (Printed Circuit Board – PCB) für alle Kameras und Mikrofone, so dass sämtliches Audio und Video über ein einziges 1394 Kabel gesendet werden. Das 1394 Kabel dient auch der Strombereitstellung, so dass zwischen der Kamera und dem PC lediglich ein einziges Kabel erforderlich ist.
  • Die verwendeten Mikrofone können entweder omnidirektional oder unidirektional sein, es werden jedoch omnidirektionale Mikrofone bevorzugt, da sie eine einheitliche Reaktion für sämtliche Schallwinkel geben, die von Interesse sind. Die Mindestanzahl der erforderlichen Mikrofone beträgt drei, obwohl eine bevorzugte Ausführungsform der Erfindung acht Mikrofone für eine erhöhte Schallquellenlokalisierungsgenauigkeit, besseres Beamforming und eine verbesserte Robustheit des gesamten Audiosystems verwendet. Die Mikrofone sind vorzugsweise gleichseitig in einem Kreis um den Umfang einer runden, ebenen Mikrofonbasis angeordnet, es sind jedoch ebenfalls andere Konfigurationen möglich. Je mehr Mikrofone verwendet werden, desto besser sind der omnidirektionale Audio-Erfassungsbereich und das Signal-Rausch-Verhältnis. Jedoch stellen die Kosten und die Komplexität der größeren Anzahl von Mikrofonen einen Zielkonflikt dar. Darüber hinaus wird mit mehr Mikrofonen das Verarbeiten der Audiosignale komplexer.
  • Um die Tischgeräusche zu reduzieren, können die Mikrofone in einem Gummigehäuse angebracht sein, und es ist eine Schallisolierung unter dem Mikrofon platziert.
  • Die Kamera kann eine Linsenabdeckung verwenden, die in einem normalen Betriebsmodus hochgeschoben ist und in einem Privatmodus heruntergezogen ist. Alternativ kann der Verschluss für die Kamerasensoren abgeschaltet werden oder die Kamera kann elektronisch isoliert werden, um die Kamera abzuschalten, wenn sie in dem Privatmodus ist. Die Mikrofone können ebenfalls vorzugsweise abgeschaltet werden, wenn der Privatmodus ausgelöst wird. Während der Aufzeichnung ist ein Licht auf der Kamera eingeschaltet, um den Benutzern anzuzeigen, dass die Kamera aktiv ist. Wenn die Kamera in dem Privatmodus ist, wird das Licht ausgeschaltet.
  • Es sind verschiedene alternative Ausführungsformen des integrierten omnidirektionalen Kamera- und Mikrofonarraydesigns möglich. Dies ist teilweise auf die Modularität des Systems zurückzuführen. Beispielweise wird in einer Ausführungsform eine omnidirektionale Kamera verwendet, die mehrere Videosensoren verwendet, um einen Kamera-Erfassungsbereich von 360 Grad zu erreichen. Alternativ dazu wird in einer weiteren Ausführungsform der Erfindung eine omnidirektionale Kamera verwendet, die einen Videosensor sowie eine hyperbolische Linse verwendet, die Licht aus 360 Grad erfasst, um einen Rundblick-Erfassungsbereich zu erreichen. Des Weiteren können beide dieser Kamera-Setups selbst, erhoben auf einer akustisch-transparenten Stange, verwendet werden, um eine Vorderansicht der Sitzungsteilnehmer bereitzustellen. Oder sie können mit dem vorangehend genannten Mikrofonarray integriert werden. Alternativ können ebenfalls andere Kameradesigns in Verbindung mit der zylindrischen Stange verwendet werden. Die Stange, die die Kamera und das Mikrofonarray verbindet, muss ebenfalls nicht zylindrisch sein, solange sie dünn genug ist, um den Schall in dem (50–4000) Hz-Bereich nicht zu beugen.
  • Gleichermaßen besteht, wie vorangehend erwähnt, das Mikrofonarray in einer Ausführungsform aus Mikrofonen, die mit gleichseitigen Abständen um den Umfang eines Kreises und so nahe wie möglich an einer Tischoberfläche angeordnet sind, um einen freien Weg zu jedem Sprecher in dem Raum mit einer minimalen Schallreflexion von dem Tisch zu erreichen. Es sind jedoch weitere Mikrofonkonfigurationen möglich, die mit einem omnidirektionalen Kamerasetup unter Verwendung der akustisch-transparenten Stange integriert werden können. Darüber hinaus kann das soeben diskutierte omnidirektionale Mikrofonarray ohne eine Kamera verwendet werden, um einen optimalen Schallerfassungsbereich von 360 Grad zu erzielen. Dieser Erfassungsbereich ist insbesondere bei der Schallquellenlokalisierung und dem Beamforming nützlich, da Multipath-Probleme minimiert oder eliminiert werden.
  • Eine Ausführungsform, die das Kamera- und Mikrofonarray der Erfindung einsetzt, verwendet einen Computer, um die Bilddaten und Audiosignale zu optimieren. Die digitale Bildausgabe der Kamera sowie die Audioausgabe des Mikrofonarrays (über einen Analog-Digital-Wandler) werden zu einem Computer gesendet. Der Computer führt verschiedene Funktionen durch, um die Bild- und Audioeingabe zu verbessern und zu verwenden. Beispielsweise heftet ein Rundblick-Bildfilter Bilder zusammen, die von mehreren Sensoren in der omnidirektionalen Kamera aufgenommen werden. Darüber hinaus können die Bilddaten komprimiert werden, um diese kompatibler für das Rundsenden über ein Netzwerk (wie beispielsweise das Internet) zu machen, oder auf einem computerlesbaren Medium gespeichert werden, vorzugsweise über einen Splitter, der die zu sendende und/oder aufzuzeichnende Video- und Audioausgabe splittet. Optional können die Bilddaten auch in eine Personenerkennungs-/Verfolgungseinrichtung eingegeben werden, um das Kameramanagement zu verbessern. Beispielsweise können die Bild-/Videoabschnitte, die den Sprecher enthalten, identifiziert und mit dem Audiosignal verknüpft werden, so dass das Kamerabild, das in der Videokonferenz gezeigt wird, in Richtung der Sprecher gerichtet werden kann, wenn diese sprechen. Darüber hinaus kann die Position des Sprechers verwendet werden, um die Videokomprimierung zu verbessern, indem eine höhere Auflösung für Gesichtsbereiche als für den Hintergrund ermöglicht wird.
  • Die Audioeingabe kann ebenfalls für verschiedene Zwecke verwendet werden. Beispielsweise kann das Audio für die Schallquellenlokalisierung verwendet werden, so dass das Audio zu jeder festgelegten Zeit für die Richtung des Sprechers optimiert werden kann. Des Weiteren kann ein Beamforming-Modul in dem Computer verwendet werden, um die Beam-Form des Audios zu verbessern, wodurch das Filtern von Audio aus einer gegebenen Richtung weiter verbessert wird. Ein Modul zur Rauschreduzierung und automatischen Verstärkungsregelung kann ebenfalls verwendet werden, um das Signal-Rausch-Verhältnis durch Reduzieren des Rauschens und Regeln der Ver stärkung zu verbessern, um die Audiosignale von einem Sprecher gegenüber den Hintergrundgeräuschen des Raumes besser zu erfassen. Jedes dieser Bild- und Audioverarbeitungsmodule kann einzeln oder in Kombination oder überhaupt nicht verwendet werden.
  • Die Video- und Audiosignale, die entweder verbessert wurden oder nicht, können zu einem anderen Videokonferenzort oder dem Internet gesendet werden. Sie können ebenfalls auf einem computerlesbaren Medium zum späteren Betrachten gespeichert werden.
  • Die vorrangige Anwendung für das vorangehend diskutierte integrierte Kamera- und Mikrofonarray ist die Videokonferenz- und Videositzungs-Aufzeichnung. Durch das Integrieren des Mikrofonarrays mit der omnidirektionalen Kamera wird die zwischen dem Audio und Video erforderliche Kalibrierung in hohem Maße vereinfacht (ein präzise hergestelltes Kamera- und Mikrofonarray erfordert keine Kalibrierung) und das Erfassen von Audio- und Videoinformationen aus einem Konferenzraum mit einer einzigen Vorrichtung wird erreicht.
  • BESCHREIBUNG DER ZEICHNUNGEN
  • Die spezifischen Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden anhand der folgenden Beschreibung, der angehängten Patentansprüche sowie der beigefügten Zeichnungen besser verständlich, wobei:
  • 1 ein Diagramm ist, das eine Universalcomputervorrichtung darstellt, die ein exemplarisches System zum Implementieren der Erfindung bildet.
  • 2 ist ein Diagramm, das eine bevorzugte Positionierung des integrierten Kamera- und Mikrofonarrays auf einem Konferenztisch darstellt.
  • 3A ist eine Seitenansicht einer Ausführungsform des integrierten Kamera- und Mikrofonarrays.
  • 3B ist eine Draufsicht der Ausführungsform des integrierten Kamera- und Mikrofonarrays, das in 3A dargestellt ist.
  • 4 ist eine perspektivische Darstellung einer weiteren Ausführungsform des integrierten Kamera- und Mikrofonarrays.
  • 5 ist eine Arbeitsausführungsform der vorliegenden Erfindung, die einen Computer verwendet, um die erfassten Video- und Audiodaten zu verbessern.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGDFORMEN
  • 1.0 Exemplarische Betriebsumgebung
  • In der folgenden Beschreibung der bevorzugten Ausführungsformen der vorliegenden Erfindung wird Bezug auf die angehängten Zeichnungen genommen, die einen Teil hiervon bilden und in denen spezifische Ausführungsformen, in denen die Erfindung ausgeführt werden kann, auf darstellende Weise gezeigt werden. Es ist offensichtlich, dass weitere Ausführungsformen verwendet und strukturelle Änderungen durchgeführt werden können, ohne von dem Umfang der vorliegenden Erfindung abzuweichen.
  • 1 illustriert ein Beispiel einer geeigneten Computersystemumgebung 100, in der die Erfindung implementiert werden kann. Die Computersystemumgebung 100 ist lediglich ein Beispiel einer geeigneten Computerumgebung und hat nicht den Zweck, den Verwendungs- oder Funktionalitätsumfang der Erfindung in irgendeiner Weise zu beschränken. Des Weiteren soll die Computerumgebung 100 nicht dahingehend interpretiert werden, dass sie jegliche Abhängigkeit oder Notwendigkeit in Bezug auf jede einzelne Komponente oder die Kombination der Komponenten aufweist, die in der exemplarischen Betriebsumgebung 100 illustriert sind.
  • Die Erfindung kann mit zahlreichen anderen Universal- oder Spezialcomputersystemumgebungen oder -konfigurationen arbeiten. Beispiele von bekannten Computersystemen, Umgebungen und/oder Konfigurationen, die für die Verwendung mit der Erfindung geeignet sein können, umfassen, sind jedoch nicht beschränkt auf, Personalcomputer, Server-Computer, Handheld- oder Laptop-Vorrichtungen, Multiprozessorsysteme, mik roprozessorbasierte Systeme, Set-Top-Boxen, programmierbare Unterhaltungselektronik, Netzwerk-PCs, Minicomputer, Großrechner, verteilte Computerumgebungen, die jegliche der vorstehenden Systeme oder Vorrichtungen enthalten, und dergleichen.
  • Die Erfindung kann im allgemeinen Zusammenhang von computerausführbaren Anweisungen, wie beispielsweise Programmmodulen, beschrieben werden, die durch einen Computer ausgeführt werden. Programmmodule umfassen im Allgemeinen Routinen, Programme, Objekte, Komponenten, Datenstrukturen und so weiter, die bestimmte Aufgaben ausführen oder bestimmte abstrakte Datentypen implementieren. Die Erfindung kann ebenfalls kann in verteilten Computerumgebungen eingesetzt werden, in denen Aufgaben durch dezentrale Verarbeitungsvorrichtungen ausgeführt werden, die durch ein Kommunikationsnetzwerk miteinander verbunden sind. In einer verteilten Computerumgebung können Programmmodule sowohl in lokalen als auch in dezentralen Computerspeichermedien, die Speichereinrichtungen einschließen, angeordnet sein.
  • In Bezug auf 1 umfasst ein exemplarisches System zum Implementieren der Erfindung eine Universalcomputervorrichtung in Form eines Computers 110. Komponenten des Computers 110 können eine Verarbeitungseinrichtung 120, einen Systemspeicher 130 und einen Systembus 121 umfassen, der verschiedene Systemkomponenten einschließlich des Systemspeichers mit der Verarbeitungseinrichtung 120 koppelt, sie sind jedoch nicht darauf beschränkt. Der Systembus 121 kann jeglicher von verschiedenen Typen von Busstrukturen sein, die einen Speicherbus oder einen Speichercontroller, einen peripheren Bus und einen lokalen Bus unter Verwendung jeglicher einer Vielzahl von Busarchitekturen einschließen. Derartige Architekturen schließen beispielhafter Weise den ISA-(Industry Standard Architecture)Bus, den MCA(Micro Channel Architecture)Bus, den ELSA(Enhanced ISA)Bus, den lokalen VESA-(Video Electronics Standards Association)Bus und den PCI-(Peripheral Component Interconnect)Bus, der auch als Mezzanine-Bus bekannt ist, ein, sie sind jedoch nicht darauf beschränkt.
  • Der Computer 110 schließt typischerweise eine Vielzahl von computerlesbaren Medien ein. Computerlesbare Medien können jegliche verfügbaren Medien sein, auf die durch den Computer 110 zugegriffen werden kann und schließen flüchtige und nicht flüchtige Medien sowie entnehmbare und nicht entnehmbare Medien ein. Computerlesbare Medien können beispielsweise Computerspeichermedien und Kommunikationsmedien um fassen, sie sind jedoch nicht darauf beschränkt. Computerspeichermedien umfassen flüchtige und nicht flüchtige, entnehmbare und nicht entnehmbare Medien, die in jeglichen Verfahren oder Technologien zum Speichern von Informationen, wie beispielsweise computerlesbaren Befehlen, Datenstrukturen, Programmmodulen oder weiteren Daten, implementiert sind. Computerspeichermedien umfassen, sind jedoch nicht beschränkt auf, RAM, ROM, EEPROM, Flash-Speicher oder andere Speichertechnologien, CD-ROM, DVDs (Digital Versatile Disks) oder andere optische Plattenspeicher, Magnetkassetten, Magnetbänder, Magnetplattenspeicher oder andere Magnetspeichereinrichtungen beziehungsweise jegliche andere Medien, die verwendet werden können, um die gewünschten Informationen zu speichern, und auf die der Computer 110 zugreifen kann. Kommunikationsmedien umfassen typischerweise computerlesbare Befehle, Datenstrukturen, Programmmodule oder weitere Daten in einem modulierten Datensignal, wie beispielsweise einer Trägerwelle oder einem anderen Transportmechanismus, und umfassen sämtliche Informationsbereitstellungsmedien. Der Begriff „moduliertes Datensignal" bezeichnet ein Signal, bei dem eine oder mehrere seiner Eigenschaften auf eine solche Weise eingestellt oder verändert sind, um Informationen in dem Signal zu kodieren. Kommunikationsmedien umfassen beispielsweise verdrahtete Medien, wie zum Beispiel ein verdrahtetes Netzwerk oder eine direkte Kabelverbindung, sowie drahtlose Medien, wie beispielsweise akustische, RF-, Infrarot- oder andere drahtlose Medien, sie sind jedoch nicht darauf beschränkt. Kombinationen der vorstehend genannten Medien sind ebenfalls in den Umfang der computerlesbaren Medien einzubeziehen.
  • Der Systemspeicher 130 schließt Computerspeichermedien in Form von flüchtigen und/oder nicht flüchtigen Speichern, wie beispielsweise einen ROM 131 (Read-Only Memory-Festspeicher) und einen RAM 208 (Random Access Memory – Direktzugriffsspeicher), ein. Ein grundlegendes Eingabe-/Ausgabesystem (BIOS) 133, das die grundlegenden Routinen enthält, die dabei helfen, Informationen zwischen Elementen innerhalb des Computers 110, wie beispielsweise während des Hochfahrens, zu übertragen, werden typischerweise in dem ROM 131 gespeichert. Der RAM 132 enthält typischerweise Daten und/oder Programmmodule, auf die umgehend durch die Verarbeitungseinrichtung 120 zugegriffen werden kann und/oder mit denen diese derzeit arbeitet. 1 illustriert auf beispielhafte und nicht auf einschränkende Weise das Betriebssystem 134, die Anwendungsprogramme 135, die weiteren Programmmodule 136 und die Programmdaten 137.
  • Der Computer 110 kann ebenfalls weitere entnehmbare/nicht entnehmbare, flüchtige/nicht flüchtige Computerspeichermedien umfassen. 1 illustriert auf beispielhafte Weise ein Festplattenlaufwerk 141 zum Lesen von nicht entnehmbaren, nicht flüchtigen Magnetmedien und zum Schreiben auf diese, ein Magnetplattenlaufwerk 151 zum Lesen von einer entnehmbaren, nicht flüchtigen Magnetplatte 152 und zum Schreiben auf diese, sowie ein optisches Plattenlaufwerk 155 zum Lesen von einer entnehmbaren, nicht flüchtigen optischen Platte 156, wie beispielsweise einer CD-ROM oder einem anderen optischen Medium, und zum Schreiben auf diese. Weitere entnehmbare/nicht entnehmbare, flüchtige/nicht flüchtige Computerspeichermedien, die in der exemplarischen Betriebsumgebung verwendet werden können, schließen Magnetbandkassetten, Flash-Speicherkarten, DVDs (Digital Video Disks), digitale Videobänder, Halbleiter-RAM, Halbleiter-ROM und dergleichen ein, sie sind jedoch nicht darauf beschränkt. Das Festplattenlaufwerk 141 ist typischerweise über eine Schnittstelle für einen nicht entnehmbaren Speicher, wie beispielsweise die Schnittstelle 140, mit dem Systembus 121 verbunden, und das Magnetplattenlaufwerk 151 sowie das optische Plattenlaufwerk 155 sind typischerweise über eine Schnittstelle für entnehmbare Speicher, wie beispielsweise die Schnittstelle 150, mit dem Systembus 121 verbunden.
  • Die Laufwerke und ihre assoziierten vorstehend diskutierten und in 1 illustrierten Computerspeichermedien stellen die Speicherung von computerlesbaren Anweisungen, Datenstrukturen, Programmmodulen und weiteren Daten für den Computer 110 bereit. In 1 wird beispielsweise das Festplattenlaufwerk 141 so dargestellt, dass es das Betriebssystem 144, die Anwendungsprogramme 145, die weiteren Programmmodule 146 sowie die Programmdaten 147 speichert. Es sollte beachtet werden, dass diese Komponenten entweder dieselben wie das Betriebssystem 134, die Anwendungsprogramme 135, die weiteren Programmmodule 136 und die Programmdaten 137 sein können oder sich von diesen unterscheiden können. Das Betriebssystem 144, die Anwendungsprogramme 145, die weiteren Programmmodule 146 sowie die Programmdaten 147 sind hier mit unterschiedlichen Nummern versehen, um zu zeigen, dass sie Kopien sind, die sich minimal voneinander unterscheiden. Ein Benutzer kann Befehle und Informationen über Eingabevorrichtungen, wie beispielsweise eine Tastatur 162 und eine Zeigevorrichtung 161, die gemein hin als eine Maus bezeichnet wird, einen Trackball oder ein Touchpad, in dem Computer 110 eingeben. Andere Eingabevorrichtungen (nicht dargestellt) können ein Mikrofon, einen Joystick, ein Game-Pad, eine Satellitenschüssel, einen Scanner und dergleichen umfassen. Diese und weitere Eingabevorrichtungen sind häufig mit der Verarbeitungseinrichtung 120 über eine Benutzereingabeschnittsteile 160 verbunden, die mit dem Systembus 121 gekoppelt ist, sie können jedoch durch andere Schnittstellen und Busstrukturen, wie beispielsweise einen parallelen Anschluss, einen Game-Anschluss oder einen universellen seriellen Bus (USB) verbunden sein. Ein Monitor 191 oder ein anderer Typ von Anzeigevorrichtung ist ebenfalls über eine Schnittstelle, wie beispielsweise eine Videoschnittstelle 190, mit dem Systembus 121 verbunden. Zusätzlich zu dem Monitor können Computer ebenfalls weitere periphere Ausgabevorrichtungen, wie beispielsweise die Lautsprecher 197 und den Drucker 196, die über eine periphere Ausgabeschnittstelle 195 verbunden sein können, umfassen. Von besonderer Bedeutung für die vorliegende Erfindung ist, dass eine Kamera 163 (wie beispielsweise eine digitale/elektronische Standbild- oder Videokamera, oder ein Film-/Fotoscanner), die eine Sequenz von Bildern 164 erfassen kann, ebenfalls als eine Eingabevorrichtung für den Personalcomputer 110 enthalten sein kann. Darüber hinaus können, obwohl lediglich eine Kamera dargestellt ist, mehrere Kameras als eine Eingabevorrichtung für den Personalcomputer 110 enthalten sein. Die Bilder 164 von der einen Kamera oder von den mehreren Kameras werden über eine geeignete Kameraschnittstelle 165 in den Computer 110 eingegeben. Diese Schnittstelle 165 ist mit dem Systembus 121 verbunden, wodurch ermöglicht wird, dass die Bilder zu dem RAM 132 oder zu einer der anderen Datenspeichervorrichtungen, die mit dem Computer 110 verbunden sind, geroutet und in diesen gespeichert werden können. Es sollte jedoch beachtet werden, dass Bilddaten von jedem der vorstehend erwähnten computerlesbaren Medien sowie ohne die Erfordernis der Verwendung der Kamera 163 in den Computer 110 eingegeben werden können.
  • Der Computer 110 kann in einer vernetzten Umgebung unter Verwendung von logischen Verbindungen zu einem Computer oder zu mehreren dezentralen Computern, wie beispielsweise einem dezentralen Computer 180, arbeiten. Der dezentrale Computer 180 kann ein Personalcomputer, ein Server, ein Router, ein Netzwerk-PC, ein Peer-Gerät oder ein anderer gemeinsamer Netzwerkknoten sein und schließt typischerweise viele oder sämtliche der vorangehend in Bezug auf den Computer 110 beschriebenen Elemente ein, obwohl lediglich eine Speichervorrichtung 181 in 1 illustriert wird. Die logischen Verbindungen, die in 1 dargestellt sind, umfassen ein lokales Netzwerk (Local Area Network – LAN) 171 sowie ein Großraumnetzwerk (Wide Area Network – WAN) 173, sie können jedoch auch andere Netzwerke umfassen. Derartige Netzwerkumgebungen sind allgegenwärtig in büroweiten oder unternehmensweiten Computernetzwerken, Intranets und dem Internet.
  • Wenn der Computer 110 in einer LAN-Netzwerkumgebung verwendet wird, ist er über eine Netzwerkschnittstelle oder einen Adapter 170 mit dem lokalen Netzwerk 171 verbunden. Wenn der Computer 110 in einer WAN-Netzwerkumgebung verwendet wird, umfasst er typischerweise ein Modem 172 oder eine andere Einrichtung zum Kommunikationsaufbau über das Großraumnetzwerk 173, wie beispielsweise das Internet. Das Modem 172, das intern oder extern sein kann, kann über die Benutzereingabeschnittstelle 160 oder andere geeignete Mechanismen mit dem Systembus 121 verbunden sein. In einer vernetzten Umgebung können Programmmodule, die in Bezug auf den Computer 110 dargestellt werden, oder Teile davon, in der dezentralen Speichervorrichtung gespeichert werden. 1 illustriert auf beispielhafte und nicht auf einschränkende Weise dezentrale Anwendungsprogramme 185 derart, dass sie in der Speichervorrichtung 181 gespeichert sind. Es ist offensichtlich, dass die gezeigten Netzwerkverbindungen exemplarischer Natur sind und andere Einrichtungen zum Aufbau einer Kommunikationsverbindung zwischen den Computern verwendet werden können.
  • Vorstehend wurde die exemplarische Betriebsumgebung diskutiert und die verbleibenden Teile dieses Beschreibungsabschnittes sind einer Beschreibung der Programmmodule gewidmet, die die Erfindung ausführen.
  • 3.0 INTEGRIERTES OMNIDIREKTIONALES KAMERA- UND MIKROFONARRAY
  • In diesem Abschnitt wird das integrierte omnidirektionale Kamera- und Mikrofonarray, das über eine akustisch transparente Stange verbunden ist, diskutiert.
  • 3.1 Überblick
  • Diese Erfindung betrifft das optimale Integrieren einer omnidirektionalen Kamera mit einem Mikrofonarray. Die Ziele des Designs waren Folgende:
    • 1. Das Mikrofonarraydesign sollte einen freien Weg von einer sprechenden Person zu allen Mikrofonen in dem Array ermöglichen. Wenn ein freier Weg nicht möglich ist, werden jegliche Schallquellenlokalisierungs- sowie Beamforming-Algorithmen, die verwendet werden, äußerst kompliziert und führen zu verschlechterten Ergebnissen.
    • 2. Das Mikrofonarraydesign sollte die Mikrofone so nahe wie möglich an einem Desktop oder einer anderen Fläche platzieren, um Schallreflexionen von der Fläche zu vermeiden, die jegliche Schallquellenlokalisierungs- sowie Beamforming-Ergebnisse verschlechtern würden.
    • 3. Das Kameraarray sollte erhoben sein, um eine Beinahe-Vorderansicht der Sitzungsteilnehmer bereitzustellen. Das Kameraarray sollte klein genug sein, um unauffällig zu sein.
    • 4. Die Mikrofonarraygeometrie (Positionen und Abstände zwischen den Mikrofonen) sollte ermöglichen, dass die Audioverarbeitungsalgorithmen, wenn die Mikrofone auf den Sprecher gerichtet sind, eine gute Beam-Form in dem Arbeitsfrequenzband erzielen können, wodurch ein hochqualitativer Schall bereitgestellt wird.
  • 3.2 Integriertes Design
  • Das integrierte Kamera- und Mikrofonarray verwendet eine zylindrische Stange, die die Mikrofonbasis mit dem Kameraarray verbindet. Diese Stange ist für die Frequenzbereiche der menschlichen Stimme (50–4000 Hz) akustisch unsichtbar.
  • Wie dies in 2 dargestellt ist, soll das integrierte Kamera- und Mikrofonarray 202 in der Mitte eines Konferenzraumtisches 204 platziert werden.
  • Das Design bietet einen freien Weg zu sämtlichen Mikrofonen von jeglichem gegebenen Sprecher oder jeglicher gegebenen Schallquelle und ordnet das Mikrofonarray nahe an der Tischoberfläche an, um Multipath-Probleme zu vermeiden, die durch Schallreflexionen von dem Tisch verursacht werden. Zusätzlich dazu erhebt das Design die Kamera von dem Desktop, wodurch eine Vorder- oder Beinahe-Vorderansicht sämtlicher Sitzungsteilnehmer erhalten wird.
  • Das integrierte Kamera- und Mikrofonarray gewährleistet eine gute Beam-Form, die zum Verbessern der Schallqualität des Sprechers durch Filtern des Schalls aus lediglich einer Richtung verwendet werden kann. Darüber hinaus ist das integrierte Wesen der Kamera und des Mikrofons dahingehend vorteilhaft, da dadurch die Notwendigkeit für wiederholte Kalibrierungen eliminiert wird. Da die Kamera und das Mikrofon als eine Einrichtung integriert sind, ist lediglich eine erste Kalibrierung erforderlich. Da die integrierte Kamera und das Mikrofon ein kompaktes und festes Design aufweisen können, sind sie weniger störend als zwei einzelne Kamera- und Mikrofonkomponenten, die separate Kabel und zusätzlichen Platz auf dem Konferenztisch benötigen würden.
  • 3.3 Systemkomponenten
  • Eine Ausführungsform des integrierten Kamera- und Mikrofonarrays wird in 3A und in 3B dargestellt. Die Komponenten in diesem Design umfassen eine omnidirektionale Kamera 302, einen Zylinder 304, eine Mikrofonbasis 306, Mikrofone 308, einen Mikrofon-Vorverstärker 310 und einen Analog-Digital-(A/D-)Wandler (nicht dargestellt).
  • 3.3.1 Omnidirektionale Kamera
  • Es gibt eine Vielzahl von omnidirektionalen Kameratechnologien. Diese umfassen einen Kameratyp, in dem mehrere Videosensoren rückseitig aneinander dicht zusammengepackt sind. Ein anderer omnidirektionaler Kameratyp verwendet einen einzigen Videosensor mit einer hyperbolischen Linse, die Lichtstrahlen aus 360 Grad erfasst. Das integrierte Kamera- und Mikrofonarraydesign der Erfindung kann jegliche solcher omnidirektionalen Kameras verwenden. Es wird bevorzugt, dass der Kamerakopf 302 klein genug ist, um nicht störend zu wirken, wenn er auf einem Konferenzraumtisch oder einer anderen Fläche platziert wird.
  • Wenn eine Mehrfachsensorkamerakonfiguration verwendet wird, kann einen Vielzahl von Kamera- und Videosensoren verwendet werden. Eine bevorzugte Anzahl ist acht. Diese Sensoren sollten vorzugsweise rückseitig aneinander angeordnet sein, so dass die Projektionszentren der Sensoren in einem gleichen Winkelabstand angeordnet ist. Wenn beispielsweise acht Sensoren verwendet werden, würde jeder Sensor 45 Grad von den an ihn angrenzenden Sensoren entfernt sein. Es ist jedoch möglich, unter schiedliche Linsen und unterschiedliche Kameraplatzierungen zu verwenden, wenn es erforderlich ist, Bilder aus unterschiedlichen Entfernungen zu erfassen. Dies würde beispielsweise bei einem rechteckigen oder ovalen Konferenztisch der Fall sein. Linsen mit längeren, engeren Bildfeldern können für längere Entfernungen verwendet werden und weitere, kürzere Bildfelder können zum Erfassen von Bildern aus kürzeren Entfernungen verwendet werden. In diesem Fall können die Kamerasensoren nicht gleichseitig um den Kamerakopf herum angeordnet sein. Kamerasensoren mit einem weiteren Bildfeld können weiter weg von den Kamerasensoren mit einem engeren Bildfeld platziert werden. Alternativ dazu können ebenfalls Kameras mit einem variablen Bildfeld (die rotieren sowie heran- und herauszoomen, um sich einer gegebenen Situation anzupassen) verwendet werden.
  • Eine Arbeitsausführungsform der Erfindung, die in 4 dargestellt wird, verwendet ein kompaktes Mehrfachsensor-Design, bei dem mehrere Miniatur-Kamerasensoren 402 rückseitig aneinander um den Umfang eines runden Kamerakopfes 404 herum angeordnet sind. Der Boden der Kamera 404 weist vorzugsweise ein schallabsorbierendes Material auf, welches verhindert, das Schallreflexionen von dem Tisch auf die Kamera und auf das Mikrofon auftreten. In dieser Ausführungsform werden 8 Kamerasensoren verwendet. Dieses kompakte Design, bei dem die Kamerasensoren rückseitig aneinander dicht zusammengepackt sind, verbessert das Zusammenheften von Bildern. In dieser Ausführungsform weist der Kamerakopf 404 einen Durchmesser von ungefähr 50 mm auf und der Zylinder 406, der den Kamerakopf mit der Basis verbindet, hat eine Höhe von ungefähr 10 Zoll. Durch diese Höhe wird die Kamera 404 derart positioniert, dass sie die Vorderansichten sämtlicher Sitzungsteilnehmer erhält. Alternativ dazu kann der Kamerakopf 404 niedriger als vorstehend angeordnet sein, und die Kamerasensoren 402 können geringfügig nach oben gerichtet sein. Dies bewirkt ebenfalls, dass die Kamera etwas weniger störend wirkt.
  • 3.3.2 Zylinder
  • In Bezug auf die in den 3A und 3B dargestellte Ausführungsform ist die omnidirektionale Kamera 302 an einem vorzugsweise hohlen Zylinder 304 angebracht, der an einer Mikrofonbasis 306 befestigt ist. Der Durchmesser des Zylinders D1 sollte dünn genug sein, um den Zylinder 304 für Frequenzen entsprechend der beabsichtigten Ver wendung akustisch transparent zu machen. Es wird bevorzugt, dass die Kamerakabel durch den Zylinder 304 verlaufen, um keine zusätzlichen akustischen Barrieren zu verursachen. Die Zylinderhöhe H1 sollte hoch genug sein, um eine Vorderansicht von jeder um den Konferenztisch sitzenden Person bereitzustellen, sie sollte jedoch nicht so hoch sein, dass die Kamera störend wirkt. Die Zylinderhöhe kann ebenfalls optional eingestellt werden. Beispielsweise kann die Zylinderhöhe in einer Videokonferenzanwendung eingestellt werden, um unterschiedliche Tisch- und Teilnehmerhöhen zu berücksichtigen.
  • Unter erneuter Bezugnahme auf die in den 3A und 3B dargestellte Arbeitsausführungsform weist der Zylinder 304 einen Durchmesser D1 von 2 cm oder weniger auf, wodurch ermöglicht wird, dass Audiofrequenzen von ungefähr 50–4000 Hz, die denen der menschlichen Stimme entsprechen, durch den Zylinder im Wesentlichen ungestört von jeglichem sprechenden Teilnehmer zu sämtlichen der Mikrofone in der Basis passieren können. Die Zylinderhöhe H1 in dieser Ausführungsform beträgt 14 cm.
  • 3.3.3 Mikrofonbasis
  • Im Allgemeinen sind die Mikrofone, der Mikrofon-Vorverstärker und der A/D-Wandler an der Mikrofonbasis angebracht. Sie ist mit dem Zylinder verbunden und stellt einen Verbindungsausgang für die Kamerakabel bereit. Die Mikrofonbasis weist ein niedriges Profil auf, um den Abstand zwischen dem Desktop und den Mikrofonen zu minimieren. Die Basis ermöglicht einen freien Weg von jedem Mikrofon zu dem Teilnehmer/den Teilnehmern.
  • Die Arbeitsausführungsform des integrierten Kamera- und Mikrofonarrays wird in den 3A und 3B gezeigt. Der Durchmesser D3 der Mikrofonbasis 306 ist breiter als der Durchmesser D2 des Kamerakopfes 302. Dadurch wird dem integrierten Kamera- und Mikrofonarray Stabilität verliehen, wodurch verhindert wird, dass es leicht umgestoßen werden kann. Die Höhe der Basis H3 ist relativ gering. Diese Abmessung ist vorzugsweise gering oder klein genug, um die eingebetteten Mikrofone 308 nahe genug beziehungsweise so nahe wie möglich an der Tischoberfläche anzuordnen oder zu positionieren, um Multipath-Probleme zu vermeiden und Schallreflexionen zu minimieren, jedoch groß genug, um das Einbetten der Mikrofone 308 in der Basis zu ermöglichen.
  • Für diese Arbeitsausführungsform beträgt D3 16 cm, H3 beträgt 1,5 cm, H2 beträgt 6 cm und D2 beträgt 10 cm.
  • 3.3.4 Mikrofone
  • Die verwendeten Mikrofone können entweder omnidirektional oder unidirektional sein, wobei jedoch omnidirektionale Mikrofone bevorzugt werden, da sie eine einheitliche Reaktion für sämtliche Schallwinkel bereitstellen, die von Interesse sind. Die Mindestanzahl der erforderlichen Mikrofone beträgt drei, obwohl die Ausführungsform der Erfindung acht Mikrofone für eine erhöhte Schallquellenlokalisierungsgenauigkeit, besseres Beamforming und eine größere Robustheit des gesamten Audiosystems verwendet.
  • Um Tischgeräusche zu reduzieren, können die Mikrofone in einem Gummigehäuse angebracht sein und eine Schallisolierung kann zum selben Zweck unter den Mikrofonen platziert sein.
  • Unter erneuter Bezugnahme auf die in den 3A und 3B dargestellte Arbeitsausführungsform sind die Mikrofone gleichseitig in einem Kreis um den Umfang der ebenen Mikrofonbasis 306 angeordnet. In dieser Ausführungsform werden acht Mikrofone 308 verwendet. Im Allgemeinen gilt, je mehr Mikrofone verwendet werden, desto besser sind der omnidirektionale Erfassungsbereich sowie das Signal-Rausch-Verhältnis. Jedoch stellen die Kosten und die Komplexität einer größeren Anzahl von Mikrofonen einen Zielkonflikt dar. Darüber hinaus wird mit mehr Mikrofonen das Verarbeiten der Audiosignale komplexer. In der in den 3A und 3B dargestellten Arbeitsausführungsform beträgt der Abstand D5 von der Mitte des Zylinders 306 zu der Mitte jedes Mikrofons 308 7 cm.
  • 3.3.5 Mikrofon-Vorverstärker, A/-D-Wandler
  • Der Mikrofon-Vorverstärker 310 und der Analog-Digital-(A/D-)Wandler (nicht dargestellt) sind vorzugsweise in der Mikrofonbasis 306 integriert, wie dies in 3B dargestellt ist. In dieser Ausführungsform beträgt die Breite des Vorverstärkers 310, D4, 5,901 cm. Der Mikrofon-Vorverstärker verstärkt die Signale von den Mikrofonen, um die Signalamplituden für den nachfolgenden A/D-Wandler zu normalisieren. Der A/D-Wandler wandelt die analogen Signale von der Kamera in digitale Signale um.
  • In dieser Ausführungsform wird das Signalabtasten der Signale von den Mikrofonen auf innerhalb 1 Mikrosekunde zueinander synchronisiert, um die Schallquellenlokalisierung und das Beamforming zu erleichtern.
  • 3.4 Privatmodus
  • Die Kamera kann eine Linsenabdeckung verwenden, die in einem normalen Betriebsmodus offen und in einem Privatmodus geschlossen ist. Darüber hinaus kann der Verschluss für die Kamerasensoren abgeschaltet werden oder die Kamera kann elektronisch isoliert werden, um die Kamera während des Privatmodus abzuschalten. Die Mikrofone werden ebenfalls vorzugsweise abgeschaltet, wenn der Privatmodus ausgelöst wird. Während des Aufzeichnens ist ein Licht auf der Kamera eingeschaltet, um dem Benutzer anzuzeigen, dass die Kamera aktiv ist. Wenn der Privatmodus eingeschaltet wird, wird das Licht ausgeschaltet.
  • 4.0 ALTERNATIVE AUSFÜHRUNGSFORMEN AUFGRUND DER MODULARITÄT
  • Es sind verschiedene alternative Ausführungsformen des integrierten omnidirektionalen Kamera- und Mikrofondesigns möglich. Dies ist teilweise auf die Modularität des Systems zurückzuführen.
  • Beispielsweise können verschiedene Kameraausführungsformen verwendet werden. In einer Ausführungsform wird eine omnidirektionale Kamera eingesetzt, die mehrere Videosensoren verwendet, um einen Kameraerfassungsbereich von 360 Grad zu erreichen. Alternativ wird in einer weiteren Ausführungsform der Erfindung eine omnidirektionale Kamera verwendet, die einen Videosensor und eine hyperbolische Linse nutzt, die Licht aus 360 Grad erfasst, um einen Rundblick-Erfassungsbereich zu erreichen. Darüber hinaus kann jede dieser Kameras selbst, erhoben auf der akustisch transparenten zylindrischen Stange, verwendet werden, um eine Vorderansicht der Sitzungsteilnehmer bereitzustellen. Es können auch beide der Kameras mit einem Mikrofonarray integriert werden. Alternativ dazu können ebenso andere omnidirektionale Kameradesigns in Verbindung mit der zylindrischen Stange und/oder dem Mikrofonarray verwendet werden.
  • Gleichermaßen können verschiedene Mikrofonkonfigurationen verwendet werden. In einer Ausführungsform besteht das Mikrofonarray aus Mikrofonen, die mit gleichseitigen Abständen um den Umfang eines Kreises und so nahe wie möglich an der Tischoberfläche angeordnet sind, um einen freien Weg zu jedem Sprecher in dem Raum zu erhalten. Es sind jedoch ebenso andere Mikrofonkonfigurationen möglich, die mit einer Kamera unter Verwendung einer akustisch transparenten Stange integriert werden können. Alternativ dazu kann das soeben diskutierte omnidirektionale Mikrofonarray ohne eine Kamera verwendet werden, um einen optimalen Schallerfassungsbereich von 360 Grad zu erreichen. Dieser Erfassungsbereich ist bei der Schallquellenlokalisierung und dem Beamforming besonders nützlich, da Multipath-Probleme minimiert oder eliminiert werden.
  • In einer Ausführungsform des integrierten Kamera- und Mikrofonarrays wird das Zusammenheften und das Komprimieren von Bildern auf einem PC ausgeführt. Eine alternative Ausführungsform führt das Zusammenheften und Komprimieren von Bildern in der Kamera mit einem FPGA (Field Programmable Gate Array) oder einem anderen Gate-Array durch. Dieses Design verwendet eine USB-Schnittstelle, um die Kamera mit dem PC zu verbinden, und räumt dem PC mehr CPU-Zyklen ein, um andere Aufgaben, wie beispielsweise die Bildkomprimierung und das Aufzeichnen/Senden der Sitzung, auszuführen.
  • 5.0 EXEMPLARISCHE ARBEITSAUSFÜHRUNGSFORM
  • Eine Arbeitsausführungsform, welche die Kamera 502 und das Mikrofonarray 504 der Erfindung verwendet, wird in 5 dargestellt. Die Bildausgabe der Kamera 502 und die Audioausgabe des Mikrofonarrays 504 werden über einen Analog-Digital-Wandler 506 zu einem Computer 508 geroutet. Der Computer 508 führt verschiedene Funktionen durch, um die Bild- und Audioeingabe zu verbessern und zu verwenden. Beispielsweise heftet ein Rundblick-Filtermodul 510 Bilder zusammen, die durch verschiedene Sensoren in der omnidirektionalen Kamera 502 aufgenommen werden. Darüber hinaus können die Bilddaten durch ein Komprimierungsmodul 512 komprimiert werden, um sie kompatibler für das Senden 514 über ein Netzwerk (wie beispielsweise das Internet) zu machen, oder auf einem computerlesbaren Medium 516 (vorzugsweise über einen Splitter 520) gespeichert werden. Optional können die Bilddaten auch in ein Menschenerfassungs-/Verfolgungsmodul 522 eingegeben werden, um das Kameramanagement 524 zu verbessern. Beispielsweise können die Bild-/Videoabschnitte, die den Sprecher enthalten, identifiziert und mit dem Audiosignal verknüpft werden, und die Bilder, die durch die/den in Richtung des Sprechers gerichtete/n Kamera/Sensor erfasst werden, werden gesendet oder auf einer Platte gespeichert.
  • Die Audioeingabe kann ebenfalls für verschiedene Zwecke verwendet werden. Beispielsweise kann das Audio in ein Schallquellenlokalisierungsmodul 526 eingegeben werden, so dass das Audio des Sprechers isoliert wird. Darüber hinaus kann ein Beamforming-Modul 528 in dem Computer 508 verwendet werden, um die Beam-Form des Audios zu verbessern. Ein Modul zur Rauschreduzierung und automatischen Verstärkungsregelung 530 kann ebenfalls verwendet werden, um das Signal-Rausch-Verhältnis durch Reduzieren des Rauschens und Regeln der Verstärkung zu verbessern, um die Audiosignale von einem Sprecher gegenüber den Hintergrundgeräuschen des Raumes besser zu erfassen.
  • Wie vorangehend erwähnt wurde, können die Video- und Audiosignale zu einem anderen Videokonferenzort oder dem Internet gesendet werden. Sie können ebenfalls auf einem computerlesbaren Medium zum späteren Betrachten gespeichert werden.
  • Die vorstehende Beschreibung der Erfindung wurde zu Illustrations- und Beschreibungszwecken gegeben. Sie erhebt keinen Anspruch auf Vollständigkeit und hat nicht den Zweck, die Erfindung auf die genaue offenbarte Form zu beschränken. Beispielsweise können die vorangehend diskutierten Ausführungsformen des integrierten Kamera- und Mikrofonarrays auf ein Überwachungssystem angewendet werden. In Bezug auf die vorstehende Lehre sind viele Modifizierungen und Änderungen möglich. Der Umfang der Erfindung soll nicht durch diese ausführliche Beschreibung sondern vielmehr durch die hieran angehängten Patentansprüche beschränkt sein.

Claims (42)

  1. Desktopeinheit für Telefonkonferenzen mit einer integrierten omnidirektionalen Kamera und einem Mikrofonarray, umfassend: eine omnidirektionale Kamera (302, 404, 502), ein Mikrofonarray (504) und eine zylindrische Stange (304, 306), die die Kamera (302, 404, 502) mit dem Mikrofonarray (504) verbindet, die Kamera (302, 404, 502) erhebt und einen Durchmesser (D1) von 2 cm oder weniger aufweist.
  2. Desktopeinheit nach Anspruch 1, wobei die omnidirektionale Kamera (302, 404, 502) mehrere Videosensoren (402) verwendet, um einen Kameraerfassungsbereich von 360 Grad zu erreichen.
  3. Desktopeinheit nach Anspruch 1, wobei die omnidirektionale Kamera (302, 404, 502) einen Videosensor (402) und eine hyperbolische Linse verwendet, die Licht aus 360 Grad erfasst, um einen Rundblick-Erfassungsbereich zu erreichen.
  4. Desktopeinheit nach Anspruch 1, wobei das Mikrofonarray (504) eine Vielzahl von Mikrofonen (308) umfasst, die mit gleichseitigen Abständen um den Umfang eines Kreises angeordnet sind.
  5. Desktopeinheit nach Anspruch 1, wobei das Mikrofonarray (504) so eingerichtet ist, dass, wenn die Desktopeinheit auf einer Fläche positioniert ist, das Mikrofonarray auf dieser Fläche aufsitzt, um Schallreflexionen zu minimieren, die durch das Array von dieser Fläche aufgenommen werden.
  6. Desktopeinheit nach Anspruch 2, wobei Videosensoren (402) mit längeren, engeren Bildfeldern verwendet werden, um Bilder aus längeren Entfernungen zu erfassen, und Videosensoren (402) mit weiteren, kürzeren Bildfeldern verwendet werden, um Bilder aus kürzeren Entfernungen zu erfassen.
  7. System zum Erfassen von Audio- und Videodaten, umfassend die Desktopeinheit nach Anspruch 1, wobei die eine Kamera oder die mehreren Kameras (302, 404, 502) Videobilddaten erfasst bzw. erfassen und das Mikrofonarray Audiosignale erfasst und die Stange die eine Kamera oder die mehreren Kameras (302, 404, 502) mit dem Mikrofonarray (504) verbindet.
  8. System nach Anspruch 7, wobei die eine Kamera oder die mehreren Kameras (302, 404, 502) Bilder über 360 Grad erfasst bzw. erfassen.
  9. System nach Anspruch 7, das des Weiteren eine Mikrofonarraybasis (306) umfasst und wobei die Mikrofone (308) an der Mikrofonarraybasis (306) angebracht sind.
  10. System nach Anspruch 9, wobei die Höhe der Mikrofonarraybasis (306) bemessen ist, um die Mikrofone (308) in der Basis (306) einzubetten und das Mikrofonarray (504) auf einer Fläche anzuordnen, wenn die Desktopeinheit auf dieser Fläche positioniert ist, um Schallreflexionen zu minimieren, die durch das Array von dieser Fläche aufgenommen werden.
  11. System nach Anspruch 7, das des Weiteren einen Computer (110) umfasst, wobei die Audiosignale in den Computer (110) eingegeben werden, der Computer (110) die Audiosignale für Schallquellenlokalisierung nutzt und die Schallquellenlokalisierung die Richtung von Schall, der die Audiosignale erzeugt, bestimmt.
  12. System nach Anspruch 7, das des Weiteren einen Computer (110) umfasst, wobei die Audiosignale in den Computer (110) eingegeben werden, der Computer (110) die Audiosignale für Beamforming nutzt, wobei Beamforming die Schallqualität eines Schalls aus einer Richtung durch Herausfiltern des Schalls aus allen anderen Richtungen verbessert.
  13. System nach Anspruch 7, das des Weiteren einen Computer (110) umfasst, wobei die Audiosignale in den Computer (110) eingegeben werden, der Computer (110) Menschenerkennung und Verfolgungsalgorithmen verwendet, um eine Person, die in den Videobilddaten erfasst ist, fehlerfrei zu erkennen und die Videobilddaten der Person mit den durch die sprechende Person erzeugten Audiosignalen zu verknüpfen.
  14. System nach Anspruch 7, das des Weiteren einen Computer (110) umfasst, wobei die Videobilddaten in den Computer (110) eingegeben werden und der Computer (110) die Videobilddaten nutzt, um Bilder zusammenzuheften.
  15. System nach Anspruch 7, wobei Mikrofone (308) in dem Mikrofonarray (504) omnidirektional sind.
  16. System nach Anspruch 7, wobei Mikrofone (308) in dem Mikrofonarray (504) unidirektional sind.
  17. System nach Anspruch 7, wobei das Mikrofonarray (504) drei Mikrofone (308) umfasst.
  18. System nach Anspruch 7, wobei das Mikrofonarray (504) acht Mikrofone (308) umfasst.
  19. System nach Anspruch 7, wobei das Mikrofonarray (504) eine Vielzahl von Mikrofonen (308) umfasst, die gleichseitig in einem Kreis um den Umfang einer ebenen Mikrofonbasis (306) angeordnet sind.
  20. System nach Anspruch 19, wobei wenigstens ein Mikrofon in einem Gummigehäuse angebracht ist, um es vor fremden Schallreflexionen zu schützen.
  21. System nach Anspruch 19, wobei eine Schallisolierung unter wenigstens einem Mikrofon platziert ist, um es vor fremden Schallreflexionen zu schützen.
  22. System nach Anspruch 7, wobei die Kamera (302, 404, 502) des Weiteren eine Linsenabdeckung umfasst, die in einem normalen Betriebsmodus hochgeschoben ist und in einem Privatmodus heruntergezogen ist.
  23. System nach Anspruch 22, wobei die Mikrofone (308) abgeschaltet werden, wenn die Kamera (302, 404, 502) in dem Privatmodus ausgelöst wird.
  24. System nach Anspruch 7, wobei ein Licht auf der Kamera (302, 404, 502) eingeschaltet ist, wenn die Kamera (302, 404, 502) aktiv ist.
  25. System nach Anspruch 7, wobei die Audiosignale über ein Netzwerk gesendet werden.
  26. System nach Anspruch 7, wobei die Audiosignale auf einem computerlesbaren Medium gespeichert werden.
  27. System nach Anspruch 7, wobei die Videobilddaten über ein Netzwerk gesendet werden.
  28. System nach Anspruch 7, wobei die Videobilddaten auf einem computerlesbaren Medium gespeichert werden.
  29. System nach Anspruch 7, wobei die Videosignale mit Hilfe eines 1394 Busses zu einem Computer (110) übertragen werden.
  30. System nach Anspruch 7, wobei die Audiosignale mit Hilfe von Analogkabeln zu einem Computer (110) übertragen werden.
  31. System nach Anspruch 7, wobei die Kameras IEEE 1394 Kameras sind.
  32. Verfahren zum Erfassen von Video und Audio für Telefonkonferenz- und Sitzungs-Aufzeichnung durch eine Desktopeinheit, die folgenden Abläufe umfassend: Erfassen von Bildern von Personen in einer Sitzung mit einer omnidirektionalen Kamera (302, 404, 502), Erfassen von Audiosignalen von in der Sitzung entstehendem Schall mit einem Mikrofonarray (504), wobei das Mikrofonarray (504) in eine Basis (306) aufgenommen ist, die durch eine zylindrische Stange (304, 306) mit der omnidirektionalen Kamera (302, 404, 502) verbunden ist, wobei die Stange (304, 306) einen Durchmesser von 2 cm oder mehr aufweist.
  33. Verfahren nach Anspruch 32, wobei das Mikrofonarray (504) auf einem Tisch platziert ist und wobei die Personen in der Sitzung um den Tisch herum platziert sind.
  34. Verfahren nach Anspruch 33, wobei das Mikrofonarray (504) auf dem Tisch platziert ist, um Schallreflexionen von dem Tisch zu minimieren, die durch das Array aufgenommen werden.
  35. Verfahren nach Anspruch 32, wobei das Mikrofonarray (504) drei oder mehr Mikrofone (308) umfasst.
  36. Verfahren nach Anspruch 35, wobei das Mikrofonarray (504) Mikrofone (308) umfasst, die gleichmäßig beabstandet in einem Kreis angrenzend an den Umfang der Mikrofonbasis (306) angeordnet sind.
  37. Verfahren nach Anspruch 32, wobei die omnidirektionale Kamera (302, 404, 502) mehrere Videosensoren (402) umfasst.
  38. Verfahren nach Anspruch 37, wobei die Videosensoren (402) gleichmäßig um den Umfang eines Kreises beabstandet sind.
  39. Verfahren nach Anspruch 32, wobei die omnidirektionale Kamera (302, 404, 502) einen einzelnen Videosensor mit einer hyperbolischen Linse umfasst, die Lichtstrahlen aus 360 Grad erfasst.
  40. Verfahren nach Anspruch 32, wobei die Stange (304, 306) hohl ist.
  41. Verfahren nach Anspruch 32, wobei die Stange (304, 306) an einer Mikrofonbasis (306) angebracht ist und wobei die Kamerakabel durch die Stange (304, 406) verlaufen, so dass diese Kabel keine akustischen Hindernisse verursachen.
  42. Verfahren nach Anspruch 32, wobei die Höhe der Stange (304, 406) einstellbar ist.
DE60317139T 2002-06-27 2003-05-27 Integriertes Design für eine omnidirektionale Kamera- und Mikrophonanordnung Expired - Lifetime DE60317139T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US184499 1994-01-18
US10/184,499 US7852369B2 (en) 2002-06-27 2002-06-27 Integrated design for omni-directional camera and microphone array

Publications (2)

Publication Number Publication Date
DE60317139D1 DE60317139D1 (de) 2007-12-13
DE60317139T2 true DE60317139T2 (de) 2008-02-07

Family

ID=29717965

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60317139T Expired - Lifetime DE60317139T2 (de) 2002-06-27 2003-05-27 Integriertes Design für eine omnidirektionale Kamera- und Mikrophonanordnung

Country Status (8)

Country Link
US (1) US7852369B2 (de)
EP (1) EP1377041B1 (de)
JP (1) JP4252377B2 (de)
KR (1) KR100960781B1 (de)
CN (1) CN1479525B (de)
AT (1) ATE377326T1 (de)
DE (1) DE60317139T2 (de)
TW (1) TW200401943A (de)

Families Citing this family (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050140785A1 (en) * 1999-03-16 2005-06-30 Mazzilli Joseph J. 360 degree video camera system
US7598975B2 (en) * 2002-06-21 2009-10-06 Microsoft Corporation Automatic face extraction for use in recorded meetings timelines
US7084904B2 (en) * 2002-09-30 2006-08-01 Microsoft Corporation Foveated wide-angle imaging system and method for capturing and viewing wide-angle images in real time
DE10304215A1 (de) * 2003-01-30 2004-08-19 Gesellschaft zur Förderung angewandter Informatik eV Verfahren und Vorrichtung zur bildgebenden Darstellung von akustischen Objekten sowie ein entsprechendes Computerprogramm-Erzeugnis und ein entsprechendes computerlesbares Speichermedium
CN100420298C (zh) * 2004-06-25 2008-09-17 北京中星微电子有限公司 摄像机拍摄方位数字声控定向方法
NO328311B1 (no) * 2004-10-01 2010-01-25 Tandberg Telecom As Skrivebordterminalfot og skrivebordsystem
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7717629B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Coordinated camera pan tilt mechanism
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US8054336B2 (en) * 2004-10-15 2011-11-08 Lifesize Communications, Inc. High definition pan tilt zoom camera with embedded microphones and thin cable for data and power
US7572073B2 (en) * 2004-10-15 2009-08-11 Lifesize Communications, Inc. Camera support mechanism
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US7667728B2 (en) * 2004-10-15 2010-02-23 Lifesize Communications, Inc. Video and audio conferencing system with spatial audio
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US7473040B2 (en) * 2004-10-15 2009-01-06 Lifesize Communications, Inc. High definition camera pan tilt mechanism
US7812882B2 (en) * 2004-12-30 2010-10-12 Microsoft Corporation Camera lens shuttering mechanism
JP2006314078A (ja) * 2005-04-06 2006-11-16 Sony Corp 撮像装置、音声記録装置および音声記録方法
US8457614B2 (en) 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7593539B2 (en) * 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US20060277254A1 (en) * 2005-05-02 2006-12-07 Kenoyer Michael L Multi-component videoconferencing system
TW200715830A (en) * 2005-10-07 2007-04-16 Sony Taiwan Ltd Image pick-up device of multiple lens camera system to create panoramic image
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP4997783B2 (ja) * 2006-02-15 2012-08-08 富士ゼロックス株式会社 電子会議システム、電子会議支援プログラム、電子会議制御装置、情報端末機器、電子会議支援方法
WO2007138617A1 (en) * 2006-05-25 2007-12-06 Asdsp S.R.L. Video camera for desktop videocommunication
US7542668B2 (en) * 2006-06-30 2009-06-02 Opt Corporation Photographic device
US7542671B2 (en) * 2006-06-30 2009-06-02 Opt Corporation Omni directional photographing device
US7667762B2 (en) * 2006-08-01 2010-02-23 Lifesize Communications, Inc. Dual sensor video camera
AU2007221976B2 (en) * 2006-10-19 2009-12-24 Polycom, Inc. Ultrasonic camera tracking system and associated methods
JP5055987B2 (ja) * 2006-12-07 2012-10-24 ヤマハ株式会社 音声会議装置および音声会議システム
US7924655B2 (en) 2007-01-16 2011-04-12 Microsoft Corp. Energy-based sound source localization and gain normalization
WO2008093270A2 (en) 2007-02-02 2008-08-07 Koninklijke Philips Electronics, N.V. Interactive patient forums
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8526632B2 (en) 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
ITVI20070213A1 (it) * 2007-08-02 2009-02-03 Tekno System Spa Custodia di protezione per telecamere atte alla trasmissione del segnale video in formato digitale.
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
US8744069B2 (en) * 2007-12-10 2014-06-03 Microsoft Corporation Removing near-end frequencies from far-end sound
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
CN101533090B (zh) * 2008-03-14 2013-03-13 华为终端有限公司 一种阵列麦克的声音定位方法和装置
US8314829B2 (en) * 2008-08-12 2012-11-20 Microsoft Corporation Satellite microphones for improved speaker detection and zoom
EP2321978A4 (de) 2008-08-29 2013-01-23 Dev Audio Pty Ltd Mikrofonarray und verfahren zur tonerfassung
US8537196B2 (en) 2008-10-06 2013-09-17 Microsoft Corporation Multi-device capture and spatial browsing of conferences
US9124769B2 (en) 2008-10-31 2015-09-01 The Nielsen Company (Us), Llc Methods and apparatus to verify presentation of media content
US20100118112A1 (en) * 2008-11-13 2010-05-13 Polycom, Inc. Group table top videoconferencing device
CN101442654B (zh) * 2008-12-26 2012-05-23 华为终端有限公司 视频通信中视频对象切换的方法、装置及系统
US8072536B1 (en) * 2009-03-03 2011-12-06 Sean Campbell Web cam apparatus
JP5316248B2 (ja) * 2009-06-16 2013-10-16 株式会社リコー テレビ会議装置、テレビ会議方法、そのプログラム
US8654524B2 (en) 2009-08-17 2014-02-18 Apple Inc. Housing as an I/O device
US8441790B2 (en) * 2009-08-17 2013-05-14 Apple Inc. Electronic device housing as acoustic input device
US8624878B2 (en) * 2010-01-20 2014-01-07 Apple Inc. Piezo-based acoustic and capacitive detection
US8553906B2 (en) * 2010-02-02 2013-10-08 Creative Technology Ltd Apparatus for enabling karaoke
US8675038B2 (en) 2010-09-28 2014-03-18 Microsoft Corporation Two-way video conferencing system
US8638354B2 (en) * 2010-10-01 2014-01-28 Creative Technology Ltd Immersive video conference system
US9876953B2 (en) 2010-10-29 2018-01-23 Ecole Polytechnique Federale De Lausanne (Epfl) Omnidirectional sensor array system
US8660847B2 (en) 2011-09-02 2014-02-25 Microsoft Corporation Integrated local and cloud based speech recognition
TWI429938B (zh) 2011-09-16 2014-03-11 Vatics Inc 聲源監視系統及其方法
US9756927B2 (en) 2011-11-30 2017-09-12 Apple Inc. Mounting system for portable electronic device
US8904052B2 (en) 2011-12-23 2014-12-02 Apple Inc. Combined input port
WO2013153464A1 (en) 2012-04-13 2013-10-17 Nokia Corporation Method, apparatus and computer program for generating an spatial audio output based on an spatial audio input
US9131295B2 (en) 2012-08-07 2015-09-08 Microsoft Technology Licensing, Llc Multi-microphone audio source separation based on combined statistical angle distributions
US9269146B2 (en) 2012-08-23 2016-02-23 Microsoft Technology Licensing, Llc Target object angle determination using multiple cameras
US9563239B2 (en) 2012-09-10 2017-02-07 Apple Inc. Internal computer assembly features and methods
CN103680549B (zh) * 2012-09-10 2016-06-01 联想(北京)有限公司 一种音频处理方法及电子设备
US9055216B1 (en) * 2012-11-19 2015-06-09 A9.Com, Inc. Using sensor data to enhance image data
CN102968991B (zh) * 2012-11-29 2015-01-21 华为技术有限公司 一种语音会议纪要的分类方法、设备和系统
CN103856740B (zh) * 2012-12-05 2017-05-24 联想(北京)有限公司 一种信息处理的方法及视频会议系统
US9124762B2 (en) 2012-12-20 2015-09-01 Microsoft Technology Licensing, Llc Privacy camera
US9516417B2 (en) * 2013-01-02 2016-12-06 Microsoft Technology Licensing, Llc Boundary binaural microphone array
US9860439B2 (en) * 2013-02-15 2018-01-02 Panasonic Intellectual Property Management Co., Ltd. Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
EP2973556B1 (de) 2013-03-13 2018-07-11 Kopin Corporation Mikrofonvorrichtung mit rauschunterdrückung
TWI494548B (zh) * 2013-04-26 2015-08-01 Solid State System Co Ltd 聲音微元件測試裝置與測試方法
CN103516969A (zh) * 2013-08-23 2014-01-15 Sm器械株式会社 移动式声学照相机及制造方法
CN103475852A (zh) * 2013-09-09 2013-12-25 镇江市新创计算机系统集成有限公司 复合部门办公楼宇电子会议系统
EP2927885A1 (de) 2014-03-31 2015-10-07 Panasonic Corporation Tonverarbeitungsvorrichtung, Tonverarbeitungssystem und Tonverarbeitungsverfahren
US10182280B2 (en) 2014-04-23 2019-01-15 Panasonic Intellectual Property Management Co., Ltd. Sound processing apparatus, sound processing system and sound processing method
EP2938097B1 (de) 2014-04-24 2017-12-27 Panasonic Corporation Tonverarbeitungsvorrichtung, Tonverarbeitungssystem und Tonverarbeitungsverfahren
EP3161828A4 (de) * 2014-05-27 2017-08-09 Chase, Stephen Videokopfhörer, systeme, helme, verfahren und videoinhaltsdateien
US10154339B2 (en) * 2014-08-18 2018-12-11 Apple Inc. Rotationally symmetric speaker array
GB2533373B (en) * 2014-12-18 2018-07-04 Canon Kk Video-based sound source separation
CN114422738A (zh) * 2015-04-01 2022-04-29 猫头鹰实验室股份有限公司 合成并缩放角度分离的子场景
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
KR101686833B1 (ko) * 2015-05-12 2016-12-16 주식회사 우현디지털 화자 추적이 가능한 다자간 회의 영상 제공 시스템
GB2540175A (en) 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
USD788725S1 (en) * 2015-09-11 2017-06-06 Polycom, Inc. Videoconferencing unit
US9531996B1 (en) 2015-10-01 2016-12-27 Polycom, Inc. Method and design for optimum camera and display alignment of center of the room video conferencing systems
US20170099426A1 (en) * 2015-10-01 2017-04-06 Polycom, Inc. Led speaker identifier system
US9598076B1 (en) * 2015-10-22 2017-03-21 Ford Global Technologies, Llc Detection of lane-splitting motorcycles
US10424314B2 (en) * 2015-12-23 2019-09-24 Intel Corporation Techniques for spatial filtering of speech
US10204397B2 (en) 2016-03-15 2019-02-12 Microsoft Technology Licensing, Llc Bowtie view representing a 360-degree image
US9866400B2 (en) 2016-03-15 2018-01-09 Microsoft Technology Licensing, Llc Action(s) based on automatic participant identification
US9686510B1 (en) 2016-03-15 2017-06-20 Microsoft Technology Licensing, Llc Selectable interaction elements in a 360-degree video stream
CN107290711A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种语音寻向系统及方法
CN105764011B (zh) * 2016-04-08 2017-08-29 甄钊 用于3d沉浸式环绕声音乐与影视拾音的传声器阵列装置
US10492000B2 (en) 2016-04-08 2019-11-26 Google Llc Cylindrical microphone array for efficient recording of 3D sound fields
GB2567600B (en) 2016-08-29 2022-05-04 Groove X Inc Autonomously acting robot that recognizes direction of sound source
CN106708041B (zh) * 2016-12-12 2020-12-29 西安Tcl软件开发有限公司 智能音箱、智能音箱定向移动方法及装置
US9992532B1 (en) 2017-01-11 2018-06-05 Htc Corporation Hand-held electronic apparatus, audio video broadcasting apparatus and broadcasting method thereof
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10764474B2 (en) * 2017-03-02 2020-09-01 Amazon Technologies, Inc. Assembly for electronic devices
JP6878974B2 (ja) 2017-03-16 2021-06-02 株式会社リコー 撮像装置、撮像システム
CN106842131B (zh) * 2017-03-17 2019-10-18 浙江宇视科技有限公司 麦克风阵列声源定位方法及装置
US11233142B2 (en) 2017-10-31 2022-01-25 The Regents of the Unverslty of California Intrinsically tunable and ultra-linear multi-fin MIS-HEMT devices
WO2019113869A1 (zh) * 2017-12-14 2019-06-20 中国电子科技集团公司电子科学研究院 基于相机阵列的全景光场采集装置、处理方法和计算设备
US10356362B1 (en) * 2018-01-16 2019-07-16 Google Llc Controlling focus of audio signals on speaker during videoconference
US10339384B2 (en) 2018-02-07 2019-07-02 Structionsite Inc. Construction photograph integration with 3D model images
US10791268B2 (en) 2018-02-07 2020-09-29 Structionsite Inc. Construction photograph integration with 3D model images
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
US11025888B2 (en) 2018-02-17 2021-06-01 Dreamvu, Inc. System and method for capturing omni-stereo videos using multi-sensors
USD943017S1 (en) 2018-02-27 2022-02-08 Dreamvu, Inc. 360 degree stereo optics mount for a camera
USD931355S1 (en) 2018-02-27 2021-09-21 Dreamvu, Inc. 360 degree stereo single sensor camera
US20190324117A1 (en) * 2018-04-24 2019-10-24 Mediatek Inc. Content aware audio source localization
CN108683874B (zh) * 2018-05-16 2020-09-11 瑞芯微电子股份有限公司 一种视频会议注意力聚焦的方法及一种存储设备
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
EP3804356A1 (de) 2018-06-01 2021-04-14 Shure Acquisition Holdings, Inc. Musterbildende mikrofonanordnung
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10467758B1 (en) 2018-07-13 2019-11-05 Structionsite Inc. Imagery-based construction progress tracking
CN109118636B (zh) * 2018-07-18 2021-12-24 平安科技(深圳)有限公司 一种业务处理方法及设备
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
TWI687753B (zh) * 2018-12-06 2020-03-11 宏碁股份有限公司 全景攝影機與全景攝影系統
CN109743526A (zh) * 2018-12-13 2019-05-10 视联动力信息技术股份有限公司 一种基于视联网的通信连接建立方法及系统
US10785563B1 (en) * 2019-03-15 2020-09-22 Hitachi, Ltd. Omni-directional audible noise source localization apparatus
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
EP3942842A1 (de) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Gehäuse und zugehörige konstruktionsmerkmale für mikrofone einer deckenanordnung
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN109873973B (zh) * 2019-04-02 2021-08-27 京东方科技集团股份有限公司 会议终端和会议系统
KR102154432B1 (ko) * 2019-04-09 2020-09-09 주식회사 엘지유플러스 영상 촬영 기기 및 이의 동작 방법
US11190732B2 (en) * 2019-05-15 2021-11-30 Gama LLC Workstation for neurobiological disorder health professionals
US11445294B2 (en) 2019-05-23 2022-09-13 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
EP3977449A1 (de) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Mit sprach- und rauschaktivitätsdetektion integrierter automatischer mischer mit niedriger latenz
WO2021041275A1 (en) 2019-08-23 2021-03-04 Shore Acquisition Holdings, Inc. Two-dimensional microphone array with improved directivity
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
WO2022031872A1 (en) 2020-08-04 2022-02-10 Owl Labs Inc. Designated view within a multi-view composited webcam signal
TWI755037B (zh) * 2020-08-21 2022-02-11 陳筱涵 影音錄製裝置與影音編輯播放系統
JP2023541551A (ja) 2020-08-24 2023-10-03 アウル ラブス、インク. 複数のカメラからのウェブカム信号のマージ
US11367220B1 (en) * 2020-08-27 2022-06-21 Edge 3 Technologies Localization of lens focus parameter estimation and subsequent camera calibration
CN114520888A (zh) * 2020-11-19 2022-05-20 信泰光学(深圳)有限公司 影像撷取系统
CN112565598B (zh) * 2020-11-26 2022-05-17 Oppo广东移动通信有限公司 聚焦方法与装置、终端、计算机可读存储介质和电子设备
JP2024505068A (ja) 2021-01-28 2024-02-02 シュアー アクイジッション ホールディングス インコーポレイテッド ハイブリッドオーディオビーム形成システム
US11636842B2 (en) * 2021-01-29 2023-04-25 Iyo Inc. Ear-mountable listening device having a microphone array disposed around a circuit board
EP4047939A1 (de) 2021-02-19 2022-08-24 Nokia Technologies Oy Audioerfassung in anwesenheit von rauschen
US11778407B2 (en) * 2021-08-10 2023-10-03 Plantronics, Inc. Camera-view acoustic fence
US20230086632A1 (en) * 2021-09-21 2023-03-23 Vistage Innovation LLC Article of furniture featuring collaborative roundtable audio-video conferencing
KR102641869B1 (ko) * 2023-07-14 2024-03-04 캠플러스(주) 스마트홈 구축용 카메라 및 그 카메라의 동작 제어 방법

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4658425A (en) * 1985-04-19 1987-04-14 Shure Brothers, Inc. Microphone actuation control system suitable for teleconference systems
JPS63144698A (ja) * 1986-12-08 1988-06-16 Nippon Telegr & Teleph Corp <Ntt> マイクロホン切替収音装置
JPH04210194A (ja) * 1990-11-30 1992-07-31 Kensaku Hori カメラの撮影に使用するカメラ台
US5426510A (en) * 1992-06-05 1995-06-20 Dolman Associates, Inc. Audio-video system
JP2939087B2 (ja) * 1993-04-07 1999-08-25 シャープ株式会社 全方位視覚系
US5625410A (en) * 1993-04-21 1997-04-29 Kinywa Washino Video monitoring and conferencing system
JPH06351015A (ja) * 1993-06-10 1994-12-22 Olympus Optical Co Ltd テレビジョン会議システム用の撮像システム
JPH0774998A (ja) * 1993-06-25 1995-03-17 Sony Corp 画像・音声記録装置
JPH0743015U (ja) * 1993-12-29 1995-08-11 株式会社オーディオテクニカ 面上収音マイクロホン
JPH07264569A (ja) * 1994-03-16 1995-10-13 Sumitomo Electric Ind Ltd 遠隔会議装置
US5796426A (en) * 1994-05-27 1998-08-18 Warp, Ltd. Wide-angle image dewarping method and apparatus
JPH0832945A (ja) * 1994-07-19 1996-02-02 Hitachi Ltd テレビ電話装置
JP3458486B2 (ja) * 1994-10-25 2003-10-20 松下電器産業株式会社 全方位撮影装置及び全方位画像合成装置
JP3310485B2 (ja) * 1994-12-27 2002-08-05 シャープ株式会社 画像入力装置
US5990934A (en) * 1995-04-28 1999-11-23 Lucent Technologies, Inc. Method and system for panoramic viewing
US5745305A (en) * 1995-04-28 1998-04-28 Lucent Technologies Inc. Panoramic viewing apparatus
JPH08340466A (ja) * 1995-06-09 1996-12-24 Sony Corp 卓上式カメラ
US5793527A (en) * 1995-06-30 1998-08-11 Lucent Technologies Inc. High resolution viewing system
US5539483A (en) * 1995-06-30 1996-07-23 At&T Corp. Panoramic projection apparatus
WO1997008896A1 (en) * 1995-08-23 1997-03-06 Scientific-Atlanta, Inc. Open area security system
US6115176A (en) * 1995-11-30 2000-09-05 Lucent Technologies Inc. Spherical viewing/projection apparatus
US6111702A (en) * 1995-11-30 2000-08-29 Lucent Technologies Inc. Panoramic viewing system with offset virtual optical centers
ES2151971T3 (es) * 1995-12-12 2001-01-16 Pareto Eugeni Jordana Sistema de lentes sin aberracion de esfericidad, y camara estereoscopica incluyendo dicho sistema de lentes.
US6118474A (en) * 1996-05-10 2000-09-12 The Trustees Of Columbia University In The City Of New York Omnidirectional imaging apparatus
US6493032B1 (en) * 1996-06-24 2002-12-10 Be Here Corporation Imaging arrangement which allows for capturing an image of a view at different resolutions
US6341044B1 (en) * 1996-06-24 2002-01-22 Be Here Corporation Panoramic imaging arrangement
US6331869B1 (en) * 1998-08-07 2001-12-18 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
US6459451B2 (en) * 1996-06-24 2002-10-01 Be Here Corporation Method and apparatus for a panoramic camera to capture a 360 degree image
US6373642B1 (en) * 1996-06-24 2002-04-16 Be Here Corporation Panoramic imaging arrangement
JP3784474B2 (ja) * 1996-11-20 2006-06-14 日本電気株式会社 ジェスチャー認識方法および装置
JP3797751B2 (ja) * 1996-11-27 2006-07-19 富士通株式会社 マイクロホンシステム
WO1998047291A2 (en) * 1997-04-16 1998-10-22 Isight Ltd. Video teleconferencing
JPH10304329A (ja) * 1997-04-30 1998-11-13 Matsushita Electric Works Ltd 会議撮像装置
US6466254B1 (en) * 1997-05-08 2002-10-15 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
US6043837A (en) * 1997-05-08 2000-03-28 Be Here Corporation Method and apparatus for electronically distributing images from a panoptic camera system
US6356296B1 (en) * 1997-05-08 2002-03-12 Behere Corporation Method and apparatus for implementing a panoptic camera system
US6072522A (en) * 1997-06-04 2000-06-06 Cgc Designs Video conferencing apparatus for group video conferencing
JPH1141577A (ja) * 1997-07-18 1999-02-12 Fujitsu Ltd 話者位置検出装置
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JPH11331827A (ja) 1998-05-12 1999-11-30 Fujitsu Ltd テレビカメラ装置
US6924832B1 (en) * 1998-08-07 2005-08-02 Be Here Corporation Method, apparatus & computer program product for tracking objects in a warped video image
US6285365B1 (en) * 1998-08-28 2001-09-04 Fullview, Inc. Icon referenced panoramic image display
US6128143A (en) * 1998-08-28 2000-10-03 Lucent Technologies Inc. Panoramic viewing system with support stand
US6144501A (en) * 1998-08-28 2000-11-07 Lucent Technologies Inc. Split mirrored panoramic image display
US6195204B1 (en) * 1998-08-28 2001-02-27 Lucent Technologies Inc. Compact high resolution panoramic viewing system
US6141145A (en) * 1998-08-28 2000-10-31 Lucent Technologies Stereo panoramic viewing system
JP2000092368A (ja) * 1998-09-09 2000-03-31 Canon Inc カメラ制御装置及びコンピュータ読み取り可能な記憶媒体
JP2000106566A (ja) * 1998-09-29 2000-04-11 Hitachi Ltd 通信制御装置
JP2000106556A (ja) * 1998-09-29 2000-04-11 Brother Ind Ltd データ記憶装置、データ通信システム、及び記憶媒体
JP3863306B2 (ja) * 1998-10-28 2006-12-27 富士通株式会社 マイクロホンアレイ装置
US6369818B1 (en) * 1998-11-25 2002-04-09 Be Here Corporation Method, apparatus and computer program product for generating perspective corrected data from warped information
JP2000181498A (ja) * 1998-12-15 2000-06-30 Toshiba Corp ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体
US6714249B2 (en) * 1998-12-31 2004-03-30 Eastman Kodak Company Producing panoramic digital images by digital camera systems
US6175454B1 (en) * 1999-01-13 2001-01-16 Behere Corporation Panoramic imaging arrangement
US6597520B2 (en) * 1999-01-13 2003-07-22 Be Here Corporation Panoramic imaging arrangement
US6278478B1 (en) * 1999-03-18 2001-08-21 Microsoft Corporation End-to-end network encoding architecture
JP2000308040A (ja) * 1999-04-22 2000-11-02 Sony Corp 双方向高速データ配信装置
US6244759B1 (en) * 1999-05-10 2001-06-12 Rob Russo Adjustable camera support
US6781606B2 (en) * 1999-05-20 2004-08-24 Hewlett-Packard Development Company, L.P. System and method for displaying images using foveal video
US6375370B1 (en) * 2000-02-10 2002-04-23 Cam Guard Systems, Inc. Temporary surveillance system
JP4416290B2 (ja) * 2000-07-31 2010-02-17 富士フイルム株式会社 デジタルカメラ
US6439515B1 (en) * 2000-10-10 2002-08-27 Adam Daniel Powers Video camera support device
US6741250B1 (en) * 2001-02-09 2004-05-25 Be Here Corporation Method and system for generation of multiple viewpoints into a scene viewed by motionless cameras and for presentation of a view path
US7184559B2 (en) * 2001-02-23 2007-02-27 Hewlett-Packard Development Company, L.P. System and method for audio telepresence
US6756990B2 (en) * 2001-04-03 2004-06-29 Be Here Corporation Image filtering on 3D objects using 2D manifolds
US6937266B2 (en) * 2001-06-14 2005-08-30 Microsoft Corporation Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network
US6628897B2 (en) * 2001-06-20 2003-09-30 Sony Corporation Camera system
US20040008423A1 (en) * 2002-01-28 2004-01-15 Driscoll Edward C. Visual teleconferencing apparatus
US20040021764A1 (en) * 2002-01-28 2004-02-05 Be Here Corporation Visual teleconferencing apparatus
US20030142402A1 (en) * 2002-01-30 2003-07-31 Be Here Corporation Method and apparatus for triggering a remote flash on a camera with a panoramic lens
US7012757B2 (en) * 2002-05-08 2006-03-14 Be Here Corporation Method for designing a lens system and resulting apparatus
US7019918B2 (en) * 2003-06-12 2006-03-28 Be Here Corporation Panoramic imaging system
US20040254982A1 (en) * 2003-06-12 2004-12-16 Hoffman Robert G. Receiving system for video conferencing system

Also Published As

Publication number Publication date
CN1479525B (zh) 2010-05-12
CN1479525A (zh) 2004-03-03
KR100960781B1 (ko) 2010-06-01
KR20040002639A (ko) 2004-01-07
JP4252377B2 (ja) 2009-04-08
US7852369B2 (en) 2010-12-14
EP1377041A2 (de) 2004-01-02
ATE377326T1 (de) 2007-11-15
EP1377041B1 (de) 2007-10-31
EP1377041A3 (de) 2004-08-25
JP2004032782A (ja) 2004-01-29
DE60317139D1 (de) 2007-12-13
US20040001137A1 (en) 2004-01-01
TW200401943A (en) 2004-02-01

Similar Documents

Publication Publication Date Title
DE60317139T2 (de) Integriertes Design für eine omnidirektionale Kamera- und Mikrophonanordnung
DE69920138T2 (de) Videokonferenzsystem mit tonquellelokalisierung
US7277118B2 (en) Method and system for compensating for parallax in multiple camera systems
DE102005024097B4 (de) Mechanisches Schwenken, Neigen und Zoomen bei einer Webcam
DE69820871T2 (de) Kamera mit Vorrichtung zur Korrektur des Trapezoidalbildfehlers
US8130257B2 (en) Speaker and person backlighting for improved AEC and AGC
US7071968B2 (en) System and method for a software steerable web camera with multiple image subset capture
US11076127B1 (en) System and method for automatically framing conversations in a meeting or a video conference
DE102011085361A1 (de) Mikrofoneinrichtung
US20040263646A1 (en) Whiteboard view camera
EP4165869A1 (de) Vorrichtung zur darstellung von bildern sowie verwendung einer solchen vorrichtung
Fiala et al. A panoramic video and acoustic beamforming sensor for videoconferencing
US20220329727A1 (en) Region of interest based adjustment of camera parameters in a teleconferencing environment
CN214384918U (zh) 音视频采集设备
CN113784084A (zh) 一种处理方法及装置
DE60309173T2 (de) Audiovisuelles system fuer die anlage einer bidirektionellen uebertragung zwischen einer ersten szene und einer zweiten
DE102010026572B4 (de) Verfahren zur Aufnahme und Wiedergabe von Panoramadarstellungen
US20200389722A1 (en) Processing of data of a video sequence in order to zoom to a speaker detected in the sequence
WO2017216263A1 (de) Bilderfassungsvorrichtung, bilderfassungssystem, bildprojektionsvorrichtung, bildübertragungssystem, verfahren zum erfassen eines 360°-objektbereichs und verfahren zum projizieren eines bildes
CN218830165U (zh) 一种图像获取装置及系统
EP2424225B1 (de) Bilderfassungssystem und Verfahren zum Erfassen eines Objekts
CN213213667U (zh) 一种基于视觉与声音融合的可交互的会议装置
DE202022100540U1 (de) Gerichtssaal-Mediensystem
EP3945716A1 (de) Panoramakamera
Rui et al. PING: A Group-to-individual distributed meeting system

Legal Events

Date Code Title Description
8364 No opposition during term of opposition