Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR FOVEAL DATA COMPRESSION FOR BILATERAL VIDEO- TRANSMISSION
Document Type and Number:
WIPO Patent Application WO/2006/105674
Kind Code:
A1
Abstract:
The invention relates to a method for compressing data for bilateral video transmission, wherein the axes (8) of the eyes (7) of an observer A (1) intersect an image (3). The co-ordinates of said point, which is known as the fixed point (9), are transmitted to a computer (6') of a second observer B (1'). Said computer (6') compresses the image content which is specific of the observer A (1). The compression rate is adapted to the resolution capacity of the human eye which becomes greater and greater with an increasing distance from the fixed point (9). The thus compressed images are transmitted to observer A (1) and are represented in a co-ordinated manner thereon, where the compression takes place on the fixed point (9) thereof. The computer (6') of the user B (1') also provides the fixed point co-ordinates for the selective compression of the video signal, which user B (1') should receive. Said devices are the same for each user.

Inventors:
LOETSCHER BERNHARD (CH)
Application Number:
PCT/CH2006/000062
Publication Date:
October 12, 2006
Filing Date:
February 01, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
LOETSCHER BERNHARD (CH)
International Classes:
H04N7/26
Other References:
SHEIKH H R ET AL: "Foveated multipoint videoconferencing at low bit rates", 2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. (ICASSP). ORLANDO, FL, MAY 13 - 17, 2002, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), NEW YORK, NY : IEEE, US, vol. VOL. 4 OF 4, 13 May 2002 (2002-05-13), pages II - 2069, XP010804308, ISBN: 0-7803-7402-9
SANGHOON LEE; PATTICHIS M S; BOVIK A C: "Foveated video compression with optimal rate control", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 10, July 2001 (2001-07-01), pages 977 - 992, XP002374842
OLEG KOMOGORTSEV , JAVED KHAN: "Predictive perceptual compression for real time video communication", INTERNATIONAL MULTIMEDIA CONFERENCE, PROCEEDINGS OF THE 12TH ANNUAL ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA, 10 October 2004 (2004-10-10), NY, pages 220 - 227, XP002374840
KHAN J I; KOMOGORTSEV O V: "A hybrid scheme for perceptual object window design with joint scene analysis and eye-gaze tracking for media encoding based on perceptual attention", PROCEEDINGS OF THE SPIE, VISUAL COMMUNICATIONS AND IMAGE PROCESSING 2004, 20 January 2004 (2004-01-20), San Jose, CA, USA, pages 1341 - 1352, XP002374841
E. VALTOS: "Optimized bandwidth usage for real-time remote surveillance system", 18 March 2005 (2005-03-18), pages 1 - 5, XP002375083, Retrieved from the Internet [retrieved on 20060330]
S. LEE, C. BOVIK: "Fast algorithms for foveated video processing", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 13, February 2003 (2003-02-01), pages 149 - 162, XP002375039
LEE S ET AL: "LOW DELAY FOVEATED VISUAL COMMUNICATIONS OVER WIRELESS CHANNELS", PROCEEDINGS 1999 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING. ICIP'99. KOBE, JAPAN, OCT. 24 - 28, 1999, INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, LOS ALAMITOS, CA : IEEE, US, vol. VOL. 3 OF 4, 24 October 1999 (1999-10-24), pages 90 - 94, XP000921562, ISBN: 0-7803-5468-0
Attorney, Agent or Firm:
Salgo R. C. (Wald, CH)
Download PDF:
Claims:
Patentansprüche
1. Verfahren zur Datenkompression bei der Übertragung von digitalen Videobildern zwischen zwei Teilnehmern, Betrachter A (1) und Betrachter B (I1), deren Augachsen (8) sich auf einem von ihnen betrachteten Bildschirm (3) in einem Fixpunkt (9) schneiden, dessen Koordinaten von einem Computer (6) (oder einem anderen dazu fähigen Gerät) aus den Bildinformationen, die eine Kamera (2) liefert (oder nach ei nein anderen bekannten Verfahren) , berechnet werden, dadurch gekennzeichnet dass der Fixpunkt (9) des Betrachters A (1) auf seinem Bildschirm (3) bestimmt, und dessen Koordinaten gleichzeitig mit dem für Betrachter B (I1) bestimmten Bild über mittelt werden, und umgekehrt, ein Sender (4) ein komprimiertes Bild, bei dem ein kleines Gebiet (Abstand vom Fixpunkt maximal 3°) um den Fixpunkt (9) mit grosserer Auflösung als in den weiter entfernten Bereichen übermittelt, wobei die Kompression an das Auflösungsvermögen des menschlichen Auges ange passt und gegen aussen immer höher wird.
2. Verfahren zur Datenkompression nach Patentanspruch 1 dadurch gekennzeichnet dass das Verfahren für VideoKommunikation optimiert ist und diese trotz beschränkter zur Verfügung stehender Bandbreite ermöglicht.
3. Verfahren zur Datenkompression nach Patentanspruch 1 da durch gekennzeichnet dass ein Wegdriften des hochauflösenden Bereiches vom Fixpunkt (9) durch Messfehler etc. durch Detektieren spezifischer Augenbewegungen festgestellt und korrigiert werden kann.
4. Verfahren zur Datenkompression nach Patentanspruch 1 dadurch gekennzeichnet dass die Erfassung und Nachführung des Fixpunktes (9) schneller erfolgt, als das Auge (7) abtasten kann (schneller als 0,2 Sekunden) und es so ermöglicht wird, den hochauflösenden Bereich optimal klein zu halten.
5. Verfahren zur Datenkompression nach Patentanspruch 1 da durch gekennzeichnet dass nur Bilddaten übertragen werden, die sich im Vergleich zum letzten Bild verändert haben oder die scharf übertragen werden müssen, weil der Fixpunkt auf den entsprechenden Bildbereich zu liegen kommt, Bildbereiche, die bereits scharf übertragen worden sind, scharf dargestellt bleiben, bis eine erneute Übertragung der entsprechenden Bilddaten erfolgt.
6. Verfahren zur Datenkompression nach Patentanspruch 1 da durch gekennzeichnet dass der Fixpunkt (9) der beiden Augachsen (8) durch Auswerten der Daten von einer oder mehreren am Bildrand angeordnete Videokameras (2) ermittelt wird.
7. Verfahren zur Datenkompression nach Patentanspruch 1 dadurch gekennzeichnet dass der Fixpunkt (9) der beiden Augachsen (8) durch Abtasten der Oberfläche der Augen (7) mittels eines schwachen Laserstrahls bestimmt wird.
8. Verfahren zur Datenkompression nach Patentanspruch 1 dadurch gekennzeichnet dass das Verfahren für tragbare Geräte wie Mobiltelefone angewendet werden kann.
9. Verfahren zur Datenkompression nach Patentanspruch 1 da durch gekennzeichnet dass das Verfahren so modifiziert werden kann, dass Video Konferenzen mit mehr als zwei Teilnehmern möglich sind.
10. Vorrichtung zur Ausführung des Verfahrens nach einem der Ansprüche 1 bis 9 mit mindestens je einem Bildschirm (3), je einer Kamera (2) (oder einem anderen Erfassungssystem für die Richtung der Augachsen (8)) und je einem zur Komprimierung eines Bildes fähigen Computers (6) dadurch gekennzeichnet dass jeder an einer VideoKonferenz teilnehmende Betrachter 1 einen Bildschirm (3) und ein Erfassungssystem (Beispielsweise eine Kamera (2) ) zur Bestimmung seines Fixpunktes (9) zur Verfügung hat, Die Kompression eines Bildes für jeden Betrachter (1) nach seinem eigenen Fixpunkt (9), der an die anderen Betrachter (1) übertragen wird, erfolgt.
11. Vorrichtung nach Anspruch 10 zur Ausführung des Verfahrens nach einem der Ansprüche 19 dadurch gekennzeichnet dass der Bildschirm bei mehr als zwei Teilnehmern einer Video Konferenz aufgeteilt wird.
12. Verfahren nach den Ansprüchen 9 und 11 dadurch gekenn zeichnet dass die Modifikation des Verfahrens darin besteht, dass jeder Teilnehmer auf einem Teil des Bildschirms (13 a) dargestellt wird, durch den Fixpunkt (19 a) des Benutzers (11 a) bestimmt wird, wessen Bild er gerade betrachtet und dieses nach dem in einem der Ansprüche 19 beschriebenen Verfahren komprimiert wird, während die nicht fixierten Bilder der anderen teilnehmenden Betrachter (11 b,c) unscharf übertragen werden.
13. Verfahren nach den Patentansprüchen 1 bis 8 dadurch gekennzeichnet dass Mittel zur Aufnahme und Darstellung von Bildern vorhanden sind, um beim Betrachter den Eindruck eines dreidimensionalen Bildes hervorzurufen.
14. Vorrichtung nach Anspruch 10 zur Ausführung des Verfah rens nach Anspruch 13 dadurch gekennzeichnet dass als Mittel zur Darstellung der übertragenen (Video) Bilder ein Headset mit einem zweigeteilten Display (3) oder zwei separaten Displays (3) verwendet wird, auf den beiden Teilen des Displays (3) nicht die exakt gleichen Bildausschnitte dargestellt werden, sondern leicht verschobene, die beiden Bildausschnitte durch die Art und Weise ihrer Darstellung vom Betrachter als ein einziges, dreidimensionales Bild wahrgenommen werden.
15. Vorrichtung nach Anspruch 10 zur Ausführung des Verfahrens nach Anspruch 13 dadurch gekennzeichnet dass als Mittel zur Aufnahme von dreidimensional darstellbaren Bildern zwei Kameras (2) verwendet werden, diese Kameras (2) je ein Bild übertragen und deren Betrachtungswinkel durch die Anordnung der Kameras (2) leicht unterschiedlich ist, wodurch leicht verschobene Bildausschnitte entstehen.
16. Vorrichtung nach Anspruch 10 zur Ausführung des Verfahrens nach Anspruch 13 dadurch gekennzeichnet dass als Mittel zur Aufnahme von dreidimensional darstellba ren Bildern eine Kamera mit beweglichem Prisma oder eine Kamera mit beweglichem Spiegel verwendet wird.
17. Vorrichtung nach Anspruch 10 dadurch gekennzeichnet dass Mittel vorhanden sind, um die Kamera (2) fernzusteuern.
Description:
VERFAHREN ZUR FOVEALEN DATENKOMPRIMIERUNG FÜR BILATERALE VIDEO- ÜBERTRAG U NG

Die vorliegende Erfindung betrifft ein Verfahren zur Daten- kompression für Video-Übertragungen nach dem Oberbegriff des Patentanspruches 1.

Solche Verfahren sind bekannt aus JP 10304355 (Dl) und US 6,091,767 (D2) . Dl bildet den nächstliegenden Stand der Technik. D2 beschreibt ein Verfahren, bei dem Informationen über den Betrachter eines Videobildes, z.B. seine relative Position zum Bildschirm und den Bereich des Bildes, den er betrachtet, an den Encoder gesendet werden. Der Encoder passt aufgrund dieser Informationen das Codierungsverfahren an. So kann ein Betrachter, der sich weit vom Bildschirm entfernt befindet, keine feinen Details mehr erkennen; also müssen diese auch nicht übertragen werden. Der gleiche Effekt tritt auf, wenn der Benutzer vor einem LCD-Display mit engem Betrachtungswinkel das Bild zu sehr von einer seitlichen Position anstatt senkrecht vor dem Display betrachtet. In Dl wird die Position auf dem Bildschirm bestimmt, welchen der Betrachter beobachtet, und die Kompression wird darauf abgestimmt. Die Kompression wird mit zunehmendem Abstand zum beobachteten Punkt erhöht. Dabei wird jedoch nicht auf die physiologischen Eigenschaften des menschlichen Auges Rück- sieht genommen.

Die Aufgabe der Erfindung ist es, die Kompressionsrate im Vergleich zu verbreiteten Verfahren weiter zu erhöhen, ohne dass der Betrachter eine Verschlechterung der Bildqualität wahrnimmt . Die Lösung der Aufgabe ist wiedergegeben im kennzeichnenden Teil des Patentanspruches 1 hinsichtlich ihrer wesentlichen Merkmale, sowie in den abhängigen Ansprüchen hinsichtlich weiterer vorteilhafter Merkmale. Anhand der Figuren wird das Verfahren näher erläutert.

Es zeigen :

Fig. 1: Eine schematische Darstellung der Anordnung, Fig. 2: Ein Diagramm Sehschärfe und Bildauflösung, Fig. 3: Eine schematische Darstellung der Anordnung für ein modifiziertes Verfahren.

Das vorliegende Verfahren basiert auf den physiologischen Eigenschaften des menschlichen Auges:

Auf der Netzhaut (Retina) nimmt die Dichte der Photorezeptoren (Sehzellen) und damit auch die Sehschärfe rapide mit steigendem Sehwinkel ab. Der Sehwinkel ist der Winkel zwischen einem Bildpunkt und dem optischen Zentrum der Retina, der Fovea. Die ausgezogene Linie in Figur 2 zeigt den Zusammenhang zwischen Sehwinkel Δφ und relativer Sehschärfe S. Das höchste Auflösungsvermögen des Auges entspricht etwa 1 ' (1 Bogenminute = 1/60°). Der Bereich, der hochauflösend er- fasst wird, ist sehr klein: Er beschränkt sich auf einen Blickwinkel von etwa 0,1°, was bei einem Betrachtungsabstand von 50 cm einer kreisförmigen Fläche von 0.6 mm 2 entspricht. Dieser Bereich wird vom Auge durch sequentielles Variieren der Blickrichtung um jeweils etwa 0.02° abgetastet. Bereits in einem Abstand vom Zentrum der Fovea von 2,5° ist die Auflösung des Auges nur noch etwa halb so gross. Bis zu diesem Abstand, was bei 50 cm Betrachtungsabstand einer Fläche mit einem Durchmesser von ca. 43 mm entspricht, wird der Bereich noch als scharf empfunden. Im hochauflösenden Bereich werden Veränderungen nur langsam erfasst, das erwähnte Abtasten erfolgt etwa fünf mal in der Sekunde. In den Randbereichen der Retina wird ein Bild zwar relativ unscharf abgebildet, es werden aber sehr schnelle Änderungen (ca. 50 Hz) wahrgenom- men.

Für das erfindungsgemässe Verfahren wird der Schnittpunkt der mit der Ziffer 8 bezeichneten Augachsen eines Betrachters 1 auf einem betrachteten Bildschirm 3 bestimmt. Dieser Schnitt-

punkt wird Fixpunkt 9 genannt und bezeichnet den Punkt auf dem Bildschirm, den der Benutzer 1 fixiert.

Die Bitrate hängt quadratisch von der Auflösung eines Bildes ab. Um eine hohe Kompression erreichen zu können, soll die Auflösung eines Bildes möglichst stark verringert werden, ohne dass ein Benutzer eine Qualitätsminderung feststellen kann. Dies wird erreicht, indem nicht für das gesamte Bild die gleiche Kompressionsrate verwendet wird, sondern die Kompression an das Auflösungsvermögen des Auges angepasst wird. Die Auflösung des Bildes wird in gleichem Masse mit zunehmendem Abstand vom Fixpunkt reduziert, wie die Sehschärfe S des Auges abnimmt (Die gestrichelte Linie in Figur 2 stellt die relative Auflösung des Bildes im Verhältnis zum Abstand vom Fixpunkt 9 dar) . Auf diese Weise können vom Fixpunkt 9 ent- fernte Bereiche immer unschärfer dargestellt werden, je weiter sie vom Fixpunkt 9 entfernt liegen, ohne dass der Betrachter 1 dies wahrnimmt. Durch die Anpassung der Zunahme der Kompressionsrate an die Sehschärfe S und weitere im Folgenden beschriebenen Massnahmen zur Optimierung des Verfah- rens bezüglich der Eigenschaften des menschlichen Sehens wird die gesamte Kompression im Vergleich zu dem in Dl geschilderten Verfahren weiter erhöht. Durch die optimale Anpassung an das menschliche Auge kann dies erfolgen, ohne dass der Betrachter eine Verschlechterung der Bildqualität wahrnimmt. Die Datenmenge und entsprechend die für eine Übertragung benötigte Bandbreite kann so drastisch reduziert werden. Da das Auge in den Randbereichen schnelle Veränderungen wahrnehmen kann, ist eine hohe Bildrate (mindestens 50 Hz) notwendig, um ein einigermassen flackerfreies Bild zu erhalten. Diese Rate kann im Empfängergerät durch rechnerische Interpolation in mehreren (z.B. 10) Schritten zwischen zwei Bildübertragungen erreicht werden. Es ist auf diese Weise nicht notwendig, 50 Bilder pro Sekunde zu übertragen; die Übertragungsrate kann

so weiter um beispielsweise einen Faktor 10 reduziert werden. Durch die genaue Bestimmung des Fixpunktes 9 (nach bekannten Verfahren) , die eine präzisere Methode darstellt, als die sensorische Ermittlung der Position oder der Bewegung des Be- trachters 1, sowie eine Fixpunkt-Nachführung auf dem Bildschirm, die weniger als 0,2 Sekunden beansprucht (also schneller erfolgt als das Auge abtasten kann) , kann der benötigte hochauflösende Bereich sehr klein gehalten werden, was die Bitrate weiter verringert. Bereiche des Bildes, die sich im Vergleich zum vorherigen Bild nicht oder nur sehr wenig verändern, müssen nicht erneut übertragen werden; das Reduzieren von redundanten Daten als bekanntes Verfahren kann mit dem erfindungsgemässen Verfahren kombiniert werden. Eine Bildstabilisierungssoftware wie sie in Videokameras häufig eingesetzt wird, kann auch in der erfindungsgemässen Anordnung eingesetzt werden: Auf diese Weise wird erreicht, dass das Bild ruhiger erscheint und dadurch Veränderungen des Bildes, die durch leichte Kamerabewegungen entstanden sind, eliminiert werden. Ein erneutes Übertragen des Bildes aufgrund dieser Veränderungen entfällt, was einer weiteren Datenreduktion entspricht.

Für das Lesen von Text ist es vorteilhaft, einen ellipsenför- migen Bereich (längste Achse in Leserichtung) anstatt eines kreisförmigen scharf zu übermitteln. Wenn der scharf dargestellte Bereich auf dem Bildschirm 3 etwas neben dem Fixpunkt 9 liegt (durch Mess- oder Rechenfehler) , folgt das Auge 7 dem scharfen Bereich, welcher ständig in die Richtung des Fehlervektors wegdriftet, springt aber immer wieder zum anfänglichen Fixpunkt 9 zurück. Durch das Detektieren dieser spezifischen Augenbewegung kann eine Drift laufend ermittelt und korrigiert werden (adaptive Servo- Regelung) , was es ebenfalls ermöglicht, den scharfen Bereich optimal klein zu halten.

Zwei Personen,. Betrachter A 1 und Betrachter B 1' führen ein bilaterales Video-Telefonie-Gespräch. Die Augachsen 8 des einen Betrachters A 1 schneiden sich im Fixpunkt 9 auf dem Bildschirm 3, auf den er blickt. Eine oder mehrere Kameras 2 nehmen das Bild des Betrachters A 1 mit voller Bandbreite auf. Ein angeschlossener Computer 6 berechnet die kartesi- schen Koordinaten des Fixpunktes 9 des Betrachters A 1 auf dem Bildschirm 3 anhand der im Bild enthaltenen Informationen (oder nach einem anderen bekannten Verfahren) , und übermit- telt diese über einen Sender 4 an den Empfänger 5' des Betrachters B 1'. Der Computer 6' des Betrachters B 1' komprimiert den für Betrachter A 1 bestimmten Bildinhalt digital. Dabei wird die Kompressionsrate dem Auflösungsvermögen des Auges angepasst, das heisst, das Bild wird mit zunehmendem Abstand Δφ vom Fixpunkt 9 immer stärker komprimiert (Figur 2: die gepunktete Linie entspricht der relativen Auflösung). Die so komprimierten Bilder werden an Betrachter A 1 übermittelt und auf seinem Bildschirm 3, da die Kompression auf seinen Fixpunkt 9 bezogen erfolgte, perfekt auf ihn abgestimmt dargestellt. Umgekehrt liefert der Computer 6' von Benutzer B 1' gleichzeitig die Fixpunktkoordinaten für die selektive Komprimierung des Video-Signals, das dieser erhalten soll. Zusätzlich zu den Koordinaten des Fixpunktes können weitere Daten über den Empfänger der Bilder respektive dessen Geräte mit übertragen werden. Verwendet beispielsweise Betrachter B 1 Λ einen Bildschirm 3 λ mit geringerer Auflösung als der eines Computerbildschirms, wie ein Handydisplay oder ein Handheld, so kann die Auflösung des übertragenen Bildes darauf abgestimmt werden. Die Einrichtungen beider Benutzer sind äquiva- lent; die Kompression funktioniert für bilaterale Kommunikation optimal: Ein dritter Betrachter (ohne eigenen Bildschirm mit Kamera) mit einem anderen Fixpunkt nimmt das Bild mit der unscharfen Umgebung wahr. Die Bestimmung des Fixpunktes 9

muss nicht unbedingt (aber kann) aus dem Bild der Kamera 2 erfolgen, die die Bilder aufnimmt, die übertragen werden sollen. Erfindungsgemäss ist auch die Verwendung anderer Systeme, beispielsweise zusätzlicher Kameras oder Lasermessung zur Bestimmung des Fixpunktes 9.

Fig. 3 zeigt eine modifizierte Anordnung für das Verfahren bei mehr als zwei Teilnehmern. Bedingung für ein einwandfreies Funktionieren des Verfahrens ist, dass jeder Teilnehmer einen eigenen Bildschirm mit Kamera verwendet. Führen bei- spielsweise drei Betrachter A IIa, B IIb, und C 11c eine Konferenz, so wird der Bildschirm 13 jedes Betrachters 11 zweigeteilt und darauf die Bilder der jeweils anderen beiden Betrachter 11 in je einer Bildschirmhälfte dargestellt (Dargestellt in Fig. 3 auf dem Bildschirm 13a des Betrachters A IIa) . Die Koordinaten des Fixpunkts 19a des Betrachters A werden an die Empfänger 15b, 15c der anderen Teilnehmer übertragen. Fixiert der Betrachter A IIa einen Teil des Bildes des Betrachters B IIb, so wird dieses mit der beschriebenen Methode komprimiert und das Bild von Betrachter C 11c, das in diesem Moment nicht betrachtet wird, unscharf übertragen. Gegebenenfalls kann der Betrachter C 11c, dessen Bild gerade nicht betrachtet wird, auf seinem Bildschirm eine entsprechende Information erhalten. Jeder Betrachter 11 erhält ein auf ihn abgestimmtes Bild. Dies bedingt, dass der Computer lβa eines Teilnehmers A IIa über genügend Rechenleistung verfügen muss, um ein Bild für die anderen Betrachter B IIb und C llc nach den jeweiligen Fixpunkten 19b und 19c separat zu berechnen. Diese Bedingung gilt für die Computer der anderen Betrachter analog. Das oben beschriebene fixpunktadaptive Verfahren kann anderen Kompressionsverfahren überlagert werden. Beispielsweise kann ein veränderungsabhängiges Kompressionsverfahren (~100-fach) mit einem vektoriellen Gegenstand- serkennungs-Kompressionsverfahren (~20-fach) und dem fixpunk-

tadaptiven Kompressionsverfahren (>10-fach) kombiniert werden. So kann ein Fernsehbild, welches unkomprimiert 6 MHz Bandbreite benötigt, mit lediglich ~300 Hz Bandbreite übertragen werden (6000 kHz / 100 / 20 / 10 = 0.3 kHz). Bei der Verwendung eines veränderungsabhängigen Kompressionsverfahrens werden nur Bildteile übermittelt, die sich im Vergleich zum letzten Bild verändert haben. Bereiche, die einmal scharf übertragen und dargestellt wurden, können scharf bleiben, auch wenn der Betrachter 1 diese nicht mehr fixiert. Mit der Zeit werden so grossere Bereiche scharf dargestellt. Erst wenn eine erneute Übertragung eines Bereiches nötig wird, weil sich in diesem etwas wesentlich verändert hat, wird dieser, wenn er nicht gerade fixiert wird, wieder unscharf übertragen und dargestellt. Alternativ zur Verwendung eines Computerbildschirms mit Kamera können andere Systeme mit analogem Funktionsumfang verwendet werden, beispielsweise ein Handy mit eingebauter Kamera oder ein Headset. Die Verwendung eines Headsets eröffnet eine weitere interessante Möglichkeit, die bei der Verwendung ei- nes gewöhnlichen Bildschirmes viel mehr Aufwand erfordert: Bilder können so übertragen werden, dass beim Betrachter der Eindruck eines dreidimensionalen Bildes mit grossem Detailreichtum entsteht. Dies kann beispielsweise dadurch erreicht werden, dass zwei Displays 3 (oder ein zweigeteiltes Display 3) verwendet werden, die ähnlich wie Brillengläser angeordnet sind. Wird in einem Display 3 ein im Vergleich zum anderen leicht parallel verschobener Bildausschnitt dargestellt, entsteht durch die Art, wie das Menschliche Gehirn Bilder verarbeitet, der Eindruck einer dreidimensionalen Umgebung. Um ein möglichst realistisches dreidimensionales Bild zu erhalten, werden die beiden Bildausschnitte vorzugsweise von zwei, ungefähr mit Augenabstand (ca. 10cm) nebeneinander aufgestellten Kameras 2 aufgenommen. Eine Kamera 2 nimmt das Bild für

das linke Auge 7 (das auf dem linken Display 3 dargestellt wird) auf,- die andere das Bild für das rechte Auge 7. Durch den leicht unterschiedlichen Betrachtungswinkel der beiden Kameras 2, der dem menschlichen Sehen nachempfunden ist, ent- steht beim Zusammenfügen der beiden Bilder im Hirn des Betrachters 1 ein besonders realistischer, dreidimensionaler Eindruck. Die Darstellung kann auch auf andere Weise als auf zwei Displays erfolgen, Methoden zur Erzeugung von dreidimensionalen Eindrücken aus Bildern sind bekannt. Meist sind die- se jedoch mit Nachteilen wie erhöhtem technischem Aufwand und damit höheren Kosten oder Einbussen in der Bildqualität verbunden. Die oben beschriebene Anordnung mit einem Headset stellt eine verhältnismässig einfach zu realisierende Möglichkeit dar, andere technische Möglichkeiten sollen jedoch nicht ausgeschlossen werden. Dies gilt auch für die Aufnahme der entsprechenden Bilder: Der Effekt, dass aus zwei leicht unterschiedlichen Bildern der Eindruck einer dreidimensionalen Gestalt entsteht, kann technisch auch anders als mit zwei nebeneinander platzierten Kameras erzeugt werden, beispiels- weise durch den Einsatz von (beweglichen) Prismen oder Spiegeln. Wird der Abstand der Kameras erhöht, kann der Eindruck von mehr Tiefe erzeugt werden.

Die Verzerrung des Bildes des Gesichts, die entsteht, wenn eine Kamera 2 auf dem Headset nahe am Gesicht angebracht ist, kann softwaremässig oder auch optisch korrigiert werden. Die Kamera 2 oder die Kameras 2 müssen aber nicht auf dem Headset befestigt werden. Eine feststehende Kamera 2 etwas vom Benutzer 1 entfernt hat den Vorteil, dass auf dem Bild ein mehr oder weniger konstanter Hintergrund zu sehen ist, was die Kompression vereinfacht. Ausserdem entfällt die genannte Verzerrung des Bildes ganz oder ist zumindest weniger stark. Bei einer solchen Konfiguration ist es vorteilhaft, wie oben beschrieben, nicht die selben Kameras 2 für die Aufnahme der zu

übertragenden Bilder und für die Bestimmung des Fixpunktes 9 zu verwenden. Werden die Kameras oder die Kamera für die Bestimmung des Fixpunktes auf dem Headset angebracht, haben sie freie Sicht auf die Augen 7 des Betrachters 1. Sie können die Position der Pupillen und der Augachsen 8 aufnehmen, wodurch der Fixpunkt 9 auf den Displays 3 berechnet werden kann. Für die Bestimmung des Fixpunktes 9 können, wie bereits erwähnt, auch andere Methoden, wie die Messung der Positionen der Augachsen 8 mittels Laser, verwendet werden. Die etwas weiter entfernt angebrachte Kamera 2 liefert ein unverzerrtes Bild des Betrachters 1 mit dem Headset.

Werden für das erfindungsgemässe Verfahren fernsteuerbare Kameras 2 verwendet, kann sich ein Betrachter A 1, indem er die Kamera 2 bei seinem Video-Gesprächspartner B 1 Λ bewegt oder den Zoom verändert, auch in dessen Umgebung umschauen. So kann beispielsweise die Kamera auf ein Dokument gerichtet werden, das Betrachter B l λ Betrachter A 1 zeigen möchte, ohne dass Betrachter B 1 Λ dieses aufwändig und unbequem vor die Kamera 2 halten muss. Die Steuerung kann über die Erfassung des Fixpunktes 9 erfolgen, beispielsweise so, dass die Kamera 2 zu schwenken beginnt, wenn dieser Fixpunkt 9 eine gewisse Zeit am Rand des Bildes liegt, oder, wie von zahlreichen Webcams bekannt, über den Computer des Betrachters 1. Diese Möglichkeit stellt eine zusätzliche komfortable Option des er- findungsgemässen Verfahrens dar.




 
Previous Patent: AIMING DEVICE

Next Patent: VALVE, ESPECIALLY FOR A BREAST CUP SET