Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
TELECOMMUNICATION TERMINAL AND METHOD FOR CONTROLLING MEDIA STREAMS
Document Type and Number:
WIPO Patent Application WO/2019/034669
Kind Code:
A1
Abstract:
The invention relates to a telecommunication terminal (1), in particular a telephone, having at least one audio interface (13) for at least one microphone (49), at least one audio interface (12) for at least one loudspeaker (11), a user control unit (16) and at least one interface (3, 5, 8) for connection to at least one telephony- and/or IP-telephony-compatible terminal (2, 4, 6), wherein the telecommunication terminal (1) is in the form of a media hub for the at least one telephony- or IP-telephony-compatible terminal (2, 4, 6), wherein the telecommunication terminal (1) has a media processing unit (17) for mixing, and a media hub controller (9) for controlling, media streams received from the at least one telephony- or IP-telephony-compatible terminal (2, 4, 6), and wherein the at least one telephony- or IP-telephony-compatible terminal (2, 4, 6) is controllable using the user control unit (16) of the telecommunication terminal (1). Further, the invention relates to a method for controlling media streams using a media hub controller (9) integrated in a telecommunication terminal (1).

Inventors:
SCHMITZ ULRICH (DE)
Application Number:
PCT/EP2018/072069
Publication Date:
February 21, 2019
Filing Date:
August 14, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIFY PATENTE GMBH & CO KG (DE)
International Classes:
H04M1/253; H04M1/247; H04M3/42; H04M7/00
Foreign References:
EP1816830A12007-08-08
US20100260173A12010-10-14
Other References:
None
Attorney, Agent or Firm:
FRITZSCHE, Thomas (DE)
Download PDF:
Claims:
Ansprüche

Telekommunikationsendgerät (1 ), insbesondere Telefongerät, mit zumindest einer Audio-Schnittstelle (13) für zumindest ein Mikrophon (49), zumindest einer Audio-Schnittstelle (12) für zumindest einen Lautsprecher (1 1 ), einer Bedieneinheit (16) und zumindest einer Schnittstelle (3, 5, 8) zur Verbindung mit zumindest einem Telefonie- und/oder IP-Telefonie-fähigen Endgerät (2, 4, 6),

dadurch gekennzeichnet, dass

das Telekommunikationsendgerät (1 ) als Media-Hub zu dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät (2, 4, 6) ausgebildet ist,

- wobei das Telekommunikationsendgerät (1 ) eine Media-Processing- Einheit (17) zum Mischen von und einen Media-Hub-Controller (9) zum Steuern von von dem zumindest einen Telefonie- oder IP- Telefonie-fähigen Endgerät (2, 4, 6) empfangenen Mediaströmen aufweist, und

- wobei das zumindest eine Telefonie- oder IP-Telefonie-fähige Endgerät (2, 4, 6) über die Bedieneinheit (16) des Telekommunikationsendgeräts (1 ) bedienbar ist.

Telekommunikationsendgerät (1 ) gemäß Anspruch 1 ,

dadurch gekennzeichnet, dass

der Media-Hub-Controller (9) Medienströme, insbesondere Audioströme, zur Ausgabe über die Audio-Schnittstelle (12) an den zumindest einen Lautsprecher (1 1 ) steuert und/oder zur Ausgabe zu dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät (2, 4, 6) über die Schnittstelle (3, 5, 8).

Telekommunikationsendgerät (1 ) gemäß Anspruch 1 oder 2,

dadurch gekennzeichnet, dass der Media-Hub-Controller (9) LAN- und/oder W-LAN- und/oder USB- und/oder Bluetooth-fähig ist.

4. Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Media-Processing-Einheit (9) angepasst ist, um Medienströme zu mischen, und dass die Media- Processing-Einheit (18) weiterhin mit einer Transkribier-Funktion zum Umwandeln von Audioströmen in Textdaten ausgestattet ist.

Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass

der Media-Hub-Controller (9) über die Bedieneinheit (16) des Telekommunikationsendgeräts (1 ) steuerbar ist.

Telekommunikationsendgerät (1 ) gemäß Anspruch 5,

dadurch gekennzeichnet, dass der Media-Hub-Controller (9) über die

Bedieneinheit (16) konfigurierbar ist.

Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Telekommunikationsendgerät (1 ) ein VolP-, SIP- oder WebRTC-fähiges Telefon ist.

Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die Schnittstelle (3, 5, 8) eine USB- und/oder eine Bluetooth- und/oder eine Intranet- und/oder eine LAN und/oder W-LAN-Schnittstelle ist.

Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass das zumindest eine Telefon ie-fäh ige oder IP-Telefonie-fähige Endgerät (2, 4, 6) ein Personal Computer (6), ein Smartphone (2) und/oder ein Laptop (4) ist, welche über die Schnittstelle (3, 5, 8) mit dem Telekommunikationsendgerät (1 ) verbindbar sind, wobei auf dem Telefonie-fähigen oder IP-Telefon ie-fäh igen Endgerät (2, 4, 6) Media-Hub-Extension-Software (32) installiert ist.

10. Verfahren zum Steuern von Medienströmen über einen in ein Telekommunikationsendgerät (1 ) gemäß einem der Ansprüche 1 bis 9 integrierten Media-Hub-Controller (9), wobei das Verfahren die folgenden Schritte umfasst:

Verbinden von zumindest einem Telefonie- oder IP-Telefonie- fähigen Endgerät (2, 4, 6) mit dem Telekommunikationsendgerät (1 ) über eine Schnittstelle (3, 5, 8);

Empfangen von Mediaströmen von dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät (3, 5, 8) an dem Telekommunikationsendgerät (1 ),

Steuern der empfangenen Mediaströme durch den Media-Hub- Controller (9), um die Mediaströme an zumindest eine Audio-

Schnittstelle (12, 14, 15) des Telekommunikationsendgeräts (1 ) weiterzuleiten, um die Mediaströme über einen an die Audio- Schnittstelle (12, 14, 15) angeschlossenen Lautsprecher (1 1 , 13, 10) auszugeben, und

- Steuern des zumindest einen Telefonie- oder IP-Telefonie-fähigen

Endgeräts (2, 4, 6) über eine Bedieneinheit (16) des Telekommunikationsendgeräts (1 ).

Description:
Telekommunikationsendgerät und

Verfahren zum Steuern von Medienströmen

Beschreibung

Die Erfindung betrifft ein Telekommunikationsendgerät gemäß dem Oberbegriff des Anspruchs 1 sowie ein Verfahren zum Steuern von Medienströmen über einen in ein Telekommunikationsendgerät integrierten Media-Hub-Prozessor.

In Büros und anderen Arbeitsumgebungen bzw. Arbeitsplätzen sind Telefone das zentrale Kommunikationsgerät auf dem Schreibtisch. Neben dem regulären Analog- oder ISDN-Telefon beziehungsweise den herkömmlichen Telefonie- Diensten wird an Arbeitsplätzen heutzutage auch vermehrt IP-Telefonie (Internet-Protokoll-Telefonie) verwendet, welche das Telefonieren über Rechnernetze erlauben. Hierzu dienen beispielsweise VolP-Applikationen, welche z. B. auf Desktop- oder Laptop-Computern installiert sind und auf diesen laufen. Es kommt häufig vor, dass neben dem Desktop-Telefon VolP bzw. Video-over-IP Clients parallel auf Desktop- oder Laptop-Computern verwendet werden. Daher werden üblicherweise sowohl das Desktop-Telefon als auch der Computer mit einer zusätzlichen Freisprecheinrichtungen mit Digital Enhanced Cordless Telecommunications (DECT)-Headsets verbunden, welche automatisch zwischen Telefon- und PC-Modus umschalten.

Kopfhörer bzw. Headsets sind jedoch oft von nur schlechter Audioqualität und darüber hinaus für den Benutzer unangenehm, da er diese mehr oder weniger ständig tragen muss. Daher ist es die Aufgabe der vorliegenden Erfindung, ein Telekommunikationsendgerät bereitzustellen, welches als Audio-Quelle und Audio-Senke (-Sink) dient, so dass beispielsweise auf einem Computer empfangene VolP-Gespräche über die Lautsprecher des Telekommunikationsendgeräts ausgegeben werden und die Notwendigkeit zusätzlicher Kopfhörer eliminiert wird.

Diese Aufgabe wird erfindungsgemäß durch ein Telekommunikationsendgerät mit den Merkmalen gemäß Anspruch 1 sowie durch ein Verfahren zum Steuern von Medienströmen über einen in ein Telekommunikationsendgerät mit den Merkmalen gemäß Anspruch 10 gelöst. Bevorzugte Weiterbildungen des erfindungsgemäßen Gegenstands sind in den Unteransprüchen definiert.

Dementsprechend wird gemäß der vorliegenden Erfindung ein Telekommunikationsendgerät bereitgestellt, insbesondere Telefongerät, mit zumindest einer Audio-Schnittstelle mit zumindest einem Mikrophon, zumindest einer Audio-Schnittstelle mit zumindest einem Lautsprecher, einer Bedieneinheit und zumindest einer Schnittstelle zur Verbindung mit zumindest einem Telefonie- und/oder IP-Telefonie-fähigen Endgerät, wobei das Telekommunikationsendgerät als Media-Hub zu dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät ausgebildet ist, wobei das Telekommunikationsendgerät eine Media-Processing-Einheit zum Mischen von und einen Media-Hub-Controller zum Steuern von von dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät empfangenen Mediaströmen aufweist, und wobei das zumindest eine Telefonie- oder IP-Telefonie-fähige Endgerät über die Bedieneinheit des Telekommunikationsendgeräts bedienbar ist. Mittels des erfindungsgemäßen Telekommunikationsendgeräts, welches insbesondere als Telefongerät ausgebildet ist, können dessen qualitativ hochwertige Lautsprecher auch zur Ausgabe von Audioströmen parallel genutzter Telefonie- oder IP-Telefonie-fähigen Endgeräte genutzt werden, ohne dass hierzu zusätzliche Headsets, redundante Lautsprecher oder Mikrophone notwendig sind, was allgemein die Kosten reduziert. Beispielsweise kann ein VolP-Telefonat über einen Desktop- oder Laptop-Computer über die Lautsprecher des Telefongeräts mit einer sehr guten Tonqualität ausgegeben werden. Das Telefon ist gemäß der Erfindung mit einem Media-Hub-Controller ausgestattet wirkt dabei als universeller Media-Hub mit einer übergreifenden Media-Hub-Funktionalität, während es aber dennoch als normales Telefon (z. B. SIP-Telefon) genutzt werden kann. Die hierzu notwendigen Hard- und Software-Erweiterungen, insbesondere der Media-Hub-Controller und die Media-Procesing-Einheit sowie entsprechende Software, sind in das Telefongerät integriert. Medienströme sind über den Media-Hub universell steuerbar, wobei das Telefongerät als Media-Quelle und als Media-Senke dient, mit der sich verschiedene Endgeräte, z. B. ein PC oder ein Smartphone, verbinden können. Medienströme, z. B. Audioströme, können in das Telefongerät fließen oder aus diesem heraus in Richtung zu den damit verbindbaren oder verbundenen Endgeräten. Verbundene Audio-Quellen- /Senken können z. B. Smartphones, Tablet PCs oder PC-Workstations oder Laptops sein. Auch Kopfhörer können zusätzlich mit dem erfindungsgemäßen Telefongerät verbunden werden. Es sei angemerkt, dass nicht nur ein einziges Endgerät mit dem Telefongerät verbindbar ist sondern vielmehr gleichzeitig mehrere Endgeräte mit dem Telefongerät verbunden werden können. Das erfindungsgemäße Telefongerät kontrolliert bzw. steuert dann alle verbundenen Audio-Quellen bzw. Audio-Senken und entscheidet, welcher Medien- bzw. Audio-Strom von welchem Endgerät wie bearbeitet wird (z. B. gemischt wird durch die Media-Processing-Einheit oder weitergeleitet durch den Media-Hub- Controller).

Besonders vorteilhaft ist dabei, dass die Bedieneinheit des Telefongeräts gewissermaßen als Fernbedienung für die parallel genutzten Telefonie- oder IP-Telefonie-fähigen Endgeräte dient, da sich diese über das Eingabefeld der Bedieneinheit steuern lassen. Hierzu kann die Bedieneinheit entsprechend erweitert werden, so dass der Benutzer über die Bedieneinheit steuern kann, welche Endgeräte beispielsweise als Media-Senke und welche als Media- Quelle dienen. Beispielsweise kann die Bedieneinheit ein graphisches Touch- Bedienfeld mit einer entsprechenden Menüstruktur umfassen, über die der User diese Media-Quellen und Media-Senken steuert.

Gemäß einer bevorzugten Ausführungsform steuert der Media-Hub-Controller Mediaströme, insbesondere Audioströme oder Videoströme, zur Ausgabe über den Audio-Ausgang an den zumindest einen Lautsprecher und/oder zur Ausgabe zu dem zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgerät über die Schnittstelle. Neben Audio- und Videoströmen ist der Media- Hub-Controller angepasst, jegliche andere Art von Mediaströmen, wie beispielsweise Textnachrichten, zu steuern.

Gemäß einer weiteren bevorzugten Ausführungsform ist der Media-Hub- Controller LAN- und/oder W-LAN- und/oder USB- und/oder Bluetooth-fähig, so dass eine universelle Media- oder Audio-Quelle und Media- oder Audio-Senke realisiert wird.

Vorzugsweise ist die Media-Processing-Einheit angepasst, um Medienströme zu mischen, und dass die Media-Processing-Einheit weiterhin mit einer Transkribier-Funktion zum Umwandeln von Audioströmen in Textdaten ausgestattet ist. Auch die Media-Processing-Einheit ist angepasst, um universell betreibbar zu sein. Die Transkribier-Funktion ist generell möglich, sobald ein verbundenes Endgerät aktiv ist. Zum Beispiel, wenn ein Smartphone, welches ein Pairing mit dem Telefongerät ausgeführt hat, einen aktiven Anruf ausführt und dieser Audio-Strom dabei zum Telefongerät geleitet wird, dann kann ein weiteres mit dem Telefongerät verbundenes Endgerät, beispielsweise ein PC oder ein Laptop, diesen Audio-Strom über das Telefongerät empfangen und aufnehmen und/oder transkribieren, d. h. in Textform umgewandelt. Dies kann beispielsweise derart erfolgen, dass eine an dem Telefongerät hierfür vorgesehene Taste während eines Anrufs gedrückt wird, wodurch das Telefongerät dann den gemischten Audio-Strom zum verbundenen Endgerät oder zu mehreren verbundenen Endgeräten umleitet und dort aufgenommen und/oder transkribiert wird. Die aufgenommene Datei kann mit allen Verbindungsdetails des Gesprächs, welche ebenfalls vom Telefongerät kommen, archiviert werden. Das Transkribieren kann mit einem zusätzlichen Transkribier-Dienst (z. B. Nuance NDEV oder Google Speech) ausgeführt werden und der erzeugte Text kann mit in das Aufnahme-Archiv neben der Aufnahme und den Verbindungs-Details abgelegt bzw. gespeichert werden. Die Transkribier-Funktion ist besonders vorteilhaft für behinderte Menschen, da der auf der Gegenseite gesprochene Text (also der empfangene Audio-Strom) auf dem Bildschirm des PCs oder Laptops in Textform angezeigt werden kann. Dies erleichtert insbesondere schwerhörigen oder tauben Menschen die Kommunikation über Telefongeräte.

Es ist darüber hinaus vorteilhaft, wenn auch der Media-Hub-Controller über eine Bedieneinheit des Telefongeräts steuerbar ist.

Ebenso vorteilhaft ist es, wenn der Media-Hub-Controller über die Bedieneinheit konfigurierbar ist. Das Telekommunikationsendgerät bzw. Telefongerät kann ein VolP-, SIP- oder WebRTC-fähiges Telefon sein. Um WebRTC-Dienste, wie Cloud-Dienste zum Realisieren von Telefon konferenzen über Intranet/Internet (z. B. Circuit), umzusetzen, kann das Telekommunikationsendgerät mit einer erweiterten Funktionalität ausgestattet sein. Das Telekommunikationsendgerät bzw. Telefongerät wird hierbei zunächst, wie oben beschrieben, als„Sound-Device", d. h. zur Ausgabe eines Audiostroms, welcher von einem verbundenen Endgerät empfangen wird, genutzt. Zusätzlich kann sich das Telefongerät aber auch als„User" (z. B. Circuit-User) eines Cloud-Kommunikationsdienstes in der entsprechenden Cloud mit den Zugangsdaten des Besitzers des Telefongeräts anmelden (z. B. Circuit-Cloud). Dann wird das Telefongerät bei Anrufen von der in der Cloud bereitgestellten Telekommunikationsplattform ebenfalls läuten, obwohl beispielsweise der verbundene PC oder Laptop keine aktive Sitzung (z. B. Circuit-Sitzung) hat. Hierdurch wird es dem Benutzer des Telefongeräts erleichtert, einer Konversation über die Telekommunikationsplattform beizutreten bzw. diese nicht zu verpassen, da der entsprechende PC oder Laptop, über den diese normalerweise stattfinden würde, nicht aktiv ist. Das Telefongerät kann somit bei Cloud-basierten Anrufen (wie z. B. über Circuit) genauso läuten, wie es bei VolP oder SIP-Anrufen der Fall ist und es kann ebenso leicht bedient werden, nämlich über die Bedien-Einheit des Telefongeräts und normales Annehmen des Gesprächs, Auflegen, Parken etc. Gemäß einer Ausführungsform kann das Telefongerät ein Display aufweisen, in dem dann bei einem Cloud-basierten Anruf eine andere Adress-Information angezeigt wird (z. B. der Circuit-Konversationsname mit einem Hinweis, dass es sich jetzt um einen Circuit-WebRTC-Anruf handelt; dies kann z. B. durch ein entsprechendes Symbol angezeigt werden). Im Fall dass der Benutzer jetzt zusätzlich eine Cloud-basierte Sitzung (z. B. eine Circuit-Sitzung) auf seinem PC, Laptop oder Smartphone oder dergleichen startet, dann wird ihm dort auch angezeigt, dass eine bereits aktive Circuit-RTC-Sitzung läuft; diese ist dabei auch parallel vom PC, Laptop oder Smartphone steuerbar.

Vorzugsweise ist die Schnittstelle eine USB- und/oder eine Bluetooth- und/oder eine Intranet- und/oder eine LAN und/oder W-LAN-Schnittstelle. Das zumindest eine Telefon ie-fäh ige oder IP-Telefonie-fähige Endgerät kann ein Computer, ein Smartphone und/oder ein Laptop sein, welche über die Schnittstelle mit dem Telefongerät verbindbar sind, wobei auf dem Telefonie- fähigen oder IP-Telefonie-fähigen Endgerät Media-Hub Software installiert ist. Erfindungsgemäß bereitgestellt wird darüber hinaus ein Verfahren zum Steuern von Medienströmen über einen in ein Telekommunikationsendgerät integrierten Media-Hub-Controller, wobei das Verfahren die folgenden Schritte umfasst: Verbinden von zumindest einem Telefonie- oder IP-Telefonie-fähigen Endgerät mit dem Telekommunikationsendgerät über eine Schnittstelle; Empfangen von Mediaströmen von dem zumindest einen Telefonie- oder IP- Telefonie-fähigen Endgerät an dem Telekommunikationsendgerät, Steuern der empfangenen Mediaströme durch den Media-Hub-Controller, um die Mediaströme an zumindest einen Audio-Ausgang des Telekommunikationsendgeräts weiterzuleiten, um die Mediaströme über einen an den Audio-Ausgang angeschlossenen Lautsprecher auszugeben, und Steuern des zumindest einen Telefonie- oder IP-Telefonie-fähigen Endgeräts über eine Bedieneinheit des Telekommunikationsendgeräts. Das erfindungsgemäße Verfahren bietet alle oben bereits beschriebenen Vorteile. Weitere Merkmale, Aufgaben, Vorteile und Einzelheiten der vorliegenden Erfindung werden aus der nachstehenden Beschreibung konkreter Ausführungsbeispiele und ihrer zeichnerischen Darstellung in den beigefügten Figuren noch deutlicher werden. Es versteht sich, dass Merkmale, Aufgaben, Vorteile und Einzelheiten einzelner Ausführungsbeispiele auf andere Ausführungsbeispiele übertragbar sind und auch im Zusammenhang mit den anderen Ausführungsbeispielen als offenbart gelten sollen, soweit dies nicht aus technischen oder naturgesetzlichen Gründen offensichtlich abwegig ist. In diesem Sinne können Merkmale verschiedener Ausführungsbeispiele grundsätzlich stets miteinander kombiniert werden, und die Kombination kann ebenfalls als Ausführungsbeispiel der Erfindung verstanden werden.

Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele und mit Hilfe der Figur näher beschrieben. Dabei ist

Fig. 1 eine schematische Darstellung eines Telekommunikationsendgeräts gemäß einer Ausführungsform der Erfindung;

Fig. 2 ein Blockschaltbild eines Telekommunikationsendgeräts gemäß einer Ausführungsform der Erfindung; und

Fig. 3 ein Sequenzdiagramm für einen Anruf von einem Smartphone; und

Fig. 4 ein weiteres Sequenzdiagramm für einen WebRTC-Anruf und weitere VolP- und Smartphone-Anrufe.

Fig. 1 ist eine schematische Darstellung eines Telekommunikationsendgeräts 1 gemäß einer Ausführungsform der Erfindung. Wie hier erkennbar ist, können sich verschiedene Endgeräte, Anwendungen oder Dienste (Services), die auf Endgeräten ausgeführt werden, mit dem Telekommunikationsendgerät 1 , im Folgenden Telefongerät 1 genannt, auf verschiedene Arten verbinden. In der hier gezeigten Konfiguration ist es ein Smartphone 2, welches sich über eine Bluetooth-Verbindung 3 mit dem Telefongerät 1 verbindet, ein Laptop 4, welches sich über eine USB-Verbindung 5 mit dem Telefongerät 1 verbindet, ein PC 6, welcher sich über das Internet 7, entweder per LAN-Verbindung oder Wireless-LAN-Verbindung 8 mit dem Telefongerät 1 verbindet, sowie ein Web- RTC-basierter Cloud-Service 44, hier„Circuit", welcher sich ebenfalls über das Internet 7, entweder per LAN-Verbindung oder W-LAN-Verbindung 8 mit dem Telefongerät 1 verbindet bzw. verbindbar ist, um so die Media-Hub-Funktionen des Media-Hub-Controllers 9, welcher in das Telefongerät 1 integriert ist, zu nutzen.

Das Telefongerät 1 weist - wie gewohnt - einen Telefon-Hörer 10 auf, welcher einen integrierten Lautsprecher und ein integriertes Mikrophon aufweist, einen Raum-Lautsprecher 1 1 sowie ein Raum-Mikrophon 12 für das sogenannte Lauthören und Freisprechen ohne Nutzung des Hörers 10. Weiterhin kann ein Headset bzw. Kopfhörer 48 mit dem Telefongerät 1 verbunden werden, um als dritte Möglichkeit eines Lautsprecher/Mikrophon-Paares genutzt zu werden.

Hinsichtlich der hier mit dem Telefongerät 1 verbundenen Endgeräte verhält sich der Media-Hub bzw. der Media-Hub-Controller 9 des Telefongeräts 1 wie ein „virtuelles Sound-System". Audio-Playback von von den verbundenen Endgeräten empfangenen Audio-Strömen findet auf dem Telefongerät 1 statt - entweder per Telefon-Hörer 10, was beispielsweise in einem Großraumbüro den Vorteil hat, dass Andere nicht gestört werden - oder über das Headset 13 oder über den Raum-Lautsprecher 1 1 . Welcher der Audio- oder Lautsprecher- Ausgänge 12, 13, 14, 15 gewählt wird, kann über den Media-Hub-Controller 9 gewählt oder vorausgewählt werden bzw. über eine entsprechende den Media- Hub-Controller 9 ansteuernde Bedien-Einheit 16 des Telefongeräts 1 eingegeben werden oder es findet implizit statt, beispielsweise durch Abheben des Telefon-Hörers 10. Im Fall, dass mehrere Abspielvorgänge parallel aktiv sind, können diese über eine in das Telefongerät 1 integrierte Media- Processing-Einheit (siehe Fig. 2) gemischt und parallel abgespielt werden.

Auch ist es möglich, dass eines der Mikrophone des Telefongeräts 1 , beispielsweise das Mikrophon 49, als Spracheingabeeinrichtung genutzt wird. Diese aufgenommenen Audio-Ströme fließen dann zu allen verbundenen Endgeräten 2, 4, 6 und können dort zum Aufzeichnen, zum Telefonieren (z. B. mittels des Smartphones 2 oder über den Cloud-Service 44) oder für andere Media-Hub-Zusatzfunktionen, wie beispielsweise das Aufzeichnen („recording") oder Transkribieren auf dem PC 6 oder Laptop 4, genutzt werden. Im Falle der Verwendung eines mit dem Telefongerät 1 über die Bluetooth- Verbindung 3 verbundenen Smartphones 2 kann das Telefongerät 1 zur Anrufsteuerung des über das Smartphone 2 empfangenen Anrufs dienen. Hierzu wird das sogenannte„hands-free-profile" von Bluetooth genutzt, d. h. ein Auflegen, Läuten, Annehmen von Anrufen über das Smartphone 2 kann an dem Telefongerät 1 erfolgen.

Im Falle, dass ein WebRTC-basierter Cloud-Service 44, beispielsweise „Circuit", auf dem PC 6, dem Laptop 4 oder dem Smartphone 2 verwendet wird, so dient das Telefongerät 1 auch über die Funktion des „virtuellen Sound- Systems", welche oben bereits erwähnt wurde, als Verstärker/Lautsprecher/Mikrophon-Einheit. Es ist weder ein zusätzliches PC- Headset erforderlich noch ist eine Lautsprecher/Mikrophon-Einheit hierzu erforderlich. Anrufe, welche z. B. über den Cloud-Service (z. B. Circuit) 44 empfangen werden, können wie normale VolP-Anrufe an dem Telefongerät 1 signalisiert werden und können auch von dort direkt angenommen und durchgeführt als auch beendet werden.

Sollte ein aktives Gespräch, wie beispielsweise ein WebRTC-Anruf über „Circuit" vorliegen, so können weitere eintreffende Anrufe der anderen Endgeräte, beispielsweise des Smartphones 2 oder des Telefongeräts 1 selber als besetzt signalisiert werden. Im Falle, dass man einen eingehenden Anruf annimmt, entsteht faktisch eine geräteübergreifende Konferenz-Sitzung und die Daten werden auf der Media-Processing-Einheit (siehe Fig. 2) entsprechend gemischt und jeweils über den Media-Hub-Controller 9 weitergeleitet.

Das Telefongerät 1 kann sich aber auch - ohne PC 6 oder Laptop 4 oder dergleichen - mit„Circuit" verbinden und damit Circuit-RTC-Anrufe ausführen oder entgegen nehmen. Dies hat den Vorteil, dass man nicht erst eine Circuit- Session auf dem PC 6 oder Laptop 4 starten muss, beispielsweise weil dieser noch ausgeschaltet ist und es wird kein Circuit-Anruf mehr hierdurch verpasst. Loggt sich der Benutzer nun parallel von einem Laptop 4 oder PC 6 in„Circuit" unter seinen Zugangsdaten ein, kann er sowohl von hier als auch von dem Telefongerät 1 die laufende Circuit-RTC-Session steuern, beispielsweis Stummschalten, Auflegen etc.

Weiterhin kann auf dem PC 6 oder Laptop 4 oder dem Smartphone 2 weitere „Media-Hub"-Software installiert sein, welche Zusatzfunktionen übernehmen kann. Beispielsweise kann dort eine Aufnahmefunktion genutzt werden, die man bei Gebrauch leicht über die Bedieneinheit 16, welche zu diesem Zweck entsprechend erweitert ist, am Telefongerät 1 aktivieren oder stoppen kann. Die Aufnahmen werden in einem Media-Hub-Archiv für die spätere Nutzung abgelegt. Das Telefongerät 1 liefert neben den Audio-Daten weiterhin die Sprachverbindungsdetails inclusive verbundener Teilnehmer-/Namen/Nummern und Uhrzeiten etc. Ein weiterer Zusatzdienst der Media-Hub-Software kann auf der PC- 6, Laptop- 4 oder Smartphone- 2 -Seite das sogenannte Transkribieren, also das Umwandeln von Audio-Strömen in Textdaten, sein. Hierbei wird der gesprochene Audio-Strom mithilfe von externen Transcribing- Dienstleistern (z. B. "Nuance NDEV" oder "Google Cloud Speech") in Textform umgewandelt. Ähnlich wie beim Aufzeichnen kann dieses leicht über die hierzu erweiterte Bedien-Einheit 16 des Telefongeräts 1 an diesem gestartet und gestoppt werden. Dieser erzeugte Text kann gemeinsam mit der Aufnahme in ein entsprechendes Dateiformat abgelegt und archiviert werden. Hierzu eignen sich beispielsweise MP4 oder MKV.

Für das leichtere Suchen von Informationen kann der so transkribierte Text sehr hilfreich sein. Auch ist es z. B. für schwerhörige Menschen von Vorteil, wenn der transkribierte Text eines Telefonats gleichzeitig auch auf einem Display, beispielsweise auf einem Display 17 des PCs 6, angezeigt wird, so dass es dem schwerhörigen Menschen durch gleichzeitiges Lesen des angezeigten Textes leichter fällt, der Unterhaltung zu folgen.

Selbstverständlich ist es auch möglich, dass alle angeschlossenen bzw. mit dem Telefongerät 1 verbundenen Endgeräte diese Dienste nutzen können. Beispielsweise kann der Anruf eines Smartphones 2, welches per Bluetooth- Verbindung 3 mit dem Media-Hub-Controller 9 und der Media-Processing- Einheit 18 (siehe Fig. 2) des Telefongeräts 1 verbunden ist, auf dem ebenfalls angeschlossenen PC 6 oder Laptop 4 aufgenommen oder transkribiert werden. Das heißt, hierbei würden die Audio-Ströme von dem Smartphone 2 über das Telefongerät 1 bis zu dem PC 6 oder Laptop 4 weitergeleitet und dort dann aufgenommen werden.

Startet man dagegen auf dem mit dem Telefongerät 1 verbundenen PC 6 einen Audio-Abspielvorgang, wie beispielsweise das Abspielen eines Hörbuches, und startet auf dem Smartphone 2 die Media-/Audio-Hub-Zusatzfunktionen, wie oben beschrieben, dann würde dort eine Transkribierung erfolgen und gegebenenfalls angezeigt werden.

Fig. 2 ist ein Blockschaltbild eines Telekommunikationsendgeräts bzw. Telefongeräts 1 gemäß einer Ausführungsform der Erfindung. Bei der hier dargestellten Konfiguration erfolgt die gesamte Ablaufsteuerung von der erweiterten Bedien-Einheit 16. Der Benutzer kann diverse Funktionen des als Media-Hub oder Media-Bridge ausgebildeten Telefongeräts 1 über die Bedieneinheit 16 steuern, z. B. können die Endgeräte 2, 4, 6, welche entweder als Media-Quellen 21 oder Media-Senken 25 fungieren können, einzeln aktiv oder passiv geschaltet werden, beispielsweise mittels einer graphischen Bedienung auf einem Touchscreen der Bedien-Einheit 16. Die Bedien-Einheit 16 umfasst dabei Tasten und ein Display zum Anzeigen von Funktionen und beispielsweise auch zum Bedienen des Telefongeräts 1 , wenn das Display z. B. als Touch-Screen ausgebildet ist. Die über die Bedien-Einheit 16 steuerbaren Funktionen sind unter anderem„Start" und„Stopp" einer Audio-Aufnahme und einer Text-Transkribierung. Ebenfalls ist über die Bedieneinheit steuerbar oder einstellbar, ob Audio-Signale geblockt werden oder ob sie in der Media- Processing-Einheit 18 gemischt werden sollen, was z. B. der Fall sein kann, wenn zwei oder mehr Media-Quellen 21 parallel aktiv sind. Hierbei fungiert das Telefongerät 1 faktisch auch als eine Art von Konferenz- Brücke zwischen verschiedenen angeschlossenen Geräten, wie der PC 4 oder das Laptop 6, ein Smartphone 2 oder 2' etc., wobei die integrierte Telefon- Funktion der Telefon-Einheit und die Circuit-Client Funktion der Circuit- Controller-Einheit 20 auch als verbundene Endgeräte angesehen werden können.

Der Media-Hub des Telefongeräts 1 besteht aus einem Media-Hub-Controller 9 und einer Media-Processing-Einheit 18. Der Media-Hub-Controller 9 übernimmt dabei die gesamte Logik und steuert die Medien-Ströme, wie beispielsweise Audio-Ströme oder Video-Ströme. Weiterhin steht er logisch in Kontakt mit den verbundenen Endgeräten 4, 6, 2 und 2' und gibt in diese Richtung Befehle ab bzw. empfängt von dort Kommandos und Ereignisse. Die Circuit-Controller- Einheit 20 regelt die Verbindung in das Circuit-System. Der Media-Hub- Controller 9 wird über die erweiterte Bedien-Einheit 16 konfiguriert bzw. auch - wie oben bereits beschrieben - gesteuert. Die Audio-Ströme sowie Kommandos und Ereignisse von/zu den angeschlossenen Endgeräten 2, 2', 4 und 6 werden über die LAN-/USB-/Bluetooth-Controller (LAN-Controller und Treiber 22, USB-Controller und Treiber 23, Bluetooth-Controller und Treiber 24) inklusive der jeweiligen entsprechenden Treiber versendet und empfangen.

Weiterhin im Telefongerät 1 umfasst sind die durch das Bezugszeichen 25 gekennzeichneten Media-Senken.

Der mit dem Telefongerät 1 verbundene PC 6 oder Laptop 4 ist ebenfalls mit einem LAN-/USB-/Bluetooth-Controller (LAN-Controller und Treiber 26, USB- Controller und Treiber 27, Bluetooth-Controller und Treiber 28), einem Media- Hub-Treiber 29, einem Sound-System 30 einer Media-Hub-ExtensionSoftware 32 zum Aufzeichnen und Transkribieren ausgestattet.

Fig. 3 ist ein Sequenzdiagramm für einen Anrufs von einem Smartphone 2, welcher per„Media-Hub" gesteuert wird und über eine Media-Hub-ExtensionSoftware 32 auf einer verbundenen PC-Workstation 6 transkribiert und archiviert wird.

Dabei führt das Smartphone 2 zunächst ein Pairing mit dem Telefongerät 1 durch und zwar über die Bluetooth-Verbindung 3 mit dem Media-Hub-Controller 9, welcher in das Telefongerät 1 integriert ist. Der Media-Hub-Controller 9 führt dann ein Paihng mit dem PC 6 durch und zwar über die LAN-Verbindung 8 mit der Media-Hub-Extension-Software 32, welche auf dem PC 6 installiert ist.

Sobald von dem Smartphone 2 ein neuer ankommender Anruf 33 signalisiert wird, veranlasst der Media-Hub-Controller 9 ein Läuten über einen Klingelton 34, welcher an dem Lautsprecher 14 des Telefongeräts 1 ausgegeben wird. Gleichzeitig wird der ankommende Anruf 33 der erweiterten Bedien-Einheit 16 signalisiert, woraufhin eine Annahme des ankommenden Anrufs über die erweiterte Bedien-Einheit 16 des Telefongeräts 1 erfolgt, beispielsweise durch Abnehmen des Hörers 10 (siehe Fig. 1 ). Nach dem Annehmen des Anrufs werden Audio-Daten von dem Smartphone 2 zu dem Media-Hub-Controller 9 und von dem Medial-Hub-Controller 9 zu dem Smartphone 2 geleitet.

Dann startet der Media-Hub-Controller 9 eine Transkriptions-Session 35 auf dem PC 6 über die dort installierte Media-Hub-Extension-Software 32. Diese initiiert einen Media-Hub-Transcriber-Service 36, welcher auf einen Cloud- Transkription-Service 31 zugreift. Die von dem Smartphone 2 an dem Media- Hub-Controller 9 empfangenen Audio-Daten 37 sowie Anruf-Details 38 werden von dort an die Media-Hub-Extension-Software 32 des PCs 6 weitergleitet, wo durch die Media-Hub-Extension-Software 32 dann eine Archivdatei 39 für die Audio-Daten mit Anruf-Details angelegt wird. Die in der Archivdatei abgelegten Daten werden dann dem Cloud-Transkription-Service 31 weitergeleitet, welcher die Audio-Daten transkribiert, d. h. in Textdaten umwandelt und transkribierte Sätze 1 , 2, ...N 40 an den PC 6 übertragt, wo die transkribierten Sätze 1 , 2, ... N auf einem Monitor 41 des PCs 6 angezeigt werden und durch den Media- Hub-Transcriber-Service 36 archiviert werden.

Ein Beenden dieses Prozesses erfolgt beim Beenden 42 des Anrufs über die erweiterte Bedieneinheit 16 des Telefongeräts 1 , beispielsweise durch Auflegen des Hörers 10 (siehe Fig. 1 ), was den am Smartphone 2 angekommenen Anruf beendet. Gleichzeitig gibt der Media-Hub-Controller 9 einen Befehl an den Media-Hub-Transcriber-Service 36 des PCs 6, die Transcription-Session zu beenden, woraufhin der Media-Hub-Transcriber-Service 36 auch einen Befehl an den Cloud-Transcription-Service 31 ausgibt, die Session zu beenden. Fig. 4 ist ein weiteres Sequenzdiagramm für einen WebRTC-Anruf eines Cloud-Services 44 (Cloud WebRTC-Service) und weiterer VolP- und Smartphone-Anrufe. Hier ist dargestellt, wie ein Circuit-RTC-Anruf mittels des Telefongeräts 1 bedient wird und wie weitere Anrufe per SIP oder Smartphone als besetzt abgewiesen werden können bzw. alternativ auch angenommen und auf dem Telefongerät 1 in der Media-Processing-Einheit 17 gemischt werden können. Auch hier findet zunächst ein Pairing des Smartphones 2 über eine Bluetooth- Verbindung 3 mit dem Telefongerät 1 über dessen Media-Hub-Controller 9 statt, woraufhin ein Pairing des Telefongeräts 1 von dessen Media-Hub- Controller 9 mit dem PC 6 über dessen Media-Hub-Extension-Software 32 stattfindet. Daraufhin registriert sich ein virtueller Sound-Treiber 43 des PCs6 an der Media-Hub-Extension-Software 32. Über einen Cloud-basierten WebRTC-Service 44 wird ein eingehender Anruf an einem WebRTC-Browser 45 des PCs 6 an dem PC 6 angenommen und die Media-Hub-Extension- Software 32 wird über den ankommenden und angenommenen Anruf informiert. Die Media-Hub-Extension-Software 32 informiert dann den Media- Hub-Controller 9 des Telefongeräts 1 über den angenommenen WebRTC-Anruf und der Media-Hub-Controller 9 informiert einen WebRTC Controller 46 bzw. Circuit/Web RTC Controller 46 über den angenommenen Anruf. Die Details des Anrufs werden daraufhin auf einem Display, welches beispielsweise Bestandteil der erweiterten Bedien-Einheit 16 des Telefongeräts 1 sein kann, angezeigt. Gleichzeitig wird von dem Telefongerät 1 ein Besetzt-Signal ausgegeben.

Der WebRTC-Browser 45 des PCs 6 gibt dann aufgenommene Audio-Daten (sound playback) des WebRTC-Anrufs an den virtuellen Sound-Treiber 43 weiter, von wo aus diese Daten an die Media-Hub-Extension-Software 32 weitergegeben werden und von dort an den Media-Hub-Controller 9 des Telefongeräts 1 , an welchem sie dann über den Lautsprecher 14 ausgegeben werden. An dem Mikrophon 12 des Telefongeräts 1 werden ebenfalls Audio- Ströme empfangen und an den Media-Hub-Controller 9 weitergeleitet, welcher diese dann an die Media-Hub-Extension-Software 32 des PCs 6 weiterleitet, von wo sie an den virtuellen Sound-Treiber 43 und von dort als Mirkophonausgabe an den WebRTC-Browser 45 weitergeleitet werden. Während dieses Vorgangs, d. h. während des aktiven Anrufs, an welchem das das Telefongerät 1 und der PC 6 über den WebRTC-Service 44 beteiligt sind, geht ein weiterer Anruf von dem SIP-Telefon 47 ein (es kann ebenfalls ein VolP-Telefon oder eine PBX sein) ein (SIP INVITE), welcher an den Media- Hub-Controller 9 weitergeleitet wird. Dieser fragt dann an dem WebRTC- Controller 46 den Status ab, woraufhin dieser ein „besetzt" signalisiert. Der Media-Hub-Controller 9, welcher das „besetzf'-Signal empfängt, gibt dieses entsprechend (486-BUSY) an das SIP-Telefon 47 weiter.

Das gleiche Procedere findet statt, wenn auf dem Smartphone 2 ein Anruf eingeht; dieser wird dem Media-Hub-Controller 9 signalisiert, der fragt wiederum an dem WebRTC-Controller 46 den Status ab und bekommt ein „besetzt" signalisiert, was er als„besetzt" an dem Smartphone 2 signalisiert, um am Smartphone 2 eingehenden Anruf abzulehnen. Das Beenden des WebRTC-Anrufs kann der Benutzer über die Bedien-Einheit 16 am Telefongerät, beispielsweise durch Drücken einer Taste oder durch Auflegen des Hörers 10, ausführen. Daraufhin wird dem Media-Hub-Controller 9 angezeigt, dass der Anruf beendet werden soll. Dieser gibt die Instruktion zum Beenden des Anrufs an den WebRTC-Controller 46 weiter und dieser sendet eine entsprechende Instruktion an die Media-Hub-Extension-Software 32 des PCs 6 sowie eine Benachrichtigung an die erweiterte Bedien-Einheit 16 des Telefongeräts 1 , welche über das integrierte Display anzeigt, dass der Anruf beendet ist. Die Media-Hub-Extension-Software 32 des PCs sendet eine Instruktion zum Beenden des WebRTC-Anrufs an den WebRTC-Browser 45 welcher diese an den WebRTC-Service 44 weiterleitet, so dass der Anruf dann schließlich an allen beteiligten Instanzen beendet worden ist. Bezugszeichen

1 Telekommunikationsendgerät / Telefongerät

2, 2' Smartphone

3 Bluetooth-Verbindung

4 Laptop

5 USB-Verbindung

6 PC

7 Internet

8 LAN/WLAN-Verbindung

9 Media-Hub-Controller

10 Telefonhörer

1 1 Lautsprecher

12 Audio-Schnittstelle

13 Audio-Schnittstelle

14 Audio-Schnittstelle

15 Audio-Schnittstelle

16 Bedien-Einheit

17 Display

18 Media-Processing-Einheit

19 Telefon-Einheit

20 Circuit-Controller-Einheit

21 Media-Quellen

22 LAN-Controller & Treiber

23 USB-Controller & Treiber

24 Bluetooth Controller & Treiber

25 Media-Senken

26 LAN-Controller und Treiber

27 USB-Controller und Treiber

28 Bluetooth-Controller und Treiber

29 Media-Hub-Treiber

30 Sound-System

31 Cloud-Transkription-Service Media-Hub-Extension Software ankommender Anruf (Smartphone)

Klingelton

Transkriptions-Session

Media-Hub-Transcriber-Service

Audio-Daten (audio in extern)

Anruf-Details (Smartphone)

Archivdatei

transkribierte Sätze

Monitor

Beenden-Befehl

virtueller Sound-Treiber des PCs

WebRTC-Service

WebRTC-Browser

WebRTC-Controller

SIP-Telefon / VolP / PBX

Kopfhörer/Headset

Mikrophon