Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND SYSTEM FOR PROVIDING A SPEECH-BASED SERVICE, IN PARTICULAR FOR ACTIVATING ROOM OPERATING ELEMENTS IN BUILDINGS
Document Type and Number:
WIPO Patent Application WO/2019/154598
Kind Code:
A1
Abstract:
The invention relates to a method and to a system for providing a speech-based service, in particular for the activation of room operating elements in buildings, wherein speech commands are received by an audio device, wherein the audio device is configured to analyze the received speech commands, to convert the same into corresponding operating commands for room operating elements for activating in particular HVAC devices (e.g. field devices) in a building and to pass said signals on to the corresponding room operating elements, and wherein, before the reception of the speech commands in the audio device, the identity of the sender (user) of the speech commands is anonymized by an anonymization service.

Inventors:
ROHRBACHER, Kai (Mühleweg 8, 6331 Hünenberg, 6331, CH)
ZECHLIN, Oliver (Letzi 9, 6300 Zug, 6300, CH)
Application Number:
EP2019/050945
Publication Date:
August 15, 2019
Filing Date:
January 15, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SIEMENS SCHWEIZ AG (Freilagerstrasse 40, 8047 Zürich, 8047, CH)
International Classes:
G10L15/22; G10L21/003; G10L21/043
Foreign References:
US20130325452A12013-12-05
US20140278366A12014-09-18
US20180005626A12018-01-04
Other References:
SHUFEI HE: "Speaker De-identification for Privacy Protection", 1 September 2016 (2016-09-01), London, England, XP055499092, Retrieved from the Internet [retrieved on 20180810]
NICHOLAS CARLINI ET AL: "Hidden Voice Commands", THIS PAPER IS INCLUDED IN THE PROCEEDINGS OF THE 25TH USENIX SECURITY SYMPOSIUM AUGUST 10-12, vol. 8275, 10 August 2016 (2016-08-10), Berlin, Heidelberg, pages 513 - 530, XP055460530, ISBN: 978-3-642-45064-8, DOI: 10.1007/978-3-642-45065-5
None
Attorney, Agent or Firm:
MAIER, Daniel (Postfach 22 16 34, München, 80506, DE)
Download PDF:
Claims:
Patentansprüche

1. Verfahren zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Gebäudeinfrastrukturtech nik, das Verfahren umfassend:

Empfangen von Sprachbefehlen (SB1-SB7, ASB1-ASB7, ASB, ASB', ASB") durch ein Audiogerät (AG1 - AG4), wobei das Audi- ogerät (AG1 - AG4) eingerichtet ist, die empfangenen Sprachbe- fehle (SB1-SB7, ASB1-ASB7 , ASB, ASB', ASB") zu analysieren, in entsprechende Bedienkommandos (BK1 - BK12, BK) zur Ansteue rung von Geräten (Gl - G4) und/oder Programmen (z.B. HVAC- o- der Feldgeräte) in einem Gebäude umzuwandeln und an entspre chenden Raumbedienelemente (RBE) oder direkt an die jeweilige Gebäudeinfrastrukturtechnik weiterzuleiten;

wobei vor der Auswertung der Sprachbefehle (SB1-SB7, ASB1-ASB7, ASB, ASB', ASB'') durch einen entsprechenden

Spracherkennungsdienst (Assistenzdienst) die Identität des Senders (PI - P6) der Sprachbefehle (SB1-SB7) durch einen se paraten und vertrauenswürdigen Anonymisierungsdienst (AD1 - AD4) anonymisiert wird.

2. Verfahren nach Anspruch 1, wobei die Anonymisierung durch eine randomisierte Sprachverfremdung erfolgt.

3. Verfahren nach einem der vorstehenden Ansprüche, wobei die Anonymisierung derart erfolgt, dass eine Rückverfolgbarkeit zwischen dem Sender (PI - P6) und dem Anonymisierungsdienst (AD1 - AD4) gegeben ist, aber nicht zwischen dem Sender (PI - P6) und dem Audiogerät.

4. Verfahren nach einem der vorstehenden Ansprüche, wobei ba sierend auf der Analyse der empfangenen Sprachbefehle das Au diogerät ein Feedback (FB) generiert, welches vom Anonymisie- rungsdienst (AD1 - AD4) einem dedizierten Sender (PI - P6) zu geordnet wird.

5. System zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen (RBE) in Gebäuden, das System umfasst:

einen vertrauenswürdigen Anonymisierungsdienst (AD1 - AD4), der eingerichtet ist, Sprachbefehle (SB1 - SB7) eines Senders (PI - P6) zu empfangen und so umzuwandeln, dass die Identität des Senders (PI - P6) der Sprachbefehle anonymisiert ist, wobei der Anonymisierungsdienst (AD1 - AD4) weiter einge richtet ist, die anonymisierten Sprachbefehle (ASB1 - ASB7 , ASB, ASB ' , ASB ' ' ) für ein Audiogerät (AG1 - AG4), insbeson dere ein nicht vertrauenswürdiges Audiogerät, bereitzustellen; ein Audiogerät (AG1 - AG4), insbesondere ein nicht ver trauenswürdiges Audiogerät, zum Empfangen der anonymisierten Sprachbefehle (ASB1 - ASB7 , ASB, ASB ' , ASB ' ' ) , wobei das Audioge rät (AG1 - AG4) eingerichtet ist, die empfangenen Sprachbefeh- le (ASB1 - ASB7 , ASB, ASB ' , ASB ' ' ) zu analysieren, in entspre chende Bedienkommandos (BK1 - BK12, BK) zur Ansteuerung von Geräten (Gl - G4) und/oder Programmen (z.B. HVAC- oder Feldge räte) in einem Gebäude umzuwandeln und an diese weiterzulei ten .

6. System nach Anspruch 5, wobei der Anonymisierungsdienst (AD1 - AD4) auf einem entsprechend ausgestatteten mobilen Kom munikationsendgerät (MG) des Senders (PI - P6) realisiert ist.

7. System nach Anspruch 5 oder 6, wobei der Anonymisierungs dienst (AD1 - AD4) im Audiogerät (AG1 - AG4) integriert ist.

8. System nach einem der Ansprüche 5 bis 7, wobei der Anonymi sierungsdienst (AD1 - AD4) als vertrauenswürdige Netzwerkkom ponente (Proxy) in einem Gebäudekommunikationsnetzwerk reali- siert ist, und wobei das Audiogerät (AG1 - AG4) eine weitere vertrauenswürdige Netzwerkkomponente des Gebäudekommunikati onsnetzwerkes ist.

9. Computerlesbares Speichermedium, das Anweisungen speichert, die wenn sie von einem Computer ausgeführt werden, den Compu ter veranlassen, ein Verfahren zum Bereitstellen eines sprach- basierten Dienstes, insbesondere für die Ansteuerung von Gerä ten oder zur Ansteuerung von Programmen in einem Gebäude, durchzuführen, wobei das Verfahren umfasst:

Bereitstellen eines Anonymisierungsdienstes (AD1 - AD4), der empfangene Sprachbefehle (SB1-SB7) eines Benutzers (PI - P6) so umwandelt, dass die Identität des Benutzers (PI - P6) der Sprachbefehle anonymisiert wird, wobei der Anonymisie rungsdienst (AD1 - AD4) die anonymisierten Sprachbefehle

(ASB1-ASB7, ASB, ASB', ASB'') an einen Assistenzdienst aus gibt; und

Bereitstellen des Assistenzdienstes zum Empfangen der anonymisierten Sprachbefehle (ASB1-ASB7, ASB, ASB', ASB''), wobei der Assistenzdienst die empfangenen anonymisierten

Sprachbefehle (ASB1-ASB7, ASB, ASB', ASB'') analysiert, in entsprechende Bedienkommandos (BK1 - BK12, BK) zur Ansteuerung von Geräten und/oder zur Ansteuerung von Programmen in einem Gebäude umwandelt und an diese weiterleitet.

10. Computerprogrammprodukt, das auf einem Computer ausführba re Instruktionen enthält, die wenn sie von dem Computer ausge führt werden, den Computer veranlassen, ein Verfahren zum Be reitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Geräten oder zur Ansteuerung von Program men in einem Gebäude, durchzuführen, das Verfahren umfasst:

Bereitstellen eines Anonymisierungsdienstes (AD1 - AD4), der empfangene Sprachbefehle (SB1-SB7) eines Benutzers (PI - P6) so umwandelt, dass die Identität des Benutzers (PI - P6) der Sprachbefehle anonymisiert wird, wobei der Anonymisie rungsdienst (AD1 - AD4) die anonymisierten Sprachbefehle

(ASB1-ASB7, ASB, ASB', ASB'') an einen Assistenzdienst aus gibt; und

Bereitstellen des Assistenzdienstes zum Empfangen der anonymisierten Sprachbefehle (ASB1-ASB7, ASB, ASB', ASB''), wobei der Assistenzdienst die empfangenen anonymisierten

Sprachbefehle (ASB1-ASB7, ASB, ASB', ASB'') analysiert, in entsprechende Bedienkommandos (BK1 - BK12, BK) zur Ansteuerung von Geräten und/oder zur Ansteuerung von Programmen in einem Gebäude umwandelt und an diese weiterleitet.

Description:
Verfahren und System zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienele menten in Gebäuden

Die Erfindung betrifft ein Verfahren und ein System zum Be reitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen in Gebäuden. Weiterhin betrifft die Erfindung ein computerlesbares Speichermedium und ein Computerprogrammprodukt, das Anweisungen speichert, die wenn sie von einem Computer ausgeführt werden, den Computer veranlassen, ein Verfahren zum Bereitstellen eines sprachba sierten Dienstes, insbesondere für die Ansteuerung von Raumbe dienelementen in Gebäuden, durchzuführen.

Intelligente Audiogeräte, wie z.B. Amazon Echo oder Google Ho me, ermöglichen einem Benutzer, im Zusammenwirken mit entspre chenden Virtuellen Assistenten bzw. Sprachassistenten (wie. z.B. Alexa von Amazon oder Siri von Apple), eine Steuerung von damit verbundenen Geräten, durch Sprachbefehle bzw. Sprachkom- mandos. Ein Sprachbefehl bzw. ein Sprachkommando oder eine Folge davon wird analysiert, ausgewertet, und eine entspre chende Reaktion am entsprechenden Gerät bewirkt. Z.B. „Schalte das Licht im Wohnzimmer ein".

Die intelligenten Audiogeräte sind dabei Geräte, die eine „Ar tificial Intelligence" engine (Künstliche Intelligenz (KI)- Engine) Software verwenden, die das Verhalten, Gewohnheiten, und Präferenzen der Benutzer lernt, und so auch individuell passende Vorschläge, Lösungen oder Aktionen für einen Benutzer anbieten kann. Dies erfordert aber die Preisgabe von individu ellen und personenbezogenen Daten durch den Benutzer, welche typischerweise ausserhalb des Kontroll- und Einflussbereichs des Benutzers verarbeitet, analysiert und personenbezogen ge speichert werden.

Aus Gründen des Datenschutzes ist der Einsatz dieser intelli genten Audiogeräte somit nur im Privathaushalt bzw. nur im Privatleben möglich, da sich die Privatperson selber dezidiert für den Einsatz dieser Art Sprachdienste innerhalb ihrer Räum lichkeiten entschieden hat. In Nicht-Privathaushalten, wie z.B. Unternehmen, ist die Verwendung dieser Art Sprachsteue rung dagegen äusserst kritisch, da in der Regel eine Vielzahl von Personen den Dienst nutzen, welche keine formale Einwilli gung für eine personenbezogene Nutzung ihrer Daten gegeben ha ben (noch teilweise geben würden) .

Es ist daher die Aufgabe der vorliegenden Erfindung ein Ver fahren und ein System bereitzustellen, welches die Verwendung von sprachbasierten Diensten auch in Nicht-Privathaushalten, wie z.B. Unternehmen, unter Berücksichtigung des Datenschutzes ermöglicht .

Die Aufgabe wird gelöst durch ein

Verfahren zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Gebäudeinfrastrukturtech nik, das Verfahren umfassend:

Empfangen von Sprachbefehlen durch ein Audiogerät, wobei das Audiogerät eingerichtet ist, die empfangenen Sprachbefehle zu analysieren, in entsprechende Bedienkommandos zur Ansteue rung von Geräten (z.B. Feldgeräte) und/oder Programmen in ei nem Gebäude umzuwandeln und an entsprechenden Raumbedienele mente oder direkt an die jeweilige Gebäudeinfrastrukturtechnik weiterzuleiten;

wobei vor der Auswertung der Sprachbefehle durch einen entsprechenden Spracherkennungsdienst (z.B. Assistenzdienst) die Identität des Senders der Sprachbefehle durch einen sepa raten und vertrauenswürdigen Anonymisierungsdienst anonymi siert wird. Die Anonymisierung erlaubt u.a. die Nutzung von Assistenzdiensten unter Beibehaltung des Datenschutzes. Durch die Anonymisierung wird die Identität des eigentlich Anfragen den verschleiert, ohne aber die eigentliche Anlagensteuerung durch Sprache zu beeinträchtigen. Mit Vorteil fungiert das Au- diogerät als Proxy zum Anonymisierungsdienst.

Die Anonymisierung der empfangenen Sprachbefehle kann durch das Audiogerät selbst erfolgen oder durch einen mit dem Audio- gerät verbundenen vertrauenswürdigen (trustworthy) Server (z.B. ein lokaler Server). Die anonymisierten Sprachbefehle können von einem externen (eventuell auch nicht vertrauenswür digen, non-trustworthy) Server übernommmen, analysiert und als entsprechende Bedienkommandos zur Ansteuerung von Geräten (z.B. Feldgeräte) oder Programmen (z.B. Programme einer Gebäu demanagementstation oder eines Raumbedienelementes) weiterge leitet werden.

Eine erste vorteilhafte Ausgestaltung der Erfindung liegt da rin, dass die Anonymisierung durch eine randomisierte Sprach- verfremdung erfolgt. Dies kann z.B. durch einen Verzerrer er folgen, der eine Deformation des ursprünglichen Sprachkomman- dos bewirkt, welche eine personenbezogene Zuordnung verhindert (z.B. Veränderung der Stimmlage und/oder Sprachgeschwindig- keit) . Die randomisierte Sprachverfremdung kann dabei im Audi ogerät, durch entsprechende Hardware- oder Softwarekomponen ten, erfolgen. Im Prinzip kann die randomisierte Sprachver- fremdung aber auch an jeder anderen vertrauenswürdigen Stelle erfolgen, bevor der entsprechende Dienstleister bzw. der vir tuelle Assistent (d.h. der entsprechende Dienst, der die digi tale Sprachanalyse bereitstellt) aufgerufen wird. Die randomi- sierte Sprachverfremdung bewirkt eine Erhöhung der Entropie des vom Benutzer abgegeben Sprachkommandos .

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt darin, dass die Anonymisierung derart erfolgt, dass eine Rück verfolgbarkeit zwischen dem Sender (Benutzer) und dem Anonymi sierungsdienst gegeben ist, aber nicht zwischen dem Sender und dem Audiogerät. Das Audiogerät und der entsprechende Anbieter des virtuellen Assistenten können somit ein empfangenes Sprachkommando nicht auf den Absender (Benutzer) rückverfolgen und diesen auch nicht identifizieren. Der Absender (Benutzer) eines Sprachkommandos ist somit intransparent für das Audioge rät und den virtuellen Assistenten. Der Provider des virtuel len Assistenten kann somit keine personenbezogenen Daten des Benutzers auswerten. Eine Rückverfolgbarkeit ist nur zwischen dem Sender (Benutzer) und dem Anonymisierungsdienst gegeben. Nur der dem Audiogerät bzw. dem virtuellen Assistenten vorge schaltete Anonymisierungsdienst ist in der Lage bzw. einge richtet personenbezogene Daten des Benutzers auszuwerten oder benutzerbezogene sprachliche Rückmeldungen (z.B. Feedback) auf ein jeweiliges Sprachkommando des Benutzers zu geben. In die ser Ausgestaltung der vorliegenden Erfindung wird die Rückmel dung bzw. das Feedback für einen Benutzer vom Anonymisierungs dienst generiert.

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt darin, dass, basierend auf der Analyse der empfangenen Sprach- befehle, das Audiogerät ein Feedback generiert, welches vom Anonymisierungsdienst einem dedizierten Sender zugeordnet wird. In dieser Ausgestaltung der vorliegenden Erfindung wird die Rückmeldung bzw. das Feedback auf einen Sprachbefehl zwar vom Audiogerät bzw. vom virtuellen Assistenten generiert, die Zuordnung des erkannten Sprachbefehls zu seinem wirklichen Sprecher ist aber maximal (und auch nur wenn explizit ge- wünscht) dem Audiogerät bzw. dem vertrauenswürdigen Anonymi sierungsdienst möglich, nicht aber dem (nicht vertrauenswürdi gen) virtuellen Assistenten / Sprachdienstleister .

Die Aufgabe wird weiterhin gelöst durch ein System zum Bereit stellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen (RBE) in Gebäuden, das System umfasst:

einen vertrauenswürdigen Anonymisierungsdienst, der ein gerichtet ist, Sprachbefehle eines Senders zu empfangen und so umzuwandeln, dass die Identität des Senders der Sprachbefehle anonymisiert ist, wobei der Anonymisierungsdienst weiter ein gerichtet ist, die anonymisierten Sprachbefehle für ein Audio gerät, insbesondere ein nicht vertrauenswürdiges Audiogerät, bereitzustellen;

ein Audiogerät, insbesondere ein nicht vertrauenswürdiges Audiogerät, zum Empfangen der anonymisierten Sprachbefehle, wobei das Audiogerät eingerichtet ist, die empfangenen Sprach befehle zu analysieren, in entsprechende Bedienkommandos zur Ansteuerung von Geräten (z.B. HVAC- oder Feldgeräte) und/oder Programmen (z.B. Programme für eine Gebäudemanagementstation) in einem Gebäude umzuwandeln und an diese weiterzuleiten. Der Anonymisierungsdienst kann z.B. im Audiogerät realisiert wer den (wenn es als vertrauenswürdig eingestuft werden kann) oder auf einem dem entsprechenden virtuellen Assistenten vorgela gerten vertrauenswürdigem Proxy (z.B. im Gebäude selbst oder bei einem vertrauenswürdigen Dienstleister) . Der Anonymisie rungsdienst kann eine empfangene Sprachnachricht (oder einen Sprachbefehl ) z.B. durch eine Sprechverzerrung in eine anony misierte Sprachnachricht umwandeln. Es ist aber auch möglich, dass eine empfangene Sprachnachricht vom Anonymisierungsdienst in einen (mit Vorteil internen) Text umgewandelt wird. Dieser Text wird dann durch einen Sprachgenerator des Anonymisie rungsdienstes für den Assistenzdienst (z.B. Amazon Alexa) aus- gegeben. Durch die Anonymisierung wird sichergestellt, dass auf die Person, die die ursprüngliche Sprachnachricht (oder den Sprachbefehl) abgesetzt hat, nicht mehr rückgeschlossen werden kann.

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt darin, dass der Anonymisierungsdienst auf einem entsprechend ausgestatteten mobilen Kommunikationsendgerät des Benutzers (Sender) realisiert ist. Es ist aber auch möglich den Anonymi sierungsdienst z.B. durch eine App auf einem mobilen Kommuni kationsendgerät des Benutzers zu installieren. Dies kann z.B. durch einen Download von einer Internetplattform eines ent sprechenden Dienstproviders erfolgen.

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt darin, dass der Anonymisierungsdienst im Audiogerät integriert ist. Mit Vorteil ist in dieser Ausgestaltung das Audiogerät vorher als vertrauenswürdig eingestuft worden. In dieser Aus gestaltung ist der Anonymisierungsdienst im Audiogerät einge bettet (embedded) . Der Anonymisierungsdienst kann z.B. in eine entsprechende Verarbeitungslogik (z.B. Mikroprozessor) des Au- diogerätes eingebettet sein, z.B. als Software oder als Firm ware .

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt darin, dass der Anonymisierungsdienst als vertrauenswürdige Netzwerkkomponente (Proxy) in einem Gebäudekommunikationsnetz werk (z.B. Installationsbus, KNX) realisiert ist, und wobei das Audiogerät eine weitere vertrauenswürdige Netzwerkkompo nente des Gebäudekommunikationsnetzwerkes ist. Ein Gebäudeau tomatisierungssystem kann somit sehr leicht mit einem Anonymi sierungsdienst versehen oder nachgerüstet werden. Mit Vorteil wird der Anonymisierungsdienst in die Infrastruktur des Gebäu- dekommunikationsnetzwerkes als Netzwerkkomponente integriert. Mit Vorteil durch eine Funkverbindung.

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt in einem computerlesbares Speichermedium, das Anweisungen spei chert, die wenn sie von einem Computer ausgeführt werden, den Computer veranlassen, ein Verfahren zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Geräten oder zur Ansteuerung von Programmen in einem Gebäude, durchzuführen, wobei das Verfahren umfasst:

Bereitstellen eines Anonymisierungsdienstes, der empfan gene Sprachbefehle eines Benutzers so umwandelt, dass die Identität des Benutzers der Sprachbefehle anonymisiert wird, wobei der Anonymisierungsdienst die anonymisierten Sprachbe- fehle an einen Assistenzdienst ausgibt; und

Bereitstellen des Assistenzdienstes zum Empfangen der anonymisierten Sprachbefehle, wobei der Assistenzdienst die empfangenen anonymisierten Sprachbefehle analysiert, in ent sprechende Bedienkommandos zur Ansteuerung von Geräten

und/oder zur Ansteuerung von Programmen in einem Gebäude um wandelt und an diese weiterleitet. Mit Vorteil werden die An weisungen zum Implementieren der Verfahren und/oder des Sys tems auf nichtflüchtigen computerlesbaren Speichermedien oder Speichern bereitgestellt, wie Cache, Puffer, RAM, Wechselspei chermedien, Festplatten, SD-Karte, CD, USB-Speicherstick, oder andere computerlesbare Speichermedien. Die computerlesbaren Speichermedien können verschiedene Typen von flüchtigen und nichtflüchtigen Speichermedien sein. Die Funktionen oder Ver fahrensschritte, die in der Beschreibung und in den Figuren beschrieben sind, werden in Reaktion auf einen oder auf mehre re Sätze von Anweisungen ausgeführt, die in oder auf einem computerlesbaren Speichermedium gespeichert sind. Die Funktio nen oder Verfahrensschritte sind unabhängig von dem speziellen Typ von Befehlssatz, Speichermedium, Prozessor oder Verarbei- tungsstrategie und können durch Software, Hardware, Firmware und dergleichen, allein oder in Kombination, ausgeführt wer den .

Eine weitere vorteilhafte Ausgestaltung der Erfindung liegt in einem Computerprogrammprodukt, das auf einem Computer ausführ bare Instruktionen enthält, die wenn sie von dem Computer aus geführt werden, den Computer veranlassen, ein Verfahren zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Geräten oder zur Ansteuerung von Program men in einem Gebäude, durchzuführen, das Verfahren umfasst:

Bereitstellen eines Anonymisierungsdienstes, der empfan gene Sprachbefehle eines Benutzers so umwandelt, dass die Identität des Benutzers der Sprachbefehle anonymisiert wird, wobei der Anonymisierungsdienst die anonymisierten Sprachbe- fehle an einen Assistenzdienst ausgibt; und

Bereitstellen des Assistenzdienstes zum Empfangen der anonymisierten Sprachbefehle, wobei der Assistenzdienst die empfangenen anonymisierten Sprachbefehle analysiert, in ent sprechende Bedienkommandos zur Ansteuerung von Geräten

und/oder zur Ansteuerung von Programmen in einem Gebäude um wandelt und an diese weiterleitet. Mit Vorteil ist das Compu terprogrammprodukt als Bibliothek und/oder als Programmmodul eines weiteren Computerprogrammprodukts ausgebildet. Mit Vor teil ist das Computerprogrammprodukt durch Software oder Firm ware implementiert in einer geeigneten Programmiersprache im plementiert. Mit Vorteil ist das Computerprogrammprodukt in ein Computersystem oder eine computerbasierte Infrastruktur eingebettet .

Die Erfindung sowie vorteilhafte Ausführungen der vorliegenden Erfindung werden am Beispiel der nachfolgenden Figuren erläu tert. Dabei zeigen: FIG 1 ein erstes beispielhaftes System zum Bereitstellen eines sprachbasierten Dienstes, umfassend einen Ano nymisierungsdienst,

FIG 2 ein zweites beispielhaftes System zum Bereitstellen eines sprachbasierten Dienstes, umfassend einen Ano nymisierungsdienst,

FIG 3 ein drittes beispielhaftes System zum Bereitstellen eines sprachbasierten Dienstes, umfassend einen Ano nymisierungsdienst,

FIG 4 einen beispielhaften Anonymisierungsdienst, und

FIG 5 ein beispielhaftes Flussdiagramm für ein Verfahren zum Bereitstellen eines sprachbasierten Dienstes, umfassend einen Anonymisierungsdienst.

Damit digitale intelligente persönliche Assistenten sinnvoll und bestimmungsgemäß funktionieren muss der Nutzer solcher Dienste viele persönliche Daten von sich preisgeben. Es ob liegt der Verantwortung des Einzelnen zu entscheiden wie viel Privatsphäre man bereit ist aufzugeben. Insbesondere im Umfeld nichtselbstständiger Arbeit (z.B. an einem Arbeitsplatz in ei nem Unternehmen) muss ein Arbeitgeber z.B. aus Datenschutz gründen oder arbeitsrechtlicher Auflagen diesbezügliche

Schutzmaßnahmen ergreifen. Geht der Arbeitgeber dabei zu rest riktiv zur Sache, sinkt die Zufriedenheit bzw. die Akzeptanz der Angestellten. Der Arbeitgeber muss einen Weg finden, er wartete und gewohnte Komfortfeatures , in diesem Fall sprachba- sierte digitale Assistenten, bereit zu stellen, ohne seine Ziele und Pflichten zu verletzen. Ein Intelligenter Persönlicher Assistent (IPA) (oder: Sprach- assistent) ist eine Software, welche u.a. Spracherkennung und -analyse, die Suche von Informationen oder das Abarbeiten ein facher Aufgaben und dann die Synthese von natürlich sprachigen Antworten verbindet. Das Ziel ist, eine intuitive Schnittstel le zwischen einem Anwender und einem System oder Gerät zu er möglichen, damit Kommandos oder Suchanfragen „menschlicher" formuliert werden können (aus Wikipedia) .

Bekannte Dienste großer Anbieter sind z.B. Microsoft Cortana, Amazon Alexa, Apple Siri oder Google Assistent. Diese Dienste werden derzeit entweder über ein Kommunikationsendgerät (z.B. Notebook, Smartphone, tablet Computer) oder dedizierter Assis tent-Hardware (z.B. Amazon Echo oder Google Home) genutzt. Ein Anwender übermittelt via Sprache und einer solchen Hardware komponente ein Kommando an ein dahinter liegendes „backend". Z.B. kann eine online-Übertragung zu einem oder mehreren Ser vern erfolgen. Dort wird der Sprachbefehl analysiert, ausge wertet und eine entsprechende Reaktion auf das Kommando gene riert. Eine solche Reaktion kann z.B. eine sprachliche Ant wort, oder aber eine übermittelte Aktion sein. Als Beispiel sei der Befehl „Schalte das Licht im Wohnzimmer ein" aufge führt. Als Reaktion auf diesen Befehl würde der dahinterlie gende Server einen Steuerungsbefehl an das der Anfrager-ID zugeordnetem Raumbedienelement übermitteln, z.B. einer ver knüpften Lampensteuerung. Damit dies seitens des Dienste anbieters möglich ist, muss dieser wissen von wem genau das Kommando kommt. Mit dieser Identität ist weiterhin das im Bei spiel genannte Raumbedienelement verknüpft.

Die sog. „Artificial Intelligence"-Engine (z.B. KI-Software, wie ein Neuronales Netz) des Diensteanbieters lernt Verhalten, Gewohnheiten, Präferenzen der Nutzer, und kann so individuell passende Vorschläge, Lösungen oder Aktionen anbieten. Für die Diensteanbieter sind die Nutzer gläserne Kunden. Auch hier wird Datenschutz und Privatspähre zu Gunsten von persönlichem Komfortgewinn aufgegeben. Was aber im Privatbereich (z.B. im eigenen Haus oder in der eigenen Wohnung) möglich und erlaubt ist, ist aber in einem Unternehmen (insbesondere mit mehreren Mitarbeitern) aufgrund von gesetzlichen und/oder innerbetrieb licher Regularien verboten, denn es können z.B. auch firmen vertrauliche Daten via Intelligentem Persönlichen Assistent (IPA) übertragen werden.

Figur 1 zeigt ein erstes beispielhaftes System zum Bereitstel len eines sprachbasierten Dienstes, insbesondere für die An steuerung von Raumbedienelementen RBE in Gebäuden. Das System gemäss Figur 1 umfasst einen Anonymisierungsdienst AD1, der eingerichtet ist Sprachbefehle SB1, SB2 eines Senders (Benut zers) PI, P2 zu empfangen und so umzuwandeln, dass die Identi tät des Senders (Benutzers) PI, P2 der Sprachbefehle SB1, SB2 anonymisiert ist, wobei der Anonymisierungsdienst AD1 weiter eingerichtet ist die anonymisierten Sprachbefehle ASB, ASB1, ASB2 für ein Audiogerät AG1 bereitzustellen bzw. an ein Audio- gerät AG1 (z.B. Amazon Echo) zu senden. Weiterhin umfasst das System gemäss Figur 1 ein Audiogerät AG1 (z.B. Amazon Echo/Alexa; digitale Assistenzdienste) zum Empfangen der ano nymisierten Sprachbefehlen ASB1, ASB2 wobei das Audiogerät AG1 eingerichtet ist die empfangenen Sprachbefehle ASB1, ASB2 zu analysieren (NLP, natural language processing) , in entspre chende Bedienkommandos BK1 - BK4 für Raumbedienelemente RBE zur Ansteuerung von HVAC-Geräten (z.B. Feldgeräten, Aktoren) Gl - G4 in einem Gebäude umzuwandeln und an die entsprechenden Raumbedienelemente RBE oder direkt an die HVAC-Geräte Gl - G4 (z.B. Aktoren zur Komfortsteuerung in einem Gebäude) weiterzu leiten .

HVAC-Geräte Gl - G4 können z.B. sein: Heizung, Lüftungsanla gen, Klimaanlagen, Lichtsysteme, Dimmer, Antriebe für Jalou- sien) . Raumbedienelemente RBE sind z.B. Raumgeräte oder Steu ergeräte zum Bedienen, Regel, oder Steuern von Komfortgrössen (z.B. Temperatur, Licht, Blendung) in einem Raum.

Durch den Anonymisierungsdienst AD1 werden die Sprachbefehle SB1, SB2 des Benutzers PI, P2 anonymisiert, z.B. durch Sprach- verzerrung oder durch Umwandlung der Sprachbefehle SB1, SB2 in eine konstruierte, fiktionale Sprache (wie z.B. die Sprachaus- gabe bei einem Navigationsgerät) . Der Anonymisierungsdienst AD1 ist dazu entsprechend eingerichtet, d.h. mit entsprechen der Hardware und Software ausgestattet.

Das nicht-vertrauenswürdige Audiogerät AG1 umfasst geeignete Schnittstellen zum Empfangen der anonymisierten Sprachbefehle ASB1, ASB2. Optional umfasst das Audiogerät AG1 Mechanismen zum Analysieren der Sprachbefehl ASB1, ASB2 und zum Generieren entsprechender Bedienkommandos BK1 - BK4 zur Ansteuerung von Geräten oder Programmen (z.B. HVAC- oder Feldgeräten) in einem Gebäude mit den jeweiligen Bedienkommandos BK1 - BK4. Die Be dienkommandos BK1 - BK4 können vom Audiogerät AG1 direkt an die jeweiligen HVAC-Geräte übertragen werden, z.B. durch eine geeignete Funkverbindung (z.B. WLAN, Bluetooth) . Die Bedien kommandos BK1 - BK4 können vom Audiogerät AG1 aber auch an entsprechende Raumbedienelemente RBE übertragen werden. Die entsprechenden Raumbedienelemente RBE leiten die Bedienkomman dos BK1 - BK4 an die jeweiligen HVAC-Geräte weiter, z.B. auch durch eine geeignete Funkverbindung (z.B. WLAN, Bluetooth).

Das Audiogerät AG1 ist dazu mit geeigneter Hardware ausgestat tet (z.B. Prozessor MCI und einem Speicher Ml) zur Ausführung entsprechender Verarbeitungslogik und entsprechender Software (z.B. KI-Programme, neuronale Netze, Deep Learning Algorith men) . Der Speicher Ml kann z.B. eine Sprachcache sein, der standardisierte bzw. häufig verwendete Sprachbefehle umfasst, die dann zur Anonymisierung verwendet werden. Optional können vom Audiogerät AG1 anonymisierte Sprachbefehle ASB an einen Server S weitergeleitet werden. Der Server S um fasst geeignete Hardware und Software zum Analysieren der Sprachbefehle ASB und zum Generieren entsprechender Bedienkom mandos BK3, BK4 zur Ansteuerung der entsprechenden HVAC-Geräte G3, G4 mit den jeweiligen Bedienkommandos BK3, BK4.

Mit Vorteil umfasst das Audiogerät AG1 und der Server S eine „Artificial Intelligence"-Engine (z.B. KI-Software, wie ein Neuronales Netz).

Mit Vorteil ist der Anonymisierungsdienst AD1 als Netzwerkkom ponente (Proxy) in einem Gebäudekommunikationsnetzwerk (z.B. Installationsbus, KNX) realisiert und das Audiogerät AG1 ist eine weitere Netzwerkkomponente des Gebäudekommunikationsnetz werkes. Ein Gebäudeautomatisierungssystem kann somit sehr leicht mit einem Anonymisierungsdienst versehen oder nachge rüstet werden. Mit Vorteil werden der Anonymisierungsdienst AD1 und das Audiogerät AG1 in die Infrastruktur des Gebäude kommunikationsnetzwerkes als Netzwerkkomponenten (Network No tes; z.B. als BacNet Objekte) integriert. Mit Vorteil durch eine Funkverbindung.

Figur 2 zeigt ein zweites beispielhaftes System zum Bereit stellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen RBE in Gebäuden. Das Sys tem gemäss Figur 2 umfasst einen Anonymisierungsdienst AD2, der eingerichtet ist Sprachbefehle SB3, SB4 eines Senders (Be nutzers) P3, P4 zu empfangen und so umzuwandeln, dass die Identität des jeweiligen Senders (Benutzers) P3, P4 der Sprachbefehle SB3, SB4 anonymisiert ist, wobei der Anonymisie rungsdienst AD2 weiter eingerichtet ist die anonymisierten Sprachbefehle ASB', ASB3, ASB4 für ein Audiogerät AG2 (z.B. Amazon Echo) bereitzustellen. Im beispielhaften System gemäss Figur 2 ist der Anonymisierungsdienst AD2 im vertrauenswürdi gen Audiogerät AG2 integriert, Z.B. als eine Hardware- und/oder Softwarekomponente des Audiogerätes AG2 (z.B. Amazon Echo/Alexa; digitale Assistenzdienste) . Das Audiogerät AG2 ist eingerichtet, die anonymisierten Sprachbefehle ASB3, ASB4 zu analysieren (NLP, natural language processing) , in entspre chende Bedienkommandos BK5 - BK8 zur Ansteuerung von Geräten (z.B. HVAC-, Feldgeräten, Aktoren) Gl - G4 in einem Gebäude umzuwandeln und die Bedienkommandos BK5 - BK8 an die entspre chenden Raumbedienelemente RBE oder direkt an die HVAC-Geräte Gl - G4 (z.B. Aktoren zur Komfortsteuerung in einem Gebäude) oder andere Empfänger weiterzuleiten.

Optional können vom vertrauenswürdigen Audiogerät AG2 anonymi sierte Sprachbefehle ASB' an einen vertrauenswürdigen Server S weitergeleitet werden. Der Server S umfasst geeignete Hardware und Software zum Analysieren der Sprachbefehle ASB' und zum Generieren entsprechender Bedienkommandos BK7, BK8 zur Ansteu erung der entsprechenden HVAC-Geräte G3, G4 mit den jeweiligen Bedienkommandos BK7, BK8. Mit Vorteil umfassen das Audiogerät AG2 und der Server S eine „Artificial Intelligence"-Engine (z.B. KI-Software, wie ein Neuronales Netz).

Das Audiogerät AG2 ist mit geeigneter Hardware ausgestattet (z.B. Prozessor MC2 und einem Speicher M2) zur Ausführung ent sprechender Verarbeitungslogik und entsprechender Software (z.B. KI-Programme, neuronale Netze, Deep Learning Algorith men) . Der Speicher M2 kann z.B. eine Sprachcache sein, der standardisierte bzw. häufig verwendete Sprachbefehle umfasst, die dann zur Anonymisierung verwendet werden. Die Integration des Anonymisierungsdienst AD2 im Audiogerät AG2 ermöglicht es, das Audiogerät AG2 mit Anonymisierungs dienst AD2 als eine Baueinheit zu vertreiben und zu verwenden. Dies erleichtert u.a. die Installation in einem Gebäude, setzt aber voraus, dass AG2 ein vertrauenswürdiges Gerät ist in dem Sinn, dass der Betrieb der Anonymisierungsschicht AD2 getrennt ist von dem Betrieb des Sprachanalysedienstes.

Figur 3 zeigt ein drittes beispielhaftes System zum Bereit stellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen RBE in Gebäuden. Das Sys tem gemäss Figur 3 umfasst einen Anonymisierungsdienst AD3, der eingerichtet ist Sprachbefehle SB5 eines Senders (Benut zers) P5 zu empfangen und so umzuwandeln, dass die Identität des jeweiligen Senders (Benutzers) P5 der Sprachbefehle SB5 anonymisiert ist, wobei der Anonymisierungsdienst AD3 weiter eingerichtet ist die anonymisierten Sprachbefehle ASB5 für ein Audiogerät AG3 (z.B. Amazon Echo) bereitzustellen. Im bei spielhaften System gemäss Figur 3 ist der Anonymisierungs dienst AD3 auf einem entsprechend ausgestatteten mobilen Kom munikationsendgerät MG (z.B. Smartphone, Tablet-Computer) des Benutzers (Sender) P5 realisiert. Z.B. als eine App, die durch einen entsprechenden Download vom Internet auf das mobile Kom munikationsendgerät MG geladen und installiert worden ist.

Der Benutzer P5 spricht einen Sprachbefehl SB5 (z.B. „erhöhe Temperatur um 3 Grad") , dieser Sprachbefehl SB5 wird vom Mik rophon des Kommunikationsendgerätes MG erfasst, durch den Ano nymisierungsdienst AD3 in einen anonymisierten Sprachbefehl ASB5 umgewandelt, z.B. durch eine Sprachverzerrung . Das nicht vertrauenswürdige Audiogerät AG3 ist eingerichtet die anonymi sierten Sprachbefehle ASB5 zu analysieren (NLP, natural langu- age processing) , in entsprechende Bedienkommandos BK9 - BK12 (z.B. digitale Darstellung eines Befehles) für Raumbedienele- mente RBE zur Ansteuerung von HVAC-Geräten (z.B. Feldgeräten, Aktoren) Gl - G4 in einem Gebäude umzuwandeln und die Bedien kommandos BK9 - BK12 an die entsprechenden Raumbedienelemente RBE oder direkt an die HVAC-Geräte Gl - G4 (z.B. Aktoren zur Komfortsteuerung in einem Gebäude) weiterzuleiten.

Das Audiogerät AG3 ist mit geeigneter Hardware ausgestattet (z.B. Prozessor MC3 und einem Speicher M3) zur Ausführung ent sprechender Verarbeitungslogik und entsprechender Software (z.B. KI-Programme, neuronale Netze, Deep Learning Algorith men) . Der Speicher M3 kann z.B. eine Sprachcache sein, der standardisierte bzw. häufig verwendete Sprachbefehle umfasst, die dann zur Anonymisierung verwendet werden.

Optional können vom Audiogerät AG3 anonymisierte Sprachbefehle ASB'' an einen Server S weitergeleitet werden. Der Server S umfasst geeignete Hardware und Software zum Analysieren der Sprachbefehle ASB'' und zum Generieren entsprechender Bedien kommandos BK11, BK12 zur Ansteuerung der entsprechenden HVAC- Geräte G3, G4 mit den jeweiligen Bedienkommandos BK11, BK12.

Figur 4 zeigt einen beispielhaften Anonymisierungsdienst AD4. Ein Anonymisierungsdienst bzw. Anonymisierungslayer AD4 kann durch entsprechende Hardware, Software, bzw. Firmware reali siert werden. Mit Vorteil agiert der Anonymisierungsdienst bzw. der Anonymisierungslayer AD4 als ein einem Audiogerät AG4 (z.B. Amazon Echo) vorgeschalteter Proxy, der einen empfange nen Sprachbefehl SB6 - SB7 für das Audiogerät AG4 in anonymi sierter Form bereitstellt bzw. weiterleitet. Der Anonymisie rungsdienst AD4 umfasst einen entsprechend eingerichteten Pro zessor (z.B. Mikroprozessor) mit entsprechender Verarbeitungs logik (Softwareprogramme), um seine Dienste bereitzustellen. Mit Vorteil ist der Anonymisierungsdienst der Sprachanalyse schicht vorgeschaltet und wird mit Vorteil getrennt von der Sprachanalyseschicht betrieben.

Ein Benutzer P6 gibt Sprachbefehle SB6, SB7 ab, die vom Mikro phon Mikro (z.B. ein handelsübliches Mikrophon) des Anonymi sierungsdienstes AD4 erfasst und von der Anonymisierungsein heit ANE des Anonymisierungsdienstes AD4 anonymisiert werden, so dass kein Rückbezug zum Benutzer P6 möglich ist. Die Anony misierungseinheit ANE kann z.B. als Sprachverzerrer realisiert sein. Die Anonymisierungseinheit ANE kann aber auch die Sprachbefehle SB6, SB7 eines Benutzers P6 in eine konstruier te, fiktionale Sprache umwandeln, z.B. durch ein randomisier- tes Ersetzen von Wörtern, die mit Vorteil in einem Sprachcache SC der Anonymisierungseinheit ANE bereitgestellt werden. Der Sprachcache SC kann in der Anonymisierungseinheit ANE oder im Speicher SC gehalten werden.

Die von der Anonymisierungseinheit ANE zu anonymisierenden Sprachbefehle SB6, SB7 werden vom Anonymisierungsdienst AD4 über eine entsprechend eingerichtete Sendeschnittstelle SSS dem Audiogerät AG4 (z.B. Amazon Echo) und dem entsprechenden Assistenzdienst (z.B. Amazon Alexa) als anonymisierte Sprach- befehle ASB6, ASB7 bereitgestellt bzw. weitergeleitet, z.B. durch eine geeignete Kommunikationsverbindung. Mit Vorteil über eine drahtlose Kommunikationsverbindung (z.B. NFC, Blue- tooth, WLAN) .

Das Audiogerät AG4 (z.B. Amazon Echo) bzw. der entsprechende Assistenzdienst (z.B. Amazon Alexa) umfasst eine Analyse- Engine AE, um die anonymisierten Sprachbefehle ASB6, ASB7 zu analysieren (z.B. durch NLP, natural language processing) und die entsprechenden Bedienkommandos BK zur Ansteuerung von Ge räten oder Programmen (z.B. HVAC- oder Feldgeräten) in einem Gebäude, zu generieren. Die Analyse-Engine AE führt somit eine syntaktische und semantische Analyse der anonymisierten Sprachbefehle ASB6, ASB7 durch und umfasst einen Generator zum generieren der entsprechenden Bedienkommandos BK zur Ansteue rung und Beeinflussung der Feldgeräte (z.B. z.B. zur Steuerung des Lichtes oder der Heizung) .

Mit Vorteil wird einem Benutzer P6 ein Feedback FB auf seine Sprachbefehle SB6, SB7 gegeben, wobei sichergestellt ist, dass das Audiogerät AG4 (z.B. Amazon Echo) bzw. der entsprechende Assistenzdienst (z.B. Amazon Alexa) keinen Rückschluss auf den Feedbackempfänger, d.h. dem Benutzer machen können.

Das Feedback FB kann z.B. eine Sprachnachricht , oder eine An zeige oder Textnachricht auf einem Display sein, das am Audio gerät AG4 angebracht ist. Beim Feedback FB kann es sich um ei ne reine Information (z.B. „Aktuelle Raumtemperatur 20 Grad") handeln oder um eine Empfehlung für den Benutzer P6 durch Aus wertung seiner früheren Sprachbefehle SB6, SB7. Die Auswertung erfolgt in einer Feedbackeinheit FBE1, FBE2 durch Methoden der Künstlichen Intelligenz (z.B. Deep Learning, Neuronale Netze). Mit Vorteil verwendet die Feedbackeinheit FBE1, FBE2 auch his torische Daten, die z.B. im Speicher M4 abgelegt sind. Die Feedbackeinheit FBE1, FBE2 kann sich im Anonymisierungsdienst AD4 und/oder im Audiogerät AG4 befinden. Wird das Feedback FB durch das Audiogerät AG4 bereitgestellt, sorgt der Anonymisie rungsdienst AD4 unabhängig vom Audiogerät AG4 und unabhängig vom Assistenzdienst für eine dedizierte Zuordnung des Feed backs FB zum jeweiligen Benutzer P6. Dies kann z.B. durch Aus wertung von Metainformationen (z.B. Merkmalen bezüglich Satz bau, Wortwahl, Frequenzspektrum) aus den Sprachbefehlen erfol- gen . Mit Vorteil erfolgt durch den Anonymisierungsdienst AD4 eine Singularisierung der Sprachbefehle SB6, SB7. D.h. die Sprach- befehle SB6, SB7 einer Masse (Anzahl) von Benutzern werden ei ner Benutzergruppe zugeordnet. Z.B. werden Sprachbefehle SB6, SB7 eines jeweiligen Benutzers P im Namen einer bestimmten Gruppe von Benutzern (z.B. eine bestimmte Abteilung) durchge führt, egal wie viele individuelle Benutzer sich dahinter be finden. Die Rückzuordnung findet immer bezüglich dieser Gruppe statt und nicht bezüglich des individuellen Benutzers, der ei nen Sprachbefehl abgesetzt hatte. Damit ist eine Nutzung eines derartigen Assistenzdienstes (z.B. Amazon Alexa) innerhalb ei nes Unternehmens möglich, obwohl dies aus Datenschutzgründen eigentlich verboten wäre.

Figur 5 zeigt ein beispielhaftes Flussdiagramm für ein Verfah ren zum Bereitstellen eines sprachbasierten Dienstes, umfas send einen Anonymisierungsdienst. Das Verfahren ist insbeson dere für die Ansteuerung von Raumbedienelementen in Gebäuden geeignet .

Das Verfahren umfasst:

(VS1) Empfangen von Sprachbefehlen durch ein Audiogerät, wobei das Audiogerät eingerichtet ist, die empfangenen Sprachbefehle zu analysieren (NLP, natural language processing) , in entspre chende Bedienkommandos zur Ansteuerung von Geräten (z.B. HVAC- oder Feldgeräte) und/oder Programmen (z.B. Programme einer Ge bäudemanagementstation) in einem Gebäude umzuwandeln und an entsprechenden Raumbedienelemente oder direkt an die jeweilige Gebäudeinfrastrukturtechnik weiterzuleiten;

wobei vor der Auswertung der Sprachbefehle durch einen entsprechenden Spracherkennungsdienst (Assistenzdienst, z.B. Amazon Alexa) die Identität des Senders (Benutzer) der Sprach- befehle durch einen separaten und vertrauenswürdigen Anonymi sierungsdienst anonymisiert wird. Der Anonymisierungsdienst kann z.B. im Audiogerät realisiert werden oder auf einem dem entsprechenden virtuellen Assisten ten (z.B. Amazon Alexa) vorgelagerten Proxy.

Durch die vom Audiogerät (z.B. Amazon Echo) wird ein Assis tenzdienst (z.B. Amazon Alexa) aktiviert, der die entsprechen den Kommandos für die HVAC-Geräte bzw. Feldgeräte generiert, um eine Komfortsteuerung (z.B. Temperatursteuerun, Lichtsteue rung) in einem Raum oder einem Gebäude zu bewirken.

Mit Vorteil erfolgt die Anonymisierung durch eine randomisier- te Sprachverfremdung, z.B. basierend auf Worten, Sätzen, oder Satzteilen aus einem Sprachcache bereitgestellt werden.

Mit Vorteil erfolgt die Anonymisierung derart, dass eine Rück verfolgbarkeit zwischen dem Sender und dem Anonymisierungs dienst gegeben ist, aber nicht zwischen dem Sender und dem Au diogerät .

Mit Vorteil wird basierend auf der Analyse der empfangenen Sprachbefehle im Audiogerät ein Feedback generiert, welches vom Anonymisierungsdienst einem dedizierten Sender zugeordnet wird .

Mit Vorteil wird das Verfahren durch ein entsprechendes compu terunterstütztes System (z.B. Mikrocomputer), welches im Audi ogerät implementiert ist, realisiert.

Der Anonymisierungsdienst kann aber auch auf einem mobilen Kommunikationsendgerät (z.B. Smartphone, Tablet-Computer) ei nes Benutzers realisiert werden. Erfinderische Merkmale und Vorteile der vorliegenden Erfindung für System und Verfahren, und insbesondere auch für das Compu terprogrammprodukt bzw. das computerlesbare Speichermedium sind insbesondere:

Durch Nutzung einer Anonymisierungsschicht können Arbeitnehmer auf zur Verfügung gestellter Hardware (Kommunikationsendgeräte oder andere dedizierte Hardware zur Nutzung von digitalen As sistenten) auf datenschutzgewährleistende Weise Assistenz dienste von Dienste-/Drittanbietern (z.B. Amazon Echo, Alexa) zur Nutzung im Arbeitsumfeld verwenden. Auch kann auf nicht vom Arbeitgeber bereitgestellter Hardware (z.B. Smartphone) eine Anonymisierungsschicht-bereitstellende Software/app ge nutzt werden.

Eine solche Anonymisierungsschicht (Software) kann entweder auf dem Kommunikationsendgerät, auf einem zwischengeschalteten Gerät oder innerhalb der Serverlandschaft des Arbeitgebers o- der eines beauftragten Dienstleisters liegen.

Die Anonymisierung erlaubt die Nutzung von Assistenzdiensten wir z.B. Amazon Alexa, unter Beibehaltung des Datenschutzes.

Damit eine individuelle Anfrage beantwortet werden kann, wird die Anfrage-Identität bzw. die Anfrager-Identität in Richtung Assistenzdienst anonymisiert. Bei Antwort des Assistenzdiens tes wird diese wieder dem eigentlichen Benutzer zugeordnet, so dass eine zielgerichtete Antwort/Reaktion möglich ist.

Der Anonymisierungsdienst fragt also als „Proxy" für den ei gentlich Anfragenden (Benutzer) an und verschleiert damit des sen Identität. Damit verschiebt sich das Vertrauensverhältnis zwar zunächst nur (der Endanwender muss nun dem Proxy vertrau en anstatt dem Dienstleister) , aber dies ist ein entscheiden der Unterschied: Im kommerziellen Gebäudeumfeld kommen nämlich Spezialitäten zum Tragen, die zu einer Anonymisierung ausgenutzt werden kön nen :

- Solche „Proxies" können direkt unter der Kontrolle des Endkunden selbst stehen; oder unter der Kontrolle eines Partners, dem der Endkunde vertraut.

- Weiterhin sind alle Geräte eines Standortes sowohl lokal vernetzt als auch immer mehr mit regionalen, nationalen oder gar globalen Datencentern verschaltet. Dies sind wiederum entweder Endkunden-eigene Datencenter oder sol che von trusted-Partners des Endkunden. Da der Proxy als eine Instanz gegenüber dem Dienstleister auftritt, wird die Anonymität gegenüber dem Dienstleister umso besser, je grösser der „Pool" an Anfragenden ist.

- Für die meisten Anwendungsfälle im Gebäudeumfeld ist es unerheblich, welche Person den Sprachbefehl gibt. Die konkrete Person kann daher bereits lokal durch eine abs trakte Person ersetzt werden. Dies kann z.B. gemacht wer den :

• Absichtlich verlustbehaftet und damit nicht mehr um kehrbar (z.B. durch eine randomisierte Sprachver- fremdung direkt im Gerät oder an jeder anderen Stel le bevor der Dienstleister aufgerufen wird) ;

• Absichtlich verfremdet aber lokal umkehrbar (wie zu vor, aber die randomisierende Instanz hält lokal die Verbindung zum Anfragenden) : Dies erlaubt persönli che Profile, die aber eben nur dem Proxy bekannt sind und nicht dem Dienstleister;

• In beiden zuvor genannten Fällen kann die eigentlich anfragende Person anonym bleiben, weil sie sich zum sprachgesteuerten Gerät hin zwar identifizieren kann (=so sie will), aber eben nicht muss: Wie erwähnt wird die Aktion letztlich konzeptionell für eine En tität eines Gebäudes ausgeführt (z.B. einen Raum), nicht für einen Benutzer.

- Der Anonymisierungsgrad eines solchen Proxy-Ansatzes kann durch weitere Massnahmen erhöht werden:

• Mixe: Der Proxy fragt randomisiert mehr als einen Dienstleister ab. Oder die Abfragen werden mit Proxies von anderen trusted Partners gemischt. In beiden Fällen erhöht sich die Entropie, was eine Rückverfolgbarkeit seitens des/der Dienstleister ( s ) erschwert ;

• Cacheing : Die Wahrscheinlichkeit, dass dieselben Steuerbefehle gegeben werden, erhöht sich sowohl über die Zeit hinweg als auch über die Menge der vernetzten Gebäude hinweg massiv.

• Ein Sprachcache (siehe Figur 4) kann mit hoher Wahr scheinlichkeit einen Großteil der Sprachbefehle er lernen und direkt aus dem Cache bedienen anstatt den Dienstleister befragen zu müssen. Dies erhöht nicht nur die Anonymität, sondern erhöht natürlich auch die Performanz der Anlage. Desweiteren dürften damit auch die Kosten optimiert werden, da Sprachdienst- leister ihre Dienste typischerweise nach der Anzahl der erfolgten Anfragen abrechnen;

• Sprachcaches (siehe Figur 4) können untereinander (anonym) abgeglichen werden: Da Sprachbefehle sehr häufig zu Gebäudestrukturen korrelieren, kann die Erkennungsrate massiv verbessert werden. Zum einen, weil der Proxy weiss, wo der Befehl abgesetzt wurde (z.B. werden Jalousiesteuerungsbefehle nur in Räumen abgesetzt, in denen auch Jalousien vor den Fenstern sind; umgekehrt darf ein System natürlich in jedem Raum, in dem Jalousien vor den Fenstern sind, auch Sprachbefehle für sie erwarten) . Zum anderen, weil in ähnlichen Entitäten eines Gebäudes (z.B. „Räume mit Jalousien vor dem Fenster") weltweit auch ähnli che Sprachbefehle zu erwarten sind.

- Anonymisierung der anfragenden Dienstnutzer (speziell aus Sicht des Diensteanbieters) .

- Möglichkeit der Bildung von logischen Nutzer-Cluster: so könnten zum Beispiel alle Assistenzanfragen eines Gebäu des unter diesem „Dach" zur Auswertung zusammengefasst werden; dies wiederum ermöglicht eine Auswertung hin sichtlich von Optimierungspotential (was wird besonders oft angefragt -> wäre es möglich diese Funktion per default anzubieten um Anfragen zu reduzieren?; „wo drückt der Schuh" der Nutzer -> wäre hier Abhilfe machbar?); Auswertung hinsichtlich einzelner Gebäude (so denn ein Nutzer-Cluster aus allen Nutzern innerhalb eines Gebäudes besteht) und damit Vergleichsmöglichkeit zwischen logi schen Clustern.

- Durch logische Anfragebündelung kann die Intelligenz (z.B. das entsprechende KI-Programm, Neuronale Netz) des Diensteanbieters noch immer die Gewohnheiten etc. lernen, d.h. besser werden und sich auf den Nutzer einstellen, ohne den einzelnen Anfrager zu kennen; der logische Clus ter, die Struktur, tritt als Dienstnutzer auf - entspre chend lernt die AI-Engine (KI-Maschine) die Vorlieben etc. dieser Struktur, z.B. einem speziellen Gebäude (ent spricht die Summe der von diesem Cluster ausgehenden An fragen) .

- Möglichkeit zur Nutzung von beliebigen / beliebig vielen Assistenzdiensten unter einer Oberfläche (auf Nutzersei te) ; dadurch je nach Frage-/Aufgabenstellung Nutzung des besten/sinnvollsten Dienstes ohne das sich der eigentli- che Nutzer darum kümmern muss; dadurch ist weiterhin ei genes branding/UI auf Seiten des Benutzers, d.h. auf Nut zerseite möglich.

- Möglichkeit ein „pre-parsing" der Anfrage zu machen: da bei wird z.B. innerhalb der IT des Arbeitgebers die von einem Nutzer abgesetzte Anfrage an den Sprachdienst vor Weiterleitung an den eigentlichen Dienstanbieter des vir tuellen Assistenzdienstes semantisch untersucht. Je nach Inhalt/Kontext der Anfrage wird der entsprechend „beste" (dies können auch monetäre, vertragliche, etc. Gründe sein, und ist nicht auf Ergebnisqualität limitiert) AI- Dienst (d.h. der beste virtuelle Assistenzdienst) selek tiert, und an diesen die Anfrage geroutet. Hierbei kann wiederum von der Möglichkeit der „Cluster-Anonymiserung" Gebrauch gemacht werden.

- Eine weitere Möglichkeit des Datenschutzes besteht darin dass vor Anfrage an einen AI-Dienst (Assistenzdienst) ei ne Sprachummodulation durchgeführt werden kann; dabei wird die Sprachanfrage z.B. in Höhe / Modulation / Ge schwindigkeit verändert (z.B. Sprache von Angestelltem X wird in synthetische Sprache umgewandelt) .

- Eine weitere Möglichkeit besteht darin eine Spracherken nung (Speech to Text) bereits vor Abfrage an den Dienste anbieter durchzuführen, und den erkannten Speech to Text Inhalt via Schnittstellen (APIs) an den Dienstanbeiter zu übermitteln. Dies bedeutet einfache Anonymisierung als auch Übertragungseffizienz.

- Die Nutzung des Beschriebenen ist auch im Privatumfeld möglich, und nicht nur auf das gewerblich/kommerzielle Umfeld beschränkt.

- Nutzung von AI-/Sprachassistenten (z.B. Alexa von Amazon, Google Assistant, Google Now) kommerzieller grosser An bieter (Amazon, Google, etc.) im betrieblichen Arbeitss- umfeld, unter Beibehaltung von datenschutzbedingter Auf lagen und Vorsichtsmassnahmen möglich.

Verfahren und System zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienele menten in Gebäuden, wobei durch ein Audiogerät Sprachbefehle empfangen werden, wobei das Audiogerät eingerichtet ist die empfangenen Sprachbefehle zu analysieren, in entsprechende Be- dienkommandos für Raumbedienelemente zur Ansteuerung von ins besondere HVAC-Geräten (z.B. Feldgeräten) in einem Gebäude um zuwandeln und an die entsprechenden Raumbedienelemente weiter zuleiten; und wobei vor dem Empfangen der Sprachbefehle beim Audiogerät, die Identität des Senders (Benutzer) der Sprachbe- fehle durch einen Anonymisierungsdienst anonymisiert wird.

Bezugs Z eichen

PI - P6 Benutzer

MG Mobiles Gerät

SB1 - SB7 Sprachbefehl

ASB1 - ASB7 , ASB, ASB ' , ASB ' ' Anonymisierter Sprachbefehl

BK1 - BK12 , BK Bedienkommando

RBE Raumbedienelement

AD1 - AD4 Anonymisierungsdienst

AG1 - AG4 Audiogerät

MCI - MC3 Prozessor

Ml - M4 Speicher

Mikro Mikrophon

ANE Anonymisierungseinheit AE Analyse-Engine

SSS Sendeschnittstelle

FBE1 , FBE2 Feedbackeinheit

SC Sprachcache

FB Feedback

S Server

Gl - G4 Gerät

VS1 Verfahrensschritt