In diesem Jahr wurde 169 Labs als Google Partner zur Google I/O eingeladen. Goolge I/O ist eine im Jahresturnus stattfindende Konferenz, bei der Google neue Funktionen, Dienstleistungen und Produkte präsentiert. Die dreitägige Veranstaltung findet neben dem Google Headquarter in Palo Alto California statt und wird von 5.000 Teilnehmern aus der ganzen Welt besucht. Die verschiedenen Sessions befassen sich mit Android, VR/AR, Firebase, Web Technology, KI, Machine Learning, Hardware und Technologie im Allgemeinen. Unser Hauptaugenmerk lag auf den Neuigkeiten rund um den Google-Assistant und der Sprachtechnologie von Google.
Der I/O-Schwerpunkt 2019
Die wichtigsten Ankündigungen werden während der Eröffnungs-Keynote gemacht. Wir werden in diesem Blogbeitrag die Ankündigungen mit den größten Auswirkungen auf den Bereich Voice besprechen.
Google Duplex Web-Erweiterungen
Letztes Jahr machte Google Duplex Schlagzeilen, als der Assistent telefonisch eine Reservierung in einem Restaurant machte. In diesem Jahr hat Google den Assistenten um die Möglichkeit erweitert, Online-Formulare im Namen des Nutzers mit seinen Daten auszufüllen. In der Demonstration wurde eine Mietwagen-Buchung durchgeführt, ohne dass der Benutzer irgendwelche Daten eingeben musste:
Google behauptet, dass diese Funktionalität möglich ist, ohne dass die Mietwagen-Website die Funktionalität ihrer Website erweitern muss. Ich denke, dies ist ein echter Assistent bei der Arbeit, der einfache und repetitive Aufgaben übernimmt. Mal sehen, wie das im wirklichen Leben funktioniert.
Der Google-Assistant verlegt das Natural Language Understanding (NLU) in die Geräte.
In einem interessanten Ansatz hat Google die KI für NLU aus der Cloud in das Gerät verschoben. Das Sprachmodell wurde von 100 GB auf 0,5 GB geschrumpft und bewahrt trotzdem die gleiche Genauigkeit beim Verständnis der menschlichen Stimme. In den letzten Jahren seit dem Aufkommen von Cloud Computing wurden die Clients immer dünner und dünner und die gesamte Logik wurde in die Cloud verlegt. Dieser neue Ansatz ist ein Paradigmenwechsel und bringt die Verarbeitung wieder auf die Geräte selbst zurück. Der klare Vorteil ist die Geschwindigkeit (die Verarbeitung wurde 10x schneller). Ein weiterer Aspekt, der von Google interessanterweise noch nicht erwähnt wurde: der Datenschutz. Da das Gerät selbst die Eingaben des Benutzers verarbeiten kann, ist es nicht notwendig, die Eingaben des Benutzers über das Netzwerk an die Cloud zu senden und dort zu verarbeiten. Die Stimmaufzeichnungen (und Daten) verlassen das Gerät nicht und werden dort verarbeitet, was private Gespräche nicht an Google weitergibt.
Hier ist eine Demonstration der Geschwindigkeitsverstärkung:
Natürlichere Gespräche und Multitasking
Multitasking war bei Sprachanwendungen bisher nicht möglich. Man musste jede Anwendung öffnen, die Aufgabe dort erledigen und zur nächsten Anwendung übergehen. Google zeigte eine sehr natürliche Art und Weise, wie man von einer Anwendung zur anderen wechselt und Fotos in eine Nachricht zieht. Ich denke, das ist die Zukunft, wie wir mit Assistenten umgehen können:
Alle diese Funktionen sollten noch in diesem Jahr auf neue Pixeltelefone kommen.
Fahrmodus
Die Nutzung im Auto ist einer der größten Anwendungsfälle für digitale Assistenten. Der Assistent ist bereits in Android Auto und Google Maps enthalten. Die neue Fahrmodusfunktion sperrt das Telefon während der Fahrt und versucht, Ablenkungen zu vermeiden. Aber es ermöglicht auch, grundlegende Aufgaben wie die Fortsetzung eines Podcasts, die Annahme oder Ablehnung eines eingehenden Anrufs per Stimme oder die Reservierung in einem Restaurant mit sogenannten Shortcuts.
Hier gibt die Demo einen kurzen Einblick:
Nest Nabe Max
Google bringt seine Google Home Produkte unter dem Dach der Nest Marke auf den Markt und präsentiert ein neues Gerät, den Nest Hub Max. Der Nest Hub Max ist eine neue Version des bestehenden Home Hubs mit einer hochauflösenden Kamera (mit einem physischen Schalter auf der Rückseite) und einem größeren Display.
Die neue Kamera ermöglicht es per Face Match (Profile, die verschlüsselt auf dem Gerät gespeichert sind) das Gerät darüber zu informieren, wer sich im Raum befindet und die Funktionalität zu personalisieren.
Eine weitere tolle Funktion ist die Gestensteuerung, mit der laufende Musik anstatt per Sprachbefehl per Geste angehalten werden kann.
Das neue Modell wird im Laufe dieses Sommers für 229 US-Dollar auf den Markt kommen.