Die Zukunft von Siri und Spracherkennung

Solche â€œTransaktionskettenâ€ sind in der Theorie gar nicht mal so problematisch, immerhin kann Siri Informationen aus Apps extrahieren oder Daten weiterreichen. Schwierig wird es erst im Zusammenspiel der akustischen Probleme, dem Dialekt/Habitus des Users, dem besprochenen Kontext und der Netzwerk-Latenz der involvierten Dienste. Was wenn die 3G/4G-Verbindung gerade etwas stockt, soll die Prozedur im Hintergrund durchlaufen? So viele Details mÃ¼ssen bei der Usererfahrung bedacht werden und kÃ¶nnen den SpaÃŸ deutlich trÃ¼ben, an vorderster Stelle steht wohl das MissverstÃ¤ndnis.

Der Charme von Siriâ€™s alternativen Antworten, die Ã¼ber eine funktionelle Limitation mit Humor und Unterhaltungsfaktor hinweghelfen sollen, wird von Apple genauso aktiv ausgebaut wie die LernfÃ¤higkeiten der virtuellen Assistentin im Smartphone. KÃ¼rzlich listete Apple sogar Jobangebote fÃ¼r Autoren, die sich mit Siri auseinandersetzen mÃ¶chten. Fragen, die wenig Bedeutung fÃ¼r einen Computer oder ein Informationssystem bieten (â€œWillst Du mich heiraten, Siri?â€) sind Ã¼berraschend wichtig fÃ¼r das Nutzungserlebnis der User und tragen zu einem positiven Gesamtbild des Dienstes bei.

Meine Empfehlungen für dich

Die 4-Stunden-Woche - Mehr Zeit, mehr Geld, mehr Leben | Der Welt-Besteller für eine geniale Work-Life-Balance, ortsunabhängiges Arbeiten und ein fantastisches Leben.

Bestes iPhone Leder-Case - Eleganter kannst du dein iPhone nicht gegen Schmutz und Kratzer schützen. Das 2in1 Leder-Case von Solo Pelle ist abnehmbar, kommt mit Kartenfächern daher und sieht einfach nur mega aus.

Mein liebster Arbeitsstuhl - Ohne den Swopper Air hätte ich sicherlich mehr Rückenschmerzen. Er fördert trotz Sitzposition eine bewegliche Wirbelsäule und hält mich beim Arbeiten aktiv. Das ist ein riesiger Vorteil zum stink normalen Bürostuhl.

Star Trek: The Next Generation - Siri's Vorbild?

Im August 2011 war Siri-Investor Gary Morgenthaler noch Ã¤uÃŸerst optimistisch hinsichtlich der kÃ¼nftigen Entwicklungen in der nÃ¤heren Zukunft. Zwei bis drei Jahre solle die Entwicklung noch brauchen, dann sei Siri auf dem Konversationstempo eines Menschen und kÃ¶nne auch unterwegs (vorausgesetzt der Empfang gÃ¤be es her) passende Antworten in Windeseile liefern. Fast 1,5 Jahre spÃ¤ter sehen wir noch keine deutlichen Steigerungen des Funktionsumfangs von Siri, vor allem keine â€œvorausschauendenâ€ oder personalisierten Antworten.

Unabdinglich ist jedoch die Anbindung von Systemen wie Siri an groÃŸe, wenn nicht gigantische Datenbanken mit dem Wissen der Menschheit. Kartografie und Restaurants sind natÃ¼rlich nur der Anfang, auch die Verbindung zu Wolfram Alpha weist die kÃ¼nftige Richtung auf.

Siri als reine Sprachsteuerung ohne manuelle AuslÃ¶sung

Eine weitere Limitation liegt in der Eingabemethode: Siri wird nach wie vor Ã¼ber einen Button (oder bei GerÃ¤ten mit Jailbreak auch per Geste) aktiviert und erfordert somit die Hand, wo die Eingabe doch â€œhands-freeâ€ sein sollte. Sprachsteuerung ohne eine Form von â€œPush-To-Talkâ€-AuslÃ¶ser ist noch immer von fundamentalen Problemen geplagt, selbst wenn wir vom enorm gesteigerten Akkuverbrauch eines zusÃ¤tzlichen Prozesses ausgehen, der konstant auf eure Eingabe wartet und lauscht.

Rauschen und Fehlerkennungen von UmgebungsgerÃ¤uschen machen Tools wie Siri nÃ¤mlich zu schaffen, was beispielsweise im iPhone 4S mit der earSmart Technologie von Audience kompensiert wurde. Trotzdem wird kein Fingerabdruck der Benutzerstimme angelegt, was Siri von der Star Trek Version (â€œComputer, einen Earl Grey Tee bitte!â€) entfernt. Denn ohne zumindest eine grobe Idee zu haben, wie der Nutzer so klingt, kann eine Spracherkennung nicht ohne die KrÃ¼cke der manuellen AuslÃ¶sung funktionieren. Innovationen im Bereich der smarten Sensorsteuerung fÃ¼r das Mikrofon und eine Art Fingerprinting kÃ¶nnten hier Abhilfe schaffen. Aktuell kann der User ja bereits Siri per Accelerometer aktivieren lassen (die Funktion nennt sich â€œSprechenâ€ in den Siri Settings), wenn er das GerÃ¤t in die Telefonierpose schwingt, was bereits eine Steigerung darstellt, aber noch immer das Entsperren und Halten erfordert.

Nuance Communications, die Macher von Dragon Naturally Speaking (eine solide Diktiersoftware), arbeiten tatsÃ¤chlich an dieser Sorte Technologie. Sie entwicklen nÃ¤mlich eine stromsparende MÃ¶glichkeit, das Mikrofon einer DauerÃ¼berwachung zu unterziehen, um Sprachbefehle jederzeit abfangen zu kÃ¶nnen.

Nicht nur DatenschÃ¼tzer betrachten eine solche Funktion (Ãœberwachungsstaat gestÃ¼tzt durch Smartphones, oh oh!) skeptisch an, auch versehentliche Befehle wie bei jetzigen Smart TVs kÃ¶nnten wesentlich peinlicher ausfallen. Anstatt die LautstÃ¤rke versehentlich zu regulieren, kÃ¶nnte ein privates Foto plÃ¶tzlich auf Facebook landen, weil der User darÃ¼ber scherzte und dem Programm somit eine missverstÃ¤ndliche Anweisung gab. Ein simpler Schutzmechanismus wÃ¤re durchaus, das Tool auf ein bestimmtes SchlÃ¼sselwort (z.B. â€œComputerâ€) zum Zwecke der Aktivierung zu trainieren.

Keine Eingabe statt Spracheingabe, liegt hier die Zukunft?

Vielleicht bringt die Zukunft auch eine kÃ¼nstliche Intelligenz mit sich, die wie in den Culture-Romanen von Iain M. Banks gar keine Usereingabe mehr benÃ¶tigt. Menschen und Maschinen vertiefen dort ihre symbiotische Beziehung so weit, dass Ã¶konomische Konstrukte wie WÃ¤hrungen abgeschafft werden und die Maschinen unsere unangenehmen Aufgaben vÃ¶llig Ã¼bernehmen. Ein Ansatz des â€œDienst vor der Erkenntnis den Dienst zu benÃ¶tigenâ€-Konzepts steckt bereits in Google Now, wenn auch in rudimentÃ¤rer Form.

Diese Idee tangiert Ã¼brigens auch die sehr interessante Frage, ob wir als Menschen tatsÃ¤chlich selbstbestimmt sind, oder nach unterbewussten und/oder komplex automatisierten Impulsen handeln. Diversen Studien zufolge handeln wir nÃ¤mlich bis zu einer halben Sekunde schneller, als wir tatsÃ¤chlich denken und entscheiden. Retrospektiv weisen wir (laut den beteiligten Neurowissenschaftlern) dann unseren Handlungen die Bedeutung zu, dass wir uns bewusst zu ihnen entschlossen haben. FÃ¼r die Interaktion mit Computern kÃ¶nnte das bedeuten, dass diese irgendwann unseren "Verhaltens-Code" geknackt hÃ¤tten und noch vor uns wÃ¼ssten, wie wir in KÃ¼rze handeln wÃ¼rden. Eine merkwÃ¼rdige Vorstellung, oder?

Welche Art von Eingabe oder Abfrage, FunktionalitÃ¤t oder Funktionsabfolge (die aktuell nicht mÃ¶glich ist) wÃ¼rdet ihr gerne mit Siri veranstalten?

TNW, WSJ, TechRadar, Time, Counternotions

Noch kein Fan? Folge WEBLOGIT auf Facebook oder Twitter, um nichts zu verpassen! ↵

Andere nÃ¼tzliche Links

Reviews / Meinungen

ENVY 4525 von HP im Test: Flacher Allrounder fÃ¼r zu Hause

Swopper im Test: Dynamisches 3D-Sitzen

Die Zukunft von Siri und Spracherkennung

Star Trek: The Next Generation - Siri's Vorbild?

Siri als reine Sprachsteuerung ohne manuelle AuslÃ¶sung

Keine Eingabe statt Spracheingabe, liegt hier die Zukunft?

Beliebte Beiträge auf WEBLOGIT: