Die Zukunft von Siri und Spracherkennung

Mit jeder neuen Iteration des Apple iPhone erwarten manche User ein Wunder. Ein fliegendes, hyperintelligentes, sensationelles Superphone mit unbegrenzter FunktionalitÃ¤t und der Rechenkraft eines Supercomputers. Wenn das erwartete Wunder sich dann leider nicht manifestiert, wird das GerÃ¤t in Grund und Boden gebashed.

Wir tendieren beim aktuellen Hype um die kleinen Taschenrechner (no pun intended) zum gelegentlichen Vergessen der eigentlichen Bestimmung und der MÃ¶glichkeiten unserer Devices, wo soll die Reise Ã¼berhaupt noch hinfÃ¼hren?

Meine Empfehlungen für dich

Die 4-Stunden-Woche - Mehr Zeit, mehr Geld, mehr Leben | Der Welt-Besteller für eine geniale Work-Life-Balance, ortsunabhängiges Arbeiten und ein fantastisches Leben.

Bestes iPhone Leder-Case - Eleganter kannst du dein iPhone nicht gegen Schmutz und Kratzer schützen. Das 2in1 Leder-Case von Solo Pelle ist abnehmbar, kommt mit Kartenfächern daher und sieht einfach nur mega aus.

Mein liebster Arbeitsstuhl - Ohne den Swopper Air hätte ich sicherlich mehr Rückenschmerzen. Er fördert trotz Sitzposition eine bewegliche Wirbelsäule und hält mich beim Arbeiten aktiv. Das ist ein riesiger Vorteil zum stink normalen Bürostuhl.

Vom ersten Smartphone, demÂ IBM Simon, sind wir mittlerweile weit entfernt. KnuffigeÂ 16 MHzÂ und lediglich eine Dritthersteller-App bei einem Gewicht vonÂ 510 GrammÂ machten dem Formfaktor â€œbrick-sizeâ€ alle Ehre, dagegen kann nicht mal das heutige Nokia Lumia 920 ankommen (kleiner Scherz, ich schÃ¤tze die robuste Bauweise sehr).

Moderne SoCâ€™s wie das Apple A6 liefern immerhin genÃ¼gend Leistung, um einen Teil der Rechenarbeit beim Einsatz von Sprachsteuerungen auf dem GerÃ¤t auszufÃ¼hren.

Bei der zunehmend effizienteren Vernetzung mit Cloud-Computing wird die reine Rechenkraft wohl zur kleinsten Limitation von Spracherkennung und Spracheingabe. Umweltfaktoren, Schall und syntaktisch schwierige Anfragen von Usern sind da noch ein viel grÃ¶ÃŸeres Problem.

Maus, Geste, Sprache: Siri im Fokus der Interface-Entwicklung

Siri ist einer der besten Chatterbots die wir neben dem fluchenden CleverBot haben, der mittlerweile fast nur noch vulgÃ¤re Ã„uÃŸerungen und Internethumor plappert. Trotzdem funktionieren mehrstufige Anweisungen oder komplexere Befehle nicht mit Appleâ€™s moderner Sprachsteuerung.

Als â€œmehrstufigâ€ wÃ¼rde ich hier einen Vorgang bezeichnen, der wie ein Makro mit der Eingabe arbeitet um ein Ergebnis hervorzubringen, das mehr als einen vergleichsweise simplen Abruf von Informationen umfasst. Aktuell kann Siri bekanntlich bereits Anweisungen wie â€œSchreibe eine SMS an XYZ mit dem Inhalt ABCâ€ verarbeiten.

Eine komplexere Anweisung wÃ¤re beispielsweise: Abruf von ungelesenen RSS-Feed-Postings meiner meistfrequentierten Seiten (Zeitraum als Parameter, z.B. 4 Wochen) und die PrÃ¤sentation in einem Layout Ã¡ la Flipboard. Oder: Zeige mir alle Fotos vom letzten Holland-Urlaub, auf denen Person XYZ zu sehen ist.

NatÃ¼rlich lieÃŸe sich diese Art von FunktionalitÃ¤t auch mit Plugins oder vordefinierten Verhaltensformen kombinieren, was allerdings den User wieder in die Lernposition manÃ¶vriert, die Anfrage mÃ¶glichst prÃ¤zise und Siri-verdaulich zu formulieren.

â€œKÃ¼nstliche Intelligenzâ€ (wir sehen mal von Bewusstsein im Androiden-Sinne ab) ist zweifelsohne eines der Totschlagfeatures der kommenden Jahre und wird in ausgefeilter Form der UnterstÃ¼tzung im Alltag dienen. Interessante Features fÃ¼r die nÃ¤chste Generation von Siri lÃ¤gen in einer ausgebauten Kontext-SensitivitÃ¤t (Einbezug von aktueller Position, Wetter, Uhrzeit, letzten Anfragen, Vorlieben und vielleicht auch Laune in einer Form von â€œGedÃ¤chtnisâ€) und einem insgesamt flÃ¼ssigeren Dialog.

Kontext ist alles. Der richtige Kontext ist, gepaart mit dem richtigen Timing, beispielsweise schon fast ein Garant fÃ¼r einen Verkaufsabschluss in jeder Branche. Wir Menschen reagieren hochsensibel auf Kontext und Setting, folglich kommen Dialogsysteme auch nicht um diese Mechanik herum.

Beispiel vom Counternotions Blog: â€œErinnere mich im BÃ¼ro an die Reservierung fÃ¼r ein nettes asiatisches Restaurant fÃ¼r den Geburtstag meiner Mutter und maile mir den besten Weg, um zu ihrem Haus zu kommenâ€. Was bedeutet in diesem Fall â€œnettâ€? Eine intelligente Suchmaschine kann Synonyme zu nett im Kontext von Restaurants mit Begriffen wie â€œgemÃ¼tlichâ€, â€œschÃ¶nâ€ oder â€œromantischâ€ gleichsetzen und Bewertungen sowie Berichte aus dem Netz damit verknÃ¼pfen. Doch woher weiÃŸ die KI, welches Restaurant ich mir leisten kann? Mit einer VerknÃ¼pfung zu einer relevanten App, die Einsicht in meine Konten hat, kÃ¶nnte Siri eine solche Abfrage starten.

Eine MÃ¶glichkeit hier Innovation anzukurbeln lÃ¤ge im Einbinden der globalen Entwickler-Community im iOS-Bereich, beispielsweise mit Schnittstellen fÃ¼r spannende Einsatzzwecke von Siri. Eine engere Integration mit den Apps, die wir alltÃ¤glich nutzen, wÃ¼rde Siri wesentlich mÃ¤chtiger machen. Aktuell ergibt eine Anfrage fÃ¼r eine bestimmte Band in Spotify bei der deutschen Siri nur die Ausweich-Websuche nach irgendwas mit â€œSchpohtifiâ€ (phonetisch) - wenig hilfreich. In China hingegen wurde Siri nachtrÃ¤glich eingeschrÃ¤nkt, da der Obrigkeit die Anzeige von Prostituierten und WaffenhÃ¤ndlern auf der Karte nicht sonderlich gefiel.

Siri hat tatsÃ¤chlich (auf dem Papier) programmatischen Zugriff auf die Apps von Drittherstellern und kÃ¶nnte eine Kette von Befehlen ausfÃ¼hren, die Handlungen in den involvierten Apps miteinbezieht.

Beispiel:
Buche zwei Kinotickets (Kino-App), erstelle Vermerk im Kalender, lade meine Freunde ein, benachrichtige meine Frau per SMS, prÃ¼fe den Verkehrsstatus und errinnere mich daran, die reservierten Karten beim Eintritt rechtzeitig abzuholen, falls ich nicht eine halbe Stunde vor dem Termin dort bin. Aktiviere den Flugzeugmodus sobald ich im Kino bin.

Fortgesetzt auf Seite 2:

Noch kein Fan? Folge WEBLOGIT auf Facebook oder Twitter, um nichts zu verpassen! ↵

Andere nÃ¼tzliche Links

Reviews / Meinungen

ENVY 4525 von HP im Test: Flacher Allrounder fÃ¼r zu Hause

Swopper im Test: Dynamisches 3D-Sitzen

Die Zukunft von Siri und Spracherkennung

Maus, Geste, Sprache: Siri im Fokus der Interface-Entwicklung

Beliebte Beiträge auf WEBLOGIT: