Sprachassistenten wie Amazons Alexa oder Chatbots, die auf vielen Webseiten angeboten werden, dringen mittlerweile in das tägliche Leben von immer mehr Menschen ein. Inzwischen können Computerprogramme sogar automatisch Texte erstellen oder Meldungen in sozialen Netzwerken posten. Doch was steckt dahinter und wie funktioniert es.
Der in San Francisco lebende freie Autor Christoph Drösser erklärt in seinem 167 Seiten starken Büchlein die Ansätze, die mit Sprachassistenten, Chatbots oder ähnlichen Programmen beschritten werden. Das beginnt mit einem (entbehrlichen) historischen Abriss des ‚Schachtürken‘ aus dem Jahr 1769 über die von Alan Turing (dessen Theorien Generationen angehender Informatiker, wie den Autor dieser Rezension, gequält haben) erdachten ‚Intelligenztest für Maschinen‘, und reicht bis zu den Technologien, die in heutigen Sprachassistenten wie Amazon Alexa, Microsofts Cortana oder Google ‚Google Assistant‘ (Google Now) verwendet werden.
Drösser spart auch keine Annektdoten aus, und erwähnt auch den bei Microsoft ziemlich schief gelaufenen Versuch mit einem Chatbot (siehe mein Blog-Beitrag Microsoft Tay-Chatbot–teilweise missglücktes Experiment). Ein großer Teil des Büchleins gibt Interviews mit Leuten wieder, die in den USA auf dem Gebiet der Chatbots, Sprachassistenten und Schreibbots arbeiten bzw. forschen oder bis vor kurzem dort aktiv waren.
Ein eigenes Kapitel geht auf die Grenzen aber auch die Möglichkeiten der statistischen Sprachanalyse ein. Zudem befasst sich das Buch mit ‚dem Computer als Autor‘, sprich mit Maschinen-generierten Texten, die in den letzten Monaten des Jahres 2020 für Furore sorgten (siehe beispielsweise den Textgenerator GPT-3).
Auf den knapp 160 Seiten kann der Autor lediglich einen Überblick über den Stand der Technik geben, wobei diese Informationen in ein oder zwei Jahren wieder überholt sind. Gut finde ich einige Einschätzungen bezüglich bestimmter Sprachassistenten-Technologien sowie die Informationen, dass die Sprachassistenten Alexa (Amazon) und Google Assistant (Google) heute bei Tests besser als Siri (Apple) abschneiden.
Drösser geht auch immer wieder kurz auf die Risiken bestimmter Technologien ein. So erwähnt er explizit auf vier Seiten die Risiken, dass Sprachassistenten beispielsweise die Kommunikation ihrer Besitzer mithören und an die Server der Firmen, die diese Assistenten bereitstellen, übertragen. Der Autor geht auch auf Alternativen wie das Open Source-Projekt Almond ein, ein virtueller Assistent, der an der Standford University entwickelt wird.
Was mir persönlich etwas fehlt, ist die Einschätzung, dass viele dieser Produkte, speziell im Konsumer-Bereich, binnen kürzester Zeit aus dem Support fallen oder gehackt werden können. Nachfolgende Links geben einen kurzen Abriss an Blog-Beiträgen, die ich in den letzten Monaten zu diesen Themen aus Sicht eines Praktikers veröffentlicht habe.
Cortana-Support stirbt für Android & iOS
Unschön: Harman Kardon Invoke bald teurer Elektroschrott?
Bundestags-Gutachten warnt Eltern vor Amazons Alexa
Sicherheit: Digitale Assistenten unterm Weihnachtsbaum
Amazons Alexa geknackt, zahlreiche Sicherheitslücken
Sprachassistenten als Hacking-Risiko für Mobilgeräte
Sprachassistenten hacken, die unerkannte Gefahr
Wer sich einen ersten Überblick über die Thematik und bezüglich der philosophischen Fragen in Bezug auf den Einsatz dieser Technologien verschaffen möchte, findet in dem Taschenbuch von Drösser einen guten Überblick. Für einen tieferen Einstieg in die einzelnen Fachgebiete ist das Werk sicherlich nicht gedacht. Dies gilt auch für Leser, die sich praktische Hinweise in Bezug auf die Nutzung von Sprachassistenten erhoffen, oder wissen möchten, wie man Texte von Bots in Social Networks oder im Internet erkennen kann.
Christoph Drösser: Wenn die Dinge mit uns reden
Von Sprachassistenten, dichtenden Computern und Social Bots
160 Seiten, Taschenbuch, Duden-Verlag
1. Auflage (12. Oktober 2020)
Preis: EUR 16,00 Euro
ISBN-10: 3411742259
ISBN-13: 978-3411742257
Klappentext: Wir sprechen mit Sprachassistenten und Chatbots, lesen Berichte, die ein Computer geschrieben hat und lassen uns von Meinungs-Bots in den sozialen Medien manipulieren. Als Kommunikationspartner nehmen Maschinen eine Rolle ein, die bislang Menschen vorbehalten war. Wir unterstellen ihnen automatisch ein Bewusstsein und Emotionen. Daher ist die neue Sprachtechnik mehr als ein neues Interface. Christoph Drösser erklärt, wie’s funktioniert, und lotet die Möglichkeiten, Chancen und Gefahren der intelligenten Sprachsysteme aus.