Semantische Netze machen Chat-Bots gesprächiger

6
Jun

 

 

„Die Bot-Revolution geht los“ –  so begrüßte die FAZ im April 2016 den digitalen Wandel. Facebook kündigt eine Messenger-Plattform an, auf der intelligente Dialogsysteme integriert und realisiert werden können, um mit Usern in Kontakt zu treten. Dabei geht es um Automatisierungsprozesse, Mitarbeiterentlastung und Unternehmenspräsenz. Ein netter Chat-Bot übernimmt, und mit nur wenigen Klicks soll es möglich sein, Bestellungen aufzugeben, Informationen zu erhalten oder einfach Spaß zu haben.

Ein Gastbeitrag von: Iryna Sorokovska M.Sc. Computerlinguistin, 4Com Innovation Center Berlin, 4Com GmbH & Co. KG

Die semantische Ebene


Die anfängliche Euphorie ist nach zwei Jahren einer gewissen Ernüchterung gewichen: Trotz einer Vielzahl an Plattformen und Bots können aktuell nur ganz wenige Bots einen einfachen, natürlichen Dialog mit dem User führen. Die meisten gehen von dem „Wählen-Sie-bitte-eine-der-Optionen“-Prinzip aus und wirken, seien wir mal ehrlich, ganz schön nervig. Warum aber ist es so schwierig, einer Maschine eine Sprache beizubringen?

Zwar wurden in den vergangenen Jahren einige Fortschritte bei der Verarbeitung natürlicher Sprache (NLP) gemacht, aber sie sind immer noch schwierig zu implementieren. Ein zentraler Trend ist dabei die Verlagerung des Verarbeitungsschwerpunktes von der syntaktischen auf die semantische Ebene. Dies soll nicht nur strukturelle, sondern auch inhaltliche Informationsabfragen ermöglichen. Heißt: Wenn Sie wissen möchten, welche Schule Quentin Tarantino besucht hat und „Quentin Tarantinos Schule“ eingeben, erhalten Sie die korrekte Antwort „Nathaniel Narbonne High School“ – und eben nicht mehr einfach eine Liste der „Tarantino-Filme“.

Bildquelle: 4Com GmbH & Co. KG

Ein solider Sprachumfang – eine Herausforderung!

Für eine Suchmaschine ist eine solche Anfrage jedoch sehr kompliziert, weil die Suchmaschine nicht nur die Stichwörter erkennen, sondern auch die inhärente Bedeutung ableiten soll. Der Lösungsansatz dafür ist nicht neu und wurde schon in 2001 von Tim Berners-Lee, dem Begründer des World Wide Web, ins Leben gerufen: das Semantische Web. Die Idee ist ganz einfach: Jede Webseite erhält eine zusätzliche Meta-Maske, die den Inhalt in einer bestimmten Form repräsentiert. Dadurch wird die Maschine in die Lage versetzt, existierende Webseiten in Relation zueinander zu setzen, eine Anfrage treffend auszulesen, eine passende Antwort zu finden und zu generieren. Die größte Hürde dabei ist, das gesamte Wissen zu kategorisieren, einheitlich darzustellen und dabei auch noch die Datenmenge einer ständig wachsenden Internet-Community zu bewältigen. Für ein Dialogsystem ist das eine Menge Arbeit!

Um einen guten und erfolgreichen Chat-Bot mit einem soliden Sprachumfang zu konstruieren, reicht es also nicht, schnell ein paar Dialogbäume zu generieren und die Schlüsselbegriffserkennung einzubauen. Ein guter und erfolgreicher Chat-Bot ist vor allem sprachfähig. Und seine Sprachfähigkeit ist das Ergebnis systematischer Projektierung, die Methoden aus dem Bereich der künstlichen Intelligenz (KI) nutzt und auf deren Frameworks zur Implementierung aufsetzt. Dazu gehört auch die Auseinandersetzung mit den linguistischen Besonderheiten des Dialogregisters und der Kontextführung. Für diese Aufgaben hat sich der Ontologie-basierte Ansatz als vielversprechende Basis herauskristallisiert.

Bildquelle: 4Com GmbH & Co. KG, Semantische Netze

Eine Wissensbasis braucht Zeit und Knowhow

Eine Ontologie ist ein komplexes semantisches Netz, eine Wissensbasis, die auf die Idee des „Semantischen Web“ zurückgeht. Zum einen stellt sie allgemeine Eigenschaften und individuelle Ausprägungen vorhandener Begriffe und Konzepte dar. Zum anderen werden diese in Relation zueinander gesetzt und abgebildet. „Quentin Tarantino“ kann beispielsweise ein Knotenpunkt sein, der mit einem Knotenpunkt „Film“ in Relation steht. So etwa wie „Quentin Tarantino ist ein Film-Regisseur“ oder „Quentin Tarantino ist ein Schauspieler im Film xxx“.

Gleichzeitig besitzt jeder Knotenpunkt eigene Attribute und dazugehörige Werte. Der wesentliche Vorteil dieses Ansatzes ist: Die Daten können autonom von einer Maschine ausgelesen und interpretiert werden. Der große Nachteil ist: Die Wissensbank muss sorgfältig und langwierig aufgebaut werden. Deswegen versucht man von vornherein, den Spielraum, die sogenannte „Domäne“ eines Chat-Bots, einzuschränken, und sich auf einen konkreten Sprachumfang zu konzentrieren. Dies erlaubt es, überschaubare Ontologien aufzubauen. Hinzu kommen noch die Kontextführung, das Antrainieren des Dialogsystems, das maschinelle Lernen und die Backend-Einbindung. Es erfordert also eine Menge Knowhow und Zeit, um eine funktionierende, qualitativ hochwertige Chat-Bot-Lösung zu liefern. Deswegen wird auf einfachere, Button-basierte Optionen zurückgegriffen, die allerdings eher als Übergang und nicht als Entwicklungsziel eines dialogbasierten Systems betrachtet werden können.  Fazit? Die Bot-Revolution geht weiter.

References:

1) Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 284 (5), May 2001, S. 34–43 (dt.: Mein Computer versteht mich. In: Spektrum der Wissenschaft, August 2001, S. 42–49)3

2) http://www.faz.net/aktuell/wirtschaft/netzwirtschaft/unternehmen-setzen-auf-Chat-Bots-chancen-risiken-14175914.html

Artikel kommentieren