Mit der Online-Anwendung “Talk to Books” hat Google Anfang des Monats eine neuartige Such-Applikation vorgestellt, die ihre Inhalte aus Büchern bezieht bzw. in ihrer Trefferliste Ergebnisse aus Google Books präsentiert. Talk to Books erscheint in einer Reihe von Experimenten mit neuer KI-Engine zur semantischen Analyse natürlicher Sprache und wird als Demoversion im Web frei zur Verfügung gestellt. Hat dieser Ansatz echtes Potenzial für die Erschließung von Wissen aus Büchern oder als Discoverability-Tool für Buchkataloge? Ein Überblick über das neueste Werkzeug des Suchmaschinen-Anbieters:
Google Talk to Books – ein neues Such-Paradigma für Bücher?
Im April hat Google eine Reihe von Applikationen vorgestellt, die auf einer neuen KI-Engine zur Verarbeitung natürlicher Sprache aufsetzen und als öffentliche Demo-Versionen unter dem Titel “Semantic Experiences” im Netz zum Test bereitstehen. “Talk to Books” ist eine Anwendung, die ein neues Such-Paradigma mit dem Datenbestand von Google Books realisiert: Das zentrale Prinzip der Suche basiert dabei – wie bei den meisten Ansätzen von Google für semantische Suche – nicht mehr auf der Eingabe von Keywords, sondern darauf, Fragen an die Applikation zu stellen, die anhand von Buchinhalten beantwortet werden. Die Anwendung ähnelt darin stark der Sprachverarbeitung in der allgemeinen Google-Suche bei Angabe von Fragesätzen, jedoch gibt es sowohl dazu, als auch zu spezifischen Suchanwendungen für Buchkataloge einige zentrale Unterschiede:
- Die Suche bedient sich nicht aus Metadaten der Buchtitel, sondern verwendet ausschließlich den Content des Buches für die Antworten auf die Fragen.
- Die Inhalte der Bücher werden bis hinunter auf die Ebene einzelner, aber zusammenhängender Sätze analysiert, die Suchanwendung versucht dabei diejenigen Sätze zu finden, die inhaltlich am besten zur Sucheingabe passen.
- Im Gegensatz zur allgemeinen Google-Suche, die in der Regel versucht, für Fragestellungen sehr konkrete und eindeutige Antworten zu finden, arbeitet Talk to Books eher assoziativ: Es versucht Konzepte zu erkennen und darauf passende Inhalte zu präsentieren – und ist darin fast eher ein Kreativitätstool zur Exploration von Themen, als die “Frage/Antwort-Maschine”, die z.B. Google Assistant versucht zu werden.
- Als Treffer werden nicht nur die gefundenen Bücher an sich, sondern vor allem auch die Passagen aus den Büchern präsentiert, die eine besonders hohe Assoziation mit der Sucheingabe zeigen.
Nach Googles eigener Einschätzung liegt die große Stärke von Talk to Books im Umgang mit unscharfen bzw. unspezifischen Fragestellungen (bei denen der Fragende evtl. selber noch gar nicht konkret weiß, wonach er sucht) – ein klassisches Beispiel für ein besonders großes Discoverability-Problem. Google selber lädt ein, mit dem Tool zu experimentieren – was wir aus unseren Erfahrungen wirklich nur empfehlen können!
Wie gut funktioniert die Suche in der Praxis?
Am besten lassen sich Tools wie Talk to Books immer in der Praxis anhand echter Fragestellungen bzw. Inhalte bewerten. Zum Test wurden drei sehr unterschiedliche Fragen mit unterschiedlichen konzeptionellen Inhalten und Abstraktionsebenen gewählt.
Beispiel 1: “how does bitcoin work?” – Mit dieser Fragestellung wird als Beispiel ein typisches Thema aus dem Tech/Business-Bereich gewählt, das in dieser Form wahrscheinlich tausende Male pro Tag auch in der Standard-Google-Suche eingegeben wird (wer wüsste nicht gerne, wie Bitcoins wirklich funktionieren?). Als “gute” Antwort auf diese sehr konkrete Frage würden sich wahrscheinlich erklärende Artikel aus dem Bereich Business-Information, aber auch längere Vertiefungstexte oder Implementierungs-Berichte / Best practise-Titel eignen.
Die Ergebnisse: Die Trefferliste könnte so fast auch aus der “normalen” Google-Suche stammen. Zwar gehen die zitierten Passagen direkt auf die Funktionalität und das Grundprinzip von Bitcoin ein, aber die Treffer beinhalten genau die typischen Sachbuch/Fachbuch-Titel aus dem Business/eCommerce-Bereich, die man plausiblerweise bei dieser Suche erwarten würde – im Ergebnis zwar keine schlechte Auswahl, aber auch nicht übermäßig innovativ.
Beispiel 2: “where can I find inspiration for a trip to barcelona?” – Die Fragestellung ist schon deutlich weniger konkret als die erste – zwar ist der Kontext (Reise nach Barcelona) klar ausgedrückt, aber “Inspiration” kann in diesem Zusammenhang natürlich quasi alles heißen. Hier müsste eine assoziationsbasierte Suche eigentlich sehr vielfältige Ergebnisse finden können.
Die Ergebnisse: Die Titelliste ist auch in diesem Fall einer klassischen Buchsuche relativ ähnlich – denn unter den ersten 10 Treffern finden sich relativ viele Reiseführer. Daneben sind aber mit ca. 50/50-Anteil auch Titel aus ganz anderen Fachgebieten dabei, bei denen die Städte-Assoziation zutrifft: Beispiele sind hier “Green Urbanism” (eine Veröffentlichung über moderne Ansätze für nachhaltige Stadtplanung), Bücher wie “Creative Cities, Cultural Clusters and Local Economic Development” (ein Titel aus dem BWL-Bereich über die lokale Organisation der urbanen Kreativwirtschaft in Europa), oder auch “Tourism in the City: Towards an Integrative Agenda on Urban Tourism” – für eine Stadt wie Barcelona ein durchaus virulentes Thema. Im Ergebnis wird die Suche dem selbstgesetzten Anspruch nicht ganz gerecht, bringt aber einige wirklich gute Beispiele für assoziative Zuordnung.
Beispiel 3: “where can I find literary worlds similiar to middle earth?” – Das dritte Beispiel ist wahrscheinlich das anspruchvollste: Eine Such-Engine muss sowohl erkennen, dass das Tolkien’sche Mittelerde gemeint ist, als auch das Konzept der “literarischen Welten” verstehen und nach verwandten Themenwelten suchen – sowohl eine konzeptionelle Metaebene, als auch eine recht vieldeutige Fragestellung (an der die meisten Buchkataloge wahrscheinlich komplett scheitern würden).
Die Ergebnisse: Die Trefferqualität schwankt von Totalausfällen bis zu sehr interessanten Titeln. Gerade Platz 1 auf der Trefferliste passt überhaupt nicht zur Eingabe – “Ancient Israel in Sinai” ist ein theologisches Fachbuch über das Konzept der Wildnis in den Büchern des alten Testaments, in dem Tolkien und Mittelerde genau in einem Absatz erwähnt wird. Die anderen Titel dagegen sind sehr gut ausgewählt: unter den ersten 10 Treffern finden sich Bücher wie The Evolution of Fantasy Role-Playing Games (passend zu Tolkien als Urvater aller Fantasy-Rollenspieler), Inside Narnia: A Guide to Exploring The Lion, the Witch and the Wardrobe (eine literarische Analyse der Chronicles of Narnia – eine durchaus verwandte Publikation), The Greenwood Encyclopedia of Science Fiction and Fantasy (ein Nachschlagewerk für Nerds und Fantasy-Fans) sowie Tolkien and the Invention of Myth: A Reader (eine episch dicke literaturwissenschaftliche Tolkien-Exegese). Im Ergebnis: für die Komplexität der Suchaufgabe eine verblüffend gute Auswahl.
Ist Talk to Books eine Revolution der Buchsuche?
Im aktuellen Zustand ist Talk to Books ein typisches Beispiel für neue Google-Produkte, die im Beta-Stadium für die Öffentlichkeit freigeschaltet werden: ein noch relativ “roher” Implementierungszustand, der wahrscheinlich vielfache Iterationen erhalten wird, bevor das Produkt wirklich “in Serie” geht. Insofern ist es in dieser Phase sicher zu früh, von einer Revolution in der Suche nach Büchern zu sprechen. Dennoch vereint die Applikation einige ausgesprochen innovative Aspekte:
Wie wir bereits letztes Jahr in unserem Artikel zur Zukunft der Suche angesprochen haben, reiht sich Talk to Books in eine Serie neuer Ansätze für Suchanwendungen ein, die alle bestimmte Merkmale vereinen: Unkonventionelle Wege der Sucheingabe, Erkennung und Verarbeitung natürlicher Sprache mit einer KI-basierten semantischen Analyse, neuartige Präsentation der Treffer und Suchergebnisse – und eine Datenbasis jenseits des sonst verwendeten URL-Katalogs. Daneben ist die Anwendung seit langer Zeit die erste aus dem Hause Google, die spezifisch auf Bücher als Content ausgelegt ist – insofern ein hoch spannendes Beispiel für die Verlags- und Medienbranche.
Denn für die Erschließung von Buch-Katalogen werden hier zwei komplett neue Paradigmen angewandt: eine rein inhaltsbasierte Suche auf der einen Seite (Metadaten, Sachgebiete, Keywords, Beschreibungstexte etc. bleiben komplett außen vor) und zum anderen ein konversationsorientiertes User-Interface. Sowohl könnte die Eingabe nicht nur in natürlicher, gesprochener Sprache erfolgen – auch für die Ausgabe könnte ein Sprach-Assistent oder Chatbot sogar nützlicher für den Kunden sein als die relativ konventionelle Ausgabe per Trefferliste. Und: Das Grundprinzip lässt sich fast beliebig auch auf andere Medien (Hörbücher, Serien, Fernsehfilme, Dokumentationen, Zeitschriften-Artikel) ausweiten, wie Bradley Metrock im Blog von Digital Book World richtig betont hat.
Für die Verlags- und Medienbranche könnte es insofern hoch interessant sein, solche Ansätze weiter zu verfolgen – egal ob man Talk to Books nun eher als Katalog-System mit neuartigem Interface oder als Buch-basiertes Kreativitätstool ansieht. Wenn die Entwicklung der sprachbasierten Suche in ähnlicher Geschwindigkeit weitergeht wie aktuell, könnte es in einigen Jahren für Discoverability essentiell sein, solche Schnittstellen zum eigenen Content anbieten zu können. Zumal die Hürden nicht unüberwindlich sind: die zugrunde liegenden Open Source-Tools sind gut dokumentiert und für Entwickler offen gelegt – der Entwicklung eines eigenen Buch-Assistenten steht damit nichts mehr im Wege.
(Zum Thema “Metadaten und Bücher” siehe auch diese Beiträge zur Optimierung der Buchsuche, der Identifizierung von Kunden im Netz und der Beschreibung der eigenen Zielgruppe mit Metadaten.)
Pingback: Die Woche im Rückblick 20.04. bis 26.04.2018 – Wieken-Verlag Autorenservice