Im Gespräch mit virtuellem Bibliothekar

Unibibliothek: Der virtuelle Assistent lernt aus dem wissenschaftlichen Bestand der SUB – Foto: Luca Alina Pallasch

Wie können wir mithilfe Künstlicher Intelligenz Forschenden die Recherche in Bibliotheken erleichtern? Die Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB), Forschende am Institut für Informatik der Universität Göttingen und die Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) wollen dafür einen virtuellen Assistenten auf Basis großer Sprachmodelle entwickeln. Projektleiter Prof. Dr. Bela Gipp gibt einen ersten Einblick in das im Dezember 2025 gestartete Vorhaben „LibraryAI“.

Mit dem dreijährigen Projekt verfolgen Sie hohe Ziele. Die Nutzenden sollen per Chat mit der Bibliothek „ins Gespräch kommen“, indem sie Fragen stellen, sich Inhalte zusammenfassen oder übersetzen lassen und sich durch komplexe Quellenbestände navigieren lassen. Angesichts der Fülle an Fachgebieten und wissenschaftlichen Fachsprachen: Wie wollen Sie den virtuellen Assistenten trainieren, damit er bei der Recherche eine wirkliche Hilfe ist?

Die Entwicklung des virtuellen Assistenten beginnt nicht bei null, sondern baut auf leistungsstarken offenen Sprachmodellen auf. Diese Modelle werden mithilfe von Transferlernen gezielt auf den wissenschaftlichen Bestand der SUB Göttingen und weitere qualitätsgeprüfte Quellen abgestimmt. Dadurch lernt die KI, moderne Fachterminologie ebenso wie historische Sprachformen und fachspezifische Ausdrucksweisen zu verstehen. Ein weiterer Baustein ist ein Verfahren, das die Inhalte der Bibliothek in semantische Vektoren überführt. Diese Methode basiert auf Forschungsarbeiten meines Teams zur Repräsentation wissenschaftlicher Literatur. Der Ansatz ermöglicht der KI, thematische Nähe zu erkennen, Bedeutungsnuancen zu erfassen und relevante Texte auch bei unterschiedlichen Formulierungen zuverlässig zu finden.

Zusätzlich wird der Assistent befähigt, externe Bibliotheksdienste wie den Katalog, Repositorien oder Volltextangebote korrekt einzubeziehen, damit er Metadaten und Inhalte bei Bedarf direkt abrufen und analysieren kann. Ergänzend fließt kontinuierlich Expertenfeedback in die Weiterentwicklung ein: Forschende bewerten typische Anfrage-Antwort-Szenarien, korrigieren Fehlinterpretationen und lenken das Modell über ein spezielles Lernverfahren so, dass es seine Recherchewege nachvollziehbar dokumentiert und fachlich belastbare Ergebnisse liefert.

Wie geht der virtuelle Assistent bei der Recherche vor?

Für Nutzer*innen fühlt sich die Recherche mit LibraryAI an wie ein Gespräch mit einem erfahrenen Bibliothekar, der im Hintergrund live im Bestand nachschlägt und gleichzeitig den Überblick über digitale Ressourcen behält. Nachdem eine Frage gestellt wurde, analysiert das System zunächst deren Inhalt und entscheidet, ob das eigene, zuvor domänenspezifisch trainierte Wissen ausreicht oder ob aktuelle Informationen aus den Bibliothekssystemen benötigt werden, etwa bei Neuerscheinungen, Verfügbarkeits- oder Standortfragen. Über standardisierte Schnittstellen greift LibraryAI dann auf den Katalog, digitale Sammlungen oder Repositorien zu und führt Suchabfragen aus, die mit klassischen Suchbegriffen, aber auch mit semantischen Verfahren arbeiten. Diese Verfahren erkennen inhaltliche Nähe selbst bei unterschiedlichen Formulierungen und analysieren wissenschaftliche Texte über Disziplinen hinweg. Die Antwort entsteht schließlich aus einer Kombination der jeweils aktuell abgefragten Daten und des eigenen Sprachverständnisses des Modells: präzise formuliert, mit Quellenangaben, auf Wunsch mit Links zu Titeln oder Volltexten. So bleibt das System nicht auf den Wissensstand seines Trainings beschränkt, sondern liefert stets aktuelle, überprüfbare Informationen.

Mit dem Projekt, das die Deutsche Forschungsgemeinschaft mit einer Million Euro fördert, wollen Sie zur digitalen Transformation des Bibliothekswesens in Deutschland beitragen. Wie können andere Einrichtungen davon profitieren?

Wir entwickeln das LibraryAI-System bewusst offen, modular und übertragbar. Der gesamte Quellcode, die Methodik und viele der verarbeiteten Datensätze werden – soweit es ihre jeweiligen Lizenzen erlauben – zugänglich gemacht, sodass andere Bibliotheken eigene KI-Assistenten darauf aufbauen oder direkt adaptieren können. Durch die angestrebte Standardisierung von Schnittstellen und die Einbindung nationaler Netzwerke wie Text+ erleichtert das Projekt zudem die technische Integration in unterschiedliche Infrastrukturen. Ergänzend sorgen Workshops mit Bibliotheken aus dem ganzen Bundesgebiet dafür, dass LibraryAI nicht nur ein lokales Experiment bleibt.

Projektleiter Bela Gipp – Foto: Klein und Neumann
Written By
More from Heike Ernestus
Renaissance der thematischen Kartografie
Klöster und Chausseen, Pilgerspuren und Handelsnetze: Dr. Niels Petersen vom Institut für...
Read More
0 replies on “Im Gespräch mit virtuellem Bibliothekar”