Ziele und Ergebnisse
Ziele
Technologien, die Maschinen befähigen, kognitive Prozesse zu imitieren, Muster zu erkennen und Sprachen zu verstehen, sind in unserer Gesellschaft nicht mehr wegzudenken. Auch in den Digitalen Geisteswissenschaften (DH) hat die Künstliche Intelligenz (KI) Einzug gehalten und beeinflusst die Art, wie Objekte untersucht, Daten erhoben und Zusammenhänge dargestellt werden. Besonders bei der Erschließung und Auswertung historischer Zeugnisse, die in der Regel aufwändige vergleichende und kontextualisierende Schritte erfordert, kann der Einsatz von KI die Arbeit erleichtern und beschleunigen.
Für die Erschließung und kritische Edition historischer Texte in älteren Sprachstufen ist es allerdings bislang nur in Ansätzen gelungen, KI-Modelle zu entwickeln, die als zuverlässige Verständnishilfe oder als editorisches Werkzeug eingesetzt werden können. Hier stoßen Forschung und Entwicklung auf das Problem, dass große KI-Modelle anhand von Sprachen trainiert werden, für die umfangreiches digitales Quellenmaterial vorliegt und weiter produziert wird. Sprachen, deren Sprachgemeinschaft klein oder nicht mehr vorhanden ist, hinterlassen dagegen weniger digitale Spuren (Low Resource Languages; LRL) und werden bei der Entwicklung oft ignoriert. Historische Sprachzeugnisse erweisen sich zudem als besonders herausfordernd, weil sie wesentlich weniger grammatikalisch und orthographisch normiert sind.
Diese Problematik ist der Ansatzpunkt für EdiKILex. In den kommenden Jahren wird das Team am Beispiel des Frühneuhochdeutschen (ca. 1350 bis 1650) eine KI entwickeln, die sowohl von Fachfremden als auch von Fachspezialistinnen und -spezialisten gewinnbringend eingesetzt werden kann. Das Frühneuhochdeutsche als LRL bietet sich für diese Pionierforschung besonders an, da nicht nur zunehmend digitale Editionen von Texten dieser Sprachstufe Trainingsmaterial bieten, sondern mit dem Frühneuhochdeutschen Wörterbuch (FWB) auch eine umfangreiche Grundlage für die lexikographische Kommentierung vorliegt.
EdiKILex hat Ziele auf vier Ebenen:
- Eine Open-Source-Software (nachhaltig gehostet von der HAB Wolfenbüttel), die die Lektüre digital edierter Texte des Frühneuhochdeutschen erleichtert. Zur Verfügung gestellt wird eine digitale Umgebung, in der ein auf jedes Wort zugeschnittenes Angebot kulturhistorischer, textpragmatischer und textsemantischer Verständnishilfen abrufbar ist. Aus dem digitalen FWB und einzelnen Editionen wird ein umfassendes Text-Wissens-System entwickelt, das die KI-Anwendung zur effektiven Assistenz der Nutzerinnen und Nutzer macht (hybride Intelligenz).
- Die Erweiterung der KI um eine intuitiv nutzbare Schnittstelle, die mittelfristig auch als Werkzeug für die Herstellung neuer digitaler Editionen genutzt werden kann, indem EdiKILex bei der oft mühevollen Aufschlüsselung und Kommentierung spätmittelalterlich-frühneuhochdeutscher Wortformen unterstützt.
- Die perspektivische Übertragung des Modells und der Methoden auf Texte in anderen LRLs, beispielsweise Keltisch oder Altfranzösisch, basierend auf gewonnenen Erkenntnissen über Probleme und Lösungen in der Genese von EdiKILex.
- Ein wissenschaftstheoretischer Beitrag auf übergeordneter Ebene zur aktuellen Diskussion über die Chancen und Risiken des Einsatzes von KI und hybrider Intelligenz in verschiedenen akademischen und soziotechnischen Zusammenhängen, nicht zuletzt unter Aspekten der Nachhaltigkeit.
Die Gestaltung der EdiKILex-Software wird frühzeitig auf die Nutzerinnen und Nutzer ausgerichtet. Bedarfsanalysen und Usability-Tests in Forschung und Lehre sind daher ein integraler Bestandteil der Entwicklung. EdiKILex schafft also nicht nur ein vielseitig einsetzbares Instrument für die interdisziplinäre Erforschung frühneuzeitlicher Sprach- und Wissenskulturen, sondern auch eine Plattform für die fachübergreifende Abstimmung über die Zukunft der Geisteswissenschaften und der Wissenschaftskommunikation.
Ergebnisse
An dieser Stelle werden zur gegebenen Zeit die entwickelten Tools und Forschungsergebnisse zur Verfügung gestellt. Bis dahin werden Neuigkeiten aus dem Projekt unter Nachrichten und Veranstaltungen und Publikationen und Presse veröffentlicht.