Software identifiziert Schreiber von mittelalterlichen Texten
Heilige, aber auch nicht-religiöse Texte wurden im Mittelalter handschriftlich in Schreibstuben dupliziert. Diese sogenannten Skriptorien waren mehrheitlich in Klöstern zu finden. Mit den Universitäten und dem erhöhten Bedarf an Büchern entstanden im 14. und 15. Jahrhundert zusätzlich auch bürgerliche Schreibwerkstätte. Die Arbeit in den Klosterschreibstuben wurde dann mit der Erfindung des Buchdrucks mit beweglichen Lettern fast zur Gänze abgelöst.
Bis heute verfügen Klöster über große Sammlungen an mittelalterlichen Manuskripten. Die Schreibstile werden für die historische Forschung von Paläografen manuell analysiert. „Die Paläografie ist eine historische Hilfswissenschaft, um Hinweise zu potenziellen Ortsveränderungen der Schreiber und der Bücher zu erhalten“, erzählt der Forscher Markus Seidl vom Institut für Creative\Media/Technologies an der Fachhochschule St. Pölten.
Es gebe eine von den Expert*innen fundierte Meinung, welche Seiten von der gleichen Hand geschrieben wurden.
KI analysiert Schrift
Die paläografische Arbeit nimmt viel Zeit und Erfahrung in Anspruch. Dabei müssen die Expert*innen auf viele Details achten, zumal die Schriften sich optisch stark ähneln. Und viele Fragen bleiben dennoch weitgehend unbeantwortet – etwa, wie diese Schreibstuben generell organisiert waren oder wie viele Schreiber in einem Kloster tätig waren.
Um ein tieferes Wissen zum Aufbau dieser Skriptorien zu generieren, bringt die FH St. Pölten ein neues Hilfswerkzeug zur Anwendung. Ein Forschungsteam rund um Seidl analysiert im Rahmen des Forschungsprojekts „Scribe ID“ mittelalterliche Handschriften mittels künstlicher Intelligenz (KI).
Die Manuskripte aus dem 12. Jahrhundert stammen aus der Bibliothek des Stifts Klosterneuburg in Niederösterreich, welche digitalisiert wurden.
Ziel ist es, die jeweiligen Schreiber durch stilistische Merkmale ihrer Handschrift zu identifizieren und so mehr über die Schreibstuben zu erfahren. Dabei geht es nicht darum, einzelne Schreiber als Personen zu identifizieren, sondern vielmehr herauszufinden, ob verschiedene Texte vom selben Schreiber oder von unterschiedlichen Urhebern stammen.
Fütterung mit Daten
Um das auf maschinellem Lernen basierte System überhaupt funktionsfähig zu machen, wurde es zunächst mit diversen Daten gefüttert. „In der ersten Runde, die bereits abgeschlossen wurde, haben wir auf bereits bestehendes Wissen zu den Handschriften in den Bibliotheken in Klosterneuburg zurückgegriffen. Die Paläografen Alois Haidinger und Franz Lackner haben ihr Leben diesen Manuskripten und ihren Schreibern gewidmet“, sagt Seidl gegenüber der futurezone.
Eingepflegt wurden somit jene Schriftdaten, deren Schreiberzugehörigkeit gemäß bestehender Hypothesen bereits bekannt war. Diese Daten wurden im Anschluss entsprechend gekennzeichnet und das KI-System damit trainiert. „Im zweiten Schritt wollten wir die trainierten Modelle ins Unbekannte schicken und Manuskripte mit mehreren hundert Blättern analysieren lassen, bei denen nicht genau klar war, von wem sie stammen und bei denen gewisse Schreiber infrage kamen“, erzählt der Wissenschafter. Danach folgten große Mengen von Manuskripten, bei denen sich bislang noch niemand Gedanken über die Schreiber gemacht habe.
Zu 99 Prozent genau
Zusätzlich zum klassischen maschinellen Lernen wurde eine Benutzerschnittstelle gebaut, sodass beliebig Bücher hineingeladen werden können. „Die Maschine liefert einen Vorschlag zur Schreiberhand. Die Experten können durchsehen, ob es dabei einen Ausreißer gibt oder es sich um keine der bekannten Schreiberhände handelt“, so Seidl.
Im Bezug auf die Genauigkeit liege das KI-System weit jenseits der 90-Prozent-Quote. Durch die Bewertung der Expert*innen kann das Modell aber weiter trainiert und verbessert werden. „Man weiß etwa aus Daten, dass ein Handwechsel nicht in weniger als vier Zeilen passiert. Das heißt, dass große Strecken von der gleichen Hand stammen. So kann man die Ergebnisse noch ein bisschen glätten und erreicht dann eine Genauigkeit von 99 Prozent“, sagt der Fachmann.
Ihm zufolge gebe es zwar derartige maschinelle Verfahren bereits, allerdings seien sie für große Textsammlungen nicht anwendbar. Anders ist das beim neuen Verfahren, das für große Mengen von Manuskripten ausgelegt ist.
Das Forschungsprojekt läuft noch bis Ende des Jahres. Partner sind das Stift Klosterneuburg und die TU Wien. Geplant ist, das System in Zukunft räumlich auch auszuweiten.
Google-Lösung soll Handschrift von Ärzten entziffern
Medizinerinnen und Mediziner sind nicht gerade für eine schöne Handschrift bekannt. Dieses Stereotyp ist nicht nur in Österreich, sondern weltweit verbreitet. Dahinter dürfte aber vielleicht mehr Wahrheit stecken, als man denkt. Unleserliche Rezepte, die oft eilig von Ärztinnen und Ärzten ausgestellt werden, scheinen tatsächlich ein großes Problem zu sein.
So groß sogar, dass sich der US-Konzern Google dem annehmen will. Um Rezepte künftig schnell und richtig entziffern zu können, will das Unternehmen eine künstliche Intelligenz (KI) zum Einsatz bringen. Dafür arbeitet der Technologie-Gigant mit Apothekern und Apothekerinnen zusammen, wie er im Rahmen der Entwickler-Konferenz „Google for India“, auf der jährlich neue Entwicklungen vorgestellt werden, angekündigt hat.
Zunächst soll die Anwendung in Indien über die Google-Lens-App zur Verfügung gestellt werden. Denn in Indien würde ein großer Teil der Bevölkerung diesen Dienst nutzen.
Google Lens
Mit der App lassen sich unter anderem Texte wie Speisekarten scannen und übersetzen. Nutzer*innen sollen in Zukunft aber auch ein unleserliches Rezept fotografieren oder eines aus ihrer Fotobibliothek hochladen können.
Die App erkennt mithilfe der künstlichen Intelligenz in Folge die Namen der Medikamente, die im Rezept handschriftlich festgehalten sind. Die Handschrift wird dabei in verständlichen Zeichen umgewandelt.
Die Schrifterkennung verlief im Zuge der Demonstration fehlerfrei. Ein Datum für die Veröffentlichung der neuen Google-Lens-Funktion hat das Unternehmen allerdings noch nicht bekannt gegeben.
Wichtiger Markt
Generell ist Indien ein wesentlicher Markt für Google. Mehr als eine halbe Milliarde Menschen nutzen die Services des Unternehmens. Unter anderem soll Google auch an einem einheitlichen Übersetzungsmodell für mehr als 100 indischen Sprachen arbeiten.