Algorithmen rekonstruieren überschriebene Texte
Software erleichtert Studium hebräischer und arabischer Dokumente
Beer-Sheva (pte001/22.08.2009/06:00) Forscher an der israelischen Ben-Gurion University (BGU) of the Negev http://web.bgu.ac.il/Eng/Home/ haben Algorithmen entwickelt, um das Studium schlecht erhaltener historischer Texte zu erleichtern. Im Rahmen eines Projekts, an dem Informatiker und Humanisten zusammenarbeiten, wollen die Wissenschaftler computergestützt auch den Originaltext sogenannter Palimpseste rekonstruieren. "Ein Palimpsest ist ein Pergament, von dem der ursprüngliche Text abgeschabt und mit neuem Text überschrieben wurde", erklärt die projektbeteiligte Informatikerin Klara Kedem gegenüber pressetext. Der Schwerpunkt des Projekts, das in Zusammenarbeit mit Humanisten der Universität betrieben wird, liegt in der Erfassung hebräischer und arabischer Texte. Gerade der Ansatz zur Rekonstruktion von Palimpsesten könnte aber auf jegliche Schriftzeichen angewandt werden.
Das Projektziel auf technischer Ebene ist, mithilfe von hochentwickelten Algorithmen zur Textrekonstruktion und -analyse ein Open-Source-System zu schaffen, das dann genutzt werden kann, um die Forschung an historischen Dokumenten voranzutreiben. Ein Problem, das es dabei zu lösen gilt, ist die Rekonstruktion des Originaltexts bei Palimpsesten. "Dazu verwenden wir zunächst die Bildverarbeitungsmethode des Thresholding, um den neuen Text zu identifizieren", erklärt Kedem. Denn dieser ist in der Regel deutlich dünkler als Spuren des Originaltexts oder unbeschriebenes Pergament. Der einst abgekratzte Text wiederum hebt sich vom leeren Blatt ebenfalls, doch leichter, ab. Das erlaubt es, mittels Algorithmen die Position alter Schriftzeichen zu bestimmen. "Dann wenden wir Inpainting-Techniken an, um die markierten Bereiche zu vervollständigen und das restaurierte Bild zu gewinnen", so die Informatikerin. Vergleichbare Techniken kommen beispielsweise zur Bildrekonstruktion bei alten Fotos und Filmen zum Einsatz, wenn Teilbereiche schlecht erhalten sind.
"Diese Methode würde für jegliche Art von Palimpsest funktionieren, unabhängig davon, welche Schriftzeichen genutzt wurden", meint Kedem. Das BGU-Projekt umfasst aber noch weitere Algorithmen, die speziell auf hebräische und arabische Texte ausgelegt sind. Dazu zählt etwa die computerisierte Unterstützung der paläografischen Analyse. Diese befasst sich etwa mit Buchstabenformen und gebräuchlichen Abkürzungen und kann unter anderem die Datierung von Dokumenten ermöglichen. Außerdem sind viele Rekonstruktionstechniken auch für Texte interessant, die nicht überschrieben wurden, sondern einfach nur schlecht erhalten sind. Wie gut sich die Computeralgorithmen für die Untersuchung alter Schriften bewähren, wird im Rahmen des Projekts von Humanisten wie Uri Ehrlich, Professor am Goldstein-Goren Department of Jewish Thought der BGU, anhand realer Texte untersucht. Dazu zählen unter anderem Fundstücke aus der Kairoer Geniza. In diesem Ende des 19. Jahrhunderts entdeckten Raum der Ben Esra Synagoge wurden an die 200.000 Manuskripte gefunden, die Teils bis ins 9. Jahrhundert zurückgehen.
(Ende)Aussender: | pressetext.austria |
Ansprechpartner: | Thomas Pichler |
Tel.: | +43-1-81140-303 |
E-Mail: | pichler@pressetext.com |