Zürich verfügt über 12'000 Briefe des Reformators Heinrich Bullinger, dem Nachfolger von Huldrych Zwingli. Die Briefe stellen eine grosse Quelle für die Aufarbeitung der Geschichte und Kultur Zürichs und darüber hinaus dar. Mit dem Projekt "Bullinger digital" soll dieses Erbe ins digitale Zeitalter gebracht werden, wie die Stiftung der Universität Zürich, UZH Foundation, schreibt.
Das Projekt wurde vom Institut für Computerlinguistik der Universität Zürich in Zusammenarbeit mit dem Institut für Schweizerische Reformationsgeschichte lanciert, um das kulturelle Erbe digital zu erschliessen und über das Internet zugänglich zu machen.
Metadaten zu allen Briefen
In einem ersten Schritt haben die Projektbeteiligten eine Datenbank aufgebaut, in der zu jedem Brief die wesentlichen Metadaten erfasst wurden. Dazu gehören etwa Absender und Empfänger, Ort und Briefsprache sowie der erste Satz des Briefes. Bisher waren diese Informationen nur auf physischen Karteikarten vorhanden.
Diese Karten wurden nun eingescannt, mit der OCR-Software Finereader digitalisiert und in die entsprechenden Datenbank-Felder übertragen. Bei dieser Digitalisierung und Übertragung passieren zwangsläufig Fehler, so eine Mitteilung. Ausserdem seien einige Einträge auf den Karteikarten handschriftlich vorgenommen worden und können maschinell nicht zuverlässig ausgelesen werden.
Freiwillige für Mithilfe gesucht
Wegen eben dieser Fehler sucht das
Projekt "Bullinger digital" nun Freiwillige, die die Datenbank-Einträge mit den gescannten Karten abgleichen und korrigieren. Dies geschieht über das Internet in einem System, das vom Institut für Computerlinguistik der Uni Zürich eigens dafür entwickelt worden ist.
Die Karteikarten-Datenbank bilde schliesslich das Gerüst für die weiteren Arbeitsschritte. Ziel sei es, alle Briefe mit einem Bild des Originals, im Volltext und mit Übersetzung in modernes Deutsch durchsuchbar zu machen.
Das Bullinger-Projekt sei nicht das erste Mal, dass das Institut für Computerlinguistik ein kollaboratives Korrektursystem einsetze, um gescannte Texte zu überprüfen. 2014 hätten im Projekt "Text+Berg" rund 100 Freiwillige eine 20'000 Seiten umfassende Dokumentensammlung korrigiert.