Welche Gedanken machte man sich im 16. Jahrhundert über astronomische Phänomene? Worauf nahm eine Buss- und Bettags-Predigt um 1712 Bezug? Und haben Autoren auch früher schon Texte voneinander abgeschrieben? Um Antworten auf diese Fragen zu erhalten, muss man heute nicht mehr in die Bibliothek gehen und vorsichtig Seite um Seite in einem historischen Buch umblättern. Dank einer Initiative der ETH-Bibliothek sind diese Werke nun digital verfügbar. Und das nicht nur für Forschende, sondern auch für die breite Öffentlichkeit.
Erste Gedanken über eine digitale Bibliotheksplattform für alte Drucke machte man sich bei der ETH-Bibliothek bereits im Jahr 2007. Doch erst als sie sich Mitstreiter wie die Zentralbibliothek Zürich, die Universitätsbibliothek Basel, die Bibliothèque de Genève und die Universitätsbibliothek Bern ins Boot holte, kam wirklich Fahrt in das Projekt. Mithilfe von Fördermitteln aus dem Projekt Elektronische Bibliothek Schweiz (e-lib.ch) entstand die Plattform e-rara, welche 2010 lanciert wurde. Drei Jahre später folgte das Pendant für handschriftliche Dokumente: e-manuscripta. Mittlerweile beteiligen sich bei e-rara 26 und bei e-manuscripta neun Partnerbibliotheken und -institutionen. E-rara hat sich so zur ersten Adresse entwickelt, wenn es um die digitale Publikation Alter Drucke in der Schweiz geht.
Das zentrale Ziel von e-rara und e-manuscripta ist es, historische Werke zu digitalisieren und sowohl für die Wissenschaft und Lehre als auch für die breite Öffentlichkeit frei online zugänglich zu machen. Und das nach einheitlichen Qualitätsstandards. Darüber hinaus wollen die Partnerinstitutionen Folgendes erreichen und sicherstellen:
Für Laien ist es natürlich spannend, wenn sie online in alten Büchern und Schriften blättern können. Für Personen aus der Lehre und Forschung stellt die Digitalisierung der Bestände jedoch eine wichtige Arbeitsgrundlage dar. So lassen sich die Werke nicht nur von überall auf der Welt anschauen, sondern können auch für computerbasierte Forschung genutzt werden. Texte können zum Beispiel online verglichen und mit speziellen Programmen analysiert werden. Dafür sorgen internationale Standards und offene Schnittstellen, die den maschinellen Zugang und den Austausch mit anderen Plattformen ermöglichen.
Offene Schnittstellen ermöglichen auch die Datenübernahme in internationale Fachportale. So werden zum Beispiel Inhalte von e-rara in der grossen französischen Plattform Gallica oder im von der Harvard University betriebenen SAO/NASA Astrophysics Data System (ADS) übernommen und stehen dort für die Recherche zur Verfügung.
Mit den beiden Plattformen wird nationales Kulturgut zugänglich gemacht. Dabei sind bei e-rara fast alle Inhalte «Public Domain», also frei verfügbar. Das heisst, man kann sie als JPEG, PDF oder in einem anderen Dateiformat herunterladen bzw. über Social Media teilen. Und anders als bei einem physischen Werk kann man das digitale nach Belieben bearbeiten. So bietet die Plattform die Möglichkeit, den Kontrast oder die Helligkeit einer bestimmten Buchseite zu verändern. Zudem kann man in ein Bild hineinzoomen oder den gesamten Text nach Stichworten durchsuchen, sofern bei dem Werk der Volltext vorhanden ist.
Das Besondere bei e-manuscripta ist, dass sie sich von einer reinen Präsentationsplattform hin zu einer Forschungs- und Editionsplattform entwickelt hat, die kollaboratives Arbeiten zulässt. So kann jede und jeder mithelfen, handschriftliche Dokumente wie Briefe, Karten oder Notizen zu entziffern und zu transkribieren. Diese Plattform, deren Geschäftsstelle von der Zentralbibliothek Zürich geführt wird, ist also zugleich ein Crowdsourcing-Projekt.
Der freie Zugang auf der einen Seite und die Möglichkeit zur Mitarbeit auf der anderen, machen e-rara und e-manuscripta zu Paradebeispielen für Public Domain- und Open Data-Projekte.
Wichtig war es den Trägerbibliotheken der beiden Plattformen, dass diese mit den gängigen Suchmaschinen kommunizieren können. Schliesslich kann man nicht davon ausgehen, dass die Recherche erst auf der eigenen Website anfängt. Es ist anzunehmen, dass viele Suchen bei Google oder der Bibliotheksplattform Swisscovery starten. Deshalb sind alle Titel auch hier eingebunden und über Google erreichbar.
Eine grundlegende Herausforderung für das immense Digitalisierungsvorhaben war der Aufbau der Infrastruktur, also die Beschaffung von Scan-Robotern und das Einrichten von Digitalisierungsstrassen. So haben sich die fünf Gründungspartner – neben der Beschäftigung mit ihren klassischen Aufgaben – in Digitalisierungsstandorte für das Projekt e-rara umgewandelt. Hier werden heute nicht nur die eigenen Altbestände digitalisiert, sondern auch die der anderen Schweizer Bibliotheken, welche sich dem Projekt angeschlossen haben, jedoch nicht über die notwendige technische Infrastruktur verfügen.
Die Plattform e-rara umfasst mittlerweile fast 99’000 Titel; bei e-manuscripta sind es über 149’000. Bei einer solchen Fülle an digitalisierten Inhalten spielt das Design eine wesentliche Rolle. Seine Aufgabe ist es, für Klarheit und Übersichtlichkeit zu sorgen. Da die Recherche im Vordergrund steht, erhält das Suchfeld einen prominenten Platz in der Bühne. Nutzer, die lieber stöbern, können sich durch übersichtlich angelegte Themen und Kollektionen klicken. Alle Werke lassen sich in unterschiedlichen Ansichten darstellen und die Bedienung ist so einfach wie intuitiv. Bei einem umfassenden Redesign erhielten die Plattformen 2022 ein neues Gesamterscheinungsbild mit zusätzlichen technischen Funktionen, welche die Nutzung verbessern und die Inhalte noch einfacher verwendbar machen.
Technisch basieren die beiden Plattformen auf der Visual Library der semantics GmbH und der Walter Nagel & Co. KG. Für das Hosting ist die IT-Abteilung der ETH-Bibliothek zuständig. Ein zentraler Grund, weshalb e-rara und e-manuscripta auch optisch ähnlich daherkommen. Zudem wollte man mit einem einheitlichen Design natürlich die Verbindung zwischen den Plattformen kommunizieren. Daher arbeiteten die UX-Designer der zuständigen Agentur Eyekon AG, welche mit der Gestaltung des Interface beauftragt wurde, ein Design-System aus, welches sich bei beiden Websites durchgängig anwenden lässt. Dass die Seiten responsive sind, also auf allen Devices optimal dargestellt werden, versteht sich von selbst.
Die Plattformen e-rara und e-manuscripta haben die Erwartungen hinsichtlich der Digitalisierungsgeschwindigkeit sowie der Besucherzahlen von Anfang an übertroffen. Und die allgemeine Begeisterung hält an. Auch, weil sich die Plattformen stetig weiterentwickeln. Ein Beispiel: die Volltexterkennung. Dank Optischer Zeichenerkennung (OCR) wird diese schrittweise erweitert. So kamen allein im Jahr 2022 über 2.7 Mio. Seiten hinzu. Zudem sorgt die Implementierung des Tools TextLab bei e-rara dafür, dass man diese Texte auch nach Orten oder Namen durchsuchen sowie zusätzliche Informationen und Verknüpfungen mit anderen Texten nachvollziehen kann, was es einem wiederum ermöglicht, noch tiefgreifender zu recherchieren.
Auch das Team von e-manuscripta arbeitet stetig an Optimierungen. So werden unter anderem bald maschinell erstellte Transkriptionen integriert werden können. Und auch in Zukunft werden die Partnerinstitutionen rund um die ETH-Bibliothek keine Mühen scheuen, neue Technologien und Services in ihre Plattformen einzubinden.
99'000
Titel
1.8 Mio
Visits
845'000
Downloads
12.7 Mio
Seiten Volltext
26
beteiligte Bibliotheken
149'000
Titel
900'000
Visits
275'000
Downloads
5'700
Transkriptionen
Der Best of Swiss Web Award zeichnet jedes Jahr herausragende Arbeiten mit Schwerpunkt Webtechnologie aus. Von insgesamt 305 Einreichungen im Jahr 2023 wurden die Plattformen e-rara und e-manuscripta unter die Top Ten gewählt. Sie gewannen zweimal Gold in den Kategorie Public Value und Technology sowie Bronze in der Kategorie Innovation.
«Open Access at its best. Die Plattformen E-Rara und E-Manuscripta stellen einen reichen Schatz an historischen Quellen öffentlich zur Verfügung. Die Scans aus zahlreichen Archiven sind vorbildlich erschlossen und mit international gebräuchlichen Metadaten angereichert. Dies ermöglicht – zusammen mit standardisierten Schnittstellen –, die Werke der Forschung global zur Verfügung zu stellen. Alte Handschriften lassen sich direkt im Portal transkribieren; eine hervorragende Basis fürs Crowdsourcing», so das Urteil der Jury.
Best of Swiss Web
2023 – Gold Public Value
Best of Swiss Web
2023 – Gold Productivity
Best of Swiss Web
2023 – Bronze Innovation