Das 2021 gestartete und von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt „Die deutschsprachige Presselandschaft im ,langen‘ 19. Jahrhundert“ hat 22 historische Zeitungstitel von 1820 bis 1920 digital und mit Optical Character Recognition (OCR) erschlossen und veröffentlicht (via blog.sbb.berlin):
“Von den 22 Zeitungstiteln stammen 17 aus Berlin – einer Stadt, die im 19. und 20. Jahrhundert als wichtiges Zentrum der Zeitungslandschaft galt. Unter den digitalisierten Zeitungen befinden sich überregional bedeutsame Titel wie die Berliner Morgenpost und das Berliner Tageblatt. Fünf Zeitungen aus Breslau und Königsberg ergänzen den mit der Zeitungsdigitalisierung ermöglichten vertieften Ein-blick in die Kaiserzeit um den Aspekt der ehemaligen ostdeutschen Provinzen.
Die Digitalisate sind im Zeitungsinformationssystem ZEFYS der Staatsbibliothek gespeichert und werden dort mit digitalisiertem Image präsentiert, wobei die meisten Zeitungsseiten Frakturschrift aufweisen. Bei Anwahl der Absatzmarke („Volltext an“) oberhalb des Digitalisats wird der OCR-erschlossene Text präsentiert. Somit sind dort einzelne Zeitungsseiten in heute gebräuchlicher Schrift lesbar und mit Stichworten durchsuchbar.
Die 22 Zeitungen waren in der Staatsbibliothek zu Berlin nahezu vollständig und überwiegend auf Mikrofilm verfügbar. Ergänzend wurden Mikrofilmbestände von externen Archiven ausgeliehen und Lücken im Mikrofilmbestand durch das Scannen von Druckausgaben geschlossen.”