Deutsche Zentralbücherei für Blinde

Projekt »Leibniz« - Sach- und Fachbuchaufbereitung für blinde und sehbehinderte Menschen

Motivation

Der Zugang zu Wissen ist entscheidend für den Erfolg in Bildung und Beruf. Nur zwei Prozent der jährlich veröffentlichten Bücher sind für blinde und sehbehinderte Menschen zugänglich. Bei Sach- und Fachbüchern ist die Quote noch deutlich niedriger. Das Projekt »Leibniz« an der Deutschen Zentralbücherei für Blinde zu Leipzig (DZB) stellt sich dieser Problematik, indem Verfahren und Werkzeuge entwickelt werden, um die aufwendige Sach- und Fachbuchaufbereitung für blinde und sehbehinderte Menschen in der Leipziger Blindenbibliothek künftig effektiver zu gestalten.

Ausgangsbasis und Zielsetzung

Die Basis für die Übertragung sind eingescannte Buchseiten oder PDF-Druckdaten, deren Struktur zentral auf einem Server analysiert wird (siehe Abbildung 1). Automatisch sind Vorarbeiten wie Entdrehen, Farbreduktion und Segmentierung der Seiten von der Software vorzunehmen. Durch erstere werden Effekte, die durch das Scannen selbst entstanden sind, vermindert.

Konzept des Workflow

Abbildung 1: zukünftige Arbeitsabläufe bei der Produktion von Sachliteratur

Das Dokument wird segmentiert, bevor eine Texterkennungs-Software die Texte analysiert. Danach werden Strukturelemente wie Überschriften, Absätze und Tabellen automatisch ausgezeichnet. Letztendlich wird eine logische Lesereihenfolge (Linearisierung) hergestellt. Im Rahmen dieser automatischen Layout-Analyse wird ein medienneutrales XML-Format ausgegeben, welches in einem Editor abschließend bearbeitet werden kann. Es schließen sich die klassischen Übertragungsprozesse an, vordergründig die Ausgabe in HBS, HTML und DAISY 3.0. Hier liegt ein essentieller Unterschied und Vorteil zur bisherigen Arbeitsweise, bei der die Strukturierungsprozesse zeitaufwendig und manuell während der Übertragung erfolgten.

Um das Angebot der DZB Leipzig von Sach- und Fachbuchliteratur zu erweitern, müssen die Arbeitsabläufe auf das neue System abgestimmt werden. Dazu gehören die Verwaltung von Quelldaten und strukturierten Dokumenten sowie ihre Einbindung in automatisierte Prozesse.

Automatische Layoutanalyse

Die zentrale Herausforderung bei der Softwareentwicklung im »Leibniz«-Projekt besteht in der automatischen Strukturierung von komplexen layoutorientierten Quelldaten, die vorerst keine Strukturinformationen enthalten. Sie können durch Algorithmen, die u. a. auf Gestaltungsregeln für Bücher beruhen, errechnet und ausgewertet werden.

Die strukturierten Dokumente werden in einem XML-Format gespeichert, das einfach an neue Anforderungen angepasst werden kann.

Konzept der Strukturierung

Abbildung 2: automatische Verarbeitungskette auf dem Server

Für die automatische Layoutanalyse wurde im bisherigen Projektverlauf ein komplexes Fundament entwickelt, das es erlaubt, zukünftig flexibel auf verschiedene Buchgestaltungen reagieren zu können. Während in der zweiten Jahreshälfte 2011 erste Strukturen programmiert werden, soll bis März 2012 ein einfaches Tagset fertig gestellt werden, das Sachbücher strukturiert und medienneutral im XML-Format darstellt. Dazu gehören neben Absätzen und Überschriften Elemente wie Listen, Seitenzahlen, Tabellen und Bilder. Mit diesen grundlegenden Elementen beginnt die Einführung des neuen DZB-Produktionswerkzeuges.

Editor für Strukturierung und Korrektur

Die im Rahmen der automatisierten Layoutanalyse erstellte XML-Datei kann mithilfe eines von Leibniz entwickelten Editors ggf. korrigiert werden. In dessen Entwicklung fließen sowohl Erfahrungen der »Leibniz«-Entwickler als auch Ergebnisse aus Befragungen von Mitarbeitern zu den Themen Funktionalität, Gestaltung und Barrierefreiheit ein. Zu den Funktionen zählen spezielle Befehle, die sich besonders effektiv auf die Korrektur eines Ausgangsdokuments auswirken. Parallel dazu wird dem Bearbeiter ein Set verschiedener Ansichtsmodi im Editor angeboten, um beispielsweise das Originaldokument mit seinen Strukturelementen oder die Vorschau des korrigierten Dokuments zu betrachten. Eine integrierte Hilfe wird den Bearbeiter bei der Strukturierung der Dokumente unterstützen.

Die Entwicklung des Editors wird wissenschaftlich von der Hochschule für Technik, Wirtschaft und Kultur Leipzig (HTWK) unterstützt, indem sie die Entwicklung mit Usability-Tests für den Editor begleitet.

Besonderheiten des im Rahmen von »Leibniz« selbst entwickelten Editors bestehen in der vereinfachten Darstellung des XML-Formats in LaTeX-ähnlicher Notation sowie der Berücksichtigung der Barrierefreiheit für den Anwender (siehe Abbildung 3). Die vielfältigen Funktionen werden dieses Produktionstool zu einem effektiven Werkzeug machen.

Screenshot des Editors

Abbildung 3: Leibniz-Editor - XML-Dokument mit Scannansicht

Integration der Produktionsabläufe

Was die Integration der Produktionsabläufe betrifft, so wird in der DZB Leipzig an der Umsetzung der Quelldatenverwaltung gearbeitet. Hierüber werden Eingangsdaten für die Produktion von Sach- und Fachbüchern sowie fertig strukturierte LeibniXML-Dokumente versioniert und verwaltet. Das aufbereitete medienneutrale XML-Dokument wird schließlich über Umwandlungsskripte in verschiedene Formate wie z. B. Braille oder DAISY umgewandelt.
Die neuen Entwicklungen werden schrittweise in den Produktionsablauf eingeführt und innerhalb des Projektzeitraums getestet. Dadurch soll herausgefunden werden, welche Arbeitsabläufe bei der Dokumentenaufbereitung sowie -verwaltung die effektivsten sind.

Beirat

Das Projekt wird fachlich begleitet von Patrick Temmesfeld, Direktor des Bildungszentrums für Blinde und Sehbehinderte in Nürnberg und Sprecher des Beirats, Rainer Just, geschäftsführender Vorstand der Verwertungsgesellschaft Wort (VG Wort), und Hans-Joachim Krahl, Mitglied des Präsidiums des Deutschen Blinden- und Sehbehinderten-Verbandes.

Förderung und Zeitraum

Das Entwicklungsprojekt »Leibniz« wird vom Bundesministerium für Arbeit und Soziales unterstützt. Das Projekt hatte eine Projektlaufzeit von drei Jahren und wird bis 31.12.2012 verlängert.

120 Jahre DZB

Am 12. November 1894 wurde die Deutsche Zentralbücherei für Blinde (DZB) gegründet. Damals wie heute versorgt sie blinde und sehbehinderte Menschen mit Braille- und Hörbüchern, Reliefs, Logo Lesende Hände Zeitschriften und Musikalien.
Erfahren Sie mehr über die Geschichte unseres Hauses.