Automatische Formalerschließung in der Deutschen Nationalbibliothek am Beispiel von Dissertationen

  • Das Projekt „Halbautomatische Erschließung von Universitätsdissertationen“ der Deutschen Nationalbibliothek in Kooperation mit der Universität Innsbruck beschäftigt sich mit dem Einsatz automatischer Erschließungsverfahren für Monografien, die in ihrem Erscheinungsbild und in ihrer Bearbeitung relativ einheitlich sind. Am Beispiel von Universitätsdissertationen werden Kompetenzen im Bereich automatischer Formalerschließung auf Basis von Titelblattanalysen auf- und ausgebaut, mit dem Ziel der Vereinfachung und Beschleunigung der Titelaufnahme. Voraussetzung dafür ist die Digitalisierung und Indexierung der Titelblätter der Universitätsdissertationen; eine im Rahmen des EU-Projektes IMPACT entwickelte Strukturerkennungssoftware (FEP bzw. Title Page Parser) extrahiert die wichtigsten bibliografischen Angaben wie Verfasser, Titel, Hochschule etc., um diese automatisch in die entsprechenden Kategorien der Katalogisierungsmaske übertragen zu können. Grundlage sind mit Strukturinformationen angereicherte OCR-Daten, Wörterbücher und diverse Regeldefinitionen. Ein erster Testlauf auf Basis von 1.000 Titelblattscans von Dissertationen und Habilitationen lieferte hohe Erkennungsquoten.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Sandra Hamm
URN:urn:nbn:de:0290-opus-14142
Document Type:Conference publication (Presentation slides)
Language:German
Date of Publication (online):2013/03/15
Year of Completion:2013
Contributing Corporation:Deutsche Nationalbibliothek Frankfurt a.M.
Release Date:2013/03/15
Themes:Erschließung, Linked Open Data, RDA
German Bibliothekartage / BiblioCon:102. Deutscher Bibliothekartag in Leipzig 2013 = 5. Kongress Bibliothek & Information Deutschland
Einverstanden
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.