Eingang zum Volltext in OPUS |
Hinweis zum Urheberrecht
InProceedings (Aufsatz / Paper einer Konferenz etc.) zugänglich unter
URN: urn:nbn:de:0290-opus-10992
URL: http://www.opus-bayern.de/bib-info/volltexte//2011/1099/
Automatische Sacherschließung elektronischer Dokumente
Automatic Subject Indexing of Electronic Documents
Lösch, Mathias
pdf-Format:
Dokument 1.pdf (2.912 KB)
![]()
![]()
![]()
![]()
![]()
SWD-Schlagwörter:
Information Retrieval , Text Mining , Dewey-Dezimalklassifikation , Inhaltserschließung
Freie Schlagwörter (Deutsch):
Textkategorisierung , Maschinelles Lernen
Freie Schlagwörter (Englisch):
Text categorization , Machine learning , Dewey Decimal Classification
Tagung / Institut:
100. Deutscher Bibliothekartag
DDC-Sachgruppe:
Bibliotheks- und Informationswissenschaft
Dokumentart:
InProceedings (Aufsatz / Paper einer Konferenz etc.)
Sprache:
Deutsch
Erstellungsjahr:
2011
Publikationsdatum:
19.06.2011
Kurzfassung auf Deutsch:
Repositorien sind nun schon seit einiger Zeit aus der Bibliotheksinfrastruktur nicht mehr wegzudenken. Ein ungelöstes Problem ist jedoch die uneinheitliche Sacherschließung der in ihnen abgelegten Dokumente: Die in der Praxis beobachtbare Palette reicht von freien Schlagwörtern über kontrollierte Vokabulare bis hin zu unterschiedlichen Fach- und Universalklassifikationen. Dadurch wird aktuell ein repositorienübergreifender, sachbezogener Zugang verhindert.
Der Vortrag stellt das DFG-Projekt Automatische Anreicherung von OAI-Metadaten vor. In Kooperation mit dem Institut für Texttechnologie an der Universität Bielefeld und dem Institut für Informatik (Abteilung Automatische Sprachverarbeitung) der Universität Leipzig werden im Rahmen des Projekts die Sacherschließungsinformationen in OAI-Metadaten normalisiert. Erreicht wird die Normalisierung durch die automatische Vergabe von Klassifikationsnotationen -- zunächst aus der Dewey Dezimalklassifikation. Ziele des Projekts sind unter anderem die Weiterentwicklung der Bielefelder Wissenschaftssuchmaschine Bielefeld Academic Search Engine (BASE) sowie die semantische Vernetzung von Repositorien. Letzteres soll ermöglicht werden, indem die angereicherten Metadaten den Ursprungsrepositorien bzw. virtuellen Fachbibliotheken zur Nachnutzung wieder zur Verfügung gestellt werden.
