DTA - Das Deutsche Textarchiv

The GermanText Archive

  • Das von der DFG geförderte Projekt Deutsches Textarchiv (DTA) hat im Juli 2007 an der Berlin-Brandenburgischen Akademie der Wissenschaften seine Arbeit aufgenommen. Das Deutsche Textarchiv wird geleitet von Prof. Wolfgang Klein (MPI für Psycholinguistik, Nijmegen), Mitantragsteller sind Prof. Manfred Bierwisch (BBAW) und Prof. Martin Grötschel (Konrad-Zuse-Institut, Berlin). Die Gesamtlaufzeit des Projekts ist auf sieben Jahre festgelegt, bewilligt sind zunächst drei Jahre. Ziel ist, einen disziplinübergreifenden Kernbestand an Texten deutscher Sprache von Beginn der Druckkunst bis zur Gegenwart nach Erstausgaben zu digitalisieren und so aufzubereiten, dass er über das Internet in vielfältiger Weise nutzbar ist. In der ersten Projektphase bis Juli 2010 sollen ca. 600 deutschsprachige Titel aus der Zeit von 1780 bis 1900 digitalisiert und sowohl als strukturierter Volltext (XML/TEI-P5) als auch als Bilddigitalisat im Internet bereitgestellt werden. Neben der Schaffung von Schnittstellen zur engmaschigen Vernetzung mit Bibliothekskatalogen, der Bereitstellung von persistenten Identifikatoren sowie von Möglichkeiten, aktiv am Textarchiv mitzuwirken, sind elaborierte linguistische Suchangebote vorgesehen. Die ausgewählten Texte sollen gleichzeitig repräsentativ für die Entwicklung der deutschen Sprache seit der frühen Neuzeit stehen. Im Vortrag werden – nach einer kurzen Projektvorstellung des DTA und des derzeitigen Standes – schwerpunktmäßig die Arbeitsschritte Bilddigitalisierung in Kooperation mit verschiedenen wissenschaftlichen Bibliotheken sowie die Volltextdigitalisierung herausgegriffen und erläutert. Es wird insbesondere auf Probleme bei der Umsetzung der Qualitätsvorgaben sowohl der Bild- als auch der Volltextdigitalisierung eingegangen und (nachahmenswerte) Lösungswege werden aufgezeigt. Ein Ausblick auf die geplanten Zugriffsmöglichkeiten des Deutschen Textarchivs wird den Vortrag beschließen. Die Präsentation soll ausdrücklich einen Werkstattcharakter tragen.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Oliver Duntze, Christiane Fritze
URN:urn:nbn:de:0290-opus-7665
Document Type:Conference publication (Presentation slides)
Language:German
Date of Publication (online):2009/06/19
Year of Completion:2009
Contributing Corporation:Berlin-Brandenburgische Akademie der Wissenschaften
Release Date:2009/06/19
Tag:Textkorpora; Volltextdigitalisierung
fulltext digitasation; language corpora
GND Keyword:Digitalisierung
Themes:Digitalisierung, Langzeitarchivierung
German Bibliothekartage / BiblioCon:98. Deutscher Bibliothekartag in Erfurt 2009
Einverstanden
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.