Exemplarische Aufbereitung von Wörterbuchressourcen

  1. Aufgaben und Ziele
  2. Stand der Arbeiten
Leitung und Partner:

Universität Trier, Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften

Akademie der Wissenschaften und der Literatur | Mainz

Laufzeit:

Januar 2017 bis Dezember 2018

Arbeitsgruppe:

Trier:
Dr. Thomas Burch, Dr. Stefan Büdenbender

Mainz:
Peter Hinkelmanns M.A. (bis.31.12.2017), Dr. Ralf Plate, Ute Recker-Hamm M.A.

  1. Aufgaben und Ziele

Dieses Arbeitspaket dient der exemplarischen Aufbereitung der vorhandenen hochwertigen und sehr umfangreichen digitalen Ressourcen zur Sprachgeschichte des Deutschen. Bei den ausgewählten Quellen handelt es sich um ein gesamtgeschichtlich bezogenes Wörterbuch (Deutsches Wörterbuch von Jacob und Wilhelm Grimm) sowie mehrere Epochenwörterbücher (Althochdeutsches Wörterbuch und Mittelhochdeutsches Wörterbuch; letzteres einschließlich seiner Vorgängerwörterbücher im Mittelhochdeutschen Wörterbuchverbund). Die zugrundeliegenden Daten werden inhaltlich angereichert und in ein XML-Format überführt, das den in den Geisteswissenschaften maßgeblich eingesetzten TEI-Guidelines entspricht. Dabei werden sie formal so weit vereinheitlicht,  dass sie über offene Schnittstellen für die gemeinsame Infrastruktur des Zentrums als Primärdaten mit Metadaten und eindeutigen Identifikatoren verfügbar sind. Ein weiteres Ziel besteht in der Beteiligung an der Vernetzung der Wörterbücher untereinander, um so zu einem übergreifenden Informationssystem zum historischen Deutsch zu gelangen.

  1. Stand der Arbeiten
  • Mittelhochdeutscher Wörterbuchverbund (MWV)

Die Artikel der im MWV enthaltenen Wörterbücher (Lexer, BMZ) sowie des „Findebuchs zum Mittelhochdeutschen Wortschatz“ liegen mittlerweile in TEI-P5 vor und sind damit für die elektronische Nachnutzung im Rahmen von ZHistLex vorbereitet.

  • Mittelhochdeutsches Wörterbuch (MWB)

Die TEI-P5 Kodierung des Wörterbuchs wurde verfeinert, insbesondere die Kodierung des internen Verweissystems wurde erweitert, sodass auch Verweise auf die Microstrukturebene des Wörterbuchs als Hyperlinks realisiert und für lexikographische Anfragen verwendet werden können.

  • Althochdeutsches Wörterbuch (AWB)

Die Auszeichnung des Althochdeutschen Wörterbuchs ist erweitert worden. Im Einzelnen betrifft dies die semantische Auszeichnung etymologischer und bibliographischer Verweise, den Formen-Teil und den Bedeutungs-Teil. Ergänzend sind die verschiedenen Literaturverzeichnisse des Althochdeutschen Wörterbuchs semantisch annotiert und zu einer Gesamtdatei zusammengeführt worden.

  • Deutsches Wörterbuch (1DWB)

Im Deutschen Wörterbuch wurden folgenden Arbeiten vorgenommen:

# Auszeichnung Quellenverzeichnis

Auch das Quellenverzeichnis wurde nach TEI-P5 ausgezeichnet, dabei wurden ausgesparte oder verkürzt wiedergegebene Informationen zu Autoren, Werken und Referenzausgaben ergänzt bzw. in maschinell auswertbarer Form hinterlegt. Außerdem wurden die fast 15000 Einträge automatisch auf PPN-Nummern des Gemeinsamen-Verbund-Katalogs bezogen. Z.Zt. erfolgt die Evaluierung dieses Ergebnisses durch Hilfskräfte des Trierer Kompetenzzentrums.

Verknüpfung Quellenverzeichnis-Wörterbuch

Aufbauend auf einer von der BBAW eingebrachten Access-Datenbank wurde mit der Zuordnung der Belegautoren in ihren jeweiligen Schreibvarianten zu den Ansätzen im Quellenverzeichnis begonnen. Auch hier ist jedoch noch mit beträchtlichem Nachbearbeitungsaufwand zu rechnen.

Auszeichnung Wörterbuchbelege

Im Wörterbuchtext wurde die Erkennung der Belegsiglen insbesondere bei komplexeren Stellenangaben verbessert.