Im Folgenden werden die einzelnen Arbeitspakete kurz vorgestellt. In Klammern hinter dem Titel des jeweiligen Arbeitspakets befinden sich die beteiligten Partner. Der jeweils erstgenannte Partner stellt für jedes Arbeitspaket den leitenden Standort dar.

AP1: Koordination (Gießen)

 

AP2: Standards, Webservices, Portalplanung (Berlin/ Trier)

Ziel des Teilprojektes „Standards, Webservices, Portalplanung“ ist es, Standards und Dienste zu entwickeln, die die Interoperabilität der Ressourcen zunächst der am Zentrum beteiligten Standorte und später auch externer Projekte gewährleisten.

Erstens werden Standards für die Auszeichnung der Ressourcen adaptiert und festgelegt, zweitens werden lexikographische Webservices spezifiziert, über die die Ressourcen des Zentrums und seiner Partner übergreifend recherchiert werden können („Federated Content Search“). Es werden die nötigen Voraussetzungen für die wissenschaftlichen Kriterien genügende Adressierung und Vernetzung von Daten verschiedenen Typs (Wörterbuchartikel, bibliographische Daten, Korpustexte) und unterschiedlicher Provenienz geschaffen. Darüber hinaus werden auf der Basis der Daten der Zentrumspartner Dienstprogramme für die automatische Konvertierung der Daten entwickelt, als Muster und Best-Practice-Lösungen für die Integration zukünftiger Ressourcen.

Das Projekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann.  Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Eine kommerzielle Verwertung ist grundsätzlich nicht ausgeschlossen, wird aber nicht angestrebt.

 

AP3: Exemplarische Aufbereitung von Wörterbuchressourcen (Trier/ Mainz)

Aufgabe des Teilprojektes „Exemplarische Aufbereitung von Wörterbuchressourcen“ ist es, die Aufbereitung der vorhandenen umfangreichen digitalen Ressourcen zur Sprachgeschichte des Deutschen nach internationalen Standards zu koordinieren.

Bearbeitet werden die digital vorliegenden Ressourcen zu einem gesamtgeschichtlich bezogenen Wörterbuch (Deutsches Wörterbuch von Jacob und Wilhelm Grimm, AP3.4) sowie zwei Epochenwörterbüchern (Althochdeutsches Wörterbuch, AP3.1, und Neues Mittelhochdeutsches Wörterbuch/Mittelhochdeutsche Wörterbücher im Verbund, AP3.2/AP3.3). Diese Ressourcen werden unter Verwendung der in den Geisteswissenschaften maßgeblich eingesetzten TEI-Guidelines einheitlich in XML aufbereitet, so dass sie über offene Schnittstellen für die gemeinsame Infrastruktur des Zentrums als Primärdaten mit Metadaten und eindeutigen Identifikatoren verfügbar sind. Ein weiteres Ziel besteht in der Beteiligung an der Vernetzung der Wörterbücher untereinander, um so zu einem übergreifenden Informationssystem zum historischen Deutsch zu gelangen.

Das Projekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann. Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Software, die von den Verbundpartnern entwickelt wird, wird unter einer „GNU Affero General Public License 3.0“ mit offenem Quellcode zur Verfügung gestellt werden.

Vorrangiges Ziel des Teilprojektes ist die Bereitstellung der standardisiert codierten Wörterbuchdaten unter Open-Access-Bedingungen für die Nachnutzung in nichtkommerziell angelegten Vorhaben sowie die Vermittlung der Codierungsvorschriften an laufende Wörterbuchprojekte mit dem Ziel der dezentralen Erweiterung des Netzwerks.

 

AP4: Metadatenschema für ein übergreifendes Quellenverzeichnis (Göttingen)

Ziel des Teilprojektes „Metadatenschema für ein übergreifendes Quellenverzeichnis“ ist es, in enger Zusammenarbeit mit dem Verbundpartner Universität Gießen neue Formen der Darstellung und der Dokumentation wort- und wortschatzgeschichtlicher Befunde zu systematisieren, zu bewerten und vor allem auszubauen und weiterzuentwickeln.

Ziel des Teilprojektes ist die Erarbeitung und Systematisierung neuartiger Formen der Visualisierung von wort-, bedeutungs- und gebrauchsgeschichtlichen Befunden. Hierfür ist zu ermitteln, welche Visualisierungstypen sich in digitale Wörterbücher, digitale lexikalische Systeme und in lexikographisch-lexikologische Untersuchungen einbinden lassen, wie diese erzeugt und mit einem digitalen Datenbestand dynamisch verknüpft werden können. Ferner ist zu zeigen, welche Aspekte der Bedeutungs- bzw. Gebrauchsgeschichte sich mit welchen Visualisierungsformen darstellen lassen.

Das Verbundprojekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann.  Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Software, die von den Verbundpartnern entwickelt wird, wird unter einer „GNU Affero General Public License 3.0“ mit offenem Quellcode zur Verfügung gestellt werden.

Die Ergebnisse des Teilprojektes werden neuartige Darstellungs-, Strukturierungs- und Zugriffsweisen auf lexikographische Daten im Bereich der wissenschaftlichen Lexikographie ermöglichen. Sie erlauben darüber hinaus, die Ergebnisse und Befunde historisch-lexikologischer Forschung in die lexikographischen Dokumentationssysteme einzubinden.

 

AP5: Exemplarische bidirektionale Verknüpfung von Wörterbuch-Belegen mit digitalen Volltexten (Mainz/ Berlin/ Frankfurt a.M.)

Aufgabe des Teilprojektes „Exemplarische bidirektionale Verknüpfung von Wörterbuch-Belegen mit digitalen Volltexten“ ist es, exemplarisch die bidirektionale Verknüpfung von Wörterbuch-Belegzitaten mit ihren Vorkommen in den Volltexten der betreffenden Wörterbuch-Quellentexte zu realisieren, und zwar für drei Wörterbücher und Texte aus vier führenden digitalen Textcorpora. Im Ergebnis wird die innovative Leistung bidirektionaler Verknüpfung für die Wörterbuchnutzung demonstriert und steht das Verfahren für Übertragung auf andere Quellentexte und Wörterbücher bereit.

Zunächst sind die Quellentexte aus führenden digitalen Textcorpora einheitlich einzurichten für ihre Verknüpfung mit Wörterbüchern, die vom Verbundprojekt inzwischen standardisiert worden sind. Für diese Texte und Wörterbücher ist ein einheitliches Verknüpfungsverfahren mit den jeweiligen Spezifikationen zu entwickeln bis zur weitgehend automatischen Praxisreife, die durch fortwährende Kontrolle der Verknüpfungsergebnisse und entsprechende Verbesserung der Verknüpfungsroutine erreicht wird; die abschließende Dokumentation erlaubt die Anwendung auf andere Texte und Wörterbücher.

Das Projekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann. Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Software, die von den Verbundpartnern entwickelt wird, wird unter einer „GNU Affero General Public License 3.0“ mit offenem Quellcode zur Verfügung gestellt werden.

Vorrangiges Ziel des Teilprojektes ist die Bereitstellung des Verknüpfungsverfahrens einschließlich der Beschreibung der Grundlagen in der standardisierten Einrichtung der zu verknüpfenden Wörterbücher und Texte für weitere Texte und Wörterbücher innerhalb des Zentrums und für externe wissenschaftliche Nutzer/innen.

 

AP6: Epochenübergreifende Wortfamilienstrukturen (Frankfurt a.M./ Mainz)

Ziel des Teilprojektes „Epochenübergreifende Wortfamilienstrukturen“ ist es, eine epochenübergreifende Wortfamilienstruktur des Deutschen exemplarisch zu etablieren und zur Verknüpfung mit den historischen Wörterbüchern bereitzustellen. Dies geschieht zunächst für die beiden frühesten Sprachepochen des Deutschen, das Althochdeutsche (Ahd.) und das Mittelhochdeutsche (Mhd.), für die es umfangreiche Vorarbeiten und eine umfassende digitale Datenbasis gibt. Halbautomatische Verfahren für die Feststellung der Entsprechungen der ahd. Wortfamilien im Mhd. werden entwickelt und durch linguistische Kontrolle für eine zentrale große Wortfamilie, die exemplarisch mit allen ihren Gliedern im Ahd. und Mhd. verknüpft wird, erprobt.

In einem ersten Schritt werden die Lexeme der mhd. Stichwortliste halbautomatisch hinsichtlich ihrer Wortbildungsstruktur durch Segmentierung mithilfe einer Liste der mhd. Präfixe und Suffixe analysiert. Die verbleibenden Kernmorpheme werden daraufhin unter Verwendung der Regeln für die Transformation von ahd. in mhd. Lexeme auf ihre Identität mit ahd. Lexemen abgeglichen. Die auf diese Weise erzeugte Kandidatenliste ahd.-mhd. Entsprechungen wird dann für eine ausgewählte Großfamilie linguistisch geprüft und für die Verknüpfung mit den Wörterbüchern des Ahd. und Mhd. eingerichtet.

Das Projekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann. Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Software, die von den Verbundpartnern entwickelt wird, wird unter einer „GNU Affero General Public License 3.0“ mit offenem Quellcode zur Verfügung gestellt werden. Das vom Teilprojekt bearbeitete Verfahren soll auch auf die Wortfamilienstruktur jüngerer Sprachepochen übertragen werden können.

 

AP7: Innovative Zugriffs- und Darstellungsformen (Gießen/ Göttingen/ Mainz/ Frankfurt a.M.)

Ziel des Teilprojektes „Innovative Zugriffs- und Darstellungsformen“ ist es, neue Formen der Darstellung und der Dokumentation wort- und wortschatzgeschichtlicher Befunde zu systematisieren, zu bewerten und vor allem auszubauen und weiterzuentwickeln. Zu den wesentlichen Gegenständen gehören Formen der Visualisierung, Formen der An- und Einbindung traditioneller Ressourcen sowie Aspekte der technischen Markierung unterschiedlicher Zugriffsweisen, die quer zum Alphabet liegen, u. a. der Zugriff anhand von Wortfamilienzusammenhängen.

In einem ersten Schritt werden die Ansätze der lexikographisch-lexikologischen Darstellungsformen jenseits alphabetischer Zugriffe und von Formen der Visualisierung dokumentiert und systematisiert. In einem zweiten Schritt werden neuartige lexikographisch-lexikologische Dokumentationsformen entwickelt. Schließlich werden ihre Einsatzmöglichkeiten im Rahmen vorhandener digitaler Wörterbuchprojekte und digitaler lexikalischer Systeme beurteilt.

Das Projekt erarbeitet die wesentlichen Voraussetzungen und Grundlagen für ein auf Dauer angelegtes Zentrum und eine generische eHumanities-Forschungsinfrastruktur, die zukünftig für Forschung im Bereich der historischen Lexikographie, der historischen Lexikologie, des Sprachwandels und der wortgeschichtlichen Anwendungsfelder genutzt werden kann. Die Ergebnisse werden außerdem publiziert, vorzugsweise im Rahmen von Open-Access-Umgebungen. Software, die von den Verbundpartnern entwickelt wird, wird unter einer „GNU Affero General Public License 3.0“ mit offenem Quellcode zur Verfügung gestellt werden.