Metadatenschema für ein übergreifendes Quellenverzeichnis

  1. Aufgaben und Ziele
  2. Methode und Arbeitsschritte
    1. Bespielbefund 1DWB, 2DWB, MWB, Lexer/BMZ, DRW, ReM für die ‚Kaiserchronik‘
    2. Verfahren
  3. Zwischenergebnisse
Leitung und Partner:

Akademie der Wissenschaften zu Göttingen (Eigenleistung in Kooperation mit der SUB Göttingen)

Arbeitsgruppe:

Göttingen:
Maike Tech (SUB Göttingen), PD Dr. Volker Harm (AdWG);

Mainz:
Peter Hinkelmanns (bis 31.12.2017), Ute Recker-Hamm M.A.

  1. Aufgaben und Ziele

Das Arbeitspaket umfasst alle im Rahmen des ZHistLex anfallenden Aufgaben, um außer den eigentlichen Wörterbuch-Ressourcen auch die Informationen der einzelnen Quellenverzeichnisse der Ressourcengeber gemeinsam absuchbar und Überschneidungen im Quellenbereich sichtbar zu machen. Dies schließt auch die Suche in den Metadaten zu den Quellen ein.  Die Herausforderung besteht daher zum einen darin, Werke unterschiedlicher Editionen und unterschiedlicher Titelaufnahmen virtuell zusammen zu führen und die in den einzelnen Quellenverzeichnissen ggf. schon kodierten Metadaten nutzbar zu machen. Des Weiteren soll die Komponente als Schaltstelle zwischen Wörterbüchern und elektronischen Textarchiven fungieren, d.h.  der bidirektionalen Verknüpfung von Wörterbüchern und Texten dienen, die in AP5 exemplarisch erarbeitet wird.

Gedacht ist dabei an Anfragen wie die folgenden:

Allgemein:

  • Welche Wörterbücher des ZHistLex führen die ‚Kaiserchronik‘ in ihrem Quellenverzeichnis auf?
  • Welche Ressourcen des ZHistLex bieten einen digitalen Volltext der ‚Kaiserchronik‘ an?
  • Welche Quellen gehören der Textsorte ‚Chronistik‘ an? Welche Quellen sind in den Metadaten auf die Mitte des 12. Jhs. datiert?

Ausgehend vom Beleg der ‚Kaiserchronik‘ in einem Wörterbuch des ZHistLex:

  • Wird die betreffende Stelle außerdem in einem anderen Wörterbuch, das am ZHistLex beteiligt ist, zitiert?
  • Zeige die betreffende Stelle in einem digitalen Volltext des Zentrums!

Ausgehend von einem digitalen Volltext:

  • Wird die aktuelle Stelle in einem Wörterbuch des ZHistLex behandelt?
  1. Methode und Arbeitsschritte
  1. Bespielbefund 1DWB, 2DWB, MWB, Lexer/BMZ, DRW, ReM für die ‚Kaiserchronik‘
  Ressource Titelaufnahme für die ‚Kaiserchronik‘ PPN
1 1DWB die kaiserchronik. Nach der aeltesten handschrift des stiftes Vorau. hg. von J. Diemer. Theil I. – urtext Wien 1849. 151750378
2   der keiser und der kunige buoch oder die sogenannte kaiserchronik. hg. v. H. F. Massmann. Quedlinburg u. Leipzig 1849-1854. 345853806

345853768

134479602

134479580

134479564

13447953X

3   die kaiserchronik eines Regensburger geistlichen. hg. v. E. Schröder. Hannover 1892. 230173861
4 2DWB [wie Z. 3] [wie Z. 3]
5 Lexer/ BMZ Der keiser und der kunige buoch oder die sogenannte Kaiserchronik, Gedicht des 12.Jh.s von 18578 Reimzeilen. Nach 12 vollständigen und 17 unvollständigen Hss. zum ersten Male hg. von Hans Ferdinand Massmann. Th.1-3. Quedlinburg/Leipzig 1849-1854 (BNL 4). [8 P Germ I, 2065:4] 345853806

345853768

134479602

134479580

134479564

13447953X

6 Die Kaiserchronik. Nach der aeltesten Hs. des Stiftes Vorau aufgefunden u. hg. von Joseph Diemer. Wien 1849.

[8 P Germ I, 8341]

151750378
7 MWB Die Kaiserchronik eines Regensburger Geistlichen. Hg. von Edward Schröder (MGH Deutsche Chroniken I, 1), Hannover 1892 (Nachdr. Dublin/Zürich 1964, 1969, München 1984). 023411627
8 MWB Textarchiv [wie Z. 7] [wie Z. 7]
9 DRW Der keiser und der kunige buoch oder die sogenannte Kaiserchronik. 3. Gedicht des zwölften Jahrhunderts von 18,578 Reimzeilen ; nach 12 vollständigen und 17 unvollständigen Handschriften, so wie anderen Hülfsmitteln … / zum ersten Male hrsg. von Hans Ferd. Massmann. – Quedlinburg [u.a.] : Basse, 1854. – XXIV, 1192 S. (Bibliothek der gesammten deutschen National-Literatur von der ältesten bis auf die neuere Zeit ; 4,3) 13447953X
10 ReM Edward Schröder (Hg.), Kaiserchronik eines Regensburger Geistlichen (MGH Deutsche Chroniken I,1), Berlin 1895 023411627
11 Vorauer Hs V [in Auszügen] Ohne PPN

Insgesamt stehen also vorerst vier Repräsentationsformen des Texts im Zentrum zur Verfügung: Die drei Editionen von Diemer, Massmann und Schröder sowie der annotierte Handschriftentext der Hs. V im Referenzkorpus Mittelhochdeutsch.

Sollen nun Anfragen der oben dargelegten Art unabhängig davon beantwortet werden, welche Ausgabe des Texts benutzt wurde und wie die Titelaufnahme im Quellenverzeichnis erfolgt ist, muss ein technisches Verfahren gefunden werden, diese Einträge virtuell zu einem Texteintrag zusammenzufassen.

  1. Verfahren

Schritt 1: Annotation mit PICA-Produktionsnummern

AP 4 schlägt ein Verfahren über die Nutzung der Pica-Produktionsnummer (PPN) vor, die im Gemeinsamen Verbundkatalog (GVK) verzeichnet ist. Im ersten Schritt annotieren die Ressourcengeber die Einträge ihrer Quellenverzeichnisse mit PPNs. Teilen zwei bibliographische Einträge des Zentrums mindestens eine PPN, so kann davon ausgegangen werden, dass es sich um denselben Text handelt. Auf diese Weise können folgende Gruppen der obigen Tabelle zusammengefasst werden: Z. 1 und 6 (Diemer), Z. 2, 4 und 9 (Massmann) sowie Z. 7, 8 und 10 (Schröder). Dass einige Ausgaben im GVK mehrere Einträge und somit mehrere PPNs haben (wie die Ausgabe von Massmann im obigen Beispiel) hat seine Ursache in verschiedenen Titelaufnahmen durch die beteiligten Bibliotheken und in der Mehrbändigkeit der Werke. Mehrfach-PPNs sind für das vorgeschlagene Verfahren im ZHistLex allerdings unproblematisch, vielmehr erhöhen sie ggf. die Trefferanzahl. Zwei Einheiten der Tabelle finden keine Gruppe: erstens der annotierte Handschriftentext, weil ihm eine PPN fehlt, zweitens Z. 3  und  4 (Schröder) finden nicht zu ihrer Gruppe, da hier (korrekterweise) nicht die PPN des Nachdrucks annotiert ist wie in den anderen Fällen der Gruppe, sondern diejenige der Erstausgabe.

Schritt 2: Zusammenfassung von Editionsgruppen zu einem Werkeintrag

Um nun die Gruppen der Ausgaben und den Einzelgänger zu einem Texteintrag zusammenzuführen, sieht der Vorschlag von AP4 in einem zweiten Schritt vor, die einschlägigen Metadaten des GVK,  der DNB oder des OPAC auszuwerten, die über die PPNs automatisch abgefragt werden können. Teilen zwei Einträge oder Eintragsgruppen die relevanten Metadatenfelder wie etwa Autor und Werk, so können die Einträge zusammengefasst werden. Der Handschriftentext bleibt auch bei diesem zweiten Schritt ohne Gruppe.

Alternativen

Ein alternatives Vorgehen könnte darin bestehen, dass die Datengeber ihre Quellenverzeichniseinträge statt auf die PPN oder einen anderen bibliographischen Identifikator direkt auf ein normiertes Werkverzeichnis beziehen. Dies könnte im Bereich der mittelhochdeutschen und frühneuhochdeutschen Zeit das Verfasserlexikon sein. Im obigen Beispiel wär das bei allen Einträgen: ‚Kaiserchronik‘ VL4, 949. Beide Verfahren – PPN-Nutzung und Bezug auf das Verfasserlexikon – können auch miteinander kombiniert werden, um zu feineren Ergebnissen zu gelangen. Die theoretische Möglichkeit, ein eigenes Werkverzeichnis im Rahmen ZHistLex anzulegen, wurde aus Zeit- und Ressourcengründen  verworfen.

Verhältnis zur ZHistLex-Architektur

Insgesamt folgt das Arbeitspaket der Gesamtarchitektur des ZHistLex, indem die Quellenverzeichnisse (wie auch die Wörterbücher und Textarchive) bei den einzelnen Datengebern verbleiben und über einen ZHistLex-Webservice (s. AP2) abgefragt werden können. Auch ggf. annotierte Metadaten wie Sprachraum, Entstehungszeit, Textsorte usw. werden nicht einem zentralen Verzeichnis gehalten, sondern bei den einzelnen Datengebern über den Service abgefragt. Die Herausforderung des Arbeitspakets liegt in der virtuellen Zusammenführung der verschiedenen Quellenverzeichnisse.

  1. Zwischenergebnisse

Für die Quellenverzeichnisse der Projekte FWB, 2DWB und MWB wurde ein gemeinsames Metadatenschema entworfen, das neben den grundlegenden bibliographischen Informationen auch Angaben z. B. zu wörterbuchinternen Quellensiglen, Sprachräumen, Themengebieten u. a. vorsieht. Die einzelnen Verzeichnisse sind mit PPN annotiert und mit übergreifenden Titeleinträgen aus dem OPAC versehen worden; dabei ist auch eine Evaluierung der PPN nach bibliothekarischen Qualitätsstandards erfolgt. Die Daten sind in einer Picadatenbank modelliert und für den Suchindex aufbereitet worden.