Die Gemeinsame Normdatei wurde von 2009 bis 2012 in einem gemeinsamen Projekt der Deutschen Nationalbibliothek, der deutschsprachigen Bibliotheksverbünde sowie der Zeitschriftendatenbank entwickelt. Ziel des Projekts war die Zusammenführung der bisher getrennt geführten Normdateien GKD, PND und SWD sowie der DMA-EST-Datei. Dabei sollten ein gemeinsames Datenformat realisiert und die vorhandenen Regelwerksunterschiede harmonisiert werden.
Der Erstellung von Normdatensätzen lagen früher unterschiedliche Regelwerke zugrunde. Dies waren die „Regeln für die alphabetische Katalogisierung“ (RAK-WB und RAK-Musik) für die Formalerschließung sowie die „Regeln für den Schlagwortkatalog“ (RSWK) für die Inhaltserschließung. Die uneinheitlichen Regeln zur Bildung der Vorzugsbenennung für die Formal- und Inhaltserschließung führten insbesondere im Bereich Körperschaften, Kongresse und Geografika zu redundanten Datensätzen in der GKD und der SWD. Daher wurden für die GND für die Fälle, in denen die Regeln der Formal- und Inhaltserschließung voneinander abweichen, Übergangsregeln erarbeitet, die eine gemeinsame Nutzung der Normdatensätze ermöglichen. Die Übergangsregeln berücksichtigten so weit wie möglich bereits die Regelungen der RDA (Resource Description and Access).
Auch die Datenformate der Normdateien, sowohl die Internformate als auch die Austauschformate, unterschieden sich teilweise beträchtlich. Das Austauschformat der GND basiert auf MARC 21 Authority. Durch die Zusammenführung aller Normdatensätze in der GND konnten die zuvor bestehenden Formatunterschiede überwunden werden. Bereits vorhandene parallele Datensätze aus den unterschiedlichen Normdateien können jedoch erst im Laufe der Zeit zusammengeführt werden.
Im Projekt Virtual International Authority File (VIAF) wird die GND mit anderen Normdateien virtuell zu einer internationalen Normdatei verbunden.
Inhalt
Die Daten bestehen aus Entitäten und Aussagen zu diesen. Jede Entität hat einen Entitätstyp und mindestens einen Identifikator.
Eigenschaften eines Datensatzes
Jeder Datensatz beschreibt eine Entität.
Entitätentypen
Die hier aufgeführten Entitätentypen entsprechen in Bibliotheken sogenannten Satzarten (Datensatzart).
In der Gemeinsamen Normdatei wird zu jeder Entitätenbeschreibung eine eindeutige Identifikationsnummer (IDN oder PPN; Grundlage für den Uniform Resource Identifier im Produktionssystem), eine normierte Vorzugsbenennung (früher auch: Ansetzungsform), abweichende Namensformen (Synonyme) und verschiedene beschreibende Attribute verzeichnet. Die Attribute werden möglichst als Relationen zu anderen Normdatensätzen abgelegt, wobei die Art der Beziehung jeweils codiert ist.[2] Beispiele für relationierte Attribute sind Geburts- und Sterbeorte von Personen sowie ihre Berufe. Für Körperschaften können u. a. Vorgänger- und Nachfolgerbeziehungen, aber auch administrative Überordnungen angegeben werden. Bei Sachbegriffen werden Oberbegriffe und verwandte Begriffe verknüpft. Dadurch kann bei der Suche in einem Bibliothekskatalog auch Literatur zu angrenzenden Themen gefunden werden. Eine reichhaltige und treffende semantische und thematische (je nach Fach auch: an der Dogmatik orientierte) Aufarbeitung der GND-Einträge zueinander kommt der Qualität des Retrievals zugute.
Auf diese Weise entsteht ein semantisches Netz von miteinander in Beziehung stehenden Datensätzen (Linked Data), das sich besonders für die Nutzung im Web eignet, die Navigation innerhalb der Normdatei erlaubt und somit die Recherchemöglichkeiten für Nutzer verbessert.
Ende August 2019 wurde die Ansetzung von Tn-Sätzen für Personennamen eingestellt.[Anm 1] Ein Jahr später, ab dem 19. Juni 2020, wurden die Verknüpfungen der Namendatensätze mit den Titeldaten gelöscht und durch Textstrings ersetzt. Seit Juli 2020 sind die Tns nicht mehr Bestandteil der Gemeinsamen Normdatei.[3]
↑Die Abkürzung „Tn“ steht für „Thesaurus Name“ und bezeichnet nicht individualisierte Namensdatensätze. In der VIAF sind sie als „undifferentiated“ gekennzeichnet.
Entitätenuntertypen
Abgesehen von Personennamen kann jede Satzart durch die Angabe eines Entitätencodes[4] in sich weiter differenziert werden. So kann ein Geografikum beispielsweise ein Staat oder ein Bauwerk sein. Insgesamt stehen sechs Entitätentypen zur Verfügung, die sich in rund 50 Untertypen gliedern.
Bauwerke und Bauensembles, Monumentalplastiken, Denkmäler, Grabmäler u. ä. gemäß RSWK §730,1
gif; gik
Gliedstaaten (sie werden immer mit „gik“ doppelt codiert)
gik
Gebietskörperschaften und Verwaltungseinheiten
gil; gik
Länder, Staaten (selbstständig) (sie werden immer mit „gik“ doppelt codiert)
gin
Natürliche geografische Einheiten, biogeografische und paläografische Einheiten, Namen von geografischen Teileinheiten mit Himmelsrichtung bzw. mit anderen Wendungen gemäß RSWK § 205, 1 und 2
gio
Kleinräumige Geografika innerhalb eines Ortes, ausgenommen Bauwerke und Bauensembles
gir; gik
Geistliche Reichsfürstentümer (bis 1803), Verwaltungseinheiten der Ostkirche (sie werden immer mit „gik“ doppelt codiert)
giv; gik
Verwaltungseinheiten, die gemäß der EH-G-03 einen instantiellen Oberbegriff von dem Gattungsbegriff der Verwaltungseinheit bekommen (sie werden immer mit „gik“ doppelt codiert)
giw
Grenzen, Wege, Linien
gix
Extraterrestrika
giz
Alle geografischen Namen, die sich keinem der anderen Entitäten-Untertypen zuordnen lassen, Regionen und Gebiete gem. RSWK § 204a, einschließlich des Umlands einzelner Städte und Gemeinden
gxz
Fiktive Orte
k
Körperschaften
kif
Firmen (ab Januar 2016)
kim
Musikalische Körperschaften (ab Januar 2016)
kio
Organe von Gebietskörperschaften
kip
Projekte und projektähnliche Vorhaben und Programme
kiv; kir
Religiöse Verwaltungseinheiten (z. B. Diözesen der Katholischen Kirche; Ausnahme: Verwaltungseinheiten der Ostkirche, Verwaltungseinheiten der Ostkirche werden mit „gir“ und „gik“ codiert) (sie werden immer mit „kir“ doppelt codiert) (ab Januar 2016)
kiz
Alle übrigen Körperschaften, die keinem anderen speziellen Entitätentyp zugehören
kxz
Fiktive Körperschaften
p
Personen
pif
Familien
pik
Regierende Fürsten, Mitglieder regierender Fürstenhäuser
pip
Pseudonyme
pis
Sammelpseudonyme
piz
Personennamen, die keinem anderen speziellen Entitätentyp zugehören
pxg
Götter
pxl
Literarische Gestalten, Sagengestalten
pxs
Geister
s
Sachbegriffe
sab; saz
Musikalische Besetzung (gemäß RDA 6.15) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016)
sad; saz
Datenträger (gemäß RDA 3.4.1.3 D-A-CH) (sie werden immer mit „saz“ doppelt codiert)
saf; saz
Formangaben zu Art des Inhalts (gemäß RDA 7.2.1.3 D-A-CH) (sie werden immer mit „saz“ doppelt codiert)
sag; saz
Musikalisches Genre (gemäß RDA 6.14.2.5.2 D-A-CH) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016)
sam; saz
Musikalische Ausgabeform (gemäß RDA 7.20.1.3 D-A-CH) (sie werden immer mit „saz“ doppelt codiert)
saz
Allgemeinbegriffe, d. h. alle Sachschlagwörter, die keinem anderen speziellen Entitätentyp zugehören
sie
Ethnografika
sif
Verkehrsmittel mit Individualnamen
sih
Historische Einzelereignisse
sip
Produkte und Markennamen außer Softwareprodukte („siw“)
sis
Sprachen
siu
Personengruppen, die keine Körperschaft sind
siw
Softwareprodukte
siz
Alle individuellen Sachverhalte, die als Sachbegriffe erfasst werden und sich keinem der anderen Entitäten-Untertypen zuordnen lassen, z. B. Wettbewerbe
slz
Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen
snz
Nomenklatur Biologie – Chemie
sxz
Fiktive Sachbegriffe
szz
Alle Zweifelsfälle für alle Entitäten
u
uiz
Unkörperschaften (nur in Altdaten)
v
Konferenzen und Veranstaltungen
vie
Konferenzen, Veranstaltungen
vif
Konferenzfolgen bzw. -reihen, Veranstaltungsfolgen bzw. -reihen w
w
Werke
wid
Druckermarken
wie
Expression
wif
Fassung eines Werks der Musik (ab Juli 2014 nicht mehr verwendet)
wim
Werke der Musik
win
Sammlungen
wip
Provenienzmerkmale
wis
Schriftdenkmäler
wit
Werke
Entitätsidentifikator
Jede Entität ist über mindestens einen Identifikator (GND-ID) eindeutig identifizierbar. Jeder Identifikator besteht maximal aus den Zeichen 0 bis 9, X und einem Bindestrich. Ein Identifikator für eine Entität vom Entitätstyp p besteht aus 9 oder 10 Zeichen, er beginnt immer mit einer 1, gefolgt von 8 oder 9 Ziffern, und endet mit einem Prüfzeichen 0–9 oder X.
Katalogisierungslevel
Jeder Datensatz ist mit einem Katalogisierungslevel zwischen 1 und 6 verknüpft. Je niedriger die Zahl, desto höher ist der Level des GND-Eintrags und desto besser ist der Datensatz aufgearbeitet.
Ansetzung von Sachbegriffen
Die Ansetzung der bevorzugten Benennung stützt sich grundsätzlich auf die in der „Liste der fachlichen Nachschlagewerke für die Gemeinsame Normdatei“ aufgeführten Werke.[6] Die Vorzugsbenennung von Sachbegriffen in der GND folgt dem allgemeinen Sprachgebrauch, wie er in Enzyklopädien (Brockhaus, Meyer, hilfsweise auch Wikipedia) nachweisbar ist; ausnahmsweise wird auf Begriffe aus der Fachsprache abgestellt. Synonyme können als Varianten oder sogenannte Quasisynonyme in die Einträge aufgenommen werden. Solange es zu einem Thema nicht genügend Titel gibt, wird zunächst versucht, neue Sachverhalte durch die Kombination mehrerer bereits verfügbarer Sachbegriffe in einer Schlagwortfolge auszudrücken, um Neuansetzungen so weit wie möglich zu vermeiden (sogenannte Zerlegungskontrolle). Dadurch wird die Kontinuität zur Beschlagwortung eines Themas in der älteren Literatur gewahrt, so dass ein Bezug zu älteren Titeln hergestellt werden kann. Erst wenn die Literatur zu einem Thema einen gewissen Umfang erreicht hat, wird ein neuer Sachbegriff eingeführt. Ändert sich der Sprachgebrauch, kann die Vorzugsbenennung angepasst werden.
Umfang
Mengenangaben sind in den Jahresberichten der DNB und den Datenauszügen der GND[7] zu finden.
Anzahl Entitäten nach Entitätentyp im Zeitablauf
Die Gemeinsame Normdatei enthält rund 9,1 Millionen Datensätze folgender Entitätentypen:
Entitäten in der GND: Anzahl nach Entitätentyp im Zeitablauf
Stand 13. Juni 2021 gibt es 465.790 Umlenksätze, veröffentlicht im Format RDF (JSON-LD) auf open.dnb.de/opendata. Damit sind einige Datensätze über mehrere GND-Identifikatoren referenzierbar.
Umlenksätze im Zeitablauf
Datum
Anzahl
Anmerkung
13.04.2021
461.335
13.06.2021
465.790
13.11.2021
472.485
GND, Umlenksaetze ohne Tu
Tripel
Die Dateien „authorities_lds“ enthalten Stand: 13. Juni 2021 13:20 Uhr UTC in 8.920.450 Datensätzen 163.131.042 Tripel.[19]
authorities_lds
Zeitpunkt
Datensaetze
Tripel
13.06.2021 13:20 Uhr UTC
8.920.450
163.131.042
13.10.2021 12:20 Uhr UTC
9.014.666
165.639.860
Nutzung und Schnittstellen
Die Gemeinsame Normdatei wird bei der Deutschen Nationalbibliothek gehalten. Die Bibliotheksverbünde haben den GND-Grundbestand einmalig in ihre Verbundsysteme eingespielt und beziehen seitdem die Aktualisierungen der Normdatei über das OAI-Verfahren. Die GND wird nicht nur von Bibliotheken, sondern auch von Archiven (bisher v. a. von wissenschaftlichen und Literaturarchiven), Museen und Redaktionen von Nachschlagewerken bearbeitet und erweitert. Die Mitarbeit erfolgt entweder über Bibliotheksverbünde oder nach Absprache mit der Deutschen Nationalbibliothek. Die Nutzung durch staatliche und kommunale Archive läuft (Stand 2015) erst an.
Die GND-Normdaten stehen auf der Website der DNB in den Formaten MARC 21 Authority, MARC21-xml und RDFxml entgeltfrei unter der Lizenz CC0 1.0 zur Verfügung.
Institutionenübergreifende Integration von Normdaten
Im Dezember 2012 wurde unter dem Namen Institutionenübergreifende Integration von Normdaten (IN2N) ein Kooperationsprojekt zwischen der Deutschen Nationalbibliothek (DNB) und dem Deutschen Filminstitut (DIF) gestartet. Ziel des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projektes ist es, Institutionen außerhalb des Bibliothekswesens bei der Nutzung der GND zu unterstützen und in die Erschließung einzubeziehen.[20] Unter anderem wurden im Rahmen des Projektes bereits die Datensätze aus filmportal.de mit den Personenartikeln aus Wikipedia abgeglichen.[21]
Ende 2014 wurden die Normdaten des DIF in die GND eingespielt. In den Monaten davor wurden unter anderem bereits Daten des Ibero-Amerikanischen Instituts (Berlin) und der Forschungsstelle Osteuropa an der Universität Bremen in die GND übernommen. Seit dem 6. Mai 2016 können Wikipedianer, die an einer entsprechenden Schulung teilgenommen haben, über das „GND-Webformular“ Normdaten für Personen anlegen. Die dazugehörige Bibliothekskennung lautet Wikimedia Deutschland (DE-B1592).
Das Projekt „ORCID DE“ widmete sich von 2016 bis 2022,[22][23] unter der Förderung der Deutschen Forschungsgemeinschaft, der Verknüpfung der GND mit ORCID.[24] Diese Arbeiten werden im Jahr 2023 im Projekt „PID Network“ fortgeführt.[25]
Literatur
Sarah Hartmann, Heinz Pampel: GND und ORCID: Brückenschlag zwischen zwei Systemen zur Autorenidentifikation. In: Bibliotheksdienst. Band51, Nr.7, Januar 2017, doi:10.1515/bd-2017-0062.
Renate Behrens-Neumann: Die Gemeinsame Normdatei (GND). Ein Projekt kommt zum Abschluss. In: Dialog mit Bibliotheken. Band 24, Heft 1, 2012, ISSN0936-1138, S. 25–28 (PDF; 130 kB).
Eva-Maria Gulder: Die Gemeinsame Normdatei (GND). Bayerische Staatsbibliothek München (Normdatenredaktion), September 2011, (PDF; 2,84 MB).
Thekla Kluttig: Gemeinsame Normdatei und Archive – was soll das? In: Clemens Rehm, Monika Storm, Andrea Wettmann (Hrsg.): Nachlässe – Neue Wege der Überlieferung im Verbund. Gemeinsame Frühjahrstagung FG 1 und FG 6 für alle Fachgruppen im VdA. 7. Mai 2013, Staatsarchiv Chemnitz (= Veröffentlichungen des Sächsischen Staatsarchivs. Reihe A: Archivverzeichnisse, Editionen und Fachbeiträge. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4, S. 85–88.
Barbara Pfeifer: Vom Projekt zum Einsatz. Die gemeinsame Normdatei (GND). In: Klaus-Rainer Brintzinger, Ulrich Hohoff (Hrsg.): Bibliotheken: Tore zur Welt des Wissens. 101. Deutscher Bibliothekartag in Hamburg 2012. Olms, Hildesheim u. a. 2013, ISBN 978-3-487-14888-5, S. 80–91.
Fabian Steeg, Adrian Pohl, Pascal Christoph: lobid-gnd – Eine Schnittstelle zur Gemeinsamen Normdatei für Mensch und Maschine. In: Informationspraxis. Band5, Nr.1, 2019, ISSN2297-3249, doi:10.11588/ip.2019.1.52673 (uni-heidelberg.de).
Brigitte Wiechmann: Die Gemeinsame Normdatei (GND). Rückblick und Ausblick. In: Dialog mit Bibliotheken. Band 24, Heft 2, 2012, S. 20–22 (PDF; 465 kB).
↑Renate Behrens, Christine Frodl: Erste Meilensteine im RDA-Projekt. In: Dialog mit Bibliotheken. Band 26, Heft 1, 2014, S. 25–31, hier S. 28, (PDF; 310 kB).
↑IN2N (Memento vom 12. August 2015 im Internet Archive), Deutsches Filminstitut, Abfragedatum: 21. November 2013.
↑Alexander Haffner: Institutionenübergreifende Integration von Normdaten (IN2N). In: Dialog mit Bibliotheken. Band 25, Heft 2, 2013, S. 42–45, (PDF; 54 kB).
↑Bertelmann, Roland, Niggemann, E., Pieper, D., Elger, Kirsten, Fenner, M., Hartmann, S., Höhnow, T., Jahn, N., Müller, U., Pampel, H., Schirrwagen, J., Summann, F.: ORCID DE – Förderung der Open Researcher and Contributor ID in Deutschland. 2015, doi:10.2312/lis.16.01.
↑Bertelmann, Roland, Cruse, P., Niggemann, E., Pieper, D., Sens, I., Burger, M., Dasler, R., Dreyer, B., Elger, Kirsten, Fenner, M., Hagemann-Wilholt, S., Hartmann, S., Höhnow, T., Kett, J., Pampel, H., Pietsch, C., Schirrwagen, J., Summann, F.: ORCID DE 2 – Konsolidierung der ORCID-Informationsinfrastruktur in Deutschland. 2019, doi:10.2312/lis.20.01.
↑Sarah Hartmann, Heinz Pampel: GND und ORCID: Brückenschlag zwischen zwei Systemen zur Autorenidentifikation. In: Bibliotheksdienst. Band51, Nr.7, 1. Juli 2017, ISSN2194-9646, S.575–588, doi:10.1515/bd-2017-0062 (degruyter.com [abgerufen am 6. Oktober 2023]).
↑Bertelmann, Roland, Buys, Matthew, Kett, Jürgen, Pampel, H., Pieper, Dirk, Scholze, Frank, Sens, Irina, Burger, Felix, Dreyer, Britta, Glagla-Dietz, Stephanie, Hagemann-Wilholt, Stephanie, Hartmann, Sarah, Schrader, Antonia C., Schirrwagen, Jochen, Summann, Friedrich, Vierkant, Paul: PID Network Deutschland. Netzwerk für die Förderung von persistenten Identifikatoren in Wissenschaft und Kultur. 2023, doi:10.48440/os.helmholtz.059.