{{:icon-news-96.png?nolink|}} ====== Neuigkeiten und Themen ► OAI-PMH, kulturpool.at und Europeana ====== [[:start|{{ ::icon-home-64.png?nolink|Startseite}}]] [[bcpro:de:news_and_topics|{{ ::icon-arrow-left-64.png?nolink|Zurück zur Übersicht}}]] **17.03.2025 [DL]** ==== Einleitung ==== Im vergangenen Jahr hat das **Salzburg Museum** als erster unserer Kunden in Österreich mit der Vorbereitung einer Datenlieferung an das neu gegründete nationale Portal **kulturpool.at** begonnen. Im März diesen Jahres wurden die ersten Objekte des Salzburg Museum sowohl auf kulturpool.at als auch auf **Europeana** online geschaltet. Kulturpool übernimmt dabei - ganz ähnlich wie in Deutschland die DDB - die Rolle eines Aggregators, welcher zunächst von verschiedenen Kulturinstitutionen Daten in einem standardisierten Verfahren sammelt und anreichert, Anschließend werden diese Daten sowohl auf einer eigenen Portalseite zur Recherche zur Verfügung gestellt als auch an Europeana als zentralem Portal weitergereicht. Voraussetzung, dass Daten an kulturpool.at und Europeana geliefert werden dürfen ist, dass die bereitstellende Institution die entsprechenden Daten bereits im Rahmen einer eignen Onlinedatenbank veröffentlicht hat. Diesen Schritt ist das Salzburg Museum schon vor vielen Jahren gegangen - das Museum hat über **BeeCollect Web** mit inzwischen über **200.000 Objekten** fast ein Drittel seines gesamten Bestands an Sammlungsobjekten online gestellt. Teil der Onlinesammlung sind auch fast **400.000 Mediendateien** in verschiedenen Formaten, die teilweise mit Deepzooming in höchster Auflösung betrachtet werden können. Ein kleiner Teil dieses Datenschatzes wurde im Rahmen eines Projektes in den letzten Monaten angereichert, um Bestandteil sowohl von kulturpool.at als auch von Europeana zu werden. Für das sogenannte Harvesting, also das Ernten oder Einsammeln der Daten von den verschiedenen Institutionen setzt kulturpool.at auf das OAI-PMH-Protokoll. Es handelt sich dabei um ein Standardverfahren, welches von der Open Archives Initiative entwickelt wurde, um den Austausch von elektronischen Publikationen, die auf unterschiedlichen Servern im Internet verfügbar gemacht werden, zu vereinfachen. Dabei werden die zu veröffentlichenden Daten in einem oder mehreren, ebenfalls standardisierten, Formaten bereitgestellt und können von interessierten Akteuren über eine genormte Schnittstelle abgerufen werden. Und diese Schnittstelle galt es im Rahmen dieses Projektes ebenfalls zu schaffen. So gesehen hatte das Projekt zwei Herausforderungen: Zum einen die inhaltliche, den Datenbestand entsprechend den Anforderungen von kulturpool.at und Europeana anzureichern, zum anderen die technische, die für die Bereitstellung notwendige Schnittstelle zu schaffen. Das beide Herausforderungen fristgemäß und in hoher Qualität gemeistert werden konnten, lag vor allem an der sehr guten Zusammenarbeit zwischen den MitarbeiterInnen im Museum, dem Team von kulturpool.at und uns als Dienstleister. Offene Fragen konnten immer schnell und kompetent besprochen und beantwortet werden, was verhindert hat, dass das Projekt an Schwung verliert. ==== Vorbereitung der Daten ==== to be written... ==== Erzeugen der Exportdaten und Bereitstellung ==== Wie bereits in der Einleitung kurz beschrieben werden die Daten von kulturpool.at über das OAI-PMH-Protokoll abgerufen. Dafür müssen zwei Datenformate bereitgestellt werden: Zum einen //Dublic Core//, welches als Mindestanforderung vom OAI-PMH-Protokoll vorausgesetzt wird. Zum anderen verwendet kulturpool.at das Datenformat //EDM//, welches von Europeana als Standardmodell für den Datenaustausch mit Sammlungen, Bibliotheken und Archiven entwickelt hat. Im folgenden werden diese Technologien und Standards kurz erklärt und gezeigt, wie wir sie im Rahmen dieses Projektes umgesetzt haben. == EDM - das Europeana Data Model == Für Europeana stellt sich im Rahmen seiner Aufgabe der Sammlung von Daten des europäischen Kulturerbes die große Herausforderung, einen automatisierten Datentransfer mit Datenanbietern aus ganz unterschiedlichen Bereichen durchführen zu müssen. Bibliotheken, Museen, Archive oder Bestände audiovisueller Medien verwenden jeweils unterschiedliche Metadatenstandards wie LIDO, EAD oder METS, die bei Europeana in einen gemeinsamen Datenbestand zusammenfließen sollen. Der semantische Ansatz im Europeana Data Model (EDM) bedeutet dabei in der Praxis, dass die Daten nicht nur als einfache Texte oder Metadaten gespeichert werden, sondern in einem verknüpften, bedeutungsvollen Kontext stehen. Konkret heißt das: * **Verknüpfung von Informationen durch Linked Data**: Anstatt isolierte Datensätze zu haben, nutzt EDM das Linked Open Data-Prinzip. Objekte, Personen, Orte, Zeiträume und Themen werden nicht nur als Text gespeichert, sondern als eindeutige Identifikatoren (URIs) miteinander verknüpft.\\ //**Beispiel**: Ein Gemälde wird nicht nur mit dem Künstlernamen gespeichert, sondern direkt mit einer Referenz zu einer Autoritätsdatenbank wie Wikidata oder der GND (Gemeinsame Normdatei).// * **Standardisierte Ontologien und Konzepte**: EDM verwendet etablierte ontologische Konzepte und kontrollierte Vokabulare (z. B. SKOS für Thesauri oder CIDOC CRM für Museumsdaten). Dadurch wird sichergestellt, dass Begriffe einheitlich verwendet und automatisch verarbeitet werden können.\\ //**Beispiel**: Der Begriff „Maler“ kann mit einem Standard-Vokabular verknüpft sein, sodass „Painter“ (Englisch) oder „Peintre“ (Französisch) als dieselbe Bedeutung erkannt werden.// * **Interoperabilität zwischen verschiedenen Metadatenstandards**: EDM ermöglicht eine gemeinsame Struktur für verschiedene Metadatenmodelle (z. B. LIDO, EAD, METS), damit unterschiedliche Kulturerbedaten miteinander kombiniert werden können.\\ //**Beispiel**: Ein digitalisiertes Manuskript aus einem Archiv (EAD) kann mit einem zugehörigen Gemälde aus einem Museum (LIDO) verknüpft werden, weil beide auf dieselbe historische Persönlichkeit verweisen.// * **Automatische Anreicherung und bessere Suche**: Durch den semantischen Ansatz können Informationen aus verschiedenen Quellen automatisch angereichert werden. Dies verbessert auch die Suchmöglichkeiten, weil verwandte Begriffe, Synonyme oder Konzepte automatisch erkannt werden können.\\ //**Beispiel**: Eine mittelalterliche Handschrift aus einer Bibliothek könnte durch eine Verknüpfung mit einer historischen Karte ergänzt werden, auf der der Entstehungsort eingezeichnet ist.// * **Bessere Darstellung komplexer Daten**: Da die Datenstruktur nicht nur einfache Tabellen oder flache Metadaten sind, kann EDM reichhaltigere Darstellungen ermöglichen.\\ //**Beispiel**: Ein digitales Objekt kann mehrere Ansichten oder Interpretationen enthalten, etwa unterschiedliche Beschreibungen aus verschiedenen Ländern oder Institutionen.// Das kulturpool.at sich hier an den Erkenntnissen von Europeana hinsichtlich der Schwierigkeiten beim Metadata-Harvesting in diesem Maßstab und in dieser Vielfalt orientiert und direkt auf EDM als Datenformat für die Bereitstellung der Daten setzt, ist auch für uns als Dienstleister sehr hilfreich. Es erspart den für den Zweck des Metadaten-Harvestings inhaltlich unnötigen, aber technisch aufwändigen Schritt der Konvertierung der Daten in ein museumsspezifisches Format wie LIDO - nur um die Daten dann in der nächsten Ebene direkt in EDM umzuwandeln. EDM ist darüber hinaus sehr gut dokumentiert und in der Struktur nur genau so komplex wie für den Anwendungsfall notwendig. Vor allem aber bietet Europeana Werkzeuge, mit deren Hilfe man eigene EDM-Exporte auf technische und inhaltliche Validität direkt und unkompliziert überprüfen kann. Allein der letzte Punkt hat für uns die Arbeit am Projekt sehr erleichtert, da wir deutlich weniger Kommunikationsaufwand zur Abklärung anfallender Fragen hatten. Letztlich konnten wir den EDM-Export so weit in Eigenregie fertigstellen, dass er bis auf sehr wenige nachträgliche Anpassungen direkt von kulturpool.at für die Weiterverarbeitung verwendet werden konnte. == OAI-PMH - das Open Archives Initiative Protocol for Metadata Harvesting == Es gibt zahlreiche Möglichkeiten, Daten für die Allgemeinheit zur Verfügung zu stellen. Wenn man den Zugang für alle Beteiligten unkompliziert und niedrigschwellig gestalten möchte, bietet es sich an, auf Standardlösungen zu setzen. Eine dieser Standards ist das OAI-PMH-Protokoll. Es handelt sich dabei um eine Schnittstellendefinition, die explizit für die Bereitstellung von standardisierten Daten zum Zwecke des Harvestings - also der "Datenernte" - entwickelt wurde. Die Schnittstelle erlaubt unter anderem auch, explizit Daten abzurufen, die seit einem bestimmten Zeitpunkt geändert wurden, was für eine inkrementelle und damit zeit- und ressourcenschonende Verarbeitung wichtig ist. Für uns als Dienstleister stellte sich die Frage, wie wir dem Museum unkompliziert einen OAI-PMH-Service zur Verfügung stellen können. Dazu eigene Infrastruktur aufzubauen ist für Museen oft eine Herausforderung, weil auch personell eine entsprechend notwendige Betreuung der Technik nicht immer gewährleistet werden kann. Daher haben den OAI-PMH-Service als Baustein in die von uns entwickelte BeeCollect Cloud integriert. Die BeeCollect Cloud stellt für Museen die Möglichkeit zur Verfügung, Daten sicher und verschlüsselt untereinander auszutauschen. Der OAI-PMH-Service kann hier als zusätzliche Option aktiviert werden und stellt entsprechend markierte Daten dann öffentlich zur Verfügung. Die Auswahl der zu veröffentlichenden Objekte sowie die Generierung der notwendigen DublinCore- und EDM-Dokumente inkl. des Exports in die BeeCollect Cloud wird komplett aus BeeCollect Professional heraus gesteuert. Es existiert also mit BeeCollect Professional ein zentrales System, in dem nicht nur die Erstellung der Objektdokumentation erfolgt, sondern in dem direkt auch gesteuert wird und nachvollziehbar ist, wo die daraus entstehenden Daten extern verwendet werden können. == Technische Infrastruktur == Das folgende Schaubild zeigt die gesamte technische Infrastruktur, die für den Veröffentlichungsprozess bei kulturpool.at und Europeana zum Einsatz kommt. **hier das Schaubild einfügen** Zu sehen sind hier auch das von Europeana zur Verfügung gestellte Testsystem, mit dem vor dem eigentlichen Export eine Vorschau auf die zu veröffentlichenden Daten generiert werden kann. Außerdem zu erkennen ist, dass Europeana selbst die Daten von seinen Aggregatoren - also z.B. der DDB oder kulturpool.at - ebenfalls per OAI-PMH einsammelt. Damit ist im Falle von kulturpool.at hinsichtlich des Datenformats und der Schnittstelle eine durchgängige Konsistenz gegeben, die vom Museum als Datenerzeuger bis zu Europeana als letztlichem Datenempfänger reicht. Es gibt keinerlei Medienbrüche und Konvertierungen, die zu Mehraufwand und Verfälschung der Daten durch notwendige manuelle Eingriffe führen können. Dass dies ein klarer Vorteil ist, zeigt sich vor allem auch in der Geschwindigkeit, in der dieses Projekt zum Abschluss gebracht werden konnte. ==== Fazit aus Sicht des Dienstleisters ==== {{:icon-modules-128.png?nolink |}}