Daten

BAW-Datenrepository startet den Produktivbetrieb

BAW-Datenrepository Startseite
BAW-Datenrepository Startseite

Die Bundesanstalt für Wasserbau (BAW) hat sich dafür entschieden, die Prinzipien von Open Access zu unterstützen und der (Fach-)Öffentlichkeit ihre Textveröffentlichungen und wissenschaftlichen Daten offen zugänglich zu machen. Als Teil dieser Initiative werden seit 2017 die Textveröffentlichungen der BAW-Beschäftigten über das Hydraulic ENgineering RepositorY (Henry) angeboten. Um dieses Angebot jetzt auf die wissenschaftlichen Daten der BAW auszuweiten, wurde eine zweite Online-Plattform, das BAW-Datenrepository, online geschaltet.

Das primäre Ziel des BAW-Datenrepositorys ist es, offenen und uneingeschränkten Zugang zu den wissenschaftlichen Daten der BAW zu ermöglichen. Dadurch soll der breiten Öffentlichkeit ein Einblick in die Arbeit der BAW als verkehrswasserbauliche Gutachterin des Bundes gegeben werden. Darüber hinaus soll die Nachnutzung und Wertschöpfung der offen bereitgestellten Daten durch die Fachöffentlichkeit gefördert werden. Das wiederum soll dabei helfen, die Sichtbarkeit der Facharbeit der BAW zu erhöhen und die Rolle der einzelnen Beschäftigten in der Erstellung der veröffentlichten Daten anzuerkennen. Schließlich ist das BAW-Datenrepository für die BAW eine der Plattformen für die Erfüllung ihrer gesetzlichen Pflichten nach Open Data oder vergleichbaren Gesetzen wie EGovG.

Beim BAW-Datenrepository spielt die BAW nicht nur die Rolle der Datenkuratorin, sondern auch die der Herausgeberin. Die ganzen Veröffentlichungsprozesse werden innerhalb der BAW abgebildet und die veröffentlichten Daten zusammen mit ihren Metadaten werden auf der IT-Infrastruktur der BAW gehostet.

Eine hybride, multifunktionale Datenplattform

Das BAW-Datenrepository wurde mit der Open-Source-Software InGrid realisiert. Die veröffentlichten Datensätze werden mit Metadaten nach nationalen und internationalen Standards wie GDI-DE und INSPIRE beschrieben. Infolgedessen können externe Geoinformationsplattformen wie Geoportal.de und mCLOUD diese Metadaten harvesten und in ihren eigenen Portalen recherchierbar machen. Ihrerseits können diese Plattformen die geharvesteten Metadaten an weitere Plattformen wie das GovData-Portal und INSPIRE Geoportal weitergeben.

Die Metadaten der veröffentlichten Daten geben den Nutzenden des BAW-Datenrepositorys einen ersten Einblick in die Daten, bevor sie diese herunterladen und für ihre eigene Zwecke verwenden. Die Metadaten sind auch die Basis der Freitextsuche-Funktion, um geeignete Daten für die eigene Nutzung zu finden. Die metadatenbasierte Freitextsuche ist eine wesentliche Funktion in der Suche nach Daten, weil binäre Daten in unterschiedlichen Datenformaten sonst nicht so leicht zu recherchieren sind. Die Nutzung von InGrid als Software-Basis für das BAW-Datenrepository stimmt mit ähnlichen technologischen Entscheidungen für den Aufbau interner Datenmanagementsysteme in der BAW überein und vereinfacht den Prozess der Datenveröffentlichung.

Bibliografische Angaben zu einem Datensatz mit DOI
Bibliografische Angaben zu einem Datensatz mit DOI

Als Ressortforschungsinstitut spielen für die BAW zwei Erweiterungen der Standard-Funktionalitäten von InGrid eine wesentliche Rolle. Diese sind eine persistente, schreibgeschützte Datenablage und die Möglichkeit, den veröffentlichten Daten einen persistenten Identifikator in Form eines Digital Object Identifiers (DOI) zu vergeben. Andere Plattformen wie Zenodo bieten auch vergleichbare Funktionalitäten an. Die weitverbreitete Nutzung von DOIs in der wissenschaftlichen Gemeinschaft vereinfacht die Zitierbarkeit der veröffentlichten Daten, wenn sie diese in ihrer eigenen Arbeit nutzen. Das ist insbesondere für die Jung- und Nachwuchswissenschaftlerinnen und -wissenschaftler der BAW von Bedeutung, weil ihr Beitrag bei der Erstellung der veröffentlichten Daten dadurch anerkannt wird. Die Kombination von persistenten Identifikatoren und einer persistenten Ablage für den langfristigen, unveränderten Zugang zu den Daten gewährleistet darüber hinaus die Reproduzierbarkeit der veröffentlichten wissenschaftlichen Arbeiten, die im BAW-Datenrepository veröffentlichten Daten genutzt haben.

Ausblick

Die Zusammenlegung der Funktionen von Metadatenverwaltung und Datenkuration hat, wie oben schon genannt, viele Vorteile, bringt aber auch viele neue Herausforderungen mit sich. Eine solche Herausforderung ist die unzureichende Mehrsprachigkeit der veröffentlichten Metadaten. Dieses Problem ist bereits bekannt und in der InGrid-Community wird bereits an Lösungen gearbeitet, sodass hoffentlich in der nahen Zukunft zweisprachige Metadaten auf Deutsch und Englisch veröffentlicht werden können. Abhängig von den Browser-Einstellungen der Besuchenden sollen dann die Metadaten in der richtigen Sprache angezeigt werden.

Künftig wollen wir im BAW-Datenrepository auch den InGrid-Kartenklient aktivieren, sodass die veröffentlichten Geodienste mit einem einfachen Klick direkt im BAW-Datenrepository visualisiert werden können.