Grundlagen von Open Data

Open Data - kurz erklärt

Open Data („offene Daten“) steht für die Idee, Daten mit entsprechenden Lizenzen auszustatten und öffentlich frei verfügbar und für unterschiedlichste Ausgabekanäle nutzbar zu machen. Als Open Data werden Daten bezeichnet, die von jedermann zu jedem Zweck genutzt, weiterverbreitet und weiterverwendet werden können. Einschränkungen der Nutzung sind nur erlaubt, um Ursprung und Offenheit des Wissens zu sichern, etwa durch Nennung des Urhebers oder die Verwendung einer Share-alike-Klausel.

Nicht alle Daten können sofort mit dem höchstmöglichen Grad an Offenheit zugänglich gemacht werden, sodass ein schrittweises Vorgehen empfohlen wird. Im Fünf-Sterne-Modell von Tim Berners-Lee wird der Grad der Offenheit von Datensätzen klassifiziert.

5-Sterne-Modell als Stufengrafik - die Offenheit beginnt links unten mit dem PDF und einem Stern und reicht bis rechts oben zum LOD-Format (5 Sterne)

* Daten im Web (Format egal) mit offener Lizenz
** Daten in strukturiertem Format (z.B. Excel)
*** Daten in strukturiertem, nicht proprietärem Format (z.B. CSV statt Excel)
**** Verwendung von eindeutigen URLs, so dass Datensätze verlinkt werden können
***** Verlinkung der eigenen Daten mit anderen Daten, um Kontext herzustellen

Durch die freie Nutzung der Daten können neue Auswertungen und Analysen, Produkte und Dienstleistungen oder neue Geschäftsmodelle entstehen. Offene Daten bieten somit auch ein hohes Innovationspotenzial.

Strukturierte Daten – kurz erklärt

Daten, die den Kriterien von Open Data genügen sollen, müssen in einer einheitlichen Ordnung strukturiert und maschinenlesbar zur Verfügung gestellt werden, so dass sie sich filtern und durchsuchen lassen und von anderen Anwendungen weiterverarbeitet werden können. Die Ordnung und Auszeichnung der Daten ist die vielleicht wichtigste Basis von Open Data: nur so wird die spätere Auffindbarkeit gewährleistet.

Favorisiertes Mittel, um die Daten zu strukturieren und einheitlich zu beschreiben, ist der de-facto globale Standard Schema.org. Schema.org ist eine Ontologie, d.h. eine Sammlung von Begriffen, um bestimmte Dinge im Web sowie deren Beziehung zueinander zu beschreiben. Auf Websites wird Schema.org für den Nutzer unsichtbar in den Quelltext der Seite integriert. Durch das Einbetten wird der Inhalt maschinenlesbar und maschineninterpretierbar.

Vereinfachtes Beispiel: Strukturierte Daten nach Schema.org

Schema.org ist kein fertiges Produkt, sondern wird kontinuierlich erweitert. Bestimmte Eigenschaften, um bspw. Datensätze im Bereich MICE zu beschreiben, sind möglicherweise noch nicht in Schema.org abgebildet; die Erweiterung des Vokabulars erfolgt im Rahmen von Domains Specifications.

Klare Lizenzrechte zur freien Nutzung

Damit Daten „offen“ zur Verfügung gestellt und verwendet werden können, müssen die Rechte etwa für Bilder, Videos und Texte klar geregelt sein. Empfohlen wird die Auszeichnung nach den Standards von Creative Commons (CC). Creative Commons ist eine gemeinnützige Organisation, die Standard-Lizenzverträge in verschiedenen Stufen entwickelt hat, mit denen Urheber der Öffentlichkeit Nutzungsrechte an den Werken einräumen können.

Es gibt verschiedene Creative Commons-Lizenztypen, die unterschiedliche Nutzungsmöglichkeiten vorsehen. Favorisiert werden die Lizenzen CC0 („No Rights Reserved“), CC BY (Namensnennung) und CC BY-SA (Namensnennung, Share Alike), die eine freie Nutzung und Weiterverbreitung unter ihren jeweiligen Bedingungen ermöglichen. Neben der CC0-Lizenz lassen die CC BY und CC BY-SA-Kategorien die kommerzielle Nutzung zu und erfüllen somit die Anforderungen an den Begriff von Open Data.

Die CC0-Kennzeichnung von Creative Commons | © Creative Commons — Visual zur Kennzeichnung einer CC0-Lizenz unter Creative Commons

Kür: Verknüpfung der Daten im Knowledge Graph

Die Bereitstellung von Daten des MICE-Standorts Deutschland als offene Daten ist ein erster Schritt zu mehr Sichtbarkeit und Reichweite. Den besonderen Nutzen und Mehrwert entfalten die Daten jedoch erst, wenn sie miteinander verknüpft werden und in Beziehung zueinander gesetzt werden können.

Ein Knowledge Graph ist eine semantische Datenbank. Durch die Verknüpfung der Daten in einem Knowledge Graph entsteht ein Netzwerk aus Objekten (bspw. Personen, Orte, Organisationen, Events etc.) und den Beziehungen dieser Objekte untereinander. Daten einer Event Location bspw. können mit Infrastrukturdaten, Mobilitätsinformationen, Sehenswürdigkeiten am Standort etc. verknüpft werden.

Beispielhafte Darstellung des Knowledge Graph MICE

Knowledge Graphen eignen sich besonders gut für komplexe und verschachtelte Anfragen und Analysen. Durch die verzweigte Graphstruktur können Zusammenhänge gefunden werden, die sonst nur schwer darstellbar sind. Ein Knowledge Graph hat dabei kein festes Schema, sondern ist flexibel adaptierbar. Datensätze können nach Belieben im Graphen ergänzt werden, in dem sie mit einem bestehenden Datensatz in Beziehung gebracht werden. Einzelne Datenpunkte und ihre Beziehungen zueinander werden unabhängig vom Ausgabekanal gepflegt. Dadurch wird es möglich, dass sie in verschiedenen Kontexten, auf unterschiedliche Art und Weise und über verschiedene Kanäle hinweg ausgegeben werden können.

Zielgruppen des Open Data Knowledge Graphen

Der Open Data Knowledge Graph ist frei zugänglich für alle interessierten Akteure wie globale Vertriebsplattformen, touristische und MICE-Dienstleister oder Startup-Unternehmen, um aus den verknüpften Daten neue Services und Dienstleistungen zu generieren – und natürlich ergeben sich auch für Anbieter (Datengeber) durch die Nutzung der Daten neue Möglichkeiten der Angebotserstellung für Ihre Kund*innen.

Die Zielgruppen dieser neuen Services und Dienstleistungen sind im touristischen Bereich Endverbraucher*innen, also Touristen und Touristinnen im Zuge der Planung einer Urlaubsreise oder vor Ort in der Urlaubsdestination. Im MICE-Bereich werden dagegen Veranstaltungsplaner*innen angesprochen, sodass die Nutzung hier vorrangig B2B-orientiert ist.

Dementsprechend unterschiedlich sind die hinterlegten Datenmodelle im touristischen und im MICE-Bereich. Das Set-up des Knowledge Graphen mit einem eigenen MICE-Subgraphen und die verschiedenen Möglichkeiten der Dateneinspeisung in den Graphen trägt den unterschiedlichen Anforderungen und Nutzungen im touristischen und MICE-Bereich Rechnung.