Masterarbeit
Entwurf und Realisierung eines Terminologie-Services zur semantischen,
interdisziplinären Beschreibung von Forschungsdatensätzen
Completion
2020/09
Research Area
Intelligent Information Management
Students
Matthias Tietz
Advisers
Description (German)
Die Publikation von Forschungsdatensätzen entsprechend der FAIR Principles gehört zu den Grundsätzen guter wissenschaftlicher Praxis. Damit diese von anderen Wissenschaftlern gefunden und weiterverwendet werden können, ist in der Regel eine zusätzliche Meta-Beschreibung dieser Forschungsdatensätze notwendig. Hierfür haben sich bereits verschiedene Beschreibungsformate etabliert, allerdings sind darin enthaltene Angaben häufig entweder natürlichsprachig, oberflächlich oder mehrdeutig. Dadurch sind gezielte Suchoperationen nach Datensätzen mit gewissen Charakteristiken schwierig und der disziplinübergreifende Austausch von Forschungsdaten wird behindert. Semantische Methoden basierend auf Linked Data sind eine Möglichkeit, um diese Situation zu verbessern. Aktuell existieren hierfür bereits eine Vielzahl an Vokabularen zur Beschreibung von Datensätzen, doch sind die angegebenen Objektwerte häufig weiterhin literaler Natur. Entweder, weil es für ein auszudrückendes Konzept keinen passenden Identifikator gibt, dieser nur domänenspezifisch dezentral bekannt oder die Suche nach diesem zu aufwändig ist.
Die Idee des nachfolgenden Projekts ist es, einen Webdienst zu schaffen, über welchen geeignete Identifikatoren für Konzepte zur Beschreibung von Forschungsdatensätzen programmatisch oder manuell abgerufen werden können. Der bereitgestellte Wortschatz sei dabei spezifisch für die Beschreibung von Forschungsdaten und gehe über allgemeine Dienste wie DBpedia, Wikidata oder ConceptNet hinaus und soll erweiterbar sein durch Dritte für zukünftige Ergänzungen oder fachspezifische Terminologien. Nach Darstellung eines motivierenden Szenarios ist zunächst eine Anforderungsanalyse durchzuführen und zu ermitteln, inwieweit existierende Entwicklungen im aktuellen Stand der Technik diese Anforderungen bereits erfüllen. Anschließend ist ein Konzept zu erarbeiten, welche Daten solch ein Terminologie-Dienst enthalten soll, wie diese intern organisiert werden sollen, und wie solch ein Service realisiert werden kann. Eine Implementation hat die Realisierbarkeit eines solchen Systems praktisch zu zeigen und in einer Evaluation zu bewerten.