Jump to main content Hotkeys
Distributed and Self-organizing Systems
Distributed and Self-organizing Systems

Masterarbeit

Entwurf und Realisierung eines Terminologie-Services zur semantischen,
          interdisziplinären Beschreibung von Forschungsdatensätzen
Entwurf und Realisierung eines Terminologie-Services zur semantischen, interdisziplinären Beschreibung von Forschungsdatensätzen

Completion

2020/09

Research Area

Intelligent Information Management

Students

Matthias Tietz

Matthias Tietz

student

Advisers

andrelanger

gaedke

Description (German)

Die Publikation von Forschungsdatensätzen entsprechend der FAIR Principles gehört zu den Grundsätzen guter wissenschaftlicher Praxis. Damit diese von anderen Wissenschaftlern gefunden und weiterverwendet werden können, ist in der Regel eine zusätzliche Meta-Beschreibung dieser Forschungsdatensätze notwendig. Hierfür haben sich bereits verschiedene Beschreibungsformate etabliert, allerdings sind darin enthaltene Angaben häufig entweder natürlichsprachig, oberflächlich oder mehrdeutig. Dadurch sind gezielte Suchoperationen nach Datensätzen mit gewissen Charakteristiken schwierig und der disziplinübergreifende Austausch von Forschungsdaten wird behindert. Semantische Methoden basierend auf Linked Data sind eine Möglichkeit, um diese Situation zu verbessern. Aktuell existieren hierfür bereits eine Vielzahl an Vokabularen zur Beschreibung von Datensätzen, doch sind die angegebenen Objektwerte häufig weiterhin literaler Natur. Entweder, weil es für ein auszudrückendes Konzept keinen passenden Identifikator gibt, dieser nur domänenspezifisch dezentral bekannt oder die Suche nach diesem zu aufwändig ist.

Die Idee des nachfolgenden Projekts ist es, einen Webdienst zu schaffen, über welchen geeignete Identifikatoren für Konzepte zur Beschreibung von Forschungsdatensätzen programmatisch oder manuell abgerufen werden können. Der bereitgestellte Wortschatz sei dabei spezifisch für die Beschreibung von Forschungsdaten und gehe über allgemeine Dienste wie DBpedia, Wikidata oder ConceptNet hinaus und soll erweiterbar sein durch Dritte für zukünftige Ergänzungen oder fachspezifische Terminologien. Nach Darstellung eines motivierenden Szenarios ist zunächst eine Anforderungsanalyse durchzuführen und zu ermitteln, inwieweit existierende Entwicklungen im aktuellen Stand der Technik diese Anforderungen bereits erfüllen. Anschließend ist ein Konzept zu erarbeiten, welche Daten solch ein Terminologie-Dienst enthalten soll, wie diese intern organisiert werden sollen, und wie solch ein Service realisiert werden kann. Eine Implementation hat die Realisierbarkeit eines solchen Systems praktisch zu zeigen und in einer Evaluation zu bewerten.


Powered by DGS
Edit list (authentication required)

Press Articles