Bachelorarbeit
Kuration semantischer Konzepte zur Beschreibung von Forschungsdaten im Problemumfeld
Hybrid Societies
Completion
2022/08
Research Area
Intelligent Information Management
Students
Advisers
Description (German)
Die Publikation von Forschungsdatensätzen entsprechend der FAIR Principles gehört zu den Grundsätzen guter wissenschaftlicher Praxis. Damit diese von anderen Wissenschaftlern gefunden und weiterverwendet werden können, ist in der Regel eine zusätzliche Meta-Beschreibung dieser Forschungsdatensätze notwendig. Hierfür haben sich bereits verschiedene Beschreibungsformate etabliert, allerdings sind darin enthaltene Angaben häufig entweder natürlichsprachig, oberflächlich oder mehrdeutig. Semantische Methoden basierend auf Linked Data sind eine Möglichkeit, um diese Situation zu verbessern, allerdings sind die dabei benutzten Objektwerte häufig weiterhin literaler Natur. Entweder, weil es für ein auszudrückendes Konzept keinen passenden Identifikator gibt, dieser nur domänenspezifisch dezentral bekannt oder die Suche nach diesem zu aufwändig ist. Dies macht die Filterung nach Forschungsdaten mit spezifischem Inhalt schwierig.
Die Idee des nachfolgenden Projekts ist es, existierende Terminologien
zusammenzutragen und in einem Taxonomiedienst bereitzustellen, sodass darüber
geeignete Identifikatoren für Konzepte zur interdisziplinären
Beschreibung von Forschungsdatensätzen programmatisch oder manuell abgerufen
werden können.
Von besonderer Relevanz sind dabei unterscheidbare
Entitäten aus dem Forschungsumfeld der Mensch-Computer-Interaktion. In diesem
fallen Forschungsdaten aus Experimenten mit menschlichen Teilnehmern an, die mit tragbaren
oder eigenständigen technisch kontrollierten Geräten in realer oder
virtueller Umgebung interagieren.
Beschreibbare Aspekte umfassen dabei unter
Anderem das Untersuchungsobjekt, den Forschungsschwerpunkt, verwendete Geräte
oder Software, angewandte Forschungs-, Datenerhebungs- und Evaluationsmethoden sowie
weitere Parameter wie Dateiformate, Materialien, demographische Characteristiken oder
datensatzbezogene Eigenschaften.
Nach Darstellung eines motivierenden Szenarios ist dafür zunächst eine Anforderungsanalyse durchzuführen und zu ermitteln, welche existierenden Ansätze im aktuellen Stand der Technik diesbezüglich bereits nutzbar sind. Anschließend ist ein Konzept zu erarbeiten, welche Terminologien für das beschrieben Szenario relevant sind, wie diese in ein importfähiges Format überführt werden können, und wie diese zueinander in Beziehung gesetzt werden. Die identifizierten Terminologien sind praktisch zu importieren. Hierfür können ein bereits existierender Taxonomiedienst soweit weitere existierende Konvertierungstools Verwendung finden und bei Bedarf beliebig angepasst werden. In einer abschließenden Evaluation ist das erreichte Ergebnis hinsichtlich der gestellten Anforderungen zu bewerten.