Jump to main content Hotkeys
Distributed and Self-organizing Systems
Distributed and Self-organizing Systems

Studienarbeit / Teamorientierte Projektarbeit / Masterarbeit / Praktikum / Bachelorarbeit

A data science approach to assess the trend of academic literature
A data science approach to assess the trend of academic literature

Completion

2021/05

Research Area

Web Engineering

Advisers

mahdanoura

gaedke

Description

Research and development (R&D) efforts are considered as one of the crucial activities of the future of a country which can result in tremendous outcome in terms of the country's overal economy. Scientific publications are considered as one the main outputs of research investements. In order to identify the research trends in a certain topic, generally systematic literature reviews (SLR) are performed on the scientific publications. SLR's are normally performed manually by several researchers expert in the topic under study. However, analyzing the individual research publications manually is not only very expensive and difficult, it is also subjective. 

This thesis aims to systemantically and automatically analyze the trends in a certain computer science topic using data science approaches. One solution to automate the process of topic identification is to use machine learning algorithms on the publications. Algorithms such as unsupervised clustering and topic modeling can be used to organize the collection of research publications into a set of clusters. This involves in particular the state of the art of clustering, topic modeling as well as the demonstration of the solution by prototypical implementation and a suitable evaluation on the Internet of Things and the Web of Things research domain. 

------

If you are interested in this topic, please contact me via email (mahda.noura@informatik.tu-chemnitz.de) to discuss the topic in detail together.

Description (German)

Forschungs- und Entwicklungsbemühungen werden als eine der entscheidenden Aktivitäten der Zukunft eines Landes angesehen, die im Hinblick auf die Gesamtwirtschaft des Landes zu enormen Ergebnissen führen können. Wissenschaftliche Veröffentlichungen gelten als eines der wichtigsten Ergebnisse von Forschungsinvestitionen. Um die Forschungstrends in einem bestimmten Thema zu identifizieren, werden allgemein systematische Literaturrecherchen (SLR) zu den wissenschaftlichen Veröffentlichungen durchgeführt. Spiegelreflexkameras werden normalerweise manuell von mehreren Forschern durchgeführt, die Experten für das untersuchte Thema sind. Die manuelle Analyse der einzelnen Forschungspublikationen ist jedoch nicht nur sehr teuer und schwierig, sondern auch subjektiv.

Diese Arbeit zielt darauf ab, die Trends in einem bestimmten Informatik-Thema mithilfe datenwissenschaftlicher Ansätze systematisch und automatisch zu analysieren. Eine Lösung zur Automatisierung des Prozesses der Themenidentifizierung besteht in der Verwendung von Algorithmen für maschinelles Lernen in den Veröffentlichungen. Algorithmen wie unbeaufsichtigtes Clustering und Themenmodellierung können verwendet werden, um die Sammlung von Forschungspublikationen in einer Reihe von Clustern zu organisieren. Dies beinhaltet insbesondere den Stand der Technik des Clustering, der Themenmodellierung sowie die Demonstration der Lösung durch prototypische Implementierung und eine geeignete Bewertung im Internet der Dinge und im Bereich Web of Things.

------

Wenn Sie an diesem Thema interessiert sind, kontaktieren Sie mich bitte per E-Mail (mahda.noura@informatik.tu-chemnitz.de), um das Thema gemeinsam ausführlich zu besprechen.


Powered by DGS
Edit list (authentication required)

Press Articles