TY - CHAP U1 - Konferenzveröffentlichung A1 - Müller-von Fischer, Armin ED - Kloos, Uwe T1 - Topic Modellierung zur Analyse von Produktfeedback-Dokumenten T2 - Wissenschaftliche Vertiefungskonferenz HuC - Design the Future : Informatik-Konferenz an der Hochschule Reutlingen, 22. November 2017 N2 - Automatisierte Analyse von Review-Daten beschäftigt sich mit den Möglichkeiten, freien Text zu analysieren und relevante Informationen daraus zu extrahieren. Die Arbeit setzt sich dabei mit Methoden des unüberwachten Lernens auseinander. Hierbei steht die Methode der Topic Modellierung im Mittelpunkt. Es werden Verfahren betrachtet, die im Bereich der textbasierten Informationsgewinnung bekannt sind. Latent Semantic Indexing LSI, (probabilistic) pLSI und Latent Dirichlet Allocation (LDA) werden erläutert und verglichen. Die Arbeit zeigt, wie LDA genutzt wurde, um einen nhaltlichen Überblick über einen Datenkorpus von 1 Mio. Reviews zu bekommen und diesen auf einen feineren Detailgrad zu betrachten. Die Topic-basierte Analyse wird genutzt, um Erkentnisse für ein Opinion Mining System zu generieren, welches eine tiefergehende Analyse vornehmen wird. Der gesamte Prozess ist als vollständig automatisiert und maschinell unüberwacht konzeptioniert. KW - Information Retrieval (IR) KW - Natural Language Processing (NLP) KW - Topic Modellierung Y1 - 2017 SN - 978-3-00-057955-4 SB - 978-3-00-057955-4 SP - 57 EP - 68 S1 - 12 PB - Hochschule Reutlingen CY - Reutlingen ER -