- search hit 1 of 1
Topic Modellierung zur Analyse von Produktfeedback-Dokumenten
- Automatisierte Analyse von Review-Daten beschäftigt sich mit den Möglichkeiten, freien Text zu analysieren und relevante Informationen daraus zu extrahieren. Die Arbeit setzt sich dabei mit Methoden des unüberwachten Lernens auseinander. Hierbei steht die Methode der Topic Modellierung im Mittelpunkt. Es werden Verfahren betrachtet, die im Bereich der textbasierten Informationsgewinnung bekannt sind. Latent Semantic Indexing LSI, (probabilistic) pLSI und Latent Dirichlet Allocation (LDA) werden erläutert und verglichen. Die Arbeit zeigt, wie LDA genutzt wurde, um einen nhaltlichen Überblick über einen Datenkorpus von 1 Mio. Reviews zu bekommen und diesen auf einen feineren Detailgrad zu betrachten. Die Topic-basierte Analyse wird genutzt, um Erkentnisse für ein Opinion Mining System zu generieren, welches eine tiefergehende Analyse vornehmen wird. Der gesamte Prozess ist als vollständig automatisiert und maschinell unüberwacht konzeptioniert.
Author of HS Reutlingen | Müller-von Fischer, Armin |
---|---|
ISBN: | 978-3-00-057955-4 |
Erschienen in: | Wissenschaftliche Vertiefungskonferenz HuC - Design the Future : Informatik-Konferenz an der Hochschule Reutlingen, 22. November 2017 |
Publisher: | Hochschule Reutlingen |
Place of publication: | Reutlingen |
Editor: | Uwe KloosORCiD |
Document Type: | Conference proceeding |
Language: | German |
Publication year: | 2017 |
Tag: | Information Retrieval (IR); Natural Language Processing (NLP); Topic Modellierung |
Page Number: | 12 |
First Page: | 57 |
Last Page: | 68 |
PPN: | Im Katalog der Hochschule Reutlingen ansehen |
DDC classes: | 004 Informatik |
Open access?: | Nein |