AG Kommunikationstheorie
Thema:
Automatische Verfahren zur Korrektur und Normalisierung von Social Media TextenAbstract:
Beim Part-of-Speech/(POS)-Tagging werden nur bekannte Wörter zu einer hohen Wahrscheinlichkeit richtig getaggt. Nicht korrekt geschriebene Wörter sind dem Tagger unbekannt. Die Folge ist, dass auf Social Media Texten, wie z.B. Blogkommentare, geringe POS Tagging Genauigkeiten erreicht werden. Um ein besseres POS-Tagging zu erzielen, soll eine automatische Rechtschreibkorrektur benutzt werden, damit mehr bekannte Wörter richtig getaggt werden.
In meinem Vortrag erläutere ich die Entwicklung eigener Korrekturen und die Verwendung des Korrekturprogramms "Jazzy" zur automatischen Korrektur. Abschließend werte ich die verschiedene Korrekturen aus und untersuche die Auswirkung auf das POS-Tagging.