Logo: Deutsches Institut für Internationale Pädagogische Forschung

Publikationen

The Impact of Topic Bias on Quality Flaw Prediction in Wikipedia

Eine Qualitätsanalyse nutzergenerierter Texte am Beispiel von Wikipedia

Die stetig wachsende Zahl nutzergenerierter Texte im Netz verlangt nach zuverlässigen Methoden zur automatischen Qualitätsanalyse. Am Beispiel von Wikipedia wurden Methoden entwickelt, um einzelne Artikel automatisch auf Qualitätsprobleme zu untersuchen. In dieser Arbeit argumentieren die Forscherinnen und Forscher, dass bisherige Systeme vielmehr thematische Eigenheiten fehlerbehafteter Texte erlernen, als die textuellen Kriterien selbst zu identifizieren, welche die Probleme ausmachen. Es ist daher wichtig, die Trainingsdaten für ein statistisches Analysesystem derart zu wählen, dass ein Themenbias möglichst vermieden wird. Dies steigert zwar die Schwierigkeit, spiegelt jedoch die tatsächliche Erkennungsrate von Qualitätsproblemen realistischer wieder.

Ferschke, O. & Gurevych, I., Rittberger, M. (2013) The Impact of Topic Bias on Quality Flaw Prediction in Wikipedia. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (ACL 2013), p. (to appear)

zuletzt verändert: 23.09.2013