Logo: Deutsches Institut für Internationale Pädagogische Forschung

Publikationen

Bringing order to digital libraries: from keyphrase extraction to index term assignment

Schnelleres Finden von Schlagworten in Dokumenten durch Extraktion und Klassifikation: Vorstellung eines neuen Systems.

Dokumentensammlungen zu einem Thema sind wertvolle Ressourcen, jedoch ist das Suchen bei vielen Dokumenten schwierig. Schlagworte zu Dokumenten erleichtern die Suche, ihre Erstellung bedeutet allerdings einen hohen manuellen Aufwand. Ein neues System bietet Hilfe. Die Autorinnen und Autoren stellen einen hybriden Ansatz vor, der Schlagworte automatisch durch Extraktion von wichtigen Begriffen und durch Klassifikation findet. Damit werden auch selten verwendete Schlagworte abgedeckt und die häufig verwendeten Schlagworte werden mit sehr hoher Genauigkeit identifiziert. Der hybride Ansatz wurde mit deutschen Bildungsdokumenten evaluiert und zeigt Verbesserungen gegenüber bisherigen Ansätzen.

Erbs, N., Gurevych, I. & Rittberger, M. (2013). D-lib magazine, 19 (9). Doi: 10.1045/september2013-erbs.

zuletzt verändert: 19.05.2014