Logo: Deutsches Institut für Internationale Pädagogische Forschung

Forschung

Text-Mining und Informationssuche

Das Thema Text-Mining und Informationssuche befasst sich mit einer möglichst intuitiven, hochwertigen Recherchetechnik für Web und Informationsportale des Informationszentrums Bildung. Darüber hinaus soll die Erstellung von Inhalten durch Redakteure des Deutschen Bildungsservers mit intelligenten Werkzeugen unterstützt werden.

Die Wissenschaftlerinnen und Wissenschaftler beschäftigen sich im Bereich der Suche mit semantischen Methoden, die es dem Nutzer ermöglichen, mehr relevante Dokumente aufzufinden. Dabei kommt die groß angelegte und auf Bedeutungsebene verlinkte lexikalisch-semantische Ressource UBY für Deutsch und Englisch zum Einsatz.

Des Weiteren arbeiten sie an Methoden zur automatischen Beschreibung von Dokumenten und Beantwortung von Fragen (das sogenannte Question-Answering), u.a. mit Anwendung auf die Inhalte in sozialen Medien, wie Folksonomies, Frage-Antwort-Repositorien zu Bildungsfragen.

Eine wichtige Rolle in Web-basierten Szenarien kommt der automatisierten Bewertung der Qualität von Inhalten zu. Dafür erforschen die Wissenschaftler/-innen die textbasierten und pragmatischen Indikatoren der Qualität in Web-Inhalten sowie Verfahren zur automatischen Qualitätsbewertung von im Web gefundenen Dokumenten und deren durch Nutzer erstellten Metadaten.

Im Bereich der Inhaltserstellung ist qualitativ hochwertige redaktionelle Arbeit, wie sie am Deutschen Bildungsserver betrieben wird, mit hohem zeitlichem Aufwand für die Redakteur/-innen verbunden. Ziel ist die Erforschung von Methoden, um die heute noch weitgehend manuelle Arbeit zu unterstützen. Dazu gehört bspw. das Auffinden weiterer Links auf Basis der vorhandenen Links, die Vergabe von Index-Termen oder die maschinelle Erstellung von Zusammenfassungen bildungsrelevante Web-Seiten. Grundlage für diese Methoden bildet das maschinelle Lernen und linguistisch inspirierte Textmerkmale.

Eine hohe Qualität der gefundenen Ressourcen und der erstellten Inhalte wird sowohl durch die Entwicklung von Verfahren der automatischen Qualitätsanalyse sowie durch eine finale Qualitätsprüfung der Redakteurinnen und Redakteure des Deutschen Bildungsservers garantiert.

Projekte

Leitung

Marc Rittberger

Abteilungen

Informationszentrum Bildung
zuletzt verändert: 12.09.2014

Dieses Forschungsthema wird in Kooperation mit dem Fachbereich Informatik der TU Darmstadt bearbeitet.