-
-
Autor*innen: Goldhahn, Dirk; Remus, Steffen; Quasthoff, Uwe; Biemann, Chris
Titel: Top-level domain crawling for producing comprehensive monolingual corpora from the web
Aus: Kupietz, Marc;Biber, Hanno;Lüngen, Harald;Banski, Piotr;Breiteneder, Evelyn;Mörth, Karlheinz;Witt, Andreas;Takhsha, Jani (Hrsg.): Proceedings of the LREC-14 Workshop on Challenges in the management of Large Corpora (CMLC-2), Reykjavik: European Language Resources Association, 2014 , S. 10-14
URL: http://www.lrec-conf.org/proceedings/lrec2014/workshops/LREC2014Workshop-CMLC2%20Proceedings-rev2.pdf
Dokumenttyp: 4. Beiträge in Sammelwerken; Tagungsband/Konferenzbeitrag/Proceedings
Sprache: Englisch
Schlagwörter: Computerlinguistik; Internet; Sprache; Text; Tool; Wortschatz
Abstract: This paper describes crawling and corpus processing in a distributed framework. We present new tools that build upon existing tools like Heritrix and Hadoop. Further, we propose a general workflow for harvesting, cleaning and processing web data from entire top-level domains in order to produce high-quality monolingual corpora using the least amount of language-specific data. We demonstrate the utility of the infrastructure by producing corpora for two under-resourced languages. Web corpus production for targeted languages and/or domains thus becomes feasible for anyone. (DIPF/Orig.)
DIPF-Abteilung: Informationszentrum Bildung
-
-
Autor*innen: Muhie Yimam, Seid; Eckart de Castilho, Richard; Gurevych, Iryna; Biemann, Chris
Titel: Automatic annotation suggestions and custom annotation layers in WebAnno
Aus: Bontcheva, Kalina; Jingbo, Zhu (Hrsg.): Proceedings of COLING 2014: System demonstrations, Stroudsburg; PA: Association for Computational Linguistics, 2014 , S. 91-96
URL: http://www.aclweb.org/anthology/P/P14/P14-5016.pdf
Dokumenttyp: 4. Beiträge in Sammelwerken; Tagungsband/Konferenzbeitrag/Proceedings
Sprache: Englisch
Schlagwörter: Automatisierung; Computerlinguistik; Computerprogramm; Fallstudie; Indexierung; Inhaltserschließung; Text; Textanalyse; Tool
Abstract: In this paper, we present a flexible approach to the efficient and exhaustive manual annotation of text documents. For this purpose, we extend WebAnno (Yimam et al., 2013) an open-source web-based annotation tool. While it was previously limited to specific annotation layers, our extension allows adding and configuring an arbitrary number of layers through a web-based UI. These layers can be annotated separately or simultaneously, and support most types of linguistic annotations such as spans, semantic classes, dependency relations, lexical chains, and morphology. Further, we tightly integrate a generic machine learning component for automatic annotation suggestions of span annotations. In two case studies, we show that automatic annotation suggestions, combined with our split-pane UI concept, significantly reduces annotation time. (DIPF/Orig.)
DIPF-Abteilung: Informationszentrum Bildung
-
-
Autor*innen: Heinen, Richard; Blees, Ingo
Titel: Social Bookmarking als Werkzeug für die Kooperation von Lehrkräften. Das Projekt edutags für den Deutschen Bildungsserver
Aus: Griesbaum, Joachim;Mandl, Thomas;Womser-Hacker, Christa (Hrsg.): Information und Wissen: global, sozial und frei?: Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011) Hildesheim, 9. bis 11. März 2011, Boizenburg: Hülsbusch, 2011 (Schriften zur Informationswissenschaft, 58), S. 111-122
Dokumenttyp: 4. Beiträge in Sammelwerken; Tagungsband/Konferenzbeitrag/Proceedings
Sprache: Deutsch
Schlagwörter: Benutzerfreundlichkeit; Bildungsserver; Deutschland; Entwicklung; Förderung; Internet; Kooperation; Lehrer; Mediennutzung; Projekt; Soziale Software; Tools; Unterrichtsplanung; World wide web 2.0
Abstract: Im Artikel werden zunächst Forschungsergebnisse zur Kooperation von Lehrkräften dargestellt. Daran schließen sich Überlegungen an, welche webbasierten Dienste eine Kooperation unter Lehrkräften unterstützen könnten und ob solche Dienste bereits (erkennbar) genutzt werden. Abschließend werden die Konzeption eines Social-Bookmarking-Dienstes für Lehrkräfte erläutert und die ersten Entwicklungs- und Implementationsschritte dargestellt.
Abstract (english): The article begins with an outline of research on cooperation among teachers that is followed by reasoning about which web-based services could support such cooperation and whether these services are already in use by teachers. In the main part the design of a customized social bookmarking service for teachers is explicated and the first steps of its development and implementation are shown.
DIPF-Abteilung: Informationszentrum Bildung
-
-
Autor*innen: Upsing, Britta; Rölke, Heiko; Andrea, Ferrari; Steve, Dept
Titel: Case study: XLIFF in a large-scale international OECD-study
Aus: Anastasiou, Dimitria; Vázquez, Lucia Morado (Hrsg.): First International XLIFF Symposium, Limerick: Univ., 2010 , S. 17-19
Dokumenttyp: 4. Beiträge in Sammelwerken; Tagungsband/Konferenzbeitrag/Proceedings
Sprache: Englisch
Schlagwörter: Computer; Datenaustausch; Datenverarbeitung; Deutschland; Erwachsener; Fallstudie; Internationaler Vergleich; Kompetenz; Software; Test; Tools; Übersetzung
Abstract: Das Programme for the International Assessment of Adult Competencies (PIAAC) ist eine von der OECD (Organization for Economic Co-operation and Development) in Auftrag gegebene und von den teilnehmenden Ländern finanzierte Studie. In der Studie werden Daten von Erwachsenen im Alter von 16 bis 65 Jahren erhoben. Neben einem umfangreichen Hintergrundfragebogen umfasst die Studie kognitive Tests in den Gebieten Lesefähigkeit, Zahlenverständnis und Problemlösen im Umgang mit dem Computer.
XLIFF wurde für den gesamten Prozess der Übersetzung, Anpassung und Verifikation der Testmaterialien im Einsatz. Um die Vergleichbarkeit der Tests international sicherzustellen, wurde auf eine strikte Trennung von Text und Layout geachtet. Für die Übersetzung wurde das Open Language Tool (OLT) eingesetzt. Der Gesamtprozess wurde über eine Portal online gesteuert, dass auch eine Vorschau von übersetzten Tests anbot. Insgesamt wurden Tausende unterschiedliche Dateien und Zehntausende Zwischenversionen verwaltet.
Unser Prozess zeigte Vor- und Nachteile des Einsatzes von XLIFF auf. Ein Flaschenhals war beispielsweise der zentrale Server mit dem Portal in Zeiten hohen Benutzungsaufkommens. Fehler in XLIFF-Dokumenten konnten bisweilen erst spät festgestellt werden, so dass mehrere Schritte wiederholt werden mussten. Die Installation des OLT war teilweise schwierig.
Im Positiven kann man festhalten, dass sich die strikte Trennung von Text und Layout extrem bewährt hat gerade auch im Vergleich zum Ablauf bei den (zeitgleich durchgeführten) Übersetzung der papierbasierten Tests, bei denen diese Trennung nicht gegeben war.
Abstract (english): The Programme for the International Assessment of Adult Competencies (PIAAC) is a study organised by the Organization for Economic Co-operation and Development (OECD) and funded by the participating countries. It assesses skills of adults in 27 countries (35 national versions totalling 24 languages). This is done by administering tests to people aged 16 to 65. The tests are delivered on computer or on paper, depending on the participant s familiarity with information technology. The survey measures literacy and numeracy skills in the participants and collects their background data. In addition, the computer-based version measures how well the participants can solve problems in technology-rich environments, e.g. problems that involve finding information on a web-page.
XLIFF was used for the entire translation, adaptation and verification process of the computer-based test material. The rationale for this was to completely separate the text from the layout. The translation of paper-based files was done in word documents. The Open Language Tool (OLT) was used to translate, edit and verify computer-based test materials and background questionnaires. Every upload of a translated XLIFF file made it possible to preview the translated item online. All in all, several thousand different XLIFF files with tens of thousands of distinct versions have been processed so far in the PIAAC study.
The translation and adaptation process showed strengths and weaknesses of our workflow as well as of the XLIFF approach.
As examples of the drawbacks: the central generation of previews was slow in times of heavy usage of the translation portal; there was a relatively high occurrence of crashes in using the OLT translation editor; corrupt XLIFF files were sometimes detected relatively late in the process, so that a set of motions had to be repeated; maintenance of TMs posed a variety of unexpected challenges; inline formatting that involves tag edition seemed difficult to handle for translators who were not sufficiently familiar with the tool; and the installation and use varied across operating systems.
On the positive side: the strict separation of layout and text content was extremely useful in comparison to the translation of MS Word-files mentioned above, where some translators introduced errors and layout changes; the spellchecking options worked well for those languages for which dictionaries were available; different scripts and alphabets were processed smoothly; propagation of 100% matches across XLIFF files worked in a satisfactory way; and, in general, the format was deemed suitable for a mix of players with advanced knowledge of CAT tools and others with virtually no experience with this type of interface.
DIPF-Abteilung: Informationszentrum Bildung
-
-
Herausgeber*innen: Abs, Hermann Josef
Titel: Introducing quality assurance of education for democratic citizenship in schools. Comparative study of 10 countries
Erscheinungsvermerk: Strasbourg: Council of Europe, 2009
Dokumenttyp: 2. Herausgeberschaft; Sammelband (keine besondere Kategorie)
Sprache: Englisch
Schlagwörter: Schule; Politische Bildung; Demokratische Erziehung; Staatsbürgerliche Erziehung; Erziehungsziel; Demokratie; Menschenrechte; Qualitätssicherung; Schulsystem; Evaluation; Selbsteinschätzung; Schulentwicklung; Praxisbericht; Internationaler Vergleich; Fallstudie; Tools; Methodologie; Konzeption; Europa; Deutschland; Tschechische Republik; Estland; Lettland; Litauen; Polen; Russische Föderation; Ukraine; Belarus; Israel
Abstract: Die Studie vergleicht die schulischen Qualitätssicherungssysteme in zehn Saaten (Deutschland, Estland, Israel, Lettland, Litauen, Polen, Russland, Tschechien, Ukraine und Weißrussland). Dabei wird ein Schwerpunkt auf den Bereich der Politischen Bildung in Unterricht und Schulkultur gelegt. Die Länderstudien verfolgen weiterhin das Ziel, die Bedingungen für eine Nutzung des "Tool for quality assurance in education for democratic citizenship in schools" zu analysieren. Diese Handreichung wurde im Jahr 2005 von Europarat und UNESCO veröffentlicht um den Mitgliedsländern ein gemeinsames Referenzmaterial in der Entwicklung eigener Praktiken zur Verfügung zu stellen.(DIPF/Autor)
Abstract (english): This publication presents an overview, from international perspectives, of the applicability and relevance of the Tool for Quality Assurance of Education for Democratic Citizenship in Schools, published jointly by UNESCO, the Council of Europe and the Centre for Educational Policies. Based on 10 country reports, it examines quality assurance requirements in the field of education for democratic citizenship (EDC) and compares the specific evaluation systems in those countries. lt also provides a feasibitity study on relevant conditions for implementing the Tool and aims to serve as a set of orientation guidelines for policy makers, a case study on implentation tor researchers and a source book for education practitioners.(DIPF/Orig.)
DIPF-Abteilung: Bildungsqualität und Evaluation