CiteX 2026: Workshop "Citation Extraction and Parsing"

Workshop zu offenen Zitationsdaten
@Anton Gvozdikov – stock.adobe.com

Für die interdisziplinäre Veranstaltung zum Thema Zitationsdaten können noch bis zum 15. Januar Abstracts eingereicht werden.

Wann

28.05.2026 bis 29.05.2026 (Europe/Berlin / UTC200)

Wo

DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Rostocker Straße 6, 60323 Frankfurt am Main

Termin zum Kalender hinzufügen

iCal

Offene und präzise Zitationsdaten sind eine zentrale Grundlage für transparente, reproduzierbare und vernetzte Forschung. Der Workshop "Citation Extraction and Parsing" (CiteX 2026) bietet ein interdisziplinäres Forum für Forschende, Entwickler*innen und Praktiker*innen, um aktuelle Fortschritte in der automatisierten Erkennung, Strukturierung und Bereitstellung bibliografischer Referenzen zu diskutieren.

Aufbauend auf Initiativen wie WikiCite WOOC und der Frankfurter Workshop-Reihe New Approaches for Extracting Heterogeneous Reference Data möchte CiteX 2026 den Austausch zwischen unterschiedlichen Fachgemeinschaften fördern, die an methodischen und infrastrukturellen Fragen rund um Zitationsdaten arbeiten. Der Workshop lädt Beiträge zu einem breiten Spektrum von Themen ein – von regelbasierten und maschinellen Lernverfahren bis hin zum Einsatz großer Sprachmodelle (LLMs) für Zitationsaufgaben.

Themenbereiche

  • Automatisierte Extraktion und Analyse von Referenzen
  • Erstellung und gemeinsame Nutzung von Goldstandards und Testdatensätzen
  • Standardisierung und Interoperabilität von Zitierdaten
  • Qualitätsbewertung und Validierung extrahierter Referenzen
  • Bereitstellung und Integration offener Zitierdaten in Repositorien und Suchsysteme
  • Zitierpraktiken in verschiedenen Disziplinen
  • Datenverknüpfung zwischen wissenschaftlichen Arbeiten, Datensätzen und anderen Forschungsergebnissen
  • Annotation und Anreicherung von Zitierdaten
  • Prompt Engineering und Feinabstimmung von LLMs (z. B. GPT-4, LLaMA) für Zitieraufgaben
  • Vergleich von LLM-basierten und toolbasierten (z. B. GROBID, Anystyle, Cermine) Extraktionspipelines
  • Extraktion von Zitaten im Text und Kontextanalyse unter Verwendung von LLMs
  • Verwendung von offenen Web-Such-APIs oder LLMs für die Quellenbeschaffung

Termine

  • Einreichungsfrist: 15. Januar 2026
  • Benachrichtigung über Annahme: 1. März 2026
  • Abgabe der Endfassung: 31. März 2026

Teilnahme & Beiträge

Eingeladen sind Beiträge in Form von Präsentationen, Postern oder Hands-on-Sessions. Extended Abstract (1.250–1.500 Wörter, ohne Literaturangaben) sind in englischer Sprache über das Formular auf der Workshop-Website einzureichen. Angenommene Beiträge werden in einer Zenodo-Community veröffentlicht.
Die Teilnahme ist mit oder ohne eigenen Beitrag möglich. Die Präsenzteilnahme wird bevorzugt, Online-Beiträge sind jedoch in begrenztem Umfang vorgesehen. Für die Teilnahme wird eine geringe Gebühr zur Deckung der Organisationskosten erhoben.

Weitere Informationen & Einreichungsformular
Kontakt: d29ya3Nob3AuY2VwLjIwMjZAZ21haWwuY29t
OFFZIB-Projektwebsite