Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Auswahl von Dokumenten der UN im XML-Format, verfügbar in sechs Sprachen, darunter Französisch und Spanisch.sieben Sprachen.

 

Sprache

Englisch, Französisch, Spanisch, Deutsch, Arabisch, Russisch, Chinesisch

Sprachliche Realisierung

schriftlich

Umfang

ca. 300 Mio. Wörter pro Sprache

Medium

Dokumente der Vereinten Nationen, heruntergeladen von der UN-Website

Zeitliche Einordnung

2000-2009

Form der Daten

Files im XML-Format, nach einzelsprachen sortiert und zum Download verfügbar

Format

XML

Quelle/Herausgeber

Andreas Eisele, Yu Chen, DFKI (Deutsches Forschungszentrum für künstliche Intelligenz)

Nutzungsvoraussetzungen

Zugang frei

Link

http://www.euromatrixplus.net/multi-un/ 

LiteraturEisele, Andreas / Chen, Yu (2010): "MultiUN: A Multilingual Corpus from United Nation Documents".In: Tapias, Daniel et al. (eds.): Proceedings of the Seventh conference on International Language Resources and Evaluation. La Valletta, Malta, European Language Resources Association (ELRA), 2868-2872. Download