Sehr umfangreiches Korpus zum zeitgenössischen Spanisch

 

Sprache

Spanisch

Varietät

Standard

Sprachliche Realisierung

schriftlich

Umfang

540 Mio. Wörter

Medium

 zusammengesetzt aus drei Teikorpora:

  1. Spanischer Teil des Europarl: European Parliament Proceedings Parallel Corpus (1996-2010)
  2. Spanischer Teil des Wikicorpus (2006)
  3. Spanischer Teil des MultiUN: Multilingual UN Parallel Text (2000-2009)

Geographischer Ursprung

Spanien

Zeitliche Einordnung

1996-2010

Form der Daten

online durchsuchbare Akten, Gesetztestexte und WIkipedia-Einträge

Format

HTML

Annotation

lemmatisiert, morphosyntaktisch annotiert

Mögliche Suchabfragen

Die Suchmaske CPQweb ermöglicht die Suche nach Wörtern, Lemmata, Wortarten und Konstruktionen unter Verwendung regulärer Ausdrücke. Es können Frequenzlisten und Kollokationen abgerufen werden.

Quelle/Herausgeber

Carlos Subirats und Marc Ortega, 2012

Nutzungsvoraussetzungen

Zugang frei

Link

http://spanishfn.org/tools/cea/english