Sprachdaten aus der geschriebenen und gesprochenen Sprache, mit zeitgenössischen sowie älteren Varietäten. Das Ziel des Korpus ist möglichst viele Varietäten des Italienischen zu dokumentieren.

Sprache

Italienisch

Sprachstufe

Alt-, Standarditalienisch

Sprachliche Realisierung

schriftlich, mündlich

Umfang

30.000 Tokens


Medium

Texte und Transkripte aus unterschiedlichen Kontexten: Zeitungen, Schulbücher, Romanen, Aufsätze, Gebrauchsanleitungen, offizielle Schreiben, private Briefe, Filme, Fernsehsendungen, private Gespräche usw.


Geographischer Ursprung

Italien


Zeitliche Einordnung

ab dem 13. Jahrhundert

Form der Daten

Volltexte mit Metadaten

Format

MDB Dateien

Annotation

Metadaten: Gattung, diamesische Varietät (Scritto Diacronia (SD), Scritto Sincronia (SS), Orale Sincronia (OS)), Zeitraum, Texttyp


Mögliche Suchabfragen

Nach Tokens kann gesucht werden und das Korpus kann nach Metadaten unterteilt werden (http://www.parlaritaliano.it/attachments/article/643/Come_consultare_il_database_di_Penelope.pdf)

Quelle/Herausgeber

G. Policarpi und M. Rombi, Parlare Italiano (University of Salerno)

Nutzungsvoraussetzungen

Zugang frei

Link

http://www.parlaritaliano.it/index.php/en/corpora/643-corpus-penelope

Zum Zitieren:

Voghera, Miriam, Giusy Turco, Gianna Policarpi, Maggi Rombi & Debora Vena. 2006. Corpus Penelope. http://www.parlaritaliano.it/index.php/it/dati/45-corpus-penelope.