Sprachdaten aus der geschriebenen und gesprochenen Sprache, mit zeitgenössischen sowie älteren Varietäten. Das Ziel des Korpus ist möglichst viele Varietäten des Italienischen zu dokumentieren.
Sprache | Italienisch |
Sprachstufe | Alt-, Standarditalienisch |
Sprachliche Realisierung | schriftlich, mündlich |
Umfang | 30.000 Tokens |
Medium | Texte und Transkripte aus unterschiedlichen Kontexten: Zeitungen, Schulbücher, Romanen, Aufsätze, Gebrauchsanleitungen, offizielle Schreiben, private Briefe, Filme, Fernsehsendungen, private Gespräche usw. |
Geographischer Ursprung | Italien |
Zeitliche Einordnung | ab dem 13. Jahrhundert |
Form der Daten | Volltexte mit Metadaten |
Format | MDB Dateien |
Annotation | Metadaten: Gattung, diamesische Varietät (Scritto Diacronia (SD), Scritto Sincronia (SS), Orale Sincronia (OS)), Zeitraum, Texttyp |
Mögliche Suchabfragen | Nach Tokens kann gesucht werden und das Korpus kann nach Metadaten unterteilt werden (http://www.parlaritaliano.it/attachments/article/643/Come_consultare_il_database_di_Penelope.pdf) |
Quelle/Herausgeber | G. Policarpi und M. Rombi, Parlare Italiano (University of Salerno) |
Nutzungsvoraussetzungen | Zugang frei |
Link | http://www.parlaritaliano.it/index.php/en/corpora/643-corpus-penelope |
Zum Zitieren: | Voghera, Miriam, Giusy Turco, Gianna Policarpi, Maggi Rombi & Debora Vena. 2006. Corpus Penelope. http://www.parlaritaliano.it/index.php/it/dati/45-corpus-penelope. |