Sprachdaten aus der geschriebenen und gesprochenen Sprache, zeitgenössisch sowie ältere Varietäten. Das Ziel des Korpus ist möglichst viele Varietäten des Italienischen zu dokumentieren.
Sprache | Italienisch |
Sprachstufe | Alt-, Standarditalienisch |
Sprachliche Realisierung | schriftlich, mündlich |
Umfang | 30.000 Tokens |
Medium | Texte und Transkripte aus unterschiedlichen Kontexten: Zeitungen, Schulbücher, Romanen, Aufsätze, Gebrauchsanleitungen, offizielle Schreiben, private Briefe, Filme, Fernsehsendungen, private Gespräche usw. |
Geographischer Ursprung | Italien |
Zeitliche Einordnung | ab dem 13. Jahrhundert |
Form der Daten | digitalisierte, online durchsuchbare Texte |
Format | Online, Herunterladen der Texte nicht möglich |
Annotation | Subkorpus TLIO (Tesoro della Lingua Italiana delle Origini, 2.268 Texte) ist lemmatisiert |
Mögliche Suchabfragen | Wortfrequenzen |
Quelle/Herausgeber | |
Nutzungsvoraussetzungen | Zugang frei |
Link | http://www.parlaritaliano.it/index.php/en/corpora/643-corpus-penelope |