Corpus PENELOPE

Sprachdaten aus der geschriebenen und gesprochenen Sprache, zeitgenössisch sowie ältere Varietäten. Das Ziel des Korpus ist möglichst viele Varietäten des Italienischen zu dokumentieren.

Sprache	Italienisch
Sprachstufe	Alt-, Standarditalienisch
Sprachliche Realisierung	schriftlich, mündlich
Umfang	30.000 Tokens
Medium	Texte und Transkripte aus unterschiedlichen Kontexten: Zeitungen, Schulbücher, Romanen, Aufsätze, Gebrauchsanleitungen, offizielle Schreiben, private Briefe, Filme, Fernsehsendungen, private Gespräche usw.
Geographischer Ursprung	Italien
Zeitliche Einordnung	ab dem 13. Jahrhundert
Form der Daten	digitalisierte, online durchsuchbare Texte
Format	Online, Herunterladen der Texte nicht möglich
Annotation	Subkorpus TLIO (Tesoro della Lingua Italiana delle Origini, 2.268 Texte) ist lemmatisiert
Mögliche Suchabfragen	Wortfrequenzen
Quelle/Herausgeber
Nutzungsvoraussetzungen	Zugang frei
Link	http://www.parlaritaliano.it/index.php/en/corpora/643-corpus-penelope

Seitenhierarchie

Corpus PENELOPE