Repräsentatives Korpus zum zeitgenössischen gesprochenen und geschriebenen Italienisch in verschiedenen Genres.

Kontakt über die Projektverantwortliche Stefania Spina.

 

Sprache

Italienisch

Varietät

Standard

Sprachliche Realisierung

schriftlich und mündlich

Umfang

ca. 25 Mio. Wörter

Medium

Sprachdaten zu zehn verschiedenen textuellen und kommunikativen Genres: Parlato, Televisione, Amministrazione, Web, Accademico, Stampa, Scuola, Film, Saggi, Letteratura

Geographischer Ursprung

Italien

Form der Daten

digital aufbereitete Texte und Transkripte

Annotation

lemmatisiert, part-of-speech-annotiert

Quelle/Herausgeber

Stefania Spina, Università per Stranieri di Perugia

Link

http://perugiacorpus.unistrapg.it/ (nur Beschreibung, kein Zugang zum Korpus); Korpusabfrage mit CQP: https://www.unistrapg.it/cqpwebnew

Zum Zitieren:

Spina, Stefania. 2014. Il Perugia Corpus: una risorsa di riferimento per l'italiano. Composizione, annotazione e valutazione. In Basili, Roberto/Lenci, Alessandro/Magnini, Bernardo (Eds.), Proceedings of the First Italian Conference on Computational Linguistics CLiC-it 2014 & and of the Fourth International Workshop EVALITA 2014, 197–202. Pisa: Pisa University Press.