Repräsentatives Korpus zum zeitgenössischen gesprochenen und geschriebenen Italienisch in verschiedenen Genres.
Kontakt über die Projektverantwortliche Stefania Spina.
Sprache | Italienisch |
Varietät | Standard |
Sprachliche Realisierung | schriftlich und mündlich |
Umfang | ca. 25 Mio. Wörter |
Medium | Sprachdaten zu zehn verschiedenen textuellen und kommunikativen Genres: Parlato, Televisione, Amministrazione, Web, Accademico, Stampa, Scuola, Film, Saggi, Letteratura |
Geographischer Ursprung | Italien |
Form der Daten | digital aufbereitete Texte und Transkripte |
Annotation | lemmatisiert, part-of-speech-annotiert |
Quelle/Herausgeber | Stefania Spina, Università per Stranieri di Perugia |
Link | http://perugiacorpus.unistrapg.it/ (nur Beschreibung, kein Zugang zum Korpus); Korpusabfrage mit CQP: https://www.unistrapg.it/cqpwebnew |
Zum Zitieren: | Spina S. Il Perugia Corpus: una risorsa di riferimento per l’italiano. Composizione, annotazione e valutazione. In: (a cura di): R. Basili, A. Lenci, B. Magnini, Proceedings of the First Italian Conference on Computational Linguistics CLiC-it 2014. vol. 1, p. 354-359. Pisa: Pisa University Press, 2014. |