...
Die Sprachaufnahmen sind sowohl als Audiofiles als auch als transkribierte Textdateien (ca. 300 000 Wörter pro Sprache) verfügbar. Die Transkriptionen sind lemmatisiert und PoS-Annotiert. Zudem enthält die DVD die Metadaten der Sprecher, eine Übersicht über die diversen Kommunikationssituationen, in denen die Aufnahmen entstanden sind, Frequenzlisten sowie Software zur Analyse der Korpora.
Sprache | Italienisch, Französisch, Spanisch, Portugiesisch |
Sprachliche Realisierung | mündlich |
Umfang | ca. 1,2 Mio. Wörter (300.000 pro Sprache) |
Medium | Sprachaufnahmen in diversen Kommunikationssituationen (privat und öffentlich, Nähe und Distanz, Monolog und Dialog, formell und informell) |
Geographischer Ursprung | Italien, Frankreich, Spanien, Portugal |
Zeitliche Einordnung | ab 1970 |
Form der Daten | Audiofiles und transkribierte Textdateien; die DVD enthält Software zur Bearbeitung und Analyse der Daten |
Format | WAV, CHAT, TXT, IMDI, XML |
Annotation | prosodische Annotation ("terminal" und "non terminal breaks"), lemmatisiert, part-of-speech-annotiert |
Mögliche Suchabfragen | Suche nach key words in context, Wortfolgen und Wortarten sowie Erstellung von Frequenzlisten möglich |
Buch + DVD | |
Infos online | C-ORAL-ROM Vollversion |
Zugang im FU-Netz | |
Zum Zitieren: | Cresti, Emanuela & Massimo Moneglia (eds.). 2005. C-Oral-Rom: Integrated Reference Corpora for Spoken Romance Languages. C-ORAL-ROM. Amsterdam: Benjamins. |