...
http://www.accademiadellacrusca.it/it/link-utili/banche-dati-dellitaliano-scritto-parlato
z.B.:
...
zum Beispiel:
- CoLFIS (Corpus e Lessico di Frequenza dell'Italiano Scritto) - ISTC
- Corpora e lessici dell'italiano parlato e scritto (CLIPS)
...
- Corpora LABLITA (Corpus di italiano parlato, corpus Stammerjohann, etc.)
...
- Corpus Athenaeum
- Corpus Taurinense (22 testi fiorentini della seconda metà del XIII secolo)
- Corpus di parlato cinematografico
...
- Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005 (CPT)
- Integrated reference corpora for spoken romance languages (C-Oral-Rom)
- Corpus del Lessico di frequenza dell'italiano parlato (LIP corpus)
...
- Corpus VALICO Varietà Apprendimento Lingua Italiana
- Lessico italiano radiofonico (LIR corpus)
...
- Lessico italiano televisivo (LIT corpus or LIT 2006 corpus)
...
- Newsgroup UseNet Corpora (NUNC)
...
- Corpus della Piattaforma per l’apprendimento dell’italiano su corpora annotati (PAISÀ corpus)
- pvbvarless (Valori di età di acquisizione, immaginabilità e frequenza per 527 parole del Primo Vocabolario del Bambino)
...
- SMS Monitor Studies
- Corpus Stammerjohann
- Corpus TWITA
- varless (Variabili lessicali e sub-lessicali: valori per 626 nomi dell'italiano)
- uvm.
- Web as corpus kool ynitiative (corpus itWaC)