Übersicht der Accademia della Crusca zu diversen, auch weniger bekannten italienischen Korpora und Textdatenbanken
http://www.accademiadellacrusca.it/it/link-utili/banche-dati-dellitaliano-scritto-parlato
zum Beispiel:
- CoLFIS (Corpus e Lessico di Frequenza dell'Italiano Scritto) - ISTC
- Corpora e lessici dell'italiano parlato e scritto (CLIPS)
- Corpora LABLITA (Corpus di italiano parlato, corpus Stammerjohann, etc.)
- Corpus Athenaeum
- Corpus Taurinense (22 testi fiorentini della seconda metà del XIII secolo)
- Corpus di parlato cinematografico
- Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005 (CPT)
- Corpus VALICO Varietà Apprendimento Lingua Italiana
- Lessico italiano radiofonico (LIR corpus)
- Lessico italiano televisivo (LIT corpus or LIT 2006 corpus)
- Newsgroup UseNet Corpora (NUNC)
- Corpus della Piattaforma per l’apprendimento dell’italiano su corpora annotati (PAISÀ corpus)
- pvbvarless (Valori di età di acquisizione, immaginabilità e frequenza per 527 parole del Primo Vocabolario del Bambino)
- SMS Monitor Studies
- varless (Variabili lessicali e sub-lessicali: valori per 626 nomi dell'italiano)
- uvm.