Mehr als 5 Mio. Tokens, unterteilt in fünf Teilkorpora; Texte aus dem 16.-20. Jahrhundert, entnommen aus Dominio Público, GMHP, Tycho Brahe (Quellenangaben zu den Einzeltexten dort) und aufbereitet durch POS mit TreeTagger.
http://corporavm.uni-koeln.de/colonia/
Beschreibung des Korpus:
Zampieri, M. and Becker, M. (2013) Colonia: Corpus of Historical Portuguese. In: ZSM Studien, Special Volume on Non-Standard Data Sources in Corpus-Based Research. Volume 5. Shaker.