Das CNRTL (Centre National de Ressources Textuelles et Lexicales) ist eine 2005 vom CNRS (Centre National de la Recherche Scientifique) gegründete und vom französischen Staat finanzierte Organisation, die für die Erschließung, digitale Aufbereitung und Distribution textueller Ressourcen zuständig ist. Es verfügt über eine Onlineplattform mit umfangreichen Informationen zur elektronischen Bearbeitung von Textdaten sowie zahlreichen Links zu Korpora, Lexika und Analysetools.
Folgende Korpora sind derzeit auf der Plattform zum Download verfügbar:
- Corpus Frantext
- Corpus journalistique de l'Est Républicain
- DEDE: un corpus annoté pour le traitement des DEscriptions DEfinies
- Guillaume de Digulleville, Pèlerinage de Vie humaine
- PERCEO : un Projet d'Etiqueteur Robuste pour l'Ecrit et pour l'Oral
- TCOF - Traitement des Corpus Oraux en Français
- Corpus d'articles de linguistique issus de la revue "Sciences Humaines"
Die vollständige Übersicht befindet sich unter: http://cnrtl.fr/corpus/