Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Anzeige untergeordneter Seiten
alltrue

 

Grundlagen der Korpusarbeit

Was ist eigentlich ein Korpus?

Korpora sind Textsammlungen, die als Datengrundlage für die Untersuchung sprachlicher Phänomene dienen. Sie sind computerlesbar und häufig sehr umfangreich, was die maschinelle Auswertung und statistische Erfassung bestimmter Wörter, ihrer Flexionsformen oder ihrer Verwendungskontexte enorm erleichtert.

Jedes Korpus deckt einen ganz konkreten Referenzbereich ab und kann dadurch zur Beantwortung bestimmter sprachwissenschaftlicher Untersuchungsfragen genutzt werden. Das sehr bekannte FRANTEXT-Korpus beispielsweise umfasst 4500 vorwiegend literarische Texte des Französischen vom 12. Bis zum 21. Jahrhundert. Es eignet sich zur Untersuchung der diachronischen Entwicklung der geschriebenen Sprache oder zur Charakterisierung sprachlicher Besonderheiten in bestimmten literarischen Strömungen. Genauso gibt es aber auch Korpora zur gesprochenen Sprache in Form transkribierter Interviews (ESLO, CLAPI), Korpora zur Sprache im Internet (TWITA, WaCky), zur Jugendsprache (COLA) usw. Bevor man ein sprachliches Phänomen untersucht, sollte man sich stets fragen, ob das ausgewählte Korpus die nötige Repräsentativität für die Forschungsfrage aufweist. Um die Repräsentativität zu erhöhen, kann man bestehende Korpora auf Teilbereiche einschränken oder selbst Daten für ein Arbeitskorpus erheben.

[Fortsetzung folgt…]

 

Spanische Korpora  

Italienische Korpora

Portugiesische Korpora  

Rumänische Korpora

Mehrsprachige Korpora

 Französische Korpora
Werkzeuge für die Arbeit mit Korpora
Anleitungen für die Arbeit mit Korpora
Digitalisierte Texte, Editionen, Digitalisate von Manuskripten und Alten Drucken
Online zugängliche Sprachatlanten und Wörterbücher
Bibliographische und enzyklopädische Rechercheportale

...