Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Viele Korpora sind in Bezug auf Wortarten und Flexionsformen (Parts of Speech – PoS), Lemmata oder auch syntaktische Kategorien annotiert, was das Spektrum der möglichen Suchabfragen enorm erweitert. Dies unterscheidet sie von Textdatenbanken, die lediglich Texte in „Rohform“ zur Verfügung stellen. Textdatenbanken dienen eher dokumentarischen als sprachwissenschaftlichen Zwecken, durchaus können sie aber die Basis für ein selbst erstelltes und zu Analysezwecken weiter aufbereitetes Korpus darstellen. Die Lemmatisierung und morphosyntaktische Annotation eines Korpus erlauben die Formulierung komplexer Suchanfragen unter Anwendung von Wildcards und regulären Ausdrücken, die Erstellung von Frequenzlisten (z.B. zur Ermittlung der Type-Token-Relation) und die Untersuchung von Konkordanzen zwischen Lemmata oder Wortarten.

[Fortsetzung folgt…] 

cf. hierzu auch: Gerstenberg, Annette (2013): Arbeitstechniken für Romanisten. Eine Anleitung für den Bereich Linguistik. Berlin/Boston: De Gruyter, Kap. 6: "Benutzung von Korpora und Datenbanken"

Weitere hilfreiche Literatur zum Thema Korpora und Korpuslinguistik ist unter unten stehendem Link zu finden

 

 Französische Korpora
 Spanische Korpora

...