Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Viele Korpora sind in Bezug auf Wortarten und Flexionsformen (Parts of Speech – PoS) und/oder Lemmata , Lemmata oder auch syntaktische Kategorien annotiert, was das Spektrum der möglichen Suchabfragen enorm erweitert. Dies unterscheidet sie von Textdatenbanken, die lediglich Texte in „Rohform“ zur Verfügung stellen. Textdatenbanken dienen eher dokumentarischen als sprachwissenschaftlichen Zwecken, durchaus können sie aber die Basis für ein selbst erstelltes und zu Analysezwecken weiter aufbereitetes Korpus darstellen. Die Lemmatisierung und morphosyntaktische Annotation eines Korpus erlauben die Formulierung komplexer Suchanfragen unter Anwendung von Wildcards und regulären Ausdrücken, die Erstellung von Frequenzlisten (z.B. zur Ermittlung der Type-Token-Relation) und die Untersuchung von Konkordanzen zwischen Lemmata oder Wortarten.

...