Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Um sie verlässlich durchsuchbar und im Internet verfügbar zu machen, werden Korpora in adäquaten Dateiformaten aufbereitet. Häufig wird hierbei XML (Extensible Markup Language) verwendet, eine Auszeichnungssprache, die mit einer Vielzahl von Textverarbeitungsprogrammen (z.B. Transcriber, Oxygen, TextPad, SCP, R) kompatibel ist und somit eine weitere Aufbereitung der Texte sowie die Suche nach bestimmten sprachlichen Phänomenen mit und ohne Suchmaske ermöglicht. XML ermöglicht auch die Integration von Metadaten in ein Textdokument. Hierzu zählen Informationen zu Sprache, Varietät und Textsorte, zum Autor bzw. Sprecher und dessen Alter, Geschlecht und sozialem Status, zum Zeitpunkt der Niederschrift/Veröffentlichung/Aufnahme der Daten sowie ggf. zu den Modalitäten der Transkription. All diese Informationen sind unabdingbar für die Kontextualisierung der Daten und der die Klärung ihrer Repräsentativität für zu beantwortende Forschungsfragen.

...