Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 47 Nächste Version anzeigen »

Das Wiki Textdaten Romanistik sammelt und kommentiert eine umfassende Auswahl an online verfügbaren textuellen Ressourcen, die im Rahmen sprachwissenschaftlicher Forschungsfragen in der Romanistik von Bedeutung sind. Der bewusst weit gefasste Begriff Textdaten verweist auf die diversen Arten von Texten - Korpora, historische und aktuelle Literatur, Wörterbücher, Sprachatlanten, Sekundärliteratur - die als Informationsquelle oder als direkter Untersuchungsgegenstand zur Klärung einer Fragestellung oder zum Beleg einer Hypothese beitragen können. Von Daten ist die Rede, da es sich um digitalisierte Texte handelt, die dem Benutzer online zugänglich sind. Die Korpora können zudem mithilfe enstprechender Software digital analysiert und weiterverarbeitet werden und bilden somit eine Datengrundlage, auf der sich sprachliche Merkmale differenziert und statistisch aussagekräftig untersuchen lassen. In sieben Teilbereichen stellt das Wiki seinen Nutzern die diversen Textsorten vor, verlinkt sie und liefert, gegliedert nach Einzelsprachen, umfassende Informationen zu ihrer Herkunft und Beschaffenheit. Außerdem präsentiert es diverse Programme zur Bearbeitung und Analyse der Textdaten sowie einen Selbstlernbereich mit Anleitungen zur Nutzung der wichtigsten Ressourcen und Tools.

Der Bereich Korpora und Textdatenbanken enthält Textsammlungen zur gesprochenen und geschriebenen Sprache, zu historischen Dokumenten, zur Medien- und Jugendsprache sowie zu regionalen Varietäten und Dialekten. Aufgrund ihres speziellen Formates (meist XML) können die Korpora  - je nachdem, wie detailliert sie annotiert sind - auf bestimmte lexikalische, morphologische oder syntaktische Phänomene sowie auf Verwendungskontekte und Konkordanzen von Wörtern untersucht werden. Eine genauere Erläuterung zur Beschaffenheit von Korpora und der zielgerichteten Arbeit mit ihnen ist in der Subkategorie Grundlagen der Korpusarbeit zu finden. Einen tieferen Einstieg in die Materie soll die thematisch gegliederte Liste zur Sekundärliteratur bieten, die ebenfalls im Bereich Korpora und Textdatenbanken zu finden ist.

Als zusätzliche Ressourcen umfasst das Wiki Digitale Editionen von Zeitschriften und Buchreihen sowie Digitalisate historischer Manuskripte und alter Drucke, welche Aufschluss über weiter zurückliegende Sprachstadien geben und damit auch zum Objekt linguistischer Untersuchungen werden können. Sie stehen in Online-Bibliotheken und Datenbanken zur Verfügung.

In den Bereichen Wörterbücher und Sprachatlanten kann der Nutzer sich über lexikalische Besonderheiten einzelner Sprachen, Sprachstufen und Varietäten informieren und sich ein Bild von der regionalen Ausprägung der Sprachen der Romania machen.

Zur Unterstützung der selbständigen Informationssammlung im Internet und der Erschließung unterstützender Forschungsliteratur verweist das Wiki Textdaten Romanistik im entsprechenden Bereich auf einschlägige bibliographische, biographische und enzyklopädische Rechercheportale.

Wer sich an die aktive Arbeit mit den Textdaten wagen will, und vielleicht sogar selbst Korpora erstellen oder Texte zur Analyse aufbereiten möchte, findet im Bereich Tools diverse gängige Programme zur Transkription und Annotation.

Zum Einstieg in die Datenanalyse, beziehungsweise zur Erweiterung ihres bereits vorhandenen Wissens, dient den Nutzern Bereich Manuals. Hier finden sie Hintergrundinformationen zur Datencodierung und Textedition, Anleitungen zu Transkriptions- und Analyseprogrammen wie Praat oder Transcriber, hilfreiche Tipps und Links zum wissenschaftlichen Arbeiten sowie einen Selbstlernbereich, der in die Nutzung des Wiki und deren Potentiale einführt. Das im Selbstlernbereich erworbene Wissen kann schließlich im dazugehörigen Blackboard-Quiz wiederholt und überprüft werden.

Alle Inhalte sind durch Verschlagwortung erschlossen. Die Stichwörter/Labels umfassen die Bezeichnung der jeweiligen Sprache und des Arbeitsgebietes, Angaben zur Beschaffenheit des Korpus oder der Ressource sowie gegebenenfalls eine historische Einordnung.

 

Labels

 

 

Das Wiki ist im Aufbau!

Kontakt: textdaten@zedat.fu-berlin.de

 

  • Keine Stichwörter