Textdaten Romanistik Home

Das Wiki Textdaten Romanistik sammelt und kommentiert eine umfassende Auswahl an online verfügbaren textuellen Ressourcen, die im Rahmen sprachwissenschaftlicher Forschungsfragen in der Romanistik von Bedeutung sind. Der bewusst weit gefasste Begriff Textdaten verweist auf die diversen Arten von Texten - Korpora, historische und aktuelle Literatur, Wörterbücher, Sprachatlanten, Sekundärliteratur - die als Informationsquelle oder als direkter Untersuchungsgegenstand zur Klärung einer Fragestellung oder zum Beleg einer Hypothese beitragen können. Von Daten ist die Rede, da es sich um digitalisierte Texte handelt, die dem Benutzer online zugänglich sind. Die Korpora können zudem mithilfe enstprechender Software digital analysiert und weiterverarbeitet werden und bilden somit eine Datengrundlage, auf der sich sprachliche Merkmale differenziert und statistisch aussagekräftig untersuchen lassen. In sieben Teilbereichen stellt das Wiki seinen Nutzern die diversen Textsorten vor, verlinkt sie und liefert, gegliedert nach Einzelsprachen, umfassende Informationen zu ihrer Herkunft und Beschaffenheit. Außerdem präsentiert es diverse Programme zur Bearbeitung und Analyse der Textdaten sowie einen Selbstlernbereich mit Anleitungen zur Nutzung der wichtigsten Ressourcen und Tools.

Der Bereich Korpora und Textdatenbanken enthält Textsammlungen zur gesprochenen und geschriebenen Sprache, zu historischen Dokumenten, zur Medien- und Jugendsprache sowie zu regionalen Varietäten und Dialekten. Aufgrund ihres speziellen Formates (meist XML) können die Korpora - je nachdem, wie detailliert sie annotiert sind - auf bestimmte lexikalische, morphologische oder syntaktische Phänomene sowie auf Verwendungskontekte und Konkordanzen von Wörtern untersucht werden. Eine genauere Erläuterung zur Beschaffenheit von Korpora und der zielgerichteten Arbeit mit ihnen ist in der Subkategorie Grundlagen der Korpusarbeit zu finden. Einen tieferen Einstieg in die Materie soll die thematisch gegliederte Liste zur Sekundärliteratur bieten, die ebenfalls im Bereich Korpora und Textdatenbanken zu finden ist.

Als zusätzliche Ressourcen umfasst das Wiki Digitale Editionen von Zeitschriften und Buchreihen sowie Digitalisate historischer Manuskripte und alter Drucke, welche Aufschluss über weiter zurückliegende Sprachstadien geben und damit auch zum Objekt linguistischer Untersuchungen werden können. Sie stehen in Online-Bibliotheken und Datenbanken zur Verfügung.

In den Bereichen Wörterbücher und Sprachatlanten kann der Nutzer sich über lexikalische Besonderheiten einzelner Sprachen, Sprachstufen und Varietäten informieren und sich ein Bild von der regionalen Ausprägung der Sprachen der Romania machen.

Zur Unterstützung der selbständigen Informationssammlung im Internet und der Erschließung unterstützender Forschungsliteratur verweist das Wiki Textdaten Romanistik im entsprechenden Bereich auf einschlägige bibliographische, biographische und enzyklopädische Rechercheportale.

Wer sich an die aktive Arbeit mit den Textdaten wagen will, und vielleicht sogar selbst Korpora erstellen oder Texte zur Analyse aufbereiten möchte, findet im Bereich Tools diverse gängige Programme zur Transkription und Annotation.

Zum Einstieg in die Datenanalyse, beziehungsweise zur Erweiterung ihres bereits vorhandenen Wissens, dient den Nutzern Bereich Manuals. Hier finden sie Hintergrundinformationen zur Datencodierung und Textedition, Anleitungen zu Transkriptions- und Analyseprogrammen wie Praat oder Transcriber, hilfreiche Tipps und Links zum wissenschaftlichen Arbeiten sowie einen Selbstlernbereich, der in die Nutzung des Wiki und deren Potentiale einführt. Das im Selbstlernbereich erworbene Wissen kann schließlich im dazugehörigen Blackboard-Quiz wiederholt und überprüft werden.

Alle Inhalte sind durch Verschlagwortung erschlossen. Die Stichwörter/Labels umfassen die Bezeichnung der jeweiligen Sprache und des Arbeitsgebietes, Angaben zur Beschaffenheit des Korpus oder der Ressource sowie gegebenenfalls eine historische Einordnung.

Labels

Das Wiki ist im Aufbau!

Kontakt: textdaten@zedat.fu-berlin.de

data-hasbody="false" data-macro-name="popular-labels"> 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 2000 900 africa annotation audio bibliography biographical_information canada catalan child_language cmc collocates contemporary_resources corpus database diachrony dialects dictionary digital_edition early_printed_book encoding_data english etymology european_union francophonie french frequency frequency_list german germanic_languages grammar greek historical_resources history italian key_word_in_context language_acquisition language_and_law language_comparison language_for_special_purposes language_in_politics latin latin_america lemmatized linguistic_atlas link_list literature manual media methods middle_ages middle_french morphology multilingual old_french online part_of_speech phonetics phonology portuguese postagging press prosody regional_languages regular_expression renaissance research_portal romance_languages romanian scientific_language scientific_standards secondary_literature slavic_languages sociolinguistics spanish spoken_language statistics syntactic_annotation theatre tokenized tool tools transcription varieties video volgare web_as_corpus written_language xml youth_language

Wikis der Freien Universität Berlin

Seitenhierarchie

Labels