Eigenschaften
- Text-Ton alignierte Transkription
- Annotationstools
- Kennzeichnung unterschiedlicher Personen ("overlapping speech")
- Direkte Exportmöglichkeit z.B. nach EXMARaLDA
- Konvertierung zu Praat möglich
- XML-strukturierte Daten
Arbeiten mit Transcriber
Das Programm ist im Internet frei verfügbar (http://sourceforge.net/projects/trans/files/transcriber/1.5.1/).
Installation entsprechend den Anweisungen in der Readme-Datei.
Das Programm erzeugt ein Ikon auf dem Desktop. Wenn es angeklickt wird, startet das Programm.
Zunächst kann eine eigene Tondatei (Format *.wav) geladen werden: "File", "New trans", im Explorerfenster Ablageort der entsprechenden *.wav-Datei wählen (Fig. 1).
Fig. 1 Erstellen einer neuen Transkription
Wenn bereits eine Transkriptionsdatei erstellt wurde, kann sie unter "File“, "Open trans…" wieder geöffnet und weiter bearbeitet werden.
1. Das Oszillogramm
Im Fenster unten erscheint nun das Tonsignal bzw. Oszillogramm. Das obere Feld dient der Eingabe der Transkription. Durch den kleinen Schieberegler am oberen rechten Rand der Tonspur kann die Tonfrequenz in die Breite gezogen werden; je nachdem, ob an einer kurzen Stelle gearbeitet wird oder die ganze Aufnahme überblickt werden soll lässt sich auf diese Weise der betrachtete Ausschnitt variieren. Die Tonausgabe wird durch die Tab-Taste gestartet, und ebenso durch Tab beendet.
Durch einfaches Anklicken einer Stelle im Signal mit dem Cursor der Maus kann der Beginn der Tonausgabe festgelegt werden. Auch kann eine Passage mit der Maus markiert werden; ist eine Passage markiert, wird genau diese durch Klicken der "Tab" abgespielt.
Fig. 2 Tonwiedergabe
2. Segmentieren
In einem ersten Schritt empfiehlt es sich, das Signal zu segmentieren. Dadurch wird das Signal in Abschnitte unterteilt, denen im oberen Bereich Zeilen entsprechen. Eine Grenze zwischen zwei Segmenten wird bei Transcriber als Breakpoint bezeichnet.
Diese Abschnitte müssen nicht mit Sprecherwechseln übereinstimmen; sie sollten nicht zu lang sein, um die Orientierung im Text zu erleichtern.
Der Ton wird abgespielt. Dabei bewegt sich die gelbe Anzeige von links nach rechts. Es empfiehlt sich, vor Beginn einer Intonationseinheit eine neue Zeile zu erzeugen – im ersten Durchgang ist mit Intonationseinheit gemeint, dass nach einer kurzen inhaltlich geschlossenen Sprechpassage eine Pause folgt.
Mit der Maus wird die gelbe Anzeige genau an die gewünschte Stelle im Oszillogramm gezogen und durch Enter ein Segment erstellt. Gleichzeitig wird nun im Texteingabefeld eine neue Zeile erzeugt (Fig. 3).
Fig. 3 Segmentieren des Signals und Erzeugen von Zeilen für die Texteingabe
Eine falsche Segementgrenze wird gelöscht, indem man auf den grünen Punkt am linken Rand der transkribierten Zeile mit der linken Maustaste klickt und in der Menüleiste unter „Segmentation“ den Befehl "Delete Breakpoint" auswählt oder Strg + Backspace drückt (Fig. 4). Soll eine Änderung der Grenzen vorgenommen werden, wird der Breakpoint zunächst gelöscht und an entsprechender Stelle mithilfe der Enter-Taste an der gewünschten Position eingefügt.
Fig. 4 Segmentgrenzen entfernen
3. Einteilung von turns
Das Segmentieren hat eine Reihe von Zeilen erzeugt, die Sinneinheiten oder Sätzen oder einfach Einheiten, die bei der Transkription sinnvoll erscheinen, entsprechen können.
Diese Einteilung nach Zeilen kann durch zwei weitere Überschriften gegliedert werden: in rot sind die einzelnen sections dargestellt (Shortcut: Strg+r, oder „Create Section…“ unter dem Menüpunkt „Segmentation“); dadurch kann man z.B. nicht transkribierte Passagen kennzeichnen ("nontrans" markieren). In kürzeren Abschnitten müssen keine sections markiert werden.
Wichtiger ist die Zuweisung von turns ‘Sprecherbeiträgen’ zu den beiden beteiligten Sprechern. Mit Linksklick auf den grauen Button (zuerst mit "(no speaker)" beschriftet) öffnet sich ein Fenster, mit dem die grauen Buttons beschriftet werden; Nach einem Klick auf „Create Speaker“ können die beteiligten Sprecher darin selbst benannt werden oder nach Voreinstellung mit Speaker 1, 2, 3... unterschieden werden, es können auch mehrere Sprecher pro turn eingetragen werden. Mit Enter wird die Eingabe bestätigt.
Fig. 5 Benennung eines Sprechers
4. Gleichzeitiges Sprechen – Overlapping speech
Wenn mehrere Sprecher gleichzeitig sprechen, kann die in der Gesprächsanalyse übliche Partiturschreibweise programmgestützt hergestellt werden. Dazu kann mit linkem Mausklick auf den grauen Button die Funktion "Overlapping speech" aktiviert werden (Fig. 7); Nun wird in der oberen Zeile der zu bestimmende Sprecherslot ausgewählt und mit je einem Sprecher gefüllt. Auch hier bestätigt Enter die Eingabe.
Fig. 6 Overlapping speech
5. Texteingabe
Der Text kann zunächst in orthographischer (also: nicht phonetischer) Transkription erfasst werden, wobei auf Interpunktion verzichtet wird. Dabei werden alle Wörter klein geschrieben, außer Eigennamen, nach Apostroph folgt ein Leerzeichen. Wiederholte Wörter werden wiederholt transkribiert.
Die weitere Vorgehensweise wird durch die jeweils für die Arbeit festzulegenden Transkriptionskriterien bestimmt.
Auch begleitende Sprechereignisse können mit Shortcut erzeugt werden: durch Strg+d an einer per Linksklick ausgewählten Stelle der Transkription öffnet sich ein Fenster mit Eingabefeld; hier können eigene Abkürzungen oder redebegleitende Ereignisse (z.B. rire, bruit) notiert werden (Fig. 7). Die genannten redebegleitenden Ereignisse sind unter dem Typ "Noise" zusammengefasst. Das Dropdown-Menü ändert sich je nachdem, welcher Eventtyp ausgewählt ist.
Fig. 7 Begleitgeräusche auswählen
Bei den Interjektionen ist die Transkription gemäß den Formen, die auch in die Wörterbücher aufgenommen wurden, üblich. Frz. ah, euh, ben, hein, hum; It. boh, mah.
Leider kennt Transcriber nicht alle Diakritika, die in den romanischen Sprachen verwendet werden. Sie müssen daher auf die jeweiligen ASCII-Codes zugreifen, durch gleichzeitiges Drücken von Alt und einer Zahlenkombination im Nummernblock. Achtung: die Anzeige "Num" muss leuchten, dies wird durch Drücken der Taste Num erreicht; die Anzeige "Num" erlischt manchmal nach Eingabe einer Zahlenkombination und muss dann neu aktiviert werden!
Bei dialektalen Texten kann zusätzlich eine phonetische Transkription in Sampa angefertigt werden.
6. Speichern und Weiterverarbeiten
Zur Sicherung der Transkription wird der Text im Format *.tag gespeichert; dieses Format ist XML-strukturiert und kann sehr gut von anderen Programmen ausgewertet werden, weil der Text der Transkription unabhängig von den Zusatzinformationen (Metainformationen, Zeitangabe, Name des Sprechers, redebegleitende Ereignisse) gespeichert ist. Die Datei mit der Extension *.tag kann in Wordpad oder in anderen Texteditoren geöffnet bzw. gelesen werden. Es besteht auch die Möglichkeit, wenn z. B. die phonetische Analyse vertieft werden soll, die Dateistruktur so zu transformieren, dass das Transkript in PRAAT eingelesen werden kann.
7. Export
Transcriber-Dateien können direkt in anderen Transkriptionssystemen wie EXMARaLDA gelesen und weiterverarbeitet werden.
Es besteht aber auch die Möglichkeit einer einfachen Textausgabe, die in Textdateien kopiert werden kann. Dafür können Sie die Exportfunktion wählen. Die Wahl des Dateiformates hängt davon ab, welche Informationen für Ihre Auswertung relevant sind:
- File – Export file: „HTML“: Metaangaben zur Datei, ohne Zeitangaben, enthält Angaben zu Sprechern und Sequenzen
- File – Export file: „STM“: ohne Angabe zu den Sprechern, Overlapping speech wird nicht mit ausgegeben
- File – Export file: „Text“: Ohne Metainformationen zur Datei, ohne Zeitangaben, ohne Namen der Sprecher
- File – Export file: „LIMSI“: Text ausschließlich mit Zeitangaben
Alle diese Dateiformate können in Wordpad bzw. im Texteditor geöffnet werden (rechte Maustaste: "öffnen mit...").