Die dialektometrische Verfahrenskette

vgl. GOEBL, Hans (1998, Figur 1: Flußdiagramm dialektometrischer Verfahren, S. 978).

1) Taxierung

Bei der Taxierung geht es darum, die Antworten einer Sprachatlaskarte in Typen, i.e. Taxate zusammenzufassen. Dabei kann man die zu klassifizierenden Daten (Taxandum) jeweils nach phonetischen, morphosyntaktischen oder lexikalischen Kriterien vermessen (taxieren). Das Ergebnis ist eine Liste, die jeder Ortnummer der Karte ein Taxat bzw. dessen Taxatnummer zuordnet. Jede Liste einer taxierten Sprachatlaskarte bildet einen Zeilenvektor der nominalskalierten Datenmatrix.
Die von Linguisten durchgeführten händische Taxierungen folgen in der Regel folgendem Ablauf:

Kriterien festlegen (z.B. lexikalisch, phonetisch).
Liste der verschiedenen Typen (Taxate) aufstellen und Nummern vergeben.
Zuweisung der einzelnen Antworten auf der Karte zu je einem Taxat, es entsteht die Ortnummer-Taxatnummer-Liste.

Daneben gibt es ein Programm zur automatischen Taxierung (I R S), das z.Z. an Karten des ALD-I erprobt wird.

2) Wahl des Ähnlichkeits- bzw. Distanzmaßes

Der erste Schritt bei der Erforschung von Relationen in der Datenmatrix besteht in der Vermessung der Ähnlichkeiten bzw. Abständen zwischen den Orte (Variablen oder Spaltenvektoren der Datenmatrix). Dazu kann zwischen verschiedenen Ähnlichkeits- bzw. Distanzmaßen ausgewählt werden, die jeweils den Abstand zwischen Orten, d.h. zwischen Spaltenvektoren definieren:

RIW - relativer Identitätswert (simple matching coefficient)
GIW - gewichteter Identitätswert; hier geht die Frequenz der einzelnen Taxate in die Berechnung mit ein
DEM - durchschnittliche Euklidische Distanz

Die Ergebnisse der Distanzberechnung, i.e. die Ähnlichkeit jedes Ortes (Variable) zu allen anderen Orten, werden als Prozentwerte in eine Distanzmatrix eingetragen. Diese ist wegen der Reflexivität der in der Dialektometrie verwendeten Ähnlichkeitsmaße eine symmetrische N * N Matrix (d.h. gleiche Werte über und unter der Diagonale) mit N=Anzahl der Orte. Aus einer Datenmatrix können durch Wahl verschiedener Ähnlichkeitsmaße mehrere Matrizen erzeugt werden.

3) Numerische Klassifikation

Solchermaßen erzeugte Ähnlichkeitsmatrixen können in VDM unmittelbar visualisiert werden; im einfachsten Fall als Ähnlichkeitsprofil: Eine Zeile der Ähnlichkeitsmatrix enthält die dialektale Ähnlichkeit des Referenzorts (nächste Abb.: Sartrouvill, ALF Nr. 227, Distanzmaß RIW) zu allen andern Orten. Auf der Karte erscheinen Nachbarn mit hoher Ähnlichkeit (84-92%) rot, weiter entfernte in orange, gelb usw. bis zu den weitest entfernten in dunkelblau. Zur Segmentierung der Ähnlichkeitswerte bietet VDM 3 Segmentierungsalgorithmen an, die sich in den letzten 15 Jahren in der Dialektometrie etabliert haben – hier wird MINMWMAX verwendet mit gleicher Segmentbreite unter bzw. über dem Mittelwert.

Der Wechsel des Referenzorts durch Klick in die interaktive Karte zeigt das Ähnlichkeitsprofil eines anderen Referenzorts. So lassen sich Dialektlandschaften erforschen. Man findet große Flächen mit vielen unmittelbaren Nachbarn (z.B. die bekannte Opposition Nord-Süd, langue d'oil-langue d'oc), Enklaven mit wenigen „Freunden“ (z.B. Aosta), Übergangszonen und sogar Sprachinseln.
Darüber hinaus sind synoptische Auswertungen der Ähnlichkeitsmatrix möglich (Minimum, Maximum, Mittelwert, Sandardabweichung, Schiefe, Clusteranalyse - in Arbeit) sowie Visualisierungen mit verschiedenen Kartentypen (Ähnlichkeitsprofil - siehe oben, Isoglossenkarten, Dendrogramm der Clusteranalyse in Arbeit).

Bemerkungen und Vorschläge bitte an: Edgar Haimerl

Letzte Änderung / aggiornato al: