Gesetz der WortschatzdynamikUnter Wortschatzdynamik (oft auch als Informationsfluss angesprochen) ist das Vorkommen neuer Wörter im Textverlauf zu verstehen. UntersuchungMan kann einen Text daraufhin untersuchen, wann zum ersten Mal ein Wort vorkommt, das bis dahin im Textverlauf noch nicht zu beobachten war. Das erste Wort kommt natürlich auch zum ersten Mal vor; bald aber setzen Wiederholungen ein: Ein Wort tritt zum zweiten, dritten etc. Mal auf. Man kann erwarten, das neue Wörter, also solche mit erstmaligem Vorkommen im Verlauf eines Textes, seltener werden, da die Wortwiederholungen ja zunehmen werden. Eine GesetzeshypotheseFür diesen Fall hat Altmann die Gleichung y = axb als Gesetzesvorschlag begründet und abgeleitet.[1] Verfahren und ErgebnisseDie Untersuchung kann auf zweierlei Weise vorgenommen werden: 1. Man stellt Wort für Wort fest, ob es sich um ein erstes oder schon um ein wiederholtes Vorkommen handelt; Altmann hat dieses Verfahren am Beispiel der Ballade Erlkönig dargestellt und mit Erfolg getestet.[2] 2. Man teilt den zu untersuchenden Text in gleich große Textblöcke ein und untersucht dann, wie viele neue Wörter in Textblock x verglichen mit allen vorherigen vorkommen. Das Verfahren wurde an Georg Büchner, Der hessische Landbote erprobt und ebenfalls mit Erfolg getestet.[3] In beiden Fällen handelt es sich um vergleichsweise kurze Texte; mit dem Textblock-Verfahren wurden auch ein wesentlich längerer Text, Gottfried August Bürgers Münchhausen,[4] und weitere Texte[5] untersucht und mit ebenfalls sehr gutem Testergebnis bearbeitet. Die oben genannte Gleichung ist nicht die einzig mögliche. Altmann & Altmann führen ebenfalls anhand des Erlkönigs weitere Modelle mit Testergebnissen an.[6] Ein BeispielDas folgende Beispiel stellt die Auswertung eines Prosatextes von Jägersberg[7] vor, der 8006 Textwörter und 2320 verschiedene Wortformen enthält. Der laufende Text wurde in Textblöcke zu je 500 Wörtern eingeteilt und daraufhin untersucht, wie viele neue Wortformen von Textblock zu Textblock dazukommen. An diese Datei wurde dann die oben genannte Gleichung angepasst.[8]
(Dabei ist x die laufende Nummer der Textblöcke, n(x) die in Textblock x beobachtete Zahl der erstmals auftretenden Wortformen; NP(x) die Zahl der neu auftretenden Wortformen, die berechnet wird, wenn man die obige Gleichung an die beobachteten Daten anpasst. Die Anpassung gelingt mit D = 0,91, einem sehr guten Testergebnis. Textblock 17 bleibt dabei unberücksichtigt, weil er zu wenige Wörter enthält.) Stellt man sich das Ergebnis in Form einer Graphik vor, so stehen die berechneten Werte für eine immer flacher werdende Kurve, um die die beobachteten Werte etwas schwanken. Die Tendenz, dass mit fortlaufendem Text das Vorkommen neuer Wortformen abnimmt, ist aber deutlich. Dieses Ergebnis wird von einer ganzen Reihe weiterer Textauswertungen immer wieder bestätigt.[9] Siehe auchEinzelnachweise
|
Portal di Ensiklopedia Dunia