Gesetz der Verteilung von Schriftzeichen verschiedener KomplexitätDas Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität sagt aus, dass Schriftzeichen verschiedener Komplexitätsgrade in Texten gemäß einem theoretisch begründbaren Sprachgesetz verwendet werden. Komplexität von SchriftzeichenSchaut man sich geschriebene Texte an, so ist deutlich, dass Schriftzeichen wie etwa das <o> relativ einfach oder solche wie das <m> recht komplex gestaltet sein können, wenn man als Kriterium für die Komplexität zum Beispiel die Zahl der Richtungsänderungen im Verlauf des Schriftzeichens annimmt. Deutlicher als in der lateinischen Schrift sind die Unterschiede jedoch in der chinesischen oder der japanischen Schrift. In diesen Fällen kann als Kriterium für die Komplexität die Zahl der Striche oder der Komponenten, aus denen die einzelnen Schriftzeichen bestehen, gewählt werden. Gesetz der Verteilung von Schriftzeichen verschiedener KomplexitätDas Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität besagt nun, dass Schriftzeichen, die aus unterschiedlichen Mengen von Strichen oder Komponenten bestehen, in Texten nicht chaotisch, sondern gesetzmäßig verteilt sind. Es handelt sich dabei im Prinzip um das gleiche Sprachgesetz, das die Quantitative Linguistik besonders für die Häufigkeitsverteilung der Wortlängen entwickelt hat (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u. a.[1]). Verteilung der Schriftzeichen im ChinesischenSchriftzeichen sind im Chinesischen hierarchisch organisiert: Sie bestehen zunächst aus einer oder mehreren Komponenten, die Komponenten wiederum aus einem oder mehreren einzelnen Strichen. Untersuchungen zur Verteilung von Schriftzeichen unterschiedlicher Komplexität im Chinesischen wurden auf folgende Weisen durchgeführt:
[3] (Dabei ist x: Zahl der Striche pro Schriftzeichen, n(x) die in diesem Text beobachtete Zahl der Schriftzeichen mit x Strichen; NP(x) die Zahl der Schriftzeichen mit x Strichen, die berechnet wird, wenn man die 1-verschobene Binomial-Verteilung an die beobachteten Daten anpasst. Ergebnis: die 1-verschobene Binomial-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0,34, wobei P als gut erachtet wird, wenn es größer/gleich 0,05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)
Verteilung der Komplexität der geschriebenen Wörter im JapanischenBei einer Untersuchung zum Japanischen spielte die Komplexität der Kanji-Zeichen nur indirekt eine Rolle. Hier wurde vielmehr die Wortkomplexität untersucht, wobei Wörter mit x = 1 – 5 Strichen, x = 6 – 10 Strichen und so weiter klassifiziert wurden. Das Beispiel hat Sanada anhand eines Wörterbuchausschnitts erarbeitet[6]:
(Dabei ist x: Zahl der Striche pro Wort, n(x) die in diesem Text beobachtete Zahl der Wörter mit x Strichen; NP(x) die Zahl der Wörter mit x Strichen, die berechnet wird, wenn man die Conway-Maxwell-Poisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: die Conway-Maxwell-Poisson-Verteilung ist für Wortschatzausschnitt ein gutes Modell mit dem Testkriterium P = 0,28, wobei P als gut erachtet wird, wenn es größer/gleich 0,05 ist. (Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.) Ein allgemeines SprachgesetzMit diesen Untersuchungen, die noch nicht sehr reichhaltig sind, deutet sich an, dass auch für die Schriftzeichen unterschiedlicher Komplexität im Prinzip die gleichen Gesetzmäßigkeiten gelten, die auch schon für die gut erforschten Wortlängen und etliche andere Sprachgrößen gelten. Bearbeitet man, wie im vorigen Abschnitt am Beispiel des Japanischen dargestellt, die Verteilung unterschiedlich komplexer Wörter in ihrer schriftlichen Form, kommt man zu einem vergleichbaren Ergebnis. Siehe dazu auch:
Literatur
Einzelnachweise
Weblinks |
Portal di Ensiklopedia Dunia