Worthäufigkeit

Die Worthäufigkeit (Wortfrequenz) ist eine statistische Größe, die angibt, wie oft ein bestimmtes Wort in einem Text oder Textkorpus vorkommt. Sie kann als absolute Anzahl oder in Relation zur Gesamtzahl der Wörter des Textes angegeben werden. Die Häufigkeitsverteilung der Wörter hängt von der Sprache, der Art und dem Fachgebiet des untersuchten Textes ab. Die Worthäufigkeit wird in Häufigkeitswörterbüchern für den Wortschatz einer Sprache oder auch von Texten dargestellt.

Gesetzmäßigkeit der Worthäufigkeiten

Vorkommenshäufigkeit von Personalpronomina im Serbokroatischen

Bereits 1928 stellte E. V. Condon eine die Verteilung von Worthäufigkeiten beschreibende Gleichung auf. 1979 publizierte Hartvig Dahl eine Häufigkeitstabelle für Wörter in gesprochenem Englisch und 1982 erschien eine syntaktisch bereinigte Auszählung englischer Worthäufigkeiten von W. Nelson Francis und Henry Kučeras.[1] Stellt man zu einem Text oder Textkorpus die Wörter, geordnet nach ihren Häufigkeiten, zusammen, so gilt für diese Zusammenstellung eine Ranghäufigkeitsverteilung, deren einfachste Form das Zipfsche Gesetz darstellt. Wegen Problemen mit den häufigsten und den seltensten Wörtern bei der Anwendung dieses Gesetzes wurden eine Reihe weiterer Vorschläge dazu entwickelt. Wichtig ist dabei aber vor allem, dass die Worthäufigkeiten bestimmten Gesetzen folgen. Für den Wortschatz von Goethes Erlkönig haben Altmann & Altmann gezeigt, dass die sogenannte Zipf-Mandelbrot-Verteilung ein gutes Modell ist;[2] das Gleiche lässt sich für einen Text aus den Sudelbüchern von Lichtenberg nachweisen. Diese Ranghäufigkeitsverteilungen gehören zu den bekanntesten und ältesten Errungenschaften der Quantitativen Linguistik.[3]

Anwendungsgebiete

Siehe auch

Weblinks

Wiktionary: Worthäufigkeit – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. George A. Miller: Wörter. Streifzüge durch die Psycholinguistik. Herausgegeben und aus dem Amerikanischen übersetzt von Joachim Grabowski und Christiane Fellbaum. Spektrum der Wissenschaft, Heidelberg 1993; Lizenzausgabe: Zweitausendeins, Frankfurt am Main 1995; 2. Auflage ebenda 1996, ISBN 3-86150-115-5, S. 303 und 304.
  2. Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. RAM-Verlag, Lüdenscheid 2008, S. 86–89. ISBN 978-3-9802659-5-9.
  3. Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3. stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, S. 77–80. ISBN 3-933043-17-4.

Auf dieser Seite verwendete Medien

Personal pronouns.jpg
Autor/Urheber: Snježana Kordić , Lizenz: CC BY 3.0
Frequency of personal pronouns in Serbo-Croatian from Snježana Kordićʼs book Wörter im Grenzbereich von Lexikon und Grammatik im Serbokroatischen, Munich 2001, diagram on p. 12 or its Serbo-Croatian translation: Riječi na granici punoznačnosti, Zagreb 2002, diagram on p. 13