Liste der häufigsten Wörter der deutschen Sprache

Die Liste der häufigsten Wörter der deutschen Sprache beruht auf statistischen Auswertungen von Publikationen in deutscher Sprache.

Eine im Kaedings Häufigkeitswörterbuch 1897 publizierte Auszählung von rund elf Millionen Wörtern ergab, dass nur 207 Wortformen nach ihrer Häufigkeit (Okkurrenz) über 50 Prozent der deutschen Schriftsprache ausmachen.[1] Eine solche Liste ist vor allem für die Linguistik, Kryptoanalyse und Textkompression interessant. Es sei darauf hingewiesen, dass hier die Häufigkeit von Wörtern (grammatisches Wort: Wortform) und nicht von Worten (semantisches Wort: Wortparadigma oder Lemma) ermittelt wurde und ein Rückschluss auf die Größe des Wortschatzes daher nur begrenzt möglich ist. Eine die Verteilung von Worthäufigkeiten beschreibende Gleichung hatte 1928 E. V. Condon[2] aufgestellt.

Die 207 häufigsten Wortformen im Deutschen (1897, Häufigkeitswörterbuch von F. W. Kaeding)

30 Formen stellen 31,8 % der Wörter
die, der, und, in, zu, den, das, nicht, von, sie,
ist, des, sich, mit, dem, dass, er, es, ein, ich,
auf, so, eine, auch, als, an, nach, wie, im, für

Diese Formen (mit Ausnahme der Form eine) sind wie nach dem Zipf’schen Gesetz zu erwarten einsilbig und höchstens fünf Buchstaben lang. Als Wortklassen sind vorwiegend Partikeln, insbesondere Konjunktionen und Präpositionen, sowie Personalpronomen und Artikel vertreten, beispielsweise alle einsilbigen Formen des bestimmten Artikels. Als einziges Verb taucht sein in der 3. Person Singular Präsens Indikativ (ist) auf. Die einzige Wortform in dieser Liste, die durch die Rechtschreibreform von 1996 beeinflusst wurde, ist dass.

Weitere 70 Formen stellen nochmals 15,3 % der Wörter
man, aber, aus, durch, wenn, nur, war, noch, werden, bei,
hat, wir, was, wird, sein, einen, welche, sind, oder, zur,
um, haben, einer, mir, über, ihm, diese, einem, ihr, uns,
da, zum, kann, doch, vor, dieser, mich, ihn, du, hatte,
seine, mehr, am, denn, nun, unter, sehr, selbst, schon, hier,
bis, habe, ihre, dann, ihnen, seiner, alle, wieder, meine, Zeit,
gegen, vom, ganz, einzelnen, wo, muss, ohne, eines, können, sei

Das häufigste Substantiv ist nach dieser Zählung Zeit, allerdings wird bei der Zählung allgemein nicht zwischen Groß- und Kleinschreibung unterschieden, was das Ergebnis verfälschen kann. Als weiterer Verbalstamm zeigt sich haben in verschiedenen Formen.

Weitere 107 Formen stellen dann 7,25 % der Wörter
ja, wurde, jetzt, immer, seinen, wohl, dieses, ihren, würde, diesen,
sondern, weil, welcher, nichts, diesem, alles, waren, will, Herr, viel,
mein, also, soll, worden, lassen, dies, machen, ihrer, weiter, Leben,
recht, etwas, keine, seinem, ob, dir, allen, großen, Jahre, Weise,
müssen, welches, wäre, erst, einmal, Mann, hätte, zwei, dich, allein,
Herren, während, Paragraph, anders, Liebe, kein, damit, gar, Hand, Herrn,
euch, sollte, konnte, ersten, deren, zwischen, wollen, denen, dessen, sagen,
bin, Menschen, gut, darauf, wurden, weiß, gewesen, Seite, bald, weit,
große, solche, hatten, eben, andern, beiden, macht, sehen, ganze, anderen,
lange, wer, ihrem, zwar, gemacht, dort, kommen, Welt, heute, Frau,
werde, derselben, ganzen, deutschen, lässt, vielleicht, meiner

Als erstes Vollverb erscheint sagen in der Liste, während wissen nicht vom Farbnamen in weiß getrennt gezählt ist. Die Okkurrenz von Paragraph deutet auf ein Korpus hin, das zu einem signifikanten Teil aus juristischen Texten besteht.

Die hundert häufigsten Wörter im Deutschen

Diese Liste der Universität Leipzig (2001, Uni Leipzig, Deutschland-Korpus[3]) stammt aus dem Jahr 2001 und enthält deshalb und auch weil das Korpus aus Deutschland ist, noch das Wort Mark, das zudem weiterbestehende Bedeutungen hat.[4] Die gesprochene Sprache ist nicht berücksichtigt. Manche Wortformen wie Artikel tauchen doppelt auf, da die Großschreibung (am Satzanfang) berücksichtigt wird.

Platz 1–10
PlatzWort
1der
2die
3und
4in
5den
6von
7zu
8das
9mit
10sich
Platz 11–20
PlatzWort
11des
12auf
13für
14ist
15im
16dem
17nicht
18ein
19Die
20eine
Platz 21–30
PlatzWort
21als
22auch
23es
24an
25werden
26aus
27er
28hat
29dass
30sie
Platz 31–40
PlatzWort
31nach
32wird
33bei
34einer
35Der
36um
37am
38sind
39noch
40wie
Platz 41–50
PlatzWort
41einem
42über
43einen
44Das
45so
46Sie
47zum
48war
49haben
50nur
Platz 51–60
PlatzWort
51oder
52aber
53vor
54zur
55bis
56mehr
57durch
58man
59sein
60wurde
Platz 61–70
PlatzWort
61sei
62In
63Prozent
64hatte
65kann
66gegen
67vom
68können
69schon
70wenn
Platz 71–80
PlatzWort
71habe
72seine
73Mark
74ihre
75dann
76unter
77wir
78soll
79ich
80eines
Platz 81–90
PlatzWort
81Es
82Jahr
83zwei
84Jahren
85diese
86dieser
87wieder
88keine
89Uhr
90seiner
Platz 91–100
PlatzWort
91worden
92Und
93will
94zwischen
95Im
96immer
97Millionen
98Ein
99was
100sagte

Weitere Listen

Im Duden-Korpus ist das häufigste Substantiv „Jahr“. Es folgen „Euro“, „Uhr“, „Prozent“ und „Deutschland“. Das Häufigkeitswörterbuch von Randall Jones und Erwin Tschirner 2015 wiederum umfasst gesprochenes und geschriebenes Deutsch. Gesprochenes basierend unter anderem auf in Deutschland erschienenen Fernsehsendungen. Auf Grund der Wahl der Korpora zeigt sich auch, dass derartige Häufigkeitslisten eher deutschlandlastig sind, in Österreich oder in der Schweiz würde das teils anders ausfallen („Mark“/„Euro“, „Paragraph“, „Deutschland“ usw.).

Für das Schweizer Hochdeutsch ist keine eigene Statistik bekannt.[5]

Die häufigsten Substantive, Verben, Adjektive, Pronomen und Zahlen

Bei den Substantiven, Verben und Adjektiven werden nur die jeweiligen Grundformen angegeben. Es wurde festgestellt, welches Wort häufig vorkam, und dessen Grundwort in der Liste vermerkt. Bei den Pronomen wurden die groß geschriebenen Höflichkeitsformen nicht berücksichtigt. Bei den Zahlwörtern konnten die Formen der Zahl eins nicht von denen des indefiniten Artikels unterschieden werden.

Literatur

  • Friedrich Wilhelm Kaeding (Hrsg.): Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographie-Systeme. (= Grundlagenstudien aus Kybernetik und Geisteswissenschaft. Band 4). Schnelle, Quickborn bei Hamburg 1963, S. 648–671 (Faksimile-Druck der Originalausgabe, Selbstverlag des Herausgebers, Steglitz bei Berlin 1897. 55 Seiten; Beiheft zu Band 4).
    • 1. Teil: Wort- und Silbenzählungen (auszugsweise Reproduktion).
    • 2. Teil: Buchstabenzählungen (Auszug aus dem Nachtrag).
  • Arno Ruoff (Hrsg.): Häufigkeitswörterbuch gesprochener Sprache. Gesondert nach Wortarten alphabetisch, rückläufig-alphabetisch und nach Häufigkeit geordnet. Unter Mitarbeit von Harald Fuchs (= Idiomatica. Band 8). 2. unveränderte Auflage. Niemeyer, Tübingen 1990, ISBN 3-484-24008-3 (517 S.).
  • Werner König: dtv-Atlas zur deutschen Sprache (= dtv. Band 3025). 10., überarbeitete Auflage. Deutscher Taschenbuch-Verlag, München 1994, ISBN 3-423-03025-9, Worthäufigkeit, S. 114–115 (256 S.).
  • Helmut Meier: Deutsche Sprachstatistik. Mit einem Geleitwort von Lutz Mackensen. Georg Olms, Hildesheim 1967.
    • Band 1: Bausteine zu einer vergleichenden Sprachstatistik. 2., erweiterte und verbesserte Auflage, XIII, 406 S.
    • Band 2: Relative Häufigkeitswerte zu den 512 häufigsten deutschen Wortformen, 150 S.
  • Helmut Meier: Deutsche Sprachstatistik. 2. erweiterte Auflage. 2 Bände in 1 Band. Georg Olms, Hildesheim 1978 (422 und 150 Seiten).
  • Günther Thomé, Dorothea Thomé: Häufige Wörter. Basiskonzept Rechtschreiben. Was ist einfach? Was ist schwierig? 3., erweiterte Aufl. (kompl. Ökoproduktion). Oldenburg: isb-Fachverlag 2021 (ISBN 978-3-942122-25-2, 68 Farbseiten, 6,80 €, Leseprobe unter: www.isb-oldenburg.de).

Siehe auch

Weblinks

Nachweise

  1. Anmerkung: Kaedings Häufigkeitswörterbuch wurde nach jahrelangen Zählungen im Jahr 1897 veröffentlicht.
  2. George A. Miller: Wörter. Streifzüge durch die Psycholinguistik. Herausgegeben und aus dem Amerikanischen übersetzt von Joachim Grabowski und Christiane Fellbaum. Spektrum der Wissenschaft, Heidelberg 1993; Lizenzausgabe: Zweitausendeins, Frankfurt am Main 1995; 2. Auflage ebenda 1996, ISBN 3-86150-115-5, S. 303.
  3. Vgl. Wortschatz-Portal der Universität Leipzig.
  4. http://pcai056.informatik.uni-leipzig.de/downloads/etc/legacy/Papers/top1000de.txt
  5. Welches ist das häufigste Substantiv im Deutschen? In: Tages-Anzeiger. ISSN 1422-9994 (tagesanzeiger.ch [abgerufen am 11. November 2020]).