Grundgesamtheit

Die Grundgesamtheit (auch Population, statistische Masse, Kollektiv oder Gesamterhebungsumfang[1][2]) ist ein Begriff der Statistik. Die Grundgesamtheit bezeichnet diejenige Menge aller Objekte, über die eine Aussage getroffen werden soll.[3] Grundgesamtheiten werden häufig nur unvollständig erfasst und lediglich näherungsweise beschrieben, etwa durch eine Teilerhebung in der deskriptiven Statistik oder eine stichprobenhafte Erhebung mittels der Stochastik.

Definition

In der Statistik bezeichnet die Grundgesamtheit die Menge aller statistischen Einheiten (auch Merkmalsträger, Untersuchungseinheiten, Erhebungseinheiten)[4][5] mit übereinstimmenden Identifikationskriterien (sachlich, räumlich und zeitlich).[1] Die statistische Einheit ist Träger der Informationen für die statistische Untersuchung. Statistische Einheiten können natürliche Einheiten (Personen, Tiere, Pflanzen, Werkstücke), aber auch künstliche Einheiten, zum Beispiel sozio-ökonomische Einheiten (Familien, Haushalte, Unternehmen) oder Ereignisse, sein.[4][6]

„Eine Grundgesamtheit kann endlich oder unendlich viele Elemente enthalten. Theoretische Grundgesamtheiten sind oft (überabzählbar) unendlich, wie z. B. bei stetigen Zufallsvariablen. Reale Grundgesamtheiten sind meistens sehr groß, aber immer endlich.“[7] Dementsprechend unterscheidet man auch endliche Grundgesamtheiten und unendliche Grundgesamtheiten. Man spricht auch von einer geschlossenen Grundgesamtheit und einer offenen Grundgesamtheit.[8] „Die endliche Grundgesamtheit wird als eine geschlossene, die unendliche als eine offene bezeichnet.“[9]

Erfassung und Erhebung von Grundgesamtheiten

Vollständige Erfassung von Grundgesamtheiten

Die vollständige Erfassung von Grundgesamtheiten ist mittels der deskriptiven Statistik möglich. Sie wird auch als Vollerhebung oder Totalerhebung[10] bezeichnet, wobei der Begriff Erhebung in diesem Fall irreführend ist, da er aus der Empirie stammt.

Ein Beispiel für eine vollständig erfassbare Grundgesamtheit sind alle Personen (statistische Einheiten), die am 1. Januar 2009 (zeitliche Identifikation) mit ihrem Hauptwohnsitz (sachliche Identifikation) in Berlin (örtliche Identifikation) gemeldet sind.

Ein Hinweis, dass die Datenerfassung keine Vollerhebung darstellt, ist die Antwort auf die Frage: Würde eine Wiederholung der Erhebung dieselben Daten liefern? Beispielsweise: Messdaten sind selten eine Vollerhebung, da sie bei der Wiederholung in der Praxis zeitlich oder örtlich versetzt genommen würden. Das ist insbesondere dann der Fall, wenn die Daten automatisch durch eine kontinuierliche Messung mit einer zeitlichen Abtastung erzeugt werden, oder wenn für die Erhebung manuell Proben aus einem Prozess entnommen werden.

Je nachdem, wie die Eingrenzung der Grundgesamtheit über ein zeitliches Kriterium erfolgt, spricht man entweder von Bestandmassen oder von Bewegungsmassen:[4]

Bestandmasse
Von einer Bestandmasse spricht man, wenn zu einem festen Zeitpunkt der Bestand an Merkmalsträgern festgelegt wird. Dies ist bei Merkmalsträgern mit einer bestimmten Verweildauer sinnvoll („z. B. der Lagerbestand einer Firma am 31. Dezember 2006“).[4]
Bewegungsmasse
Von einer Bewegungsmasse spricht man, wenn die Elemente Ereignisse sind, deren Menge durch Angabe eines bestimmten Zeitraumes eingegrenzt wird („z. B. die Anzahl der Geburten in einer Stadt im Jahre 2006“).[4]

Auch Meinungsumfragen können Grundgesamtheiten unter Umständen vollständig abbilden. Dies ist dann möglich, wenn alle statistischen Einheiten auch tatsächlich befragt werden, etwa eine Meinungsumfrage in einem Sportverein, die ausschließlich die Meinung dieses einen Sportvereins abbilden soll (und nicht etwa daraus auf die Meinung in anderen Sportvereinen geschlossen wird). Beispiele für die vollständige Erfassung großer Grundgesamtheiten sind Volkszählungen sowie die Stimmenauszählung bei überregionalen Wahlen.

Grundgesamtheiten sind oftmals sehr groß und nur mit großem Aufwand oder gar nicht erfassbar. Wird die vollständige Erfassung mittels der deskriptiven Statistik nicht erreicht, spricht man von einer Teilerhebung.[11]

Erhebung mittels Stochastik

Um Grundgesamtheiten, die nicht vollständig erfasst wurden, zumindest näherungsweise zu beschreiben, werden Methoden der Stochastik, insbesondere der mathematischen Statistik, angewendet. Dabei wird auf Basis der Datenerhebung aus einer Stichprobe, die für die Grundgesamtheit als repräsentativ angenommen wird, auf die tatsächliche, gesuchte Grundgesamtheit geschlossen. Diese wird in der empirischen Forschung unter anderem als Population oder Zielpopulation (englisch target population) bezeichnet.

Zum Beispiel wird in der Wahlforschung nicht die gesamte wahlberechtigte Bevölkerung nach ihrer Parteienpräferenz befragt, sondern eine Stichprobe erhoben, die in ihren Eigenschaften (Alter, Geschlecht, Wohnsitz usw.) die Verhältnisse widerspiegelt, die in der Grundgesamtheit vorliegen. Die durch Befragung mittels Stichprobe erfassten Daten werden mit Hilfe statistischer Verfahren auf die Grundgesamtheit hochgerechnet und ergeben so eine Wahlprognose. Die Grundgesamtheit ist in diesem Fall definiert als die Anzahl an Personen, die zu einem bestimmten Wahltermin ihre Stimme einer bestimmten Partei (Identifikationsmerkmal) geben werden. Eine vollständige Erfassung der Grundgesamtheit erfolgt in diesem Fall aber ebenfalls, durch das Auszählen aller abgegebenen Stimmen nach der tatsächlich erfolgten Wahl. An diesem Beispiel wird auch deutlich, dass die empirische Beschreibung von Grundgesamtheiten nicht immer unabhängig von der tatsächlichen Grundgesamtheit ist: Allein die Erhebung von Wahlprognosen kann das Wahlverhalten und somit die tatsächlichen Grundgesamtheiten beeinflussen. Der Effekt ist nur schwer charakterisierbar und gilt nicht zuletzt deshalb als unerwünscht bei demokratischen Wahlen. Er wird so gut es geht vermieden, indem beispielsweise keine Wahlprognosen veröffentlicht werden, während gewählt wird.

Die definierte Zielpopulation (z. B. alle Deutschen ab 18 Jahren) ist oft nicht identisch mit der faktischen Grundgesamtheit, aus der die Stichprobe, beispielsweise für eine Wahlumfrage, gezogen wird.[12] Das liegt daran, dass manche Elemente der Grundgesamtheit gar keine oder eine kleinere Chance haben, in die Stichprobe zu gelangen, als andere. Dazu gehören Menschen in Anstalten (z. B. Studentenwohnheimen, Strafanstalten, Kasernen), mobile Personen wie Binnenschiffer, aber auch manche Obdachlose (Undercoverage). In der Praxis wird der Schluss von der Stichprobe auf die Zielpopulation zusätzlich durch Nonresponse (auch bezeichnet als Dropout) erschwert. Darunter versteht man das Nichtantworten auf eine Befragung durch Elemente der Grundgesamtheit, die bereits in die Stichprobe gelangt sind.

Einzelnachweise

  1. a b Georg Bol: Deskriptive Statistik: Lehr- und Arbeitsbuch. 6. Auflage. Oldenbourg Wissenschaftsverlag, München 2004, ISBN 3-486-57612-7, S. 9–15 (eingeschränkte Vorschau in der Google-Buchsuche).
  2. Manfred Kühlmeyer: Statistische Auswertungsmethoden für Ingenieure. Springer, 2001, ISBN 3-540-41097-X (online [abgerufen am 13. September 2012]).
  3. Göran Kauermann, Helmut Küchenhoff: Stichproben. Methoden und praktische Umsetzung mit R. 1. Auflage. Springer, Berlin Heidelberg 2011, ISBN 978-3-642-12317-7, S. 5 (eingeschränkte Vorschau in der Google-Buchsuche).
  4. a b c d e Peter Pflaumer, Joachim Hartung, Barbara Heine: Statistik für Wirtschafts- und Sozialwissenschaften. Deskriptive Statistik. 3. Auflage. Oldenbourg Wissenschaftsverlag, München 2005, ISBN 978-3-486-57779-2, S. 13 (eingeschränkte Vorschau in der Google-Buchsuche).
  5. Peter P. Eckstein: Repetitorium Statistik. 6. Auflage. Gabler, 2006, S. 4.
  6. Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Wissenschaftlicher Verlag Harri Deutsch, München 2008, ISBN 978-3-8171-1827-4, S. 11 (eingeschränkte Vorschau in der Google-Buchsuche).
  7. Walter Assenmacher: Induktive Statistik. 1. Auflage. Springer, Berlin 2000, ISBN 978-3-540-67145-9, S. 185 (eingeschränkte Vorschau in der Google-Buchsuche).
  8. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. 12. Auflage. Springer, Berlin 2006, ISBN 978-3-540-32160-6, S. 12 (eingeschränkte Vorschau in der Google-Buchsuche).
  9. Käthe Schneider: Die Teilnahme und die Nicht-Teilnahme Erwachsener an Weiterbildung. Theorieartige Aussage zur Erklärung der Handlungsinitiierung. 12. Auflage. Klinkhardt, Bad Heilbrunn 2004, ISBN 978-3-7815-1338-9, S. 51 (eingeschränkte Vorschau in der Google-Buchsuche).
  10. Karl Bosch: Basiswissen Statistik: Einführung in die Grundlagen der Statistik mit zahlreichen Beispielen, Übungsaufgaben und Lösungen. Oldenbourg Wissenschaftsverlag, München 2007, ISBN 978-3-486-58253-6, S. 6 (eingeschränkte Vorschau in der Google-Buchsuche).
  11. Peter Pflaumer, Joachim Hartung, Barbara Heine: Statistik für Wirtschafts- und Sozialwissenschaften. Deskriptive Statistik. 3. Auflage. Oldenbourg Wissenschaftsverlag, München 2005, ISBN 978-3-486-57779-2, S. 11 (eingeschränkte Vorschau in der Google-Buchsuche).
  12. Rainer Schnell: Zur faktischen Grundgesamtheit bei „allgemeinen Bevölkerungsumfragen“: Undercoverage, Schwererreichbare und Nichtbefragbare. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie. Band 43. Oldenbourg Wissenschaftsverlag, München 1991, S. 106–137.