Gewichtung der SOEP-CoV-Studie
Rainer Siegers, Hans Walter Steinhauer, Sabine Zinn
Zuletzt aktualisiert am 06.08.2020
1 Übersicht
Das Sozio-Oekonomische Panel (SOEP) ist eine Längsschnittstudie am Deutschen Institut für Wirtschaftsforschung (DIW Berlin), die beginnend im Jahr 1984, eine jährliche Befragung von Haushalten und deren Haushaltsmitgliedern in Deutschland durchführt. Somit können anhand von Daten des SOEP Verläufe und Veränderungen durch externe Einflüsse sehr gut beschrieben und analysiert werden. Im Frühjahr 2020 wurden die SOEP Haushalte neben der regulären, persönlichen Befragung zusätzlich telefonisch (d.h. in einem CATI) zu ihren Erfahrungen durch die Corona-Krise befragt. Weitere Informationen zum Design und der Inhalte der SOEP-CoV-Studie bieten Kühne et al. (2020). Die Ergebnisse und Spotlights der Studie werden unter www.soep-cov.de gesammelt.
Der zuletzt veröffentlichte Scientific Use File (SUF) des SOEP in der Version 35 umfasst die Erhebungsjahre von 1984 bis einschließlich 2018. Die Daten aus dem Erhebungsjahr 2019 liegen der SOEP Abteilung im DIW Berlin ebenfalls vor, sind allerdings noch nicht aufbereitet und veröffentlicht. Aufgrund von Zuzügen zu und Auszügen aus Haushalten, ebenso wie durch Geburten neuer Personen in den Haushalt und das Sterben von Haushaltsmitgliedern verändert sich die Zusammensetzung der Haushalte über die Zeit. Zudem ist es möglich, dass Haushalte oder einzelne Haushaltsmitglieder in einem Erhebungsjahr ihre Teilnahme aussetzen. Aufgrund all dieser Veränderungen in Haushaltsstrukturen, werden für die SOEP-CoV-Studie diejenigen Haushalte ausgewählt, die in den Erhebungsjahren 2018 und 2019 mindestens an einer Erhebung teilgenommen haben und bis zum Feldbeginn 2020 nicht explizit ihre Teilnahme verweigert haben. Von den verbleibenden Haushalten werden darüber hinaus folgende Haushalte ausgeschlossen:
- Haushalte der Geflüchteten-Stichproben M3, M4 und M5. Diese werden im Rahmen einer gesonderten Befragung unter der Verantwortung des Instituts für Arbeitsmarkt und Berufsforschung (IAB) telefonisch zu ihren Erfahrungen in der Corona-Krise befragt.
- Haushalte der Stichproben, die 2019 erstmals befragt wurden (d.h. die Teilstichproben P und Q), um deren Teilnahmebereitschaft an der regulären 2. Welle nicht zu gefährden.
- Haushalte der sogenannten “zentralen Bearbeitung”. Die “zentrale Bearbeitung” des SOEP Erhebungsinstituts (Kantar Public) kümmert sich um Haushalte, die über die üblichen Kontaktwege des SOEP (nämlich über Interviewer) nicht kontaktiert werden wollen oder können. Die Befragten der “Zentralen Bearbeitung” werden in der Regel telefonisch kontaktiert und füllen den Fragebogen selbständig oder telefonisch assistiert aus. Somit handelt es sich bei den zentral bearbeiteten Haushalten um Haushalte, die bereits im Rahmen der regulären SOEP Befragung eine große Neigung der Nichtteilnahme zeigen. Diese Haushalte sollen durch Sonderbefragungen nicht zusätzlich belastet werden.
- Haushalte ohne gültige Telefonnummer, da diese im Rahmen der SOEP-CoV-Studie nicht telefonisch befragt werden können.
Die Stichprobe der verbleibenden Haushalte wurde hinsichtlich ihrer Zusammensetzung und der Kontaktinformationen durch das Erhebungsinstitut des SOEP auf den Zeitpunkt März 2020 aktualisiert und als Bruttostichprobe für die CoV-Studie an das SOEP zurückgespielt. Diese wurde zufällig auf insgesamt neun Tranchen verteilt. Diese werden zeitlich aufeinander folgend befragt. Dabei sind die Tranchen so konstruiert, dass ihre Stichprobengröße über die Zeit abnimmt. Dieser Ansatz hat der Tatsache Rechnung getragen, dass die Menschen in Deutschland in den ersten Wochen des kompletten Lockdowns (und somit während der Feldzeit der ersten vier Tranchen) den größten Herausforderungen und somit Änderungen im alltäglichen Leben gegenüberstanden.
Die ersten vier Tranchen sind die größten mit einem Befragungszeitraum von jeweils zwei Wochen. Die restlichen fünf Tranchen fallen kleiner aus und ihr Befragungszeitraum erstreckt sich auf eine Woche. Einzelne Interviews konnten erst mit einigen Tagen Verzögerung realisiert werden, so dass die tatsächlichen Befragungszeiträume zwischen den Tranchen nicht disjunkt sind. Die Befragungszeiträume und Stichprobenumfänge sind in Tabelle 1.1 nach den einzelnen Tranchen ausgewiesen.
Tranche | Feldstart | Feldende | Eingesetzt | Erreicht | Realisiert |
---|---|---|---|---|---|
1 | 01.04.2020 | 18.04.2020 | 2.756 | 2.068 | 1.689 |
2 | 14.04.2020 | 02.05.2020 | 3.296 | 2.450 | 1.932 |
3 | 27.04.2020 | 16.05.2020 | 1.767 | 1.310 | 978 |
4 | 11.05.2020 | 30.05.2020 | 1.183 | 871 | 632 |
5 | 25.05.2020 | 06.06.2020 | 608 | 443 | 309 |
6 | 02.06.2020 | 13.06.2020 | 629 | 450 | 303 |
7 | 08.06.2020 | 20.06.2020 | 578 | 409 | 288 |
8 | 15.06.2020 | 27.06.2020 | 598 | 433 | 298 |
9 | 22.06.2020 | 04.07.2020 | 584 | 405 | 265 |
1-9 | 01.04.2020 | 04.07.2020 | 11.999 | 8.839 | 6.694 |
Der Feldstart der SOEP-CoV-Studie war am 1. April 2020 und der letzte Tag der Befragung von Tranche 9 war am 4. Juli 2020. In den Tranchen 1 bis 9 wurden 11.999 Haushalte eingesetzt, wovon 8.839 Haushalte telefonisch erreicht werden konnten und schließlich 6.694 an der SOEP-CoV-Studie teilgenommen haben.
Eine grafische Aufbereitung der Stichprobenumfänge nach Status (Kontaktierbarkeit sowie Teilnahmebereitschaft) und Tranchen findet sich in Abbildung 1.1. Der linke Teil der Abbildung zeigt dabei Verteilung nach Tranche Kontakt- bzw. Teilnahmestatus in absoluten Fallzahlen, der rechte Teil in Anteilen.
Der rechten Abbildung ist zu entnehmen, dass der Anteil der teilnehmenden Haushalte im Zeitverlauf leicht, aber stetig, gesunken ist. (Hier liegt die Vermutung nahe, dass das anfänglich große Interesse in der Bevölkerung am Thema “Corona” über Zeit abgenommen hat.) Der Anteil an Haushalten, die nicht erreicht werden konnten, ist über die Tranchen hinweg indes nahezu unverändert.
2 Ablauf der SOEP-CoV-Gewichtung
Die Gewichtung der SOEP-CoV-Studie verlief in weiten Teilen analog zur Gewichtung des SOEP-Core. Diese wird detailliert von Kroh, Siegers, and Kühne (2015) beschrieben und ist für die aktuelle Version 35 dokumentiert in Siegers, Belcheva, and Silbermann (2020).
Als Ausgangsgewicht für die Gewichtung der Haushalte in der SOEP-CoV-Studie diente das Haushaltsgewicht (hhrf) ihrer letzten realisierten Befragung bis 2018, also in der Regel der SOEP-Welle bi (aus der SOEP SUF Version v35). Dieses wurde für die Haushalte der SOEP-CoV-Studie für aufeinanderfolgende Ausfallschritte auf Haushaltsebene adjustiert und bezüglich verschiedener Populationsverteilungen, die dem Mikrozensus 2018 entnommen wurden, randangepasst.
Ausgehend von diesen Haushaltsgewichten wurden über einen weiteren Randanpassungsschritt Gewichte für alle Personen in den teilnehmenden Haushalten generiert. Für diejenige Person des Haushalts, die an der CATI-Befragung teilgenommen hat, wurde ein weiterer Gewichtungsschritt durchgeführt, der auftretende Selektionseffekte korrigiert.
Die nachfolgende Abbildung 2.1 zeigt schematisch den Ablauf der Gewichtung. Konkret wurden in einem ersten Schritt die Ausgangsgewichte für die Veränderungen zwischen der Zusammensetzung des SOEP im Jahr 2018 und 2020 korrigiert. In diesem Zusammenhang wurden die 2018er SOEP Haushaltsgewichte angepasst um Zugänge zu (Zuzug in bestehende Haushalte, Neugeborene) und Abgänge (Verstorbene, Verweigerer) aus der Stichprobe.
Im darauffolgenden Schritt wurde für die Haushalte korrigiert, die von vornherein von der Teilnahme an der SOEP-CoV-Studie ausgeschlossen waren (siehe Abschnitt 1).
Für eine zeitnahe Verwendung der Daten wurde die Stichprobe der SOEP-CoV-Studie nach Abschluss bestimmter Tranchen jeweils gemeinsam gewichtet. Hierbei wurde der tranchenweise Einsatz berücksichtigt und die Haushalte jeweils auf die Grundgesamtheit hochgerechnet. Insbesondere der Einsatz der Teilstichproben M1 und M2 (Migrationsstichproben), der erst ab der zweiten Tranche stattfand, fand in diesem Schritt Berücksichtigung.
Um eine möglichst heterogene Zahl von verschiedenen Haushaltsmitgliedern zu erreichen, wurden alle Haushalte zu verschiedenen Tageszeiten von 7 Uhr morgens bis 21 Uhr abends angerufen. Generell wurde auch davon ausgegangen, dass aufgrund der Ausgangsbeschränkungen und des erhöhten Anteils an Personen, die durch die Krise im Home Office arbeiteten, Befragungspersonen telefonisch besser zu erreichen sind als vor der Krise. Die entsprechende Verteilung der Anrufe nach Wochentag, Uhrzeit und Anschluss ist in Abbildung 2.2 dargestellt. Dennoch verbleiben zwischen 25 und 31 Prozent der Haushalte, die im jeweiligen Befragungszeitraum nicht erreicht werden konnten (vgl. hierzu Abbildung 1.1 weiter oben). Im dritten Schritt der Gewichtung wurde daher für die Kontaktierbarkeit der Haushalte innerhalb der jeweiligen Befragungszeiträume korrigiert.
Im vierten Schritt wurde schließlich für die Bereitschaft der Haushalte korrigiert, an der SOEP-CoV-Befragung teilzunehmen. Für die SOEP-CoV-Studie konnten innerhalb der einzelnen Tranchen zwischen 69 und 75 Prozent der eingesetzten Haushalte erreicht werden. Über die Tranchen 1 bis 9 hinweg wurden 73 Prozent erreicht. Von den erreichten Haushalten konnten innerhalb der einzelnen Tranchen zwischen 65 und 82 Prozent der Haushalte realisiert werden. Über die Tranchen 1 bis 9 hinweg wurden 72 Prozent realisiert. Somit ergibt sich eine Response Rate nach AAPOR (The American Association for Public Opinion Research 2016) von RR1 = 0,558. Innerhalb der einzelnen Tranchen schwankt sie zwischen 0,454 und 0,613. Diesem Schritt folgt eine Randanpassung auf eine Vielzahl an Populationsverteilungen, siehe Abschnitt 5, der die Gewichtung auf Haushaltsebene abschließt.
Anschließend wurden auf Basis der Haushaltsgewichte über einen weiteren Randanpassungsschritt Hochrechnungsfaktoren für die einzelnen Haushaltsmitglieder erstellt. Das Verfahren und die hierfür verwendeten Randverteilungen sind im Abschnitt 5 genauer beschrieben.
Auf Basis dieses Personengewichts erzeugen wir in einem letzten Schritt Hochrechnungsfaktoren für die auskunftgebende Person eines teilnehmenden Haushalts. In diesem Schritt wird für die selektive (Selbst-)Auswahl der Auskunftsperson bei Haushalten mit mindestens zwei Erwachsenen korrigiert.
3 Merkmale für die Gewichtung
In die Ausfallmodelle (cloglog Regressionen) der SOEP-CoV-Gewichtung gingen über 400 Merkmale auf Haushalts- und Personenebene ein. Der Großteil der Merkmale entstammt den vorangegangenen Wellen der Paneldaten des SOEP. Insgesamt flossen Variablen aus zahlreichen Befragungsgebieten des SOEP ein wie beispielsweise Demographie, Arbeit, Gesundheit, Bildung, Familie, Finanzen, Persönlichkeit, Migration oder auch politische Einstellung. Zudem wurden in den Ausfallmodellen, soweit sinnvoll und möglich, Personenmerkmale aggregiert auf Haushaltsebene berücksichtigt. Eine Liste mit Merkmalen, die für die Gewichtung des SOEP-Core Version 35 verwendet wurden findet sich in Siegers, Belcheva, and Silbermann (2020 S. 63f, 70ff).
Auch Informationen über den Kontaktverlauf gingen in die Gewichtung ein. Von Seiten des Erhebungsinstitutes wurden dem SOEP für insgesamt 86.069 Anrufe die Kontaktprotokolle der Telefonverläufe zur Verfügung gestellt. Diese umfassen Informationen zu erfolgreichen und erfolglosen Kontaktversuchen. Zusätzlich enthalten sie Informationen zu Datum und Uhrzeit eines Kontaktversuchs, ob über eine Festnetz- oder Mobiltelefonnummer angerufen wurde und den Rücklaufcode zu dem jeweiligen Kontaktversuch. Aus diesen Informationen haben wir weitere Variablen gebildet, die bspw. angeben, über welchen Telefonanschluss (Festnetz, Mobiltelefon, beide) ein Haushalt kontaktiert wurde oder wie oft ein Haushalt zu bestimmten Tageszeiten kontaktiert wurde.
Des weiteren wurden die jeweils tagesaktuellen Corona-Fallzahlen (Anzahl der Erkrankten, Verstorbenen, Genesenen) auf Kreisebene zum Tag des Kontaktversuchs bzw. Interviews verwendet. Die entsprechenden Daten werden vom Robert Koch-Institut öffentlich zugänglich gemacht.1 Mit Hilfe der vom Statistischen Bundesamt bereitgestellten Bevölkerungszahlen auf Kreisebene wurde zusätzlich zu den obigen Größen die Corona-Inzidenz auf Kreisebene berechnet.2 Auch diese Inzidenz war Teil der Gewichtungsvariablen.
Ebenso flossen kleinräumige Informationen unterhalb der Kreisebene, überwiegend zur Sozialstruktur von Nachbarschaften, in die Ausfallmodellierung ein. Entsprechende Daten werden von Microm bereitgestellt.
Tabelle A.1 in Anhang A fasst alle Variablen zusammen, die in den verschiedenen Ausfallmodellen auf ihren Einfluss hinsichtlich einer Einschluss in die Stichprobe, Erreichbarkeit oder Teilnahme hin geprüft wurden.
Nicht alle Variablen fließen in jedes Ausfallmodell ein. Der Grund hierfür ist offensichtlich: unter den über 400 verfügbaren Merkmalen haben erwartungsgemäß viele keinen Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) und/oder sind miteinander hoch korreliert. Nimmt man unnötig viele erklärende Variablen in ein Modell auf, erzeugt dies eine große Streuung in den zu erzeugenden Gewichtungsfaktoren (die sich aus dem Inversen der vorhergesagten Einschluss-, Kontakt- und Teilnahmewahrscheinlichkeiten ergeben). Dies sollte aus Gründen der Stichprobeneffizienz in jedem Fall vermieden werden.
Daher wurden vor jeglicher multivariaten (Ausfall-)Modellierung alle Variablen einzeln auf ihren Zusammenhang mit der zu erklärenden Variable (d.h. Einschluss in die Stichprobe, Kontaktierbarkeit und Teilnahme) geprüft. Nur wenn dieser Zusammenhang signifikant (p<0.05) war, wurde die entsprechende Variable in die vorläufige Menge der erklärenden Variablen für das entsprechende Ausfallmodell aufgenommen. Aus Gründen der Modelleffizienz wurden aus der Menge der erklärenden Variablen zudem noch stark korrelierte Merkmale ausgeschlossen. Hierfür wurde die Korrelation aller erklärenden Variablen untereinander bestimmt. Von Merkmalen, die eine betragsmäßige Korrelation von größer als 0,95 aufwiesen, floss nur jenes in das Ausfallmodell ein, das den größten (signifikanten) Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) hatte. So ergaben sich für die verschiedenen Ausfallmodelle unterschiedliche Mengen an erklärenden Variablen.
In einem letzten Schritt fand nun noch eine Variablenselektion anhand des bayesianischen Informationskriteriums (BIC) statt. Hierbei wurden dem jeweiligen Modell iterativ Variablen entnommen bzw. wieder hinzugefügt, wenn diese Veränderung im Modell zu einem niedrigeren BIC und somit zu einer besseren Modellgüte führte. Dieses hier beschriebene dreistufige Verfahren zur Variablenselektion fand für jedes der Ausfallmodelle Anwendung, die im Rahmen der SOEP-CoV-Gewichtung geschätzt wurden.
4 Geschätzte Gewichtungsmodelle
Dieser Abschnitt präsentiert die Modelle, die für die oben aufgeführten Gewichtungsschritte geschätzt wurden.3 Die Ergebnisse werden in Form von Koeffizientenplots präsentiert. Auf der y-Achse sind die Merkmale abgetragen, die als erklärende Variablen in das jeweilige Gewichtungsmodell eingeflossen sind. Parallel zur x-Achse sind die Werte der geschätzten Koeffizienten (roter Punkt) samt ihres 95%-Konfidenzintervalls (rote Balken mit vertikalen Enden) dargestellt. Die gestrichelte, vertikale Linie markiert den Wert 0. Die geschätzten Koeffizienten sind dabei vom kleinsten (oben links) hin zum größten (unten rechts) sortiert. Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, weisen auf einen negativen Einfluss hin. Merkmale, deren Koeffizientenschätzer rechts der grau gestrichelten Linie liegen weisen auf einen positiven Einfluss hin.4
4.1 Ausfälle zwischen 2018 und der Bruttostichprobe SOEP-CoV
Abbildung 4.1 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für die Ausfälle zwischen der 2018er SOEP-Welle bi und der Bruttostichprobe an Haushalten im Jahr 2020 zu korrigieren. Wir finden, dass die Nichtteilnahme im Erhebungsjahr 2018 einen deutlich negativen Effekt auf die Bleibewahrscheinlichkeit im SOEP 2020 hat. Weiter beeinflussen der Einsatz von Übersetzungshilfen in den Migrationsstichproben im Rahmen der letzten Erhebung sowie die Zugehörigkeit zur den Migrationsstichproben M1 und M2 die Teilnahmebereitschaft negativ. Haushalte mit sehr jungen Haushaltsmitgliedern weisen ebenso wie Haushalte mit alten Haushaltsvorständen eine deutlich geringere Bleibewahrscheinlichkeit auf.5 Auch das Nichtvorhandensein eines Internetanschlusses im Haushalt wirkt sich negativ aus auf die Wahrscheinlichkeit im SOEP zu verbleiben. Lebt mindestens eine Person im Haushalt, die angibt besonders heimatverbunden zu sein, findet sich ein negativer Effekt auf die Bleibewahrscheinlichkeit. Das Gleiche gilt für Merkmale, die in Bezug zu fehlenden Werten (konkret: partial unit nonrespone und ein hoher Anteil an item nonresponse auf Haushaltsebene) stehen. Schließlich wirkt sich auch der Umstand, dass das letzte Interview spät in der Feldphase durchgeführt wurde, negativ auf den Verbleib im SOEP aus.
Positiv auf die Bleibewahrscheinlichkeit wirken sich hingegen das Vorhandensein einer Parteipräferenz sowie ein starkes politisches Interesse bei mindestens einem Haushaltsmitglied aus. Ebenfalls positiv wirkt es sich aus, wenn eine der Personen im Haushalt ledig oder mindestens eine Person im Haushalt einen systemrelevanten Job hat. Haushalte, in denen zwei Erwachsene ohne Kinder leben und Haushalte in denen in der letzten Erhebung das Zusatzinstrument für die Mutter-Kind-Befragung ausgefüllt wurde haben eine höhere Wahrscheinlichkeit im SOEP zu verbleiben als Haushalte mit mehr als 2 Personen in denen keine Kinder leben und Haushalte, in denen dieses Instrument nicht ausgefüllt wurde. Angehörige der Teilstichproben L3, die zum Zeitpunkt der Ziehung nur die Familientypen Alleinerziehende und Mehrkindfamilien enthielten, haben ebenfalls eine höhere Bleibewahrscheinlichkeit.
Abbildung B.1 in Anhang B zeigt die vom Modell geschätzten Bleibewahrscheinlichkeiten.
4.2 Tranchenweise eingesetzte Fälle
Für die Befragung im Rahmen der SOEP-CoV-Studie kamen nur Haushalte in Frage, für die eine aktuelle Telefonnummer vorlag und die zuletzt nicht durch die “zentrale Bearbeitung” des Erhebungsinstituts betreut wurden, siehe Abschnitt 1. Die (potentielle) selektive Verzerrung des Ausgangsbrutto für SOEP-CoV im Vergleich zur SOEP Stichprobe 2018 wird im folgenden Modell (anhand von Informationen aus der SOEP Befragung 2018) untersucht und quantifiziert.
Abbildung 4.2 zeigt die geschätzten Koeffizienten und deren 95%-Konfidenzintervalle für das zugehörige Ausfallmodell mit cloglog-Link. Auch in diesem Fall sind die Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, relativ weniger im Ausgangsbrutto von SOEP-CoV vorhanden als im Gesamt-SOEP. Die Nichtteilnahme an der SOEP-Erhebung im Jahr 2018 ebenso wie Haushalte mit jungen (jünger als 35 Jahre) Haushaltsvorständen, sind relativ weniger im Ausgangsbrutto enthalten. Gleiches gilt für Haushalte, aus denen mindestens eine Person seit 2018 ausgezogen ist und Haushalte in Ostdeutschland (Haushalte in Thüringen und Sachsen-Anhalt und Haushalte der Teilstichprobe C, welche das Ausgangs-Sample für Haushalte Ostdeutschland aus dem Jahr 1990 bildet). Ein hohes Niveau an Item Nonresponse auf Haushalts-, wie auch auf Personenebene, führt zu einer geringeren Wahrscheinlichkeit. Auch die Zugehörigkeit zu den Teilstichproben A (Ausgangs-Sample Westdeutschland; 1984) und O (Haushalte in Gebieten der Sozialen Stadt; 2018) führt zu einer niedrigeren Wahrscheinlichkeit im Ausgangsbrutto zu verbleiben. Schließlich sind auch Haushalte mit zwei Erwachsenen ohne Kinder und ‘andere’ Haushaltszusammensetzungen relativ weniger wahrscheinlich. Schließlich wirkt sich auch die Unzufriedenheit mit dem Familienleben negativ auf den Verbleib im Ausgangsbrutto aus.
Relativ häufiger hingegen wurden Haushalte eingesetzt, in denen mindestens eine Person mehr als 3 Stunden Freizeit werktags hat, deren ältestes Haushaltsmitglied älter als 65 Jahre ist, in denen mindestens eine Person selbstständig ist, deren Haushaltsvorstand älter als 74 Jahre ist und deren Haushaltsvorstand zum Zeitpunkt der Stichprobenziehung noch nicht im Haushalt lebte. Ebenfalls überproportional im Ausgangsbrutto der Stichprobe enthalten sind Haushalte, bei denen das Interview der letzten Befragung besonders lang (4. Quartil der Verteilung der Befragungsdauer) oder kurz (1. Quartil der Verteilung der Befragungsdauer) gedauert hat. Ebenfalls häufiger im Ausgangsbrutto verblieben sind Haushalte der Teilstichproben J (Aufstockung aus dem Jahr 2011), K (Aufstockung aus dem Jahr 2012), Teilstichproben aus den Jahren 2010 und 2011 mit Fokus auf unterschiedliche Familientypen L1 (Geburtskohorten von 2007 bis 2010), L2 (Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Alleinerziehend, Mehrkindfamilien). Gleiches gilt für die Migrationsstichproben M1 aus 2013 und M2 aus dem Jahr 2015, sowie für die Teilstichprobe N (Aufstockung aus dem Jahr 2017).
Abbildung B.2 in Anhang B zeigt die vom Modell geschätzten Wahrscheinlichkeiten für den Einsatz in der SOEP-CoV-Studie.
4.3 Telefonische Erreichbarkeit der Haushalte
Im Gegensatz zur bisherigen Befragung des SOEP, die für gewöhnlich mittels eines persönlichen computergestützten (CAPI) oder schriftlichen (PAPI) Interviews durchgeführt wird, wurde diese Studie als telefonische Umfrage (CATI) durchgeführt. Hierbei waren Haushalte aus unterschiedlichen Gründen nicht erreichbar, bspw. wegen falscher Telefonnummern, Nummern von Firmen- oder Fax-Anschlüssen oder auch weil die Personen des Haushalts zwischenzeitlich verstorben oder ins Ausland verzogen waren. Darüber hinaus wies ein kleiner Teil der Stichprobe einen Sperrvermerk für telefonische Befragungen beim ADM (Verband für Interessensvertretung, Selbstregulierung und Standards in der deutschen Markt- und Sozialforschung, www.adm-ev.de) auf und durfte daher nicht auf telefonischem Wege kontaktiert werden. Andere Haushalte konnten aus sonstigen Gründen während der Befragungszeit der jeweiligen Tranchen nicht erreicht werden.
Abbildung 4.3 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wird, um für die Erreichbarkeit der Haushalte zu kontrollieren. Um die Kontaktierbarkeit von Haushalten zu beschreiben, wurden Angaben zu Uhrzeiten und Häufigkeit telefonischer Kontakte genutzt, siehe auch Abbildung 2.2. Einige Haushalte waren besonders schwer zu erreichen und wurden daher oft (11-25 Anrufe) auf Festnetz und Mobiltelefon angerufen, ebenso wie überwiegend nachmittags bis abends. Auch Haushalte, die weniger oft über das Festnetz angerufen wurden bzw. zu anderen Zeiten waren zum Teil schwierig zu erreichen. Gleiches gilt für Haushalte der Migrationsstichproben M1 und M2. Haushalte, die im Vorjahr keine Wertanlagen hatten und in den mindestens eine Person raucht weisen ebenfalls eine niedrigere Wahrscheinlichkeit auf erreicht zu werden.
Eine erhöhte Wahrscheinlichkeit Haushalte telefonisch zu erreichen, liegt bei Haushalten vor, die in denen mindestens eine Person eine Parteipräferenz für eine bestimmte Partei hat. Auch Haushalte, in denen mindestens eine verrentnete Person lebt waren leichter zu erreichen. Ebenfalls sind Haushalte die selbstgenutztes Wohneigentum bewohnen und Haushalte mit mindestens einer im öffentlichen Dienst beschäftigten Person leichter zu erreichen. Schließlich weisen auch Haushalte, die ausschließlich über einen Festnetzanschluss kontaktiert wurden, eine höhere Erreichbarkeit auf. Abbildung B.3 in Anhang B zeigt die vom zugehörigen Ausfallmodell geschätzten Wahrscheinlichkeiten für die Erreichbarkeit der Haushalte.
4.4 Teilnahme der Haushalte an der SOEP-CoV-Studie
Die Haushalte, die während der jeweiligen Befragungszeiträume telefonisch erreicht werden konnten, entschieden sich dann schließlich für bzw. gegen die Teilnahme an der SOEP-CoV-Studie. Abbildung 4.4 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für Verweigerung der Teilnahme an der SOEP-CoV-Studie zu korrigieren. Unter den Faktoren, die die Teilnahmeentscheidung der Haushalte negativ beeinflussten, sind das Nichtvorhandensein eines Internetanschlusses im Haushalt, teilweise Nichtteilnahme von Befragungspersonen am letzten SOEP Interview im Haushalt und dass der Haushaltsvorstand älter als 74 Jahre die Prädiktoren mit dem stärksten Einfluss hat. Zudem beobachten wir eine niedrigere Teilnahmewahrscheinlichkeit für Haushalte, mit mindestens einer Person nichtdeutscher Staatsangehörigkeit oder in denen mindestens eine Person der Meinung ist, dass Flüchtlinge schlecht für die Wirtschaft seien. Gleiches gilt für Haushalte in denen mindestens eine Person im Ausland geboren wurde und in denen mindestens eine Person Arbeitslosengeld II bezieht. Schließlich verringert sich die Teilnahmewahrscheinlichkeit, wenn mindestens eine Person im Haushalt keinen Schulabschluss hat.
Positiv hingegen wirkte sich hier aus, wenn der Haushalt in einer Wohngegend mit hohem Anteil an überregionalen Zeitungen wohnt oder mindestens eine Person im Haushalt ein starkes politisches Interesse hat. Auch Haushalte, in denen mindestens eine Person keine Bedenken gegenüber Ausländern hat oder in denen mindestens eine Person einen Hochschulabschluss besitzt, haben eine höhere Teilnahmewahrscheinlichkeit. Ein Wohnort in Bayern wirkt sich ebenfalls positiv auf die Teilnahmewahrscheinlichkeit aus. Besonders teilnahmebereit waren auch Haushalte mit einem weiblichen Haushaltsvorstand. In Interaktion mit der Tranchierung finden sich hingegen negative Effekte, die dadurch zu erklären sind, dass in den späteren Tranchen gezielt nach männlichen Teilnehmern für das Telefoninterview gefragt wurde. Schließlich wirkt sich auch die Zugehörigkeit zu den Teilstichproben L2 (Familientypen: Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Familientypen: Alleinerziehend, Mehrkindfamilien) positiv auf die Teilnahmeentscheidung aus.
Abbildung B.4 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten auf Haushaltsebene.
4.5 Kontaktperson beim Telefoninterview
Bei SOEP-CoV wurde je Haushalt nur eine Person befragt, die auch einige Proxy-Informationen über die anderen Haushaltsmitglieder angegeben, aber zu großen Teilen über sich selbst berichtet hat. Die Auswahl der Kontaktperson war dabei nicht systematisch, sondern war davon abhängig wer zur angerufenen Zeit ans Telefon ging und bereit war, an der Befragung teilzunehmen. Generell wurde über den ganzen Tag verteilt angerufen, vermehrt allerdings am späten Nachmittag und abends, um auch berufstätige Personen befragen zu können, siehe auch Abbildung 2.2. Um eine Verzerrung hinsichtlich des Geschlechts der befragten Person zu verringern, wurde einerseits sowohl nach dem Haushaltsvorstand als auch regelmäßig nach einem männlichen Haushaltsmitglied gefragt. Da für die Teilnahme am CATI der SOEP-CoV-Studie erforderlich war, dass die zu befragende Person zum Zeitpunkt der Befragung mindestens 18 Jahre alt war, gingen auch nur SOEP-Haushaltsmitglieder in die Modellierung ein, die dieses Kriterium erfüllten. Außerdem wurden zur Modellierung nur Personen aus Haushalten berücksichtigt, in denen mindestens zwei volljährige Personen leben, da in erfolgreich kontaktierten 1-Personen- oder Alleinerziehendenhaushalten eindeutig ist, welche Person die Fragen beantwortet.
Abbildung 4.5 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um hinsichtlich Verzerrungen auf Personenebene zu korrigieren. Mit Blick auf die Selektion innerhalb der teilnehmenden Mehrpersonenhaushalte zeigt sich, dass Personen im Alter von 18 bis 24 Jahren seltener an der CATI-Befragung teilnehmen als Personen höheren Alters. Ebenso weisen Personen mit Abitur und Personen der Altersgruppen “65 bis 69” und “70 Jahre und älter” eine niedrigere Teilnahmewahrscheinlichkeit auf als Personen ohne Abitur bzw. Personen im Alter von 25 bis 68 auf. Gleiches gilt für Männer sowie für vollzeiterwerbstätige Personen.
Hingegen nehmen Personen mit Universitätsabschluss oder systemrelevanten Berufen mit einer höheren Wahrscheinlichkeit am CATI teil. Das gleiche gilt für Personen, die in einem 2-Personen Haushalt leben im Vergleich zu Personen, die in Haushalten mit mehr als 2 Personen leben. Personen mit einer mittleren Reife nehmen ebenso mit einer höheren Wahrscheinlichkeit am CATI teil, wie Personen, die bereits auf Covid-19 getestet wurden und deren Ergebnis negativ ausgefallen ist. Schließlich nimmt übermäßig häufig der Haushaltsvorstand der Befragung von 2018 an der CATI-Befragung teil.
Abbildung B.5 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten an der CATI-Befragung auf Personenebene.
5 Trimmen und Randanpassung
Mit dem Ziel die statistische Effizienz von gewichteten Analysen zu verbessern, wurden die Gewichte getrimmt. Durch das Trimmen der Gewichte wird die Varianz reduziert und somit einer möglichen Verzerrung gewichteter Analysen durch einzelne Beobachtungen mit großen Gewichten entgegengewirkt. Die Gewichte wurden hierbei nicht bei einem bestimmten Wert gekappt, sondern es findet eine Umverteilung der Gewichte nach der “Weight Distribution” Methode statt (vgl. Potter 1990).
Dieser Methode liegt die parametrische Annahme zugrunde, dass die Gewichte \(w\) einer inversen Beta-Verteilung mit Verteilungsfunktion \(F_w\) folgen. Die beiden Parameter der Verteilung werden aus den Gewichten geschätzt und es wird ein Maximalwert \(\tau\) berechnet, so dass \(1 – F_w (\tau) = 0,99\). Gewichte, die diesen Wert \(\tau\) überschreiten, werden an diesem Maximalwert getrimmt und die überschüssige Masse wird auf die übrigen Gewichte verteilt. Nun wird für die derart getrimmten Gewichte, analog zum obigen Vorgehen, ein neuer Maximalwert \(\hat{\tau}\) berechnet. Liegen nun Gewichte vor, die größer sind als \(\hat{\tau}\), werden diese am neuen Maximalwert getrimmt und die verbleibende Masse wird wiederum auf alle Gewichte kleiner \(\hat{\tau}\) umverteilt. Dieses Verfahren wird iterativ so lange wiederholt, bis keines der getrimmten Gewichte mehr größer ist als der neue Maximalwert oder anders ausgedrückt bis \(\tau = \hat{\tau}\). Das Trimmen der Gewichte kam zum einen auf der Haushaltsebene und zum anderen auf Ebene der Personen im CATI-Gewichtungsschritt zur Anwendung.
Um Stichprobenfehler und Undercoverage auszugleichen, werden alle Gewichte in einem letzten Schritt an bekannte Randverteilungen angepasst. Hierzu wurde die in Deville, Särndal, and Sautory (1993) beschriebene Raking Prozedur angewandt. Da für das Jahr 2020 noch keine Randverteilungen vom Statistischen Bundesamt bereitgestellt werden können (z.B. durch den entsprechenden Mikrozensus), wurden für die Randanpassungen auf Haushaltsebene und für alle Personen des Haushaltes die letzten vorhandenen Randverteilungen des Mikrozensus’ aus dem Jahr 2018 verwendet. Ein dritter zur Verfügung gestellter Gewichtungsfaktor rechnet nur die Kontaktpersonen hoch. Da es sich dabei ausschließlich um erwachsene Personen handelt und uns für diese Population keine Ränder des Mikrozensus vorlagen, wurden die entsprechenden Randverteilungen für Erwachsene auf Basis der SOEP-Daten von 2018 geschätzt.
Auf Haushaltsebene wurden Verteilungen zur Anzahl der Haushalte nach Bundesland, Haushaltsgröße, Gemeindegrößenklasse, selbstbewohntem Eigentum, Haushaltstyp sowie zum letzten Zuzugsjahr eines Haushaltsmitglieds aus dem Ausland zur Randanpassung genutzt. Der entsprechende Randanpassungsschritt erfolgte nach dem Gewichtungsschritt, der Verzerrungen auf Haushaltsebene bei einem realisierten Interview in einem Haushalt ausgleicht, und dem Trimmen der Gewichte. Die Ränder auf Haushaltsebene samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.2 in Anhang A aufgeführt.
Auf der Personenebene wurden Verteilungen zur Anzahl der Personen in der Grundgesamtheit nach Alter, Geschlecht, Staatsbürgerschaft (Deutsch vs. andere) zur Randanpassung der Gewichte herangezogen. Diese Randanpassung erfolgte an den Personengewichten, für alle Haushaltsmitglieder in einem realisierten Haushalt. Die Ränder auf Personenebene in realisierten Haushalten samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.3 in Anhang A aufgeführt. Für die Randanpassung im Anschluss an den CATI-Gewichtungsschritt werden die Ränder aus Tabelle A.4 in Anhang A zur Anpassung verwendet.
6 Zusammenfassung der Gewichte
Tabelle 6.1 weist für die einzelnen Tranchen die Anzahl der Haushalte und der Personen aus, die an der SOEP-CoV-Studie teilgenommen haben. Da je Haushalt nur eine Person interviewt wurde, ist die Zahl der am CATI teilnehmenden Personen identisch mit der Zahl der Haushalte. Darüber hinaus enthält die Tabelle Angaben dazu, wie viele Haushalte und darin lebende Personen ein Gewicht mit dem Wert 0 aufweisen. Da je Haushalt nur eine Person am CATI teilnimmt, weisen die CATI-Gewichte für die übrigen Personen im Haushalt ebenfalls den Wert 0 auf. Gewichte mit dem Wert 0 treten auf, da in der Teilstichprobe D (1994/5 Migration (1984-1994, West)) ein Schneeballverfahren zur Anwendung kam. Aufgrund dessen können für bestimmte Haushalte keine Inklusionswahrscheinlichkeiten und somit auch keine Gewichte berechnet werden. Hierbei sind Haushaltsgewichte mit hhrf gekennzeichnet, Gewichte für alle Haushaltsmitglieder mit phrf und die Gewichte von Personen, die im Rahmen der SOEP-CoV-Studie mittels CATI befragt werden konnten, mit phrf_cati.
Tranche | Haushalte | Personen | hhrf | phrf | phrf_cati |
---|---|---|---|---|---|
1 | 1.689 | 4.126 | 7 | 14 | 2.444 |
2 | 1.932 | 4.947 | 9 | 21 | 3.024 |
3 | 978 | 2.443 | 1 | 1 | 1.466 |
4 | 632 | 1.584 | 1 | 4 | 953 |
5 | 309 | 723 | 0 | 0 | 414 |
6 | 303 | 756 | 3 | 5 | 456 |
7 | 288 | 750 | 1 | 3 | 463 |
8 | 298 | 722 | 5 | 11 | 429 |
9 | 265 | 665 | 0 | 0 | 400 |
1-9 | 6.694 | 16.716 | 27 | 59 | 10.049 |
Die nachfolgende Tabelle 6.2 zeigt die Verteilung der verschiedenen Gewichte (phrf, phrf und phrf_cati) für die in Tabelle 6.1 berichteten Fallzahlen. Bei der Berechnung der entsprechenden Statistiken wurden Gewichte mit dem Wert 0 ausgeschlossen.
Gewicht | Tranche | Minimum | Median | Mittelwert | Maximum | Standardabweichung | Summe |
---|---|---|---|---|---|---|---|
hhrf | 1 | 48 | 3.697 | 6.279 | 62.921 | 7.595 | 10.562.046 |
hhrf | 2 | 8 | 3.193 | 5.473 | 59.144 | 6.563 | 10.524.192 |
hhrf | 3 | 35 | 3.931 | 6.371 | 62.995 | 7.741 | 6.224.776 |
hhrf | 4 | 80 | 3.688 | 6.537 | 58.421 | 8.154 | 4.125.110 |
hhrf | 5 | 131 | 3.713 | 6.894 | 56.348 | 8.812 | 2.130.310 |
hhrf | 6 | 49 | 3.521 | 6.098 | 38.746 | 7.227 | 1.829.350 |
hhrf | 7 | 18 | 3.630 | 6.745 | 49.683 | 8.130 | 1.935.906 |
hhrf | 8 | 20 | 4.436 | 7.372 | 51.321 | 8.691 | 2.159.963 |
hhrf | 9 | 77 | 3.617 | 7.118 | 65.067 | 9.037 | 1.886.347 |
hhrf | 1-9 | 8 | 3.581 | 6.206 | 65.067 | 7.592 | 41.378.000 |
phrf | 1 | 43 | 2.692 | 4.956 | 75.018 | 6.798 | 20.378.307 |
phrf | 2 | 6 | 2.449 | 4.250 | 77.311 | 5.579 | 20.936.930 |
phrf | 3 | 29 | 2.900 | 5.165 | 54.870 | 6.904 | 12.613.619 |
phrf | 4 | 74 | 2.667 | 5.237 | 76.366 | 7.663 | 8.274.771 |
phrf | 5 | 107 | 2.916 | 5.655 | 57.986 | 7.883 | 4.088.392 |
phrf | 6 | 46 | 2.539 | 4.722 | 49.384 | 6.330 | 3.545.887 |
phrf | 7 | 17 | 2.770 | 5.534 | 64.162 | 7.644 | 4.133.597 |
phrf | 8 | 16 | 3.157 | 5.797 | 60.224 | 7.634 | 4.121.793 |
phrf | 9 | 63 | 2.571 | 5.293 | 57.744 | 7.532 | 3.519.703 |
phrf | 1-9 | 6 | 2.648 | 4.900 | 77.311 | 6.727 | 81.613.000 |
phrf_cati | 1 | 60 | 5.674 | 10.254 | 92.106 | 12.478 | 17.246.453 |
phrf_cati | 2 | 3 | 5.463 | 9.574 | 98.090 | 11.601 | 18.410.223 |
phrf_cati | 3 | 49 | 6.263 | 10.790 | 92.106 | 12.925 | 10.542.234 |
phrf_cati | 4 | 159 | 6.131 | 10.754 | 80.088 | 12.865 | 6.785.625 |
phrf_cati | 5 | 206 | 6.118 | 11.460 | 98.090 | 13.668 | 3.540.989 |
phrf_cati | 6 | 48 | 5.954 | 10.487 | 65.970 | 12.309 | 3.146.210 |
phrf_cati | 7 | 26 | 6.186 | 11.244 | 92.106 | 13.966 | 3.227.107 |
phrf_cati | 8 | 38 | 7.091 | 11.622 | 72.292 | 13.117 | 3.405.221 |
phrf_cati | 9 | 127 | 6.909 | 12.082 | 72.292 | 13.812 | 3.201.754 |
phrf_cati | 1-9 | 3 | 5.862 | 10.425 | 98.090 | 12.552 | 69.505.815 |
7 Ableiten eigener Gewichtungsfaktoren
Mit den SOEP-CoV-Daten ist eine Vielzahl von Analysen an unterschiedlichsten Analysemengen möglich. Für jede potentielle Analysemenge eigene Gewichte zur Verfügung zu stellen, übersteigt den Rahmen des Machbaren. Dennoch sollen und müssen die zur Verfügung gestellten Gewichte der gesamten SOEP-CoV-Stichprobe für statistische Auswertungen, die auf Populationsaussagen abzielen, genutzt werden; wenn auch nur um zu prüfen, ob die Gewichte relevant für die Berechnung von Populationsstatistiken sind (z.B. durch den simplen Vergleich von gewichteten und ungewichteten Statistiken). Die SOEP-CoV-Gewichte wurden für die gesamte Stichprobe (der neun SOEP-CoV-Tranchen) an Haushalten bzw. Personen, die an der CATI-Befragung teilgenommen haben, erzeugt. Somit stellen sie Hochrechnungsfaktoren für genau diese Stichprobe bzw. für eine Zufallsauswahl aus dieser Stichprobe dar. Das bedeutet, dass für jede Analysemenge, die diese Voraussetzung nicht erfüllt, Adjustierungsfaktoren berechnet werden müssen, damit Hochrechnungen auf die Grundgesamtheit der SOEP-CoV-Stichprobe möglich sind.
- Um in einem ersten Schritt zu prüfen, ob die SOEP-CoV-Gewichte für eine Teilstichprobe der SOEP-CoV-Stichprobe verwendet werden können und — falls dies nicht ohne weiteres möglich ist — entsprechende Adjustierungsfaktoren abzuleiten, muss eine Selektivitätsanalyse durchgeführt werden:
- Hierbei müssen mindestens alle Variablen, die in die geplante Analyse aufgenommen werden sollen, als erklärende Variablen in ein logistisches Regressionsmodell (oder eine probit oder cloglog Regression) einfließen.
- Die abhängige Variable dieses Selektionsmodells ist ein Indikator (kodiert auf 0 und 1), der angibt ob im Vergleich zur gesamten SOEP-CoV-Stichprobe eine Datenzeile Teil der Analysemenge ist (y = 1) oder nicht (y = 0).
- Das Selektionsmodell umfasst somit genauso viele Datenzeilen wie es in SOEP-CoV Beobachtungen gibt.
- Zeigt nun keine der Analysevariablen einen signifikanten (d.h. p < 0,05) und gleichzeitig bedeutungsvollen Effekt (d.h. \(\beta > 0,01\)) hinsichtlich der Zuordnung zur Analysemenge, ist die betrachtete Teilstichprobe eine im Hinblick auf die Analysevariablen zufällige Auswahl aus der gesamten SOEP-CoV-Stichprobe. Die originalen SOEP-CoV-Gewichte können zur Hochrechnung dieser Teilstichprobe auf die Grundgesamtheit genutzt werden. Hierbei gilt zu beachten, dass gewichtete Angaben dann in Summe natürlich nicht die gesamte Populationsgröße ergeben, sondern eben nur auf die Teilpopulation, auf die sich die Analyse bezieht.
- Ergibt die Selektivitätsanalyse allerdings Verzerrungen der Teilstichprobe hinsichtlich der Analysevariablen (d.h. gibt es signifikante und bedeutungsvolle Effekte in der Selektivitätsanalyse), ist eine Korrektur der SOEP-CoV-Gewichte erforderlich, bevor sie zu Hochrechnungszwecken herangezogen werden können. Diese Korrektur der SOEP-CoV-Gewichte erfolgt über die Multiplikation mit einem Adjustierungsfaktor, der sich wiederum aus der durchgeführten Selektivitätsanalyse ergibt.
- Konkret heißt das: Alle Analysevariablen, die sich als signifikant und gleichzeitig bedeutungsvoll herausgestellt haben, fließen in eine neue Selektivitätsanalyse ein. Analysevariablen, die in der zuvor berechneten Selektivitätsanalyse nicht signifikant und/oder bedeutungsvoll waren, werden hierbei außer Acht gelassen (um eine unnötige Varianzerhöhung in den zu erzeugenden Adjustierungsfaktoren zu vermeiden). Die abhängige Variable der neuen Selektivitätsanalyse ist identisch mit der der zuvor berechneten, auch die Stichprobengröße bleibt unverändert.
- Auf Basis der geschätzten (neuen) Selektivitätsanalyse müssen nun für jede Datenzeile Wahrscheinlichkeiten geschätzt (bzw. vorhergesagt) werden der Analysemenge anzugehören.
Das kann in Stata mit dem Befehl
predict pr
getan werden und in R mit dem Befehlpredict()
unter Berücksichtigung des Argumentstype = "response"
. Nun werden der Analysemenge die vorhergesagten Wahrscheinlichkeiten für eine Zugehörigkeit zur originalen SOEP-CoV-Stichprobe zugespielt. Die Inverse dieser Wahrscheinlichkeiten gibt den Adjustierungsfaktor an, der mit den SOEP-CoV-Gewichten zu multiplizieren ist, um für Verzerrungen im Vergleich zur gewichteten Ausgangsstichprobe der SOEP-CoV-Studie zu korrigieren. Mit anderen Worten, durch die Multiplikation der SOEP-CoV-Gewichte, die zur Analysemenge gehören, mit der inversen vorhergesagten Wahrscheinlichkeit ergibt sich das gesuchte adjustierte Gewicht, das zur Berechnung von Populationsstatistiken hergezogen werden kann. - Anmerkung: Es ist in jedem Fall angeraten, zu überprüfen wie gut das berechnete Selektionsmodell zwischen Zugehörigkeit und Nicht-Zugehörigkeit zur Analysemenge diskriminieren kann, z.B. durch die Nutzung entsprechender Boxplots: ein Boxplot gibt die Verteilung der (vorhergesagten) Wahrscheinlichkeiten für die Analysemenge an und ein Box-Plot zeigt die (vorhergesagten) Wahrscheinlichkeiten für den Teil der SOEP-CoV-Stichprobe, der nicht Teil der Analysemenge ist. Generell sollte der erste Boxplot eine Verteilung nahe der 1 anzeigen, der zweite eine Verteilung nahe der 0 und die Inter-Quartile-Ranges beider Boxplots sollten möglich wenig Überschneidungen in ihrem Wertebereich aufweisen. Ist dies nicht der Fall, diskriminiert das verwendete Modell nicht gut und die Hinzunahme weiterer erklärender Variablen, die den Selektionsmechanismus (besser) beschreiben, der die Analysemenge erzeugt hat, ist sinnvoll.
8 Anmerkungen
9 Literatur
Auguie, Baptiste. 2017. GridExtra: Miscellaneous Functions for „Grid“ Graphics. https://CRAN.R-project.org/package=gridExtra.
Deville, Jean-Claude, Carl-Erik Särndal, and Olivier Sautory. 1993. “Generalized Raking Procedures in Survey Sampling.” Journal of the American Statistical Association 88 (423): 1013–20. https://doi.org/10.1080/01621459.1993.10476369.
Kroh, Martin, Rainer Siegers, and Simon Kühne. 2015. “Gewichtung und Integration von Auffrischungsstichproben am Beispiel des Sozio-oekonomischen Panels (SOEP).” In Nonresponse Bias: Qualitätssicherung Sozialwissenschaftlicher Umfragen, edited by Jürgen Schupp and Christof Wolf, 409–44. Wiesbaden: Springer Fachmedien Wiesbaden. https://doi.org/10.1007/978-3-658-10459-7_13.
Kühne, Simon, Martin Kroh, Stefan Liebig, and Sabine Zinn. 2020. “The Need for Household Panel Surveys in Times of Crisis: The Case of SOEP-CoV.” Survey Research Methods 14 (2): 195–203. https://doi.org/10.18148/srm/2020.v14i2.7748.
Potter, Frank J. 1990. “A Study of Procedures to Identify and Trim Extreme Sampling Weights.” In Proceedings of the American Statistical Association, Section on Survey Research Methods, 225–30. American Statistical Association Washington, DC. http://www.asasrms.org/Proceedings/papers/1990_034.pdf.
R Core Team. 2020. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.
Robinson, David, and Alex Hayes. 2020. Broom: Convert Statistical Analysis Objects into Tidy Tibbles. https://CRAN.R-project.org/package=broom.
Siegers, Rainer, Veronika Belcheva, and Tobias Silbermann. 2020. “SOEP-Core v35 Documentation of Sample Sizes and Panel Attrition in the German Socio-Economic Panel (SOEP) (1984 until 2018).” SOEP Survey Papers 826. Berlin: DIW/SOEP. https://www.diw.de/documents/publikationen/73/diw_01.c.745900.de/diw_ssp0826.pdf.
The American Association for Public Opinion Research. 2016. Standard Definitions: Final Dispositions of Case Codes and Outcome Rates for Surveys. 9th ed. AAPOR.
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.
Xie, Yihui, J.J. Allaire, and Garrett Grolemund. 2018. R Markdown: The Definitive Guide. Boca Raton, Florida: Chapman; Hall/CRC. https://bookdown.org/yihui/rmarkdown.
Zhu, Hao. 2019. KableExtra: Construct Complex Table with ’Kable’ and Pipe Syntax. https://CRAN.R-project.org/package=kableExtra.
Anhang
A Tabellen
Variable | Datensatz | Variablenlabel |
---|---|---|
lb0111 | biol | Mutter berufl. Ausb., Studium abgeschl. |
lb0110 | biol | Vater berufl. Ausb., Studium abgeschl. |
NumberOfContacts | CoV_CATIerg_Brutto | Anzahl der Kontaktversuche |
anz_festnetz | CoV_CATIerg_Brutto | Anzahl Festnetznummern |
anz_mobil | CoV_CATIerg_Brutto | Anzahl Mobilfunknummern |
ResponseLabel | CoV_CATIerg_Brutto | Response Label |
tranche | CoV_Contact_Log | CATI-Tranche |
fest_mobil | CoV_Contact_Log | Festnetznummer oder Mobilfunknummer |
ContactDate | CoV_Contact_Log | Kontaktdatum- und Uhrzeit |
ResponseStatus | CoV_Contact_Log | Response Status |
Personen | DESTATIS (GENESIS-Online Tabelle: 12411-0015) | Fortgeschriebener Bevölkerungsstand am 31.12.2018 |
hlc0128 | hl | Ae Kreditabzahl./Monat in D |
hlc0175 | hl | Ae Sparbetrag/Monat |
hlc0064_v2 | hl | ALG II, Sozialgeld, Unterhaltskosten heute (Ja/Nein) [2010-2018] |
hlc0065 | hl | ALG2, Sozialgeld heute Betrag |
hlc0054 | hl | ALG2, Sozialgeld im letzten Jahr, Betrag pro Monat |
hlf0197 | hl | Anzahl Buecher im HH |
hlj0005 | hl | Art der Unterkunft |
hlj0033 | hl | AsylbLG Betrag/Monat |
hlc0027_v2 | hl | Ausgabenueberschuss Hoehe (Monat) [2016-2018] |
hlf0180 | hl | Auto im HH |
hlj0038 | hl | Bankkonto |
hlc0105 | hl | Bausparvertrag Vorjahr |
hlj0043 | hl | Bedarf, nicht ueber Gutscheine abgedeckt |
hlj0042 | hl | Bedarfsdeckung ueber Gutscheine |
hlj0041 | hl | Bedarfsdeckung ueber Sachleistungen |
hlf0148 | hl | Beintraechtigung d. Laermbelaestigung |
hlf0149 | hl | Beintraechtigung d. Luftverschmutzung |
hlf0150 | hl | Beintraechtigung d.Mangel a.Gruenflaeche |
hlj0007 | hl | Bestehender Haushalt oder neuer Haushalt |
hlc0190 | hl | Betrag Bildungspaket 2016/Monat |
hlc0192 | hl | Betrag Bildungspaket heute/Monat |
hlc0151 | hl | Betrag Einnahmen (Wertanlagen) 2015 im Ausland |
hlc0150 | hl | Betrag Einnahmen (Wertanlagen) 2015 in D |
hlf0601 | hl | Betrag Grundsteuer fuer Grundbesitz 2015 |
hlf0069_v5 | hl | Betrag Heizkosten/Monat [2002-2014,2016-2018] |
hlf0600 | hl | Betrag Instandhaltung und Modernisierung 2015 |
hlc0045_v2 | hl | Betrag Kindergeld heute/Monat (Euro) [2002-2018] |
hle0016 | hl | Betrag Kosten fuer Pflege/Monat von Personen nicht im HH |
hlf0332 | hl | Betrag Pflegekosten im Monat |
hlc0179 | hl | Betrag/Gegenwert erbschaft 2015 |
hlc0183 | hl | Betrag/Gegenwert Lotteriegewinn 2015 |
hlc0181 | hl | Betrag/Gegenwert Schenkung 2015 |
hlc0111_v2 | hl | Betriebs-/Instandhaltungskosten Betrag Vorjahr (Euro) [2002-2018] |
hlc0104 | hl | Betriebsvermoegen Vorjahr |
hlf0071_v1 | hl | Beurteilung der Wohnungsgroesse [1984,1998-2018] |
hlf0262 | hl | Durchschnittliche Kosten im Monat |
hlc0025_v2 | hl | Einnahmeueberschuss Hoehe (Monat) [2016-2018] |
hlc0107 | hl | Festverzinsl. Wertpapiere Vorjahr |
hlf0190 | hl | Freunde zum Essen einladen 1/Monat |
hlf0531 | hl | Garage/Stellplatz |
hlc0063 | hl | Grundsicherung im Alter Betrag pro Monat |
hlc0071 | hl | Grundsicherung im Alter heute Betrag |
hlf0178_v1 | hl | Haushalt: Internet [2005,2007,2011,2013,2015-2018] |
hlc0006_v3 | hl | HH-Nettoeinkommensgruppen [2003-2018] |
hlc0068_v2 | hl | Hilfe Lebensunterhalt Betrag (Euro) [2002-2018] |
hlc0055_v1 | hl | Hilfe Lebensunterhalt Vorjahr [1984,1991,2010-2018] |
hlc0059_v2 | hl | Hilfe Lebensunterhalt Vorjahr (Betrag im Monat) (Euro) [2002-2018] |
hlf0291 | hl | Hilfe-,Pflegebeduerft. Person im HH |
hlc0114_v3 | hl | Hoehe Abzahlung Kredite (selbst und andere HH-Mitglieder) (Euro) [2011-2018] |
hlf0074_v2 | hl | Hoehe der monatlichen Miete (DM) [2002-2018] |
hlc0197 | hl | Hoehe des Betrags nach dem AsylbLG im letzten Kalenderjahr |
hlf0078 | hl | Hoehe durchschnittl. Stromkosten im Monat |
hlf0090_v2 | hl | Hoehe Heizkosten letzt.Jahr (Euro) [2002-2014,2016-2018] |
hlf0084 | hl | Hoehe Stromkosten letztes Jahr |
hlf0178_v3 | hl | Internetanschluss [2016-2017] |
hlk0057 | hl | Interviewdauer muendlich |
hlk0058 | hl | Interviewdauer schriftlich |
hlf0091_v3 | hl | Jaehrliche Nebenkosten (EURO) [2002-2014,2016-2018] |
hlf0188 | hl | Jaehrliche Urlaubsreise |
hlc0093 | hl | Keine Wertanlagen Vorjahr |
hlc0042_v2 | hl | Kindergeld letzt.J Betrag(Monat) (Euro) [2002-2018] |
hlc0051_v2 | hl | Kinderzuschlag Betrag Monat Vorjahr (Fragenpraezisierung) [2010-2018] |
hlc0047_v2 | hl | Kinderzuschlagbezug heute Betrag (mit Fragepraezisierung) [2010-2018] |
hlj0004_v2 | hl | Leben auslaend. Familien im Wohngebiet [2014] |
hlc0106 | hl | Lebensversicherung Vorjahr |
hlc0079_v2 | hl | Leistungen der Pflegeversicherung (Betrag pro Monat) (Euro) [2002-2018] |
hlc0008_v2 | hl | Miet- u.Pachteinnahmen Betrag Vorjahr (Euro) [2002-2018] |
hlf0001_v3 | hl | Miete oder Eigentum (auch Altersheim) [1999-2018] |
hlj0029 | hl | Miete/Monat |
hlj0017 | hl | Miete/Monat |
hlk0060 | hl | Monat des Interviews |
hlf0081_v2 | hl | Monatl Hoehe der Umlagen (DM) [2002-2014,2016-2018] |
hlf0088_v2 | hl | Monatl Zins-,Tilgungszahlungen (Euro) [2002-2018] |
hlc0005_v2 | hl | Monatliches HH-Netto-Einkommen (Euro) [2002-2018] |
hlf0186 | hl | Notfallruecklagen |
hli0137 | hl | Oekostromtarif |
hlc0090_v2 | hl | Pflegevers. Betrag (Euro) [2002-2018] |
hlc0085_v6 | hl | Pflegevers. Leistungen [2010-2018] |
hlf0019_v1 | hl | Qm Wohnflaeche [1984,1998-2018] |
hlf0107_v2 | hl | Seit wann in dieser Wohnung (Viersteller) [1999-2018] |
hlc0108 | hl | Sonstige Wertpapiere Vorjahr |
hlc0119_v2 | hl | Sparbetrag monatlich [2015-2018] |
hlc0173 | hl | Sparbetrag/Monat |
hlc0098 | hl | Sparbuch Vorjahr |
hlc0010 | hl | Steuerlich absetzten, Betrag Vorjahr |
hlf0239_v4 | hl | Telefon-Festnetzanschluesse [2016-2018] |
hlc0112_v2 | hl | Tilgungszahlungen und Zinsen Betrag Vorjahr (Euro) [2002-2018] |
hlf0523 | hl | Veraenderung der Wohnsit. |
hlc0024_v2 | hl | Verhaeltnis Einnahmen zu Ausgaben (Monat) [2016-2018] |
hlc0095 | hl | Verluste steuerlich absetzen, Betrag |
hlc0083_v1 | hl | Wohngeld heute (ja/nein) [1995-1998,2010-2018] |
hlc0082_v2 | hl | Wohngeld,Lastenzuschuss pro Monat (Euro) [2002-2018] |
hlc0084_v2 | hl | Wohngeldbezug heute Betrag (Euro) [2002-2018] |
hlj0010 | hl | Wohnung – Selbst eingerichtet oder moebliert |
hlf0030 | hl | Wohnung mit Balkon,Terasse |
hlf0032 | hl | Wohnung mit Garten,-benutzung |
hlf0031 | hl | Wohnung mit Keller,Abstellraeume |
hlf0035 | hl | Wohnung mit Sonnenkollekt., Solarenergie |
hlc0013_v2 | hl | Zins-u. Dividendeneinnahmen Vorjahr (Euro) [2002-2018] |
hlf0059_h | hl | Zustand des Hauses in dem man wohnt [harmonisiert] |
hlf0621 | hl | Zwei paar Strassenschuhe |
ha_tko_k_internet | Microm – Hausebene | Affinitaet fuer Internetnutzung |
ha_tme_k_uebertag | Microm – Hausebene | Affinitaet Lesen ueberregionaler Tageszeitung |
ha_mso_k_ausland | Microm – Hausebene | Ausland |
ha_mso_k_familie | Microm – Hausebene | Familie |
ha_mmo_k_fluktu | Microm – Hausebene | Fluktuation |
ha_mbe_k_haustyp | Microm – Hausebene | Haustyp |
ha_mso_k_status | Microm – Hausebene | Status |
ha_mmo_k_volumen | Microm – Hausebene | Umzugsvolumen |
p8_met_p_spaetaus | Microm – PLZ8-Ebene | Anteil der Einwohner an Spaetaussiedlern aus der frueheren Sowjetunion in % |
p8_met_p_islam | Microm – PLZ8-Ebene | Anteil der Einwohner aus aussereurop. islamischen Staaten in % |
p8_met_p_balkan | Microm – PLZ8-Ebene | Anteil der Einwohner aus dem Balkangebiet in % |
p8_met_p_tuerkei | Microm – PLZ8-Ebene | Anteil der Einwohner aus der Tuerkei in % |
p8_met_p_deutschl | Microm – PLZ8-Ebene | Anteil der Einwohner aus Deutschland in % |
p8_met_p_griechen | Microm – PLZ8-Ebene | Anteil der Einwohner aus Griechenland in % |
p8_met_p_italien | Microm – PLZ8-Ebene | Anteil der Einwohner aus Italien in % |
p8_met_p_osteurop | Microm – PLZ8-Ebene | Anteil der Einwohner aus Osteuropa in % |
p8_met_p_spanport | Microm – PLZ8-Ebene | Anteil der Einwohner aus Spanien/Portugal/Lateinamerika in % |
p8_met_p_asien | Microm – PLZ8-Ebene | Anteil der Einwohner Sued-/Ost-/Suedostasiens in % |
p8_met_p_afrika | Microm – PLZ8-Ebene | Anteil der Einwohner suedlich der Sahara in % |
p8_met_p_uebrige | Microm – PLZ8-Ebene | Anteil der uebrigen Einwohner in % |
st_kkr_w_prohh | Microm – Straßenabschnittebene | durchschnittliche Kaufkraft pro HH in dem PLZ8-Gebiet in Euro |
pgpbbil01 | pgen | Berufl. Bildungsabschluss |
pgpbbil02 | pgen | Hochschulabschluss |
germborn | pgen | In Deutschland geboren |
migback | pgen | Migrationshintergrund |
pgpsbil | pgen | Schulabschluss |
plh0136 | pl | 10.000EUR geschenkt, Anteil ausgeben |
plh0134 | pl | 10.000EUR geschenkt, Anteil sparen |
plh0135 | pl | 10.000EUR geschenkt, Anteil verschenken |
plc0043_v2 | pl |
|
plc0045_v2 | pl |
|
plj0022 | pl |
|
plb0205_v2 | pl | Abendarbeit, zwischen 19 und 22 Uhr (unregelmaessig) [1995-2017] |
plc0041_v2 | pl | Abfindung Hoehe (Euro) [2002-2018] |
plb0114 | pl | Abschalten von der Arbeit faellt leicht |
plh0206i19 | pl | Aktiv Verluste ausgleichen |
plj0680_v1 | pl | Aktueller Aufenthaltstitel [2016-2017] |
plc0139 | pl | ALG_II Sozialgeld Monate Vorjahr |
plh0166 | pl | Allg. Lebenszufriedenheit in einem Jahr |
plh0011_v2 | pl | Allgemeine Parteienpraeferenz [1984-2018] |
plj0078 | pl | Als Deutscher fuehlen |
plc0240_v2 | pl | Altersrente betriebliche Altersversorgung (EURO) [2003-2018] |
plc0235 | pl | Altersrente etc Monate Vorjahr |
plc0249_v2 | pl | Altersrente sonstige (in EURO) [2003-2018] |
plc0243_v2 | pl | Altersrente Unfallversicherung (in EURO) [2003-2018] |
plj0671_v1 | pl | Anhoerung schon stattgefunden [2016-2017] |
pld0047 | pl | Anzahl enge Freunde |
plb0570 | pl | Anzahl Mitarbeiter |
plh0212 | pl | Arbeite gruendlich |
plb0021 | pl | Arbeitslos gemeldet |
plc0130_v2 | pl | Arbeitslosengeld (M3-M5) [2016-2018] |
plc0137_v2 | pl | Arbeitslosengeld Betrag Vorjahr (Euro) [2002-2018] |
plc0131_v2 | pl | Arbeitslosengeld Brutto letzter Monat (Euro) [2002-2018] |
plc0136 | pl | Arbeitslosengeld Monate (Anz.) Vorjahr |
plc0129_v2 | pl | Arbeitslosenhilfe Betrag (Euro) [2002-2005,2017] |
plb0211 | pl | Arbeitszeitregelungen |
ple0097 | pl | Art der Krankenversicherung |
ple0013 | pl | Asthma |
plj0564 | pl | AsylbLG Leistungen |
ple0187 | pl | Ausgebranntsein (Burnout) |
ple0028 | pl | Ausgeglichen letzten 4 Wochen |
plc0171_v2 | pl | BAfoeG, Stipendium Betrag Vorjahr (Euro) [2002-2018] |
plc0170 | pl | BAfoeG, Stipendium Monate Vorjahr |
plc0168_v2 | pl | BAfoeG/Stipendium/BAB Brutto letzter Monat (Euro) [2002-2018] |
plc0236_v2 | pl | Beamtenversorgung Rente Brutto/Monat (Euro) [2003-2018] |
plc0279_v2 | pl | Beamtenversorgung Witwen-/Waisenrente Brutto/Monat (Euro) [2003-2018] |
pld0095 | pl | Befreundete Person 1: Alter |
plj0057 | pl | Befreundete Person 1: aus selben Land wie Befragungsperson |
pld0092 | pl | Befreundete Person 1: Geschlecht |
plj0054 | pl | Befreundete Person 1: Herkunft |
pld0101 | pl | Befreundete Person 1: hoechster Bildungsabschluss |
pld0098 | pl | Befreundete Person 1: ist erwerbstaetig, in Ausbildung, in Rente |
pld0089_v1 | pl | Befreundete Person 1: Verwandtschaft (unregelmaessig) [1988-2016] |
pld0096 | pl | Befreundete Person 2: Alter |
plj0058 | pl | Befreundete Person 2: aus selben Land wie Befragungsperson |
pld0093 | pl | Befreundete Person 2: Geschlecht |
plj0055 | pl | Befreundete Person 2: Herkunft |
pld0102 | pl | Befreundete Person 2: hoechster Bildungsabschluss |
pld0099 | pl | Befreundete Person 2: ist erwerbstaetig, in Ausbildung, in Rente |
pld0090_v2 | pl | Befreundete Person 2: Verwandtschaft (FID) (unregelmaessig) [1988-2016] |
pld0097 | pl | Befreundete Person 3: Alter |
plj0059 | pl | Befreundete Person 3: aus selben Land wie Befragungsperson |
pld0094 | pl | Befreundete Person 3: Geschlecht |
plj0056 | pl | Befreundete Person 3: Herkunft |
pld0103 | pl | Befreundete Person 3: hoechster Bildungsabschluss |
pld0100 | pl | Befreundete Person 3: ist erwerbstaetig, in Ausbildung, in Rente |
pld0091_v1 | pl | Befreundete Person 3: Verwandtschaft (unregelmaessig) [1988-2016] |
plb0037_v3 | pl | Befristet/unbefristet [2006-2018] |
plj0566 | pl | Behoerdengaenge |
plb0036_v2 | pl | Bei jetzigem Arbeitgeber beschaeftigt [1999-2018] |
plj0175 | pl | Beide Eltern in Deutschland geboren |
plh0206i05 | pl | Beleidigendes Verh. bei Beleidigungen |
plc0311 | pl | Bereits in Rente |
plh0206i01 | pl | Bereitschaft Gefallen zu erwidern |
plh0206i06 | pl | Bereitschaft Kosten aufzunehmen um Hilfe zurueckzugeben |
plb0586 | pl | Berufl. Stellung Selbstaendige |
plb0064_v2 | pl | Berufliche Stellung Angestellte [1991-2018] |
plh0206i04 | pl | Besondere Anstrengung Hilfe zurueckzugeben |
plj0061 | pl | Besuch bei Auslaendern letzte 12 Monate |
plj0060 | pl | Besuch bei Deutschen letzte 12 Monate |
plj0322 | pl | Besuch Herkunftsland i.d. letzt. 2 J. |
plj0063 | pl | Besuch von Auslaendern letzte 12 Monate |
pli0091_v1 | pl | Besuch von Kino,Pop,Jazz Konzerte,Disco (kurz) (unregelmaessig) [1985-2017] |
pli0090_v2 | pl | Besuch von Oper, klass. Konzerte, Theater, Ausstellungen (kurz) (unregelmaessig) |
pli0097_v2 | pl | Beteilig. Parteien, Kommunalpolitik, Buergerinitiativen (kurz) (unregelmaessig) |
plj0132_v2 | pl | Betrag an Eltern/Schwiegereltern (Euro) [2002-2018] |
plj0136_v2 | pl | Betrag an Kinder (Euro) [2002-2018] |
plj0148_v2 | pl | Betrag an nicht Verwandte (Euro) [2002-2018] |
plj0565 | pl | Betrag AsylbLG Leistungen im letzten Monat |
plc0383_v2 | pl | Betrag Erbschaft 1.Person (Euro) (letzte 15 Jahre) [2017] |
plc0393_v2 | pl | Betrag Erbschaft 2.Person (Euro) (letzte 15 Jahre) [2017] |
plc0403_v2 | pl | Betrag Erbschaft 3. Person (Euro) (letzte 15 Jahre) [2017] |
plc0220_v3 | pl | Betrag Rentenversicherung und Knappschaft (Euro) [2003-2018] |
plc0128_v2 | pl | Betrag Sozialgeld im letzten Monat (Euro) [2002-2004,2016-2018] |
plb0040 | pl | Betrieb d. oeffentl. Dienstes |
plh0218 | pl | Bin eher faul |
plh0219 | pl | Bin gesellig |
plh0213 | pl | Bin kommunikativ |
plh0221 | pl | Bin leicht nervoes |
plh0214 | pl | Bin manchmal zu grob zu anderen |
plh0215 | pl | Bin originell |
plh0223 | pl | Bin zurueckhaltend |
ple0018 | pl | Bluthochdruck |
plj0125_v3 | pl | Bruder, Brueder – Entfernung [2006,2011,2016] |
plc0074 | pl | Brutto Einkuenfte a. selbstaendiger Taetigkeit Mon. (Anz.) Vorjahr |
plb0471_v2 | pl | Brutto Lohn als Arbeitnehmer Betrag Vorjahr (Euro) [2002-2018] |
plc0016 | pl | Brutto Lohn als Arbeitnehmer Monate (Anzahl) Vorjahr |
plh0354 | pl | Bruttostundenlohn unter 10 |
ple0022 | pl | Chronische Rueckenbeschwerden |
ple0020 | pl | Demenzerkrankung |
plj0618 | pl | Demokratie: Buergerrechte schuetzen vor staatlicher Unterdrueckung |
plj0617 | pl | Demokratie: Menschen waehlen Regierung in freien Wahlen |
plj0615 | pl | Demokratie: Regierung besteuert Reiche, unterstuetzt Armen |
ple0019 | pl | Depressive Erkrankung |
pld0021_v2 | pl | Derz. Ehepartner Entf., falls nicht i.H. [2006,2011,2016] |
plg0012 | pl | Derzeit in Ausbildung |
plb0058 | pl | Derzeitige Stellung Arbeiter |
plb0065 | pl | Derzeitige Stellung Beamte |
plj0014_v3 | pl | Deutsche Staatsangehoerigkeit [1996-2018] |
ple0012 | pl | Diabetes |
plc0545 | pl | Dritte Nebentaetigkeit Bruttoverdienst letzter Monat |
plc0268_v3 | pl | Dt. Rentenvers. und Knappschaft Witwen-/Waisenrente Brut./Monat (Euro) [2003-20 |
ple0176 | pl | E-zigarette |
pli0096_v2 | pl | Ehrenamtliche Taetigkeit in Vereinen, Verbaenden, …(kurz) (unregelmaessig) [19 |
plh0206i17 | pl | Eigene Reaktionen unter Kontrolle haben |
ple0026 | pl | Eile, Zeitdruck letzten 4 Wochen |
plj0435 | pl | Einfluss von Fluechtlingen auf Deutschland als Lebensort |
plj0433 | pl | Einfluss von Fluechtlingen auf die Wirtschaft |
plb0474_v2 | pl | Einkommen selbstaendig/freiberuflich Brutto/Monat Vorjahr (Euro) [2002-2018] |
plb0477_v2 | pl | Einkuenfte a. Nebenerwerb Betrag Vorjahr (Euro) [2002-2018] |
plc0065 | pl | Einkuenfte a. Nebenerwerb Monate Vorjahr |
ple0009 | pl | Einschraenkg.im Alltgasleben wg. gesundheitl. Probleme |
ple0035 | pl | Einschraenkung sozialer Kontakte wg. Gesundheit |
plh0244 | pl | Einstellung bezueglich Zukunft |
ple0029 | pl | Energie letzten 4 Wochen |
plj0700 | pl | Englisch: Lesen |
plj0699 | pl | Englisch: Schreiben |
plb0158 | pl | Entfernung von Wohnung zur Arbeit in km |
plc0537 | pl | Entnahmen aus personengesellschaften brutto letzter monat |
plc0531 | pl | Entnahmen aus personengesellschaften brutto/monat |
plj0674 | pl | Entscheidung ber Asylantrag |
plj0677 | pl | Ergebnis des Asylantrags |
plh0222 | pl | Erledige Aufgaben wirksam, effizient |
plc0541 | pl | Erste Nebentaetigkeit Bruttoverdienst letzter Monat |
plj0668 | pl | Erster Asylantrag |
ple0040 | pl | Erwerbs-, Schwerbehinderung |
plb0022_v9 | pl | Erwerbsstatus [2016-2018] |
plj0140_v2 | pl | Euro Betrag 2016 an (geschiedenen) Ehepartner (Euro) [2002-2018] |
plj0144_v2 | pl | Euro Betrag an sonstige Verwandte (Euro) [2002-2018] |
plc0563 | pl | Euro Betrag Kreditschulden Ausbildung/BAfoeG |
plc0557 | pl | Euro Gesamtwert Sachvermoegen |
plc0553 | pl | Euro Marktwert Kraftfahrzeug |
plf0088 | pl | Euro Verkehrswert gesamter Immobilien |
plc0111 | pl | Finanz. Absicherung Krankheit |
plk0032 | pl | Folgebefragungen |
plj0089 | pl | Gedanken an Auslandsaufenthalt |
plj0588 | pl | Gefuehl, aussen vor zu sein |
plj0590 | pl | Gefuehl, Menschen aus dem Herkunftsland zu vermissen |
plj0591 | pl | Gefuehl, willkommen zu sein – bei der Ankunft |
plj0592 | pl | Gefuehl, willkommen zu sein – heute |
plh0224 | pl | Gehe mit anderen freundlich um |
plh0129 | pl | Geld gespendet |
plc0532 | pl | Geldwerter vorteil durch nutzung firmenwagen |
ple0021 | pl | Gelenkerkrankungen (auch Arthrose, Rheuma) |
pli0094_v2 | pl | Geselligkeit m. Freund., Verwandt. (kurz) (unregelmaessig) [1985-2017] |
ple0005 | pl | Gesundheitszustand beeintr. Anstreng. Taetigkeiten |
ple0004 | pl | Gesundheitszustand beeintr. Treppen steigen |
ple0008 | pl | Gesundheitszustand gegenwaertig |
plh0263_v2 | pl | Gewerkschaftsmitglied (unregelmaessig) [1990-2015] |
plc0051_v2 | pl | Gewinnbeteiligung Vorjahr Betrag (Euro) [2002-2018] |
plh0225 | pl | Habe lebhafte Phantasie |
plb0608 | pl | Haeufige unterbrechung |
plh0185 | pl | Haeufigkeit aengstlich letzte 4 Wochen |
plh0184 | pl | Haeufigkeit aergerlich letzte 4 Wochen |
plj0632 | pl | Haeufigkeit des Kontakts mit Familie/Freunden im Herkunftsland |
plh0186 | pl | Haeufigkeit gluecklich letzte 4 Wochen |
plh0187 | pl | Haeufigkeit traurig letzte 4 Wochen |
plc0001_v2 | pl | Haushaltsmindesteinkommen netto (Euro) [2002,2007,2012,2017] |
plh0206i03 | pl | Heimzahlen: in eine schwierige Lage bringen |
pld0134 | pl | Heirat |
plj0607 | pl | Herkunftsland: Freie Meinungsaeusserung, Versammlungsrecht und eine unabhaengi |
plj0611 | pl | Herkunftsland: Gleichberechtigung von Maennern und Frauen |
plj0608 | pl | Herkunftsland: Pressefreiheit und Meinungsfreiheit |
ple0014 | pl | Herzkrankheit |
plj0550 | pl | Hilfe: Erlernen der deutschen Sprache |
plj0556 | pl | Hilfe: Finanzielle Situation, Zugang zu staatlichen Leistungen |
plj0554 | pl | Hilfe: Wohnungssuche |
pli0051 | pl | Hobbies, Freizeit Std., Werktg. |
plm0554 | pl | Hoehe Betrag andere finanzielle Unterstuetzungen im letzten Monat |
plc0422 | pl | Hoehe Restschulden aus Krediten |
ple0186 | pl | IGel – individuelle Gesundheitsleistungen, Vorjahr |
plb0020_v2 | pl | In Pflegezeit [2015-2018] |
plj0654 | pl | Integrationskurs des BAMF |
plh0007 | pl | Interesse fuer Politik |
plk0038 | pl | Interviewerfragen – Audiodateien: Haeufigkeit |
plk0049 | pl | Interviewerfragen – Einschaetzung Realitaetsnaehe des Interviews |
plk0036 | pl | Interviewerfragen – uebersetzte Texte: Haeufigkeit |
plk0037 | pl | Interviewerfragen – uebersetzte Texte: Hilfreich |
plj0672 | pl | Jahr Anhoerung |
plj0666 | pl | Jahr Asylantrag |
plj0663 | pl | Jahr BUEMA/Ankunftsnachweis |
plh0226 | pl | Kann mit Stress gut umgehen |
plh0217 | pl | Kann verzeihen |
ple0160 | pl | Kassenwechsel in Vorjahr |
plb0159_v3 | pl | Kein Arbeitsweg,wechselnder Arbeitsort [2000-2013,2015,2017] |
p_buh9 | pl | Keine Uebersetzungshilfe |
pld0152 | pl | Kind geboren |
pli0098_v1 | pl | Kirchgang, Besuch religioeser Veranstaltungen (kurz) (unregelmaessig) [1990-2017 |
plj0678 | pl | Klage gegen Entscheidung ueber Asylantrag |
ple0007 | pl | Koerpergewicht in kg |
ple0006 | pl | Koerpergroesse in cm |
ple0053 | pl | Krankenhausaufenthalt Vorjahr |
ple0015 | pl | Krebserkrankung |
plb0024_v3 | pl | Laenger als 6 Wochen krank gemeldet [1999-2018] |
plh0206i08 | pl | Langes Nachdenken bei Unrecht |
plh0182 | pl | Lebenszufriedenheit gegenwaertig |
plh0183 | pl | Lebenszufriedenheit in 5 Jahren |
plh0206i07 | pl | Leichte Verarbeitung emotionaler Verletzung |
ple0036 | pl | Leiden unter chronischen Krankheiten |
plj0073 | pl | Lesekompetenz: deutsch |
plc0011 | pl | Letztes Wort finanzielle Entscheidung |
plh0377_v2 | pl | Locus of Control:Beeinflussung soz. Verh. durch Engagement [2005,2010,2015-2016 |
plh0381_v2 | pl | Locus of Control:Erfahr.,dass andere mein Leben bestimmen [2005,2010,2015-2016] |
plh0382_v2 | pl | Locus of Control:Erfolg ist hart erarbeitet [2005,2010,2015-2016] |
plh0385_v2 | pl | Locus of Control:Faehigkeiten wichtiger als Anstrengung [2005,2010,2015-2016] |
plh0378_v2 | pl | Locus of Control:Habe nicht das erreicht,was ich verdiene [2005,2010,2015-2016] |
plh0379_v2 | pl | Locus of Control:Mein Lebenslauf haengt von mir ab [2005,2010,2015-2016] |
plh0384_v2 | pl | Locus of Control:Moeglichk. von soz. Umstaenden bestimmt [2005,2010,2015-2016] |
plh0380_v2 | pl | Locus of Control:Was man erreicht haengt von Glueck ab [2005,2010,2015-2016] |
plh0386_v2 | pl | Locus of Control:Wenig Kontrolle ueber Dinge in m. Leben [2005,2010,2015-2016] |
plh0383_v2 | pl | Locus of Control:Zweifle bei Schwierigkeiten an Faehigkt. [2005,2010,2015-2016] |
plh0216 | pl | Mache mir oft Sorgen |
ple0017 | pl | Migraene |
plc0509 | pl | Mindestlohn Euro/Stunde (Cent) |
plc0508 | pl | Mindestlohn Euro/Stunde (Euro) |
plh0264_v2 | pl | Mitglied im Berufsverband (unregelmaessig) [1990-2015] |
plh0265 | pl | Mitglied in Betriebs-,Personalrat |
plh0266 | pl | Mitglied in Umweltschutzorganisation |
plj0118_v3 | pl | Mutter – Entfernung [2006,2011,2016] |
plc0153_v2 | pl | Mutterschafts-/Elterngeld Brutto letzter Monat (Euro) [2002-2018] |
plc0155_v2 | pl | Mutterschaftsgeld Betrag Vorjahr (Euro) [2002-2018] |
plc0154 | pl | Mutterschaftsgeld Monate Vorjahr |
plb0019_v2 | pl | Mutterschutz/Elternzeit [2001-2018] |
plj0009 | pl | Muttersprache deutsch: beide Eltern |
plh0344 | pl | Nachdenken ueber geld |
plb0206_v2 | pl | Nachtarbeit, nach 22 Uhr (unregelmaessig) [1995-2017] |
plh0341 | pl | Nervositaet |
plc0017_v2 | pl | Netto Lohn als Arbeitnehmer Betrag Vorjahr [2002-2018] |
plb0420_v2 | pl | Nettoverdienst mind. /Monat (Euro) [2002-2018] |
ple0027 | pl | Niedergeschlagen letzten 4 Wochen |
pld0067 | pl | Niemand als Vertrauensperson |
pld0088 | pl | Niemand darf unangenehme Warheit sagen |
pld0073 | pl | Niemand foerdert Vorankommen im Beruf, Ausbildung |
pld0082 | pl | Niemand: belastender Streit, Konflikt |
plf0047 | pl | Niemand: Um Hilfe bitten bei Pflegebeduerftigkeit |
pli0165 | pl | Nutzen sozialer Online-Netzwerke |
plh0333 | pl | Partei Bundestagswahl |
plh0204_v2 | pl | Persoenliche Risikobereitschaft [2004,2006,2008-2018] |
plh0206i11 | pl | Positive Einstellung selbst gegenueber |
plc0242 | pl | Private Altersrente (in EURO) |
pli0085_v2 | pl | Private Internet-Nutzung [2003,2008,2013] |
plc0285 | pl | Private Witwenrente (in EURO) |
plh0206i02 | pl | Rache bei schwerem Unrecht |
ple0081_v2 | pl | Rauchen gegenwaertig (unregelmaessig) [2004-2018] |
ple0086_v3 | pl | Rauchen: Anzahl Pfeifen pro Tag (unregelmaessig) [2002-2018] |
ple0086_v2 | pl | Rauchen: Anzahl Zigaretten pro Tag (unregelmaessig) [2002-2018] |
ple0086_v4 | pl | Rauchen: Anzahl Zigarren pro Tag (unregelmaessig) [2002-2018] |
plk0033 | pl | Record Linkage (IEB) |
plj0614 | pl | Regierungsformen: Demokratisches System |
plj0612 | pl | Regierungsformen: Starker Fuehrer |
plh0258_v9 | pl | Religionszugehoerigkeit [2013,2016-2018] |
plh0258_v8 | pl | Religionszugehoerigkeit [2015] |
plc568 | pl | Rente aus dem Ausland Brutto/Monat 2017 |
plc0233_v2 | pl | Rente/Pension Brutto letzter Monat (Euro) [2002-2018] |
plc0416 | pl | Restschuld Immobilie |
plf0067 | pl | Restschuld Wohneigentum |
plc0516 | pl | Riesterrente ae Brutto/Monat Vorjahr |
plc0335 | pl | Rueckkaufwert Vers. o. Geldanlagen |
plh0220 | pl | Schaetze kuenstler. Erfahrung |
pld0140 | pl | Scheidung |
ple0011 | pl | Schlafstoerung |
ple0016 | pl | Schlaganfall |
plj0072 | pl | Schreibkompetenz: deutsch |
plb0571 | pl | Schwarzarbeit im persoenlichen Umfeld Vorjahr |
plj0124 | pl | Schwester, Schwestern – Entfernung |
plb0282_v2 | pl | Seit Anfang Vorjahr aus Beruf ausgeschieden [2001-2018] |
plg0072 | pl | Seit Vorjahr Ausbildung abgeschlossen |
plj0123_v3 | pl | Sohn, Soehne – Entfernung [2006,2011,2016] |
ple0023 | pl | Sonstige Krankheit |
plc0053_v2 | pl | Sonstige Sonderverguetung Brutto Vorjahr (Euro) [2002-2018] |
plc0203_v2 | pl | Sonstige Unterstuetzung ausserhalb HH Brutto letzter Monat (Euro) [2002-2018] |
plh0032 | pl | Sorgen allgemeine wirtschaftliche Entwicklung |
plh0042 | pl | Sorgen Arbeitsplatzsicherheit |
plh0335 | pl | Sorgen eigene Altersversorgung |
plh0035 | pl | Sorgen eigene Gesundheit |
plh0033 | pl | Sorgen eigene wirtschaftliche Situation |
plj0597 | pl | Sorgen Ergebnis des Asylverfahrens |
plh0038 | pl | Sorgen Friedenserhaltung |
plh0336 | pl | Sorgen soz. Zusammenhalt der Ges. |
plj0046 | pl | Sorgen Zuwanderung |
plj0598 | pl | Sorgen, nicht in Deutschland bleiben zu koennen |
plb0031_v2 | pl | Stellenwechsel im Vorjahr [1994-2018] |
plj0624 | pl | Stellung der Frau: Ausbildung des Sohnes wichtiger als die der Tochter |
plj0122_v3 | pl | Tochter, Toechter – Entfernung [2006,2011,2016] |
pld0163 | pl | Tod der Mutter |
pld0146 | pl | Tod des Partners |
pld0160 | pl | Tod des Vaters |
pld0166 | pl | Tod eines Kindes |
pld0143 | pl | Trennung von Partner |
plh0206i16 | pl | Umgang mit schwierigen Situationen |
plj0045 | pl | Umzug nach West-/Ostdeutschland moeglich? |
plc0190_v1 | pl | Unterhalt aus Unterhaltsvorschusskassen Betrag Vorjahr [2010-2017] |
plc0184 | pl | Unterhalt aus Unterhaltsvorschusskassen Bruttobetrag pro Monat |
plc0535 | pl | Unterhalt von frueherem partner/kindesunterhalt brutto letzter monat |
plc0528 | pl | Unterhalt von frueherem partner/kindesunterhalt brutto/monat |
plc0527 | pl | Unterhalt von frueherem partner/kindesunterhalt monate |
plc0198_v2 | pl | Unterstuetzung ausserhalb des HH Betrag Vorjahr (Euro) [2002-2018] |
plc0205_v1 | pl | Unterstuetzung ausserhalb des HH Monate Vorjahr [1995-2018] |
plj0438 | pl | Unterstuetzung Fluechtlinge letztes Jahr: Spenden |
plj0439 | pl | Unterstuetzung Fluechtlinge zukuenftig: Spenden |
plc0049_v2 | pl | Urlaubsgeld Vorjahr Betrag (Euro) [2002-2018] |
plj0119_v3 | pl | Vater – Entfernung [2006,2011,2016] |
plj0568 | pl | Verbrachte Zeit mit Personen des Herkunftslandes |
plj0080 | pl | Verbundenheit Heimatland |
plj0043 | pl | Verbundenheit zum Wohnort |
plh0356 | pl | Verein/Sonst. Organisation |
plh0206i10 | pl | Vergeben und Vergessen von Unrecht |
plf0063 | pl | Verkehrswert Wohneigentum |
plb0433_v2 | pl | Verlust des Arbeitsplatzes (unregelmaessig) [1999-2018] |
plc0366 | pl | Vermoegenswert Betrieb, Beteiligung |
plj0604 | pl | Wahrscheinlichkeit einer Ausbildung oder Weiterbildung in Deutschland |
plj0044 | pl | Wegzug aus familiaeren/berufl.Gruenden? |
plc0047_v2 | pl | Weihnachtsgeld Vorjahr Betrag (Euro) [2002-2018] |
p_anw_v2 | pl | Weitere Personen anwesend [2016-2018] |
plh0206i18 | pl | Weiterentwicklung durch schwierige Situationen |
ple0033 | pl | Weniger geschafft wg. seelischer Probleme |
ple0034 | pl | Weniger Sorgfalt wg. seelischer Probleme |
plc0316 | pl | Wert Bausparvertrag |
plc0329 | pl | Wert der Geldanlagen |
plh0107 | pl | Wichtigkeit: Erfolg im Beruf haben |
plh0111 | pl | Wichtigkeit: Sich politisch, gesellschaftlich einsetzen |
ple0177 | pl | Wie oft Alkohol |
ple0180 | pl | Wie oft Fisch |
ple0179 | pl | Wie oft Fleisch |
ple0181 | pl | Wie oft Gefluegel |
plc0274_v2 | pl | Witwen/Waisenrente Brutto letzter Monat (Euro) [2002-2018] |
plc0283_v2 | pl | Witwenrente betriebliche Altersversorgung (in EURO) [2003-2018] |
plc0286_v2 | pl | Witwenrente Unfallversicherung (EURO) [2003-2018] |
plc0281_v2 | pl | Witwenrente Zusatzversorgung oeffentlicher Dienst (EURO) [2003-2018] |
pld0133 | pl | Wohnt Partner,-in im Haushalt |
plb0241_v2 | pl | Wunscharbeitszeit Std./Wo. [2000-2015,2017-2018] |
plb0041 | pl | Zeitarbeit |
plj0024_v1 | pl | Zeitpunkt Erwerb deutscher Staatsangehoerigkeit [2002-2012,2014-2018] |
plh0061 | pl | Ziel: Schutz freie Meinungsaeusserung |
plh0180 | pl | Zufriedenheit Familienleben |
plh0171 | pl | Zufriedenheit Gesundheit |
plh0162 | pl | Zufriedenheit Lebensstandard |
plj0681 | pl | Zufriedenheit mit Wohnsituation – Allgemein |
plj0683 | pl | Zufriedenheit mit Wohnsituation – Geraeuschpegel |
plj0689 | pl | Zufriedenheit mit Wohnsituation – Moeglichkeit, Deutsch zu lernen |
plj0682 | pl | Zufriedenheit mit Wohnsituation – Qualitaet des Essens |
plh0177 | pl | Zufriedenheit Wohnung |
plh0258_v11 | pl | Zugehoerigkeit islam. Religionsgemeinschaft [2013,2015-2018] |
plb0417_v2 | pl | Zukuenftige Erwerbstaetigkeit beabsichtigt [1994-2018] |
pld0137 | pl | Zusammenzug mit Partner |
plc0238_v2 | pl | Zusatzversorgung Rente Brutto/Monat (Euro) [2003-2018] |
plc0056 | pl | Zuschuesse fuer oeffentlichen Nahverkehr: Betrag (in EURO) |
plj0437 | pl | Zustrom von Fluechtlingen langfristig mehr Risiko oder Chance |
plc0543 | pl | Zweite Nebentaetigkeit Bruttoverdienst letzter Monat |
AnzahlFall | RKI Daten zu COVID-19-Dashboard | COVID-19 Fälle |
AnzahlGenesen | RKI Daten zu COVID-19-Dashboard | COVID-19 Genesene |
AnzahlTodesfall | RKI Daten zu COVID-19-Dashboard | COVID-19 Todesfälle |
IdLandkreis | RKI Daten zu COVID-19-Dashboard | Gemeindekennziffer |
Inzidenz | RKI Daten zu COVID-19-Dashboard | Inzidenz |
Meldedatum | RKI Daten zu COVID-19-Dashboard | Meldedatum |
hid | zvp | Aktuelle Haushaltsnummer (=ZHHNR) |
syear | zvp | Befragungsjahr |
Merkmal | Ausprägung | Haushalte |
---|---|---|
Bundesland | Berlin, Brandenburg | 3.285.000 |
Bundesland | Hamburg, Schleswig-Holstein | 5.286.000 |
Bundesland | Bremen, Niedersachsen | 6.453.000 |
Bundesland | Nordrhein-Westfalen | 4.339.000 |
Bundesland | Hessen | 2.473.000 |
Bundesland | Saarland, Rheinland-Pfalz | 830.000 |
Bundesland | Baden-Württemberg | 8.756.000 |
Bundesland | Bavaria | 3.091.000 |
Bundesland | Mecklenburg-Vorpommern | 2.454.000 |
Bundesland | Sachsen-Anhalt | 2.156.000 |
Bundesland | Thüringen | 1.151.000 |
Bundesland | Sachsen | 1.104.000 |
HHGröße | 1-Personen Haushalt | 17.334.000 |
HHGröße | 2-Personen Haushalt | 13.983.000 |
HHGröße | 3-Personen Haushalt | 3.748.000 |
HHGröße | 4-Personen Haushalt | 4.923.000 |
HHGröße | Haushalt mit 5 oder mehr Personen | 1.390.000 |
Gemeindegrößenklasse | Weniger als 20,000 Einwohner | 7.660.000 |
Gemeindegrößenklasse | 20,000-100,000 Einwohner | 11.309.000 |
Gemeindegrößenklasse | 100,000-500,000 Einwohner | 15.642.000 |
Gemeindegrößenklasse | Mehr als 500,000 Einwohner | 6.767.000 |
Eigentümer | Eigentümer | 22.154.796 |
Eigentümer | Mieter | 19.223.204 |
HHTyp | Single-Haushalt | 17.334.000 |
HHTyp | 2 Erwachsene ohne Kind | 13.204.000 |
HHTyp | 2 Erwachsene , 1 oder 2 Kinder | 3.790.000 |
HHTyp | Alleinerziehendes Elternteil, weniger als 3 Kinder | 1.214.000 |
HHTyp | Alleinerziehendes Elternteil, 3 oder mehr Kinder | 4.983.000 |
HHTyp | Familien mit mehr als 3 Kindern | 853.000 |
Letztes Zuzugsjahr | 1900-1979 | 35.410.969 |
Letztes Zuzugsjahr | 1980-1984 | 851.551 |
Letztes Zuzugsjahr | 1985-1989 | 1.323.417 |
Letztes Zuzugsjahr | 1990-1994 | 749.033 |
Letztes Zuzugsjahr | 1995-1999 | 381.391 |
Letztes Zuzugsjahr | 2000-2004 | 1.154.279 |
Letztes Zuzugsjahr | 2005-2009 | 945.699 |
Letztes Zuzugsjahr | 2010-2013 | 561.661 |
Nationalität | EU Bürger | 35.023.584 |
Nationalität | Ehemaliges Jugoslawien | 2.699.525 |
Nationalität | GUS Staaten | 1.746.731 |
Nationalität | Türkei | 632.517 |
Nationalität | Rest der Welt | 755.007 |
Nationalität | Nur deutsche Nationalität | 520.636 |
Migrationshintergrund | Keine Person mit Migrationshintergrund der 2. Generation im Haushalt | 38.074.217 |
Migrationshintergrund | Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995 | 572.996 |
Migrationshintergrund | Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren zwischen 1975-1994 | 353.175 |
Migrationshintergrund | Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995 | 2.377.612 |
Merkmal | Ausprägung | Personen |
---|---|---|
Alter x Geschlecht | 0-4, männlich | 1.880.000 |
Alter x Geschlecht | 0-4, weiblich | 1.804.000 |
Alter x Geschlecht | 5-9, männlich | 1.825.000 |
Alter x Geschlecht | 5-9, weiblich | 1.712.000 |
Alter x Geschlecht | 10-14, männlich | 1.860.000 |
Alter x Geschlecht | 10-14, weiblich | 1.756.000 |
Alter x Geschlecht | 15-19, männlich | 2.093.000 |
Alter x Geschlecht | 15-19, weiblich | 1.940.000 |
Alter x Geschlecht | 20-24, männlich | 2.311.000 |
Alter x Geschlecht | 20-24, weiblich | 2.086.000 |
Alter x Geschlecht | 25-29, männlich | 2.650.000 |
Alter x Geschlecht | 25-29, weiblich | 2.445.000 |
Alter x Geschlecht | 30-34, männlich | 2.705.000 |
Alter x Geschlecht | 30-34, weiblich | 2.580.000 |
Alter x Geschlecht | 35-39, männlich | 2.652.000 |
Alter x Geschlecht | 35-39, weiblich | 2.538.000 |
Alter x Geschlecht | 40-44, männlich | 2.457.000 |
Alter x Geschlecht | 40-44, weiblich | 2.436.000 |
Alter x Geschlecht | 45-49, männlich | 2.851.000 |
Alter x Geschlecht | 45-49, weiblich | 2.861.000 |
Alter x Geschlecht | 50-54, männlich | 3.480.000 |
Alter x Geschlecht | 50-54, weiblich | 3.466.000 |
Alter x Geschlecht | 55-59, männlich | 3.257.000 |
Alter x Geschlecht | 55-59, weiblich | 3.257.000 |
Alter x Geschlecht | 60-64, männlich | 2.651.000 |
Alter x Geschlecht | 60-64, weiblich | 2.782.000 |
Alter x Geschlecht | 65-69, männlich | 2.341.000 |
Alter x Geschlecht | 65-69, weiblich | 2.505.000 |
Alter x Geschlecht | 70+, männlich | 5.393.000 |
Alter x Geschlecht | 70+, weiblich | 7.039.000 |
Ausländer | nein | 71.706.000 |
Ausländer | ja | 9.907.000 |
Zuzugsjahr | 1900-1979 | 71.354.989 |
Zuzugsjahr | 1980-1984 | 1.306.214 |
Zuzugsjahr | 1985-1989 | 818.330 |
Zuzugsjahr | 1990-1994 | 1.262.019 |
Zuzugsjahr | 1995-1999 | 1.837.921 |
Zuzugsjahr | 2000-2004 | 1.419.751 |
Zuzugsjahr | 2005-2009 | 1.134.676 |
Zuzugsjahr | 2010-2013 | 555.342 |
Zuzugsjahr | Andere | 1.923.758 |
Nationalität | EU Bürger | 69.872.114 |
Nationalität | Ehemaliges Jugoslawien | 4.757.776 |
Nationalität | GUS Staaten | 1.281.253 |
Nationalität | Türkei | 3.166.757 |
Nationalität | Rest der Welt | 1.633.195 |
Nationalität | Nur deutsche Nationalität | 901.904 |
Migrationshintergrund | Indirekte Migration, born after 1995 | 4.622.919 |
Migrationshintergrund | Indirekte Migration, German nat., born 1975/1994 | 75.720.370 |
Migrationshintergrund | Indirekte Migration, other nat., born 1975/1994 | 529.641 |
Migrationshintergrund | Indirekte Migration, other nat. born before 1964 until 1974 | 524.932 |
Migrationshintergrund | Direkte oder keine Migration, oder indirekte Migration, aber Deutsche Nationalität und vor 1975 geboren | 215.138 |
Merkmal | Ausprägung | Erwachsene |
---|---|---|
Ausländer | nein | 60.902.285 |
Ausländer | ja | 8.603.532 |
Alter x Geschlecht | 18-19, männlich | 1.048.501 |
Alter x Geschlecht | 18-19, weiblich | 1.065.027 |
Alter x Geschlecht | 20-24, männlich | 2.381.657 |
Alter x Geschlecht | 20-24, weiblich | 2.124.357 |
Alter x Geschlecht | 25-29, männlich | 2.705.653 |
Alter x Geschlecht | 25-29, weiblich | 2.461.676 |
Alter x Geschlecht | 30-34, männlich | 2.741.518 |
Alter x Geschlecht | 30-34, weiblich | 2.593.183 |
Alter x Geschlecht | 35-39, männlich | 2.669.233 |
Alter x Geschlecht | 35-39, weiblich | 2.551.020 |
Alter x Geschlecht | 40-44, männlich | 2.481.609 |
Alter x Geschlecht | 40-44, weiblich | 2.439.989 |
Alter x Geschlecht | 45-49, männlich | 2.859.804 |
Alter x Geschlecht | 45-49, weiblich | 2.866.329 |
Alter x Geschlecht | 50-54, männlich | 3.510.252 |
Alter x Geschlecht | 50-54, weiblich | 3.478.934 |
Alter x Geschlecht | 55-59, männlich | 3.264.397 |
Alter x Geschlecht | 55-59, weiblich | 3.259.593 |
Alter x Geschlecht | 60-64, männlich | 2.654.516 |
Alter x Geschlecht | 60-64, weiblich | 2.783.943 |
Alter x Geschlecht | 65-69, männlich | 2.344.381 |
Alter x Geschlecht | 65-69, weiblich | 2.516.630 |
Alter x Geschlecht | 70+, männlich | 5.491.186 |
Alter x Geschlecht | 70+, weiblich | 7.212.427 |