Kritische Analyse der Heinsberg-Studie

Gaudloth

Bratze
Weil ja ein bestimmtes Klientel zum Karneval geht und man so nicht davon ausgehen kann, dass sich der Virus gleichmäßig in der Bevölkerung verteilt. Das gilt auch für das Alter. Denn diesen Zusammenhang stellt die Studie nicht dar.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
3. Die Berechnung der IFR

...Letztendlich kommunzieren die Autoren aber "die IFR betraegt 0,38%"...

Stimmt nicht. Die Autoren kommunizieren, ich zitiere:

Based on the estimated percentage of infected people in this population, the IFR wasestimated to bei 0.36% [0.29%; 0.45%]. (page 11)

In den eckigen Klammern ist das 95%-Konfidenzinterwall, will heißen der "wahre" Wert liegt sehr wahrscheinlich zwichen 0.29 und 0.45 - um das mal ganz vereinfacht zu erklären.

Und weiter:

To determine the IFR, the collection of materials and information including the reported cases and deaths was closed at the end of the study acquisition period (April 6th), and the IFR was calculated based on those data. However, some of the individuals still may have been acutely infected at the end of the study acquisition period (April 6th) and thus may have succumbed to the infection later on. In fact, in the 2-week follow-up period (until April 20th) one additional COVID-19 associated death was registered. The inclusion of this additional death would bring up the IFR from 0.36% to an estimated 0.41% [0.33%; 0.52%]. (page 11f)
 
Zuletzt bearbeitet:

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Weil ja ein bestimmtes Klientel zum Karneval geht und man so nicht davon ausgehen kann, dass sich der Virus gleichmäßig in der Bevölkerung verteilt. Das gilt auch für das Alter. Denn diesen Zusammenhang stellt die Studie nicht dar.

Das stimmt so auch nicht. Zudem diskutieren die Autoren recht ausführlich ihre Daten vor dem Hintergrund der Karnevalteilnahme, was zu sehr interessanten Erkenntnissen zu den möglichen Übertragungswegen und ihre Bedeutung für Krankheitsverlauf geben.Und ebenso für mögliche Strategien gegen die Pandemie.

Although the IFR is much less variable than the infection rate in different parts of the country, the IFR may still be affected by certain circumstances. The community in which this study was performed experienced a super-spreading event. The IFR was unlikely affected by an overwhelmed health care system because sufficient numbers of ICU beds and ventilators were available at alltimes. However, it is possible that the super-spreading event itself caused more severe cases. In our study,we found a highly significant increase in both infection rate and number of symptoms when people attended carnival festivities, as compared to people who did not celebrate carnival. This association withcarnival was at the same level when adjusted for the age of the participants. At this point, the reason for the association with celebrating carnivalremains speculative. Thus far,wecould not identify confounding factors that would explain the observed difference. However, it is well established that the rate of particleemission and superemission during human speech increaseswith voice loudness25. Because of loud voices and singing in close proximity are common in carnival events,it is reasonable to speculate that a higher viral load at the time of infection causedthe higher intensity of symptoms and thus more severe clinical courses of the infection. Notably, results from experimental human influenza infection studies havedemonstratedthat the symptom score depends on the viral dose administered26,27. Similar observations have been made for MERS28and SARS29. Little is known about the infection dynamics of SARS-CoV-2. Future studies designed to specifically analyze the infection chains after super-spreading events may provide further insight. If substantiated, the IFR under strict hygiene measures might be lower than the IFR in the context of a super-spreading event in this study, with important consequences for the strategy against the pandemic. (page 12)
 

Gaudloth

Bratze
Alles schön und gut. Es ging aber gerade darum, dass die IFR nicht repräsentativ ist und auf ganz Deutschland über tragen werden kann, selbst wenn sie für Gangelt richtig wäre.
Und dafür habe ich 2 Gründe genannt.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Alles schön und gut. Es ging aber gerade darum, dass die IFR nicht repräsentativ ist und auf ganz Deutschland über tragen werden kann, selbst wenn sie für Gangelt richtig wäre.
Und dafür habe ich 2 Gründe genannt.

Die aber beide eher nicht stimmen.
 

Gaudloth

Bratze
Natürlich stimmen die. Man kann ja diskutieren ob das eine große Auswirkung hat (ich denke schon), aber natürlich hat man beim Karneval keinen repräsentativen Bevölkerungsdurchschnitt.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Das hat aber keinerlei Auswirkungen auf der IFR.
 

Rupert

Friends call me Loretta
Das ist ja auch kein Problem. Wenn der IFR stimmt (Anteil der Toten an allen Infizierten) und die Anzahl der Toten (6700) kann man die Zahl der Infizierten errechnen. Das ist auch völlig unabhängig davon ob es in Heinsberg überdurchschnittlich viele oder wenig Infizierte gibt. Wenn wir wissen, wie viele in Heinsberg infiziert sind und wie viele Covid-19-Tote wir hatten, dann haben wir den IFR.

Völlig korrekt bezogen auf die Annahmen und Voraussetzungen, die Du nennst bzw. einbeziehst.
 

Litti

Krawallbruder
Meine Mutter kommt übrigens gebürtig aus dem Kreis Heinsberg, wohnt aber in Euskirchen. Nur das ich auch mal was wichtiges zur Diskussion beigetragen habe.
 

Rupert

Friends call me Loretta
Zu einer anderen Einschätzung bzgl. der Infektionszahl in D:
Ich habe gerade vorher in einem Video durch Frau Prof. Dr. Ulrike Protzer (ab Minute 19:25) ihres Zeichens Virologin am Helmhotz Zentrum und dem Klinkum Rechts der Isar der TU München, erfahren, dass die ihr vorliegenden Daten aussagen, dass es zwischen 1 und 2% Prozent Antikörpernachweise, auf die Bevölkerung Deutschlands hochgerechnet, geben sollte; das wären also dann zwischen 800.000 und 1.600.000 Menschen.
D.h. aber dann noch nicht, dass diese Menschen auch immun sind; es heisst nur, dass diese Menschen Kontakt zu SARS-CoV-2 hatten und eben das Immunsystem das Virus kennt.
Somit läge also die Hochrechnung der Heinsbergstudie schon im Rahmen; am oberen Ende der Skala halt.
 

Detti04

The Count
Stimmt nicht. Die Autoren kommunizieren, ich zitiere:

Based on the estimated percentage of infected people in this population, the IFR wasestimated to bei 0.36% [0.29%; 0.45%]. (page 11)

In den eckigen Klammern ist das 95%-Konfidenzinterwall, will heißen der "wahre" Wert liegt sehr wahrscheinlich zwichen 0.29 und 0.45 - um das mal ganz vereinfacht zu erklären.

Und weiter:

To determine the IFR, the collection of materials and information including the reported cases and deaths was closed at the end of the study acquisition period (April 6th), and the IFR was calculated based on those data. However, some of the individuals still may have been acutely infected at the end of the study acquisition period (April 6th) and thus may have succumbed to the infection later on. In fact, in the 2-week follow-up period (until April 20th) one additional COVID-19 associated death was registered. The inclusion of this additional death would bring up the IFR from 0.36% to an estimated 0.41% [0.33%; 0.52%]. (page 11f)
Jetzt will der mir das Konfidenzintervall erklaeren... Ausserdem hab ich doch selber gesagt, dass der 8. Todesfall erwaehnt wird. Kommunziert wird aber letztlich das, was im Abstract steht, und das sind eben die 0,37%. (Um genau zu sein werden im Abstract und an mehreren Stellen im Paper 0,36% angegeben, aber das duerften letztendlich Tippfehler oder die Folge falschen Rundens sein.)
 
Zuletzt bearbeitet:

Detti04

The Count
Das hat aber keinerlei Auswirkungen auf der IFR.
Natuerlich hat eine nicht-repraesentative Stichprobe einen Einfluss darauf, ob die aus ihr berechnete IFR repraesentativ fuer ganz Deutschland ist. Mach doch mal eine Stichprobe in einem Altersheim und berechne auf Basis dieser Stichprobe die dortige IFR. Ob die wohl repraesentativ fuer ganz Deutschland ist, also auch fuer den Rest der Bevoelkerung, der nicht in Altenheimen wohnt?
 

Detti04

The Count
Mir ist jetzt klar geworden, welchen Fehler man macht, wenn man die IFR aus den abgeschlossenen Faellen einer Kohorte berechnet und die Kohorte noch offene Faelle hat. Die so berechnete IFR ist nur dann richtig, wenn die IFR zeitlich konstant ist, d.h. wenn Todesfaelle und genesene Faelle im Mittel gleich schnell auftreten. Wenn das nicht der Fall ist, dann macht man folgende Fehler, naemlich:

a) Man ueberschaetzt mit der berechneten Zahl die IFR der gesamten Kohorte, wenn die Infizierten im Mittel schneller sterben als gesunden; oder
b) Man unterschaetzt mit der berechneten Zahl die IFR der gesamten Kohorte, wenn die Infizierten im Mittel schneller gesunden als sterben.

Bei den erfassten Infizierten scheint a) zu gelten, insbesondere in den Krankenhaeusern. Bei den nicht-erfassten Infizierten, also den ganzen leichten Faellen, duerfte b) gelten, d.h. man wird vermutlich nicht wochenlang leicht krank oder symptomlos infiziert sein. Diese Effekte heben sich beim Coroanvirus also vermutlich zumindest teilweise heraus, womit nicht klar ist, ob der Wert von 0,59% die schlussendliche IFR der Kohorte* ueber- oder unterschaetzt. Daher wuerde ich ihn unveraendert lasssen.

* Die Kohorte besteht in diesem Fall aus allen Bewohnern Gangelts, die zum Zeitpunkt der Probenentnahme der Studie infiziert waren oder infiziert gewesen waren.
 
Zuletzt bearbeitet:

Detti04

The Count
Zu einer anderen Einschätzung bzgl. der Infektionszahl in D:
Ich habe gerade vorher in einem Video durch Frau Prof. Dr. Ulrike Protzer (ab Minute 19:25) ihres Zeichens Virologin am Helmhotz Zentrum und dem Klinkum Rechts der Isar der TU München, erfahren, dass die ihr vorliegenden Daten aussagen, dass es zwischen 1 und 2% Prozent Antikörpernachweise, auf die Bevölkerung Deutschlands hochgerechnet, geben sollte; das wären also dann zwischen 800.000 und 1.600.000 Menschen.
D.h. aber dann noch nicht, dass diese Menschen auch immun sind; es heisst nur, dass diese Menschen Kontakt zu SARS-CoV-2 hatten und eben das Immunsystem das Virus kennt.
Somit läge also die Hochrechnung der Heinsbergstudie schon im Rahmen; am oberen Ende der Skala halt.
Das von der Virologin angegebene Intervall von 1-2% scheint mir ein bisschen witzlos, weil sehr gross. Um das durch den Vergleich zu den bekannten Faellen (momentan etwa 168.000) zu belegen, welche ich fuer einfaches Rechnen hier mal falsch auf 160.000 "abrunde":

- Bei insgesamt 800.000 Infizierten machten die bekannten Faelle 20% aus, d.h. auf jeden bekannten Infizierten kaemen 4 unbekannte Infizierte.
- Bei insgesamt 1.600.000 Infizierten machten die bekannten Faelle 10% aus, d.h. auf jeden bekannten Infizierten kaemen 9 unbekannte Infizierte.

Oder anders: Wie zuverlaessig faendest Du die Aussage "Die Dunkelziffer an Infizierten ist vier- bis neunmal so hoch wie die Zahl der bekannten Infizierten"? Ich faende eine solche Aussage wenig hilfreich, weil die Spannbreite zu gross ist. Fuer mich wirken die 1-2% so, als sei das ein Wert, den man (quasi aus der hohlen Hand) einfach mal annimmt, weil man irgendwas in der Groessenordnung von 1% observiert.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Kommunziert wird aber letztlich das, was im Abstract steht, und das sind eben die 0,37%.

Stimmt auch nicht. Der abstract ist eine Zusammenfassung in welchem allein schon aus Platzgründen nicht alle Ergebnisse in allen Details genannt werden. Man muss sich leider schon die Mühe und immer den ganzen Artikel lesen.

Nähme ich diese Aussage für bare Münze, dann würde alle wissenschaftlichen Artikel "falsche Ergebnisse" kommunizieren.

Natuerlich hat eine nicht-repraesentative Stichprobe einen Einfluss darauf,...

Darum ging es aber gar nicht, die Behauptung war, dass man beim Karneval keinen repräsentativen Bevölkerungsdurchschnitt findet. Was hat das mit dem IFR zu tun?

Das von der Virologin angegebene Intervall von 1-2% scheint mir ein bisschen witzlos, weil sehr gross. Um das durch den Vergleich zu den bekannten Faellen (momentan etwa 168.000) zu belegen, welche ich fuer einfaches Rechnen hier mal falsch auf 160.000 "abrunde":

- Bei insgesamt 800.000 Infizierten machten die bekannten Faelle 20% aus, d.h. auf jeden bekannten Infizierten kaemen 4 unbekannte Infizierte.
- Bei insgesamt 1.600.000 Infizierten machten die bekannten Faelle 10% aus, d.h. auf jeden bekannten Infizierten kaemen 9 unbekannte Infizierte.

Oder anders: Wie zuverlaessig faendest Du die Aussage "Die Dunkelziffer an Infizierten ist vier- bis neunmal so hoch wie die Zahl der bekannten Infizierten"? Ich faende eine solche Aussage wenig hilfreich, weil die Spannbreite zu gross ist.

Da ist man wieder beim Phänomen der subjektiven Einschätzung, was ist groß und was ist klein? Ich finde das Intervall zum Beispiel zum Beispiel eher klein. Die Herdenimmunität ist beispielsweise in beiden Fällen noch meilenweit entfernt.

Welche praktischen Unterschiede gäbe es denn in den Maßnahmen zur Eindämmung der Pandemie zwischen Fall a) 1% und Fall b) 2%?
 
Zuletzt bearbeitet:

Gaudloth

Bratze
Darum ging es aber gar nicht, die Behauptung war, dass man beim Karneval keinen repräsentativen Bevölkerungsdurchschnitt findet. Was hat das mit dem IFR zu tun?

Das hat was mit der Übertragbarkeit der IFR auf andere Regionen zu tun. Je älter und kränker die Menschen sind, desto eher sterben sie an Covid.
 
Zuletzt bearbeitet:

Rupert

Friends call me Loretta
Das von der Virologin angegebene Intervall von 1-2% scheint mir ein bisschen witzlos, weil sehr gross. Um das durch den Vergleich zu den bekannten Faellen (momentan etwa 168.000) zu belegen, welche ich fuer einfaches Rechnen hier mal falsch auf 160.000 "abrunde":

- Bei insgesamt 800.000 Infizierten machten die bekannten Faelle 20% aus, d.h. auf jeden bekannten Infizierten kaemen 4 unbekannte Infizierte.
- Bei insgesamt 1.600.000 Infizierten machten die bekannten Faelle 10% aus, d.h. auf jeden bekannten Infizierten kaemen 9 unbekannte Infizierte.

Oder anders: Wie zuverlaessig faendest Du die Aussage "Die Dunkelziffer an Infizierten ist vier- bis neunmal so hoch wie die Zahl der bekannten Infizierten"? Ich faende eine solche Aussage wenig hilfreich, weil die Spannbreite zu gross ist. Fuer mich wirken die 1-2% so, als sei das ein Wert, den man (quasi aus der hohlen Hand) einfach mal annimmt, weil man irgendwas in der Groessenordnung von 1% observiert.

Mag ja sein, dass es Dir witzlos erscheint, wenn aber die Datenlage gerade nicht mehr zulässt als so ein großes Intervall und das auch so kommuniziert wird, dann ist das für mich völlig i.O. und einzusehen.
 
Zuletzt bearbeitet:

Detti04

The Count
Stimmt auch nicht. Der abstract ist eine Zusammenfassung in welchem allein schon aus Platzgründen nicht alle Ergebnisse in allen Details genannt werden. Man muss sich leider schon die Mühe und immer den ganzen Artikel lesen.

Nähme ich diese Aussage für bare Münze, dann würde alle wissenschaftlichen Artikel "falsche Ergebnisse" kommunizieren. [...]
Im Abstract stehen die wichtigsten Ergebnisse. Soll heissen: Das, was im Abstract steht, ist die zentrale Aussage einer Arbeit. Da ist es egal, was spaeter im Hauptteil sonst noch so gesagt wird: Der Abstract uebermittelt die Kernaussage der Arbeit.
 

Detti04

The Count
[...]
Darum ging es aber gar nicht, die Behauptung war, dass man beim Karneval keinen repräsentativen Bevölkerungsdurchschnitt findet. Was hat das mit dem IFR zu tun?
[...]
Findet man einen repraesentativen Bevoelkerungsdurchschnitt im Fussballstadion? Falls nein, wieso sollte man ihn bei einem anderen Grossereignis finden koennen?

Und die Frage, was die Repraesentativitaet einer Stichprobe mit der Validitatet der aus ihr errechneten Werte zu tun hat, die kann ja wohl nicht ernst gemeint sein.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Ja eben, sag ich ja. Ob eine beliebige Großveranstaltung irgendeinen Bevölkerungdurchschnitt (übrigens: nach welchen Kriterien denn überhaupt?) repräsentiert, ist völlig unerheblich für die (jede) Studie. Daher ist dieser Kritikpunkt ja auch gar keiner.

Im Abstract stehen die wichtigsten Ergebnisse. Soll heissen: Das, was im Abstract steht, ist die zentrale Aussage einer Arbeit. Da ist es egal, was spaeter im Hauptteil sonst noch so gesagt wird: Der Abstract uebermittelt die Kernaussage der Arbeit.

Das hört sich ja schon ganz anders an. Es ist aber natürlich nicht egal, was weiter im Artikel steht, denn dann bräuchte man den ja gar nicht veröffentlichen. Zu behaupten, die Zahl im abstract wäre die einzige kommunizierte Zahl und das dann zu kritisieren ist halt eine etwas unredliche Kritik.


Das hat was mit der Übertragbarkeit der IFR auf andere Regionen zu tun. Je älter und kränker die Menschen sind, desto eher sterben sie an Covid.

Gibt es Heinsberg denn a) mehr Alte und Kranke als woanders? Und haben b) in der Studie mehr Alte und Kranke mitgemacht als im Durchschnitt? Und c) wie groß dürfen denn die Abweichungen höchstens sein, damit sie das Ergebnis unübertragbar machen?
 
Zuletzt bearbeitet:

Detti04

The Count
Ja eben, sag ich ja. Ob eine beliebige Großveranstaltung irgendeinen Bevölkerungdurchschnitt (übrigens: nach welchen Kriterien denn überhaupt?) repräsentiert, ist völlig unerheblich für die (jede) Studie. Daher ist dieser Kritikpunkt ja auch gar keiner. [...]
Behauptest Du gerade ernsthaft, dass es keine Rolle spielt, ob eine Stichprobe repraesentativ fuer die Gesamtbevoelkerung ist, fuer welche man eine Aussage treffen will?
 

Gaudloth

Bratze
Gibt es Heinsberg denn a) mehr Alte und Kranke als woanders? Und haben b) in der Studie mehr Alte und Kranke mitgemacht als im Durchschnitt? Und c) wie groß dürfen denn die Abweichungen höchstens sein, damit sie das Ergebnis unübertragbar machen?

Es ist ja nicht nur der Bevölkerungsdurchschnitt entscheidend, sondern auch, wer da beim Karneval war. Laut der Grafik in der Studie, waren die Studienteilnehmer übrigens älter als Durchschnitt. Die Erkrankten könnten aber aufgrund des Ereignisses Karneval nochmal eine andere Altersstruktur aufweisen. Denn es ist anzunehmen, dass die ganz hochaltrigen, zumindest aber die sehr morbiden, tendenziell weniger zum Karneval gehen.

Übertragbar wird es, wenn es einigermaßen repräsentativ ist. Das ist es aber nicht, schreiben sie ja in der Studie selbst. Rechnen dann aber trotzdem auf ganz Deutschland hoch um die Dunkelziffer zu ermitteln. Verstehe ich nicht.

Epidemiologie ist ja immer ein bisschen mit Schätzung verbunden, aber das scheint mir doch etwas arg mutig.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Behauptest Du gerade ernsthaft, dass es keine Rolle spielt, ob eine Stichprobe repraesentativ fuer die Gesamtbevoelkerung ist, fuer welche man eine Aussage treffen will?

Nein, immer noch nicht. Ich schrieb, dass es egal, ob die Besucher einer Großeranstaltung repräsentativ für die Gesamtbevölkerung sind oder nicht, weil das nichts mit der Stichprobe zu tun hat.

Es ist ja nicht nur der Bevölkerungsdurchschnitt entscheidend, sondern auch, wer da beim Karneval war.

Nein. Inweit das eine Rolle spielen könnte, haben die Autoren ja diskutiert (siehe Zitat weiter oben).

Laut der Grafik in der Studie, waren die Studienteilnehmer übrigens älter als Durchschnitt.

In der Grafik ist überhaupt kein Alterdurchschnitt.
 

Gaudloth

Bratze
Nein, immer noch nicht. Ich schrieb, dass es egal, ob die Besucher einer Großeranstaltung repräsentativ für die Gesamtbevölkerung sind oder nicht, weil das nichts mit der Stichprobe zu tun hat.

Es hat aber was mit der Übertragbarkeit auf die Gesamtbevölkerung zu tun. Und darum ging es hier. Wenn du etwas zitierst, darauf antwortest, dann aber was ganz anderes meinst, dann ist das für eine Diskussion natürlich irgendwie schwierig.

Nein. Inweit das eine Rolle spielen könnte, haben die Autoren ja diskutiert (siehe Zitat weiter oben).

Doch. Um mal auf dem selben Niveau zu bleiben.

In der Grafik ist überhaupt kein Alterdurchschnitt.

Das habe ich auch nicht behauptet.
 
Zuletzt bearbeitet:

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Laut der Grafik in der Studie, waren die Studienteilnehmer übrigens älter als Durchschnitt.

Was bedeutet denn dann dieser Satz?

Weil ja ein bestimmtes Klientel zum Karneval geht und man so nicht davon ausgehen kann, dass sich der Virus gleichmäßig in der Bevölkerung verteilt. Das gilt auch für das Alter. Denn diesen Zusammenhang stellt die Studie nicht dar.

Das stimmt nicht, es gibt dazu eigene Unterkapitel:
Associations between sex, age, co-morbidities and super-spreading event with the rate of
infection, the number of symptoms and IgA/IgG (page 10)

Associations between celebrating carnival and rate of infection and number of symptoms (page 10f)
 
Zuletzt bearbeitet:

Gaudloth

Bratze
Ich habe mir gerade die Altersverteilung (Grafik in der verlinkten Veröffentlichung) angeschaut und die weicht kaum von der Altersverteilung Deutschlands ab.

Und wieso sollte der Gesundheitsstand in Heinsberg denn vom Rest Deutschlands abweichen? Welche Krankheit(en) ist da denn so besonders verbreitet?

Das Infektionsrisiko unterscheidt sich zudem nicht zwischen den Altersgruppen und auch Co-Morbiditäten sind nicht mit eine höheren Infektionsrisiko verbunden. (page 11)

Da steht doch aber auch nix dazu, wie repräsentativ das für die Gesamtbevölkerung Deutschlands ist?

Edit: Falschen Beitrag zitiert. Sollte der letzte von Holgy sein. Sorry, bin nur am Handy.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Das brauch es auch nicht. Dies wird gemein dadurch erreicht, dass man die Stichprobe zufällig zieht. Das ist in diesem Fall geschehen (was Detti kritisch gesehen, die Namenseinschränkung, war in diesem Fall aber gut, da dadurch eine Verzerrung verhindert wurde - Überepräsentation von bestimmten Haushalten=Familien). Man überprüft dann ob die Altersgruppen, die Geschlechtsverteilung u.ä. etwa den Verteilungen der Gesamtbevölkerung entsprechen. Dies tut es in diesem Fall (siehe entsprechnde Infos im Artikel).
 

Detti04

The Count
Das brauch es auch nicht. Dies wird gemein dadurch erreicht, dass man die Stichprobe zufällig zieht. Das ist in diesem Fall geschehen (was Detti kritisch gesehen, die Namenseinschränkung, war in diesem Fall aber gut, da dadurch eine Verzerrung verhindert wurde - Überepräsentation von bestimmten Haushalten=Familien). [...]
Siehste, und solche Aussagen zeigen mir, dass Du Statistik nicht verstehst. Leider.

Wenn eine Zufallsauswahl unabhaengig voneinader Leute mit demselben Nachnamen und/oder aus dem selben Haushalt zieht, dann ist das eben mal so. Zufaellig eben. Wer versucht, durch zusaetzliche Einschraenkungen vor der Zufallsziehung oder durch haendische Auswahl nach der Zufallsziehung eine bessere, "zufaelligere" Auswahl zu erzeugen, der versteht schlichtweg nicht, was Zufall ist.

Wenn Du willst, dann kann ich Dir sogar an einem Beispiel erklaeren, wieso die Namenseinschraenkung bei der Heinsberg-Studie dafuer sorgt, dass schon die Auswahl der 600 angeschriebenen Kandidaten nicht zufaellig ist. Das mach ich aber nur auf Nachfrage.
 

Holgy

Kommischer Foggel Fußballromantiker
Moderator
Nee, brauchste nicht, ich kenne mich in Statistik/Methoden genug aus. In diesem Fall wollte man nicht einzelne Personen, sondern einzelne Haushalte ziehen und hat sich aus pragmatischen Gründen (i.d.F. fehlende Zeit) zu dieser Namenseinschränkung entschlossen um keine Haushalte mehrfach zu ziehen. Völlig normales Vorgehen.
 

Gaudloth

Bratze
Das brauch es auch nicht. Dies wird gemein dadurch erreicht, dass man die Stichprobe zufällig zieht. Das ist in diesem Fall geschehen (was Detti kritisch gesehen, die Namenseinschränkung, war in diesem Fall aber gut, da dadurch eine Verzerrung verhindert wurde - Überepräsentation von bestimmten Haushalten=Familien). Man überprüft dann ob die Altersgruppen, die Geschlechtsverteilung u.ä. etwa den Verteilungen der Gesamtbevölkerung entsprechen. Dies tut es in diesem Fall (siehe entsprechnde Infos im Artikel).

Repräsentativ für die Gesamtbevölkerung Deutschlands wäre es aber nur, wenn man die Stichprobe zufällig aus dem kompletten Pool, der deutschen Bevölkerung zieht.

Ich sage nicht, dass die Studie keinen wissenschaftlichen Wert hat. Ich sage nur, dass manche Schlussfolgerungen nicht richtig sind.
 
Oben