Assoziationstudien und Statistik
BLOG: Bierologie
Nach amerikanische Wissenschaftler™ ja schon das „Gay Gene“ und das „God Gene“ gefunden haben wollen ging in den letzten beiden Tagen das „Empathie-Gen“ durch die Medien. Bei Spektrumdirekt bin ich als erstes über einen Beitrag zu dem Thema gestolpert. Und obwohl in dem Artikel erfreulicherweise nicht vom Empathie-Gen sondern von einer Assoziation gesprochen wurde, so war ich doch ein wenig erstaunt über die kritiklose Berichterstattung, da sie sich überhaupt nicht mit der Statistik der Veröffentlichung beschäftigt. Und an dem Punkt muss man die Originalveröffentlichung harsch kritisieren, wie im englischen Sprachraum auch ausführlich geschehen..
Kurz zu der Forschung selbst: Das Team um Sarina Saturn hat für 23 Freiwillige den Genotyp, also die genetische Varietät, am dem Single Nucleotide Polymorphism (SNP) rs53576 bestimmt. Diese 23 Personen filmte man dabei, wie sie ihren Lebenspartner zuhören mussten, als diese ein aufwühlendes Ereignis aus ihrem Leben erzählten. Danach hat man 116 Testpersonen gebeten alle 20 Sekunden lange Stummfilme anzusehen und in Hinsicht auf das Sozialverhalten der typisierten Zuhörer zu bewerten. Und dann haben sie geschaut, in wie weit es Unterschiede in der Bewertung der Versuchspersonen die den Genotyp G/G und denen die G/A oder A/A haben.
Saturn will herausgefunden haben, dass die Personen mit dem Genotyp G/G als sozialer eingeschätzt werden als die mit den anderen Varianten. Wenn man sich die Grafik und die Werte für das vielzitierte Ergebnis anschaut, dann sieht das allerdings schon nicht mehr so eindeutig aus. Der Mittelwert für G/G ist 4,21, mit einer Standardabweichung von 1,4, der Mittelwert für die anderen beiden Genotypen kombiniert ist 3,8, mit einer Standardabweichung von 1,41. Alleine bei der Varianz fällt es mir schon schwer die Ergebnisse sonderlich ernst zu nehmen. Auch wenn die Statistischen Tests die sie machen auf Signifikanz hinweisen (mangels Expertise mit dem Hierarchical Linear Modeling das sie verwenden kann ich leider nicht wirklich beurteilen wie angebracht der Test für diese Datenreihe überhaupt ist, die generelle Kritik bleibt davon allerdings unberührt).
Dazu kommt die Anzahl der Probanden selbst: Nur 23 Probanden wurden überhaupt auf ihre Genvariante getestet und im weiteren Versuch eingesetzt: 10 Probanden mit G/G, 10 mit A/A, 3 mit G/A. Etwas über 40% der Teilnehmer haben damit die Variante G/G. Und trotzdem weisen die Autoren stolz darauf hin, dass 60% der am sozialsten eingeschätzten Probanden die Variante G/G haben. Was bei 40% Anteil an der Gesamtmenge und nur 23 Probanden insgesamt nicht wirklich überraschen dürfte.
Denn das ist schon fast vergleichbar damit 20 mal eine Münze zu werfen und am Ende 12 mal Kopf zu haben: Auch wenn wir erwarten das die Wahrscheinlichkeitsverteilung 50% pro Ausgang vorhersagt ist 12/20 bei einer kleinen Anzahl an Wiederholungen gar nicht so unwahrscheinlich. Kurz um: 23 Probanden bei genetischen Assoziationsstudien sind nicht aussagekräftig, auch wenn ihre statistischen Tests das offensichtlich anders sehen. Denn der Effekt den sie in ihren Daten finden ist gering und die Streuung groß.
Um solche Scheinassoziationen zu vermeiden setzt man deshalb üblicherweise viel größere Stichproben an. Bei der Einschätzung der Videos haben sie vermutlich auch deshalb so viele Leute nach ihrer Einschätzung befragt. Und auch wenn genomweite Assoziationsstudien nicht komplett das Gleiche sind, die grundlegende Methode Assoziationen zu finden bleibt gleich. Und dort verwendet man bei den Studien normalerweise Teilnehmerzahlen die im mittleren dreistelligen Bereich anfangen und sich bis in den mittleren fünfstelligen Bereich erstrecken können.
Bevor man die Ergebnisse von Assoziationsstudien kritiklos glaubt oder verbreitet sollte man sich deshalb unter anderem drei Dinge anschauen die verhältnismäßig einfach zu erkennen sind:
- Die Stichprobengröße: Wenn die Teilnehmerzahl im unteren zweistelligen Bereich ist, dann kann man fast sofort aufhören zu lesen, die Ergebnisse werden schwach sein.
- Die Effektgrösse: In wie weit unterscheiden sich die Gruppen überhaupt. Je kleiner der Unterschied, desto größer die Wahrscheinlichkeit, dass die Ergebnisse selbst nur zufällig entstanden sind (gerade bei so kleinen Stichproben).
- Die Streuung: Wenn die Werte so weit streuen, dass die Mittelwerte der Gegengruppe eingeschlossen sind, dann darf man auch ruhig hellhörig werden.
Ich bin gespannt ob sich jemand die Mühe macht und diese Studie mit einer größeren Stichprobe wiederholt. Philipp und ich haben gestern schon festgestellt, dass openSNP mittlerweile mehr Teilnehmer hat die für den entsprechenden SNP typisiert worden sind (36 um genau zu sein). Ob wir es damit wohl auch in PNAS schaffen?
Comic: xkcd, CC-BY-NC
Literatur
Kogan, A., Saslow, L., Impett, E., Oveis, C., Keltner, D., & Rodrigues Saturn, S. (2011). Thin-slicing study of the oxytocin receptor (OXTR) gene and the evaluation and expression of the prosocial disposition Proceedings of the National Academy of Sciences DOI: 10.1073/pnas.1112658108
Empathie-Gen + Populärwissenschaft
Hinter dem Interesse an Hochbegabungs-,Empathie-,Gay-und God-Genen steckt wohl auch Magisches Denken. Wenn solche Eigenschaften praktisch ein- und ausgesschaltet werden können durch ein einzelnes Gen oder viellicht später durch ein Medikament, welches das verantwortliche Gen zusäztlich aktiviert, dann ist der Traum vom Wundertrank a la Asterix&Obelix erfüllt.
Solche Attributierungsstudien sind statistisch gesehen of an der Grenze zur Signifikanz. Dass sie es trotzdem in wissenschaftliche Journale schaffen zeigt, dass auch die Wissenschaft nicht vor Populismus gefeit ist und zunehmend die öffentliche Arena sucht.
Empathie
Die Wiederholung des Versuchs mit einer größeren Personenzahl ist sinnlos; denn zuerst sollte die Ursache von Empathie diskutiert werden: denn Empathie ist doch nichts anderes als ein Vorurteil – wobei man eigene Erfahrungen anderen Menschen zuordnet.
Statistiken
Das ist leider ein Problem, das nicht nur auf Gen-Assoziationsstudien zutrifft. Gerade im medizinischen Bereich und vor allem bei Schlagzeilen trächtigen Studien muss man stets einen sorgfältigen Blick auf die Details werfen und dann entpuppen sich viele als nicht aussagekräftig.