Was Sie schon immer über Studien wissen wollten, aber bisher nicht zu fragen wagten: Teil 1 Studiendesign

BLOG: Die Sankore Schriften

Die Welt ist voller Rätsel
Die Sankore Schriften

Es gibt vier Typen von Studien. Typ 1: Gut gemeint und gut gemacht, Typ 2: Gut gemeint und schlecht gemacht, Typ 3: Schlecht gemeint und schlecht gemacht, Typ 4: Schlecht gemeint und gut gemacht. Um festzustellen über welchen Studientyp Wissenschaftsblogger am häufigsten schreiben bedarf es einer Studie. Wie sollte solch eine Studie aufgebaut sein? Eine Antwort auf diese Frage gibt das Studiendesign und damit sind wir schon beim Thema.
Im ersten Teil dieser dreiteiligen Serie befasse ich mich mit dem Studiendesign und möchte euch einen praktischen Leitfaden in die Hand geben, der es euch erleichtert Studien, die in Fachzeitschriften publiziert werden, besser verstehen und beurteilen zu können. Im zweiten Teil geht es dann um die verschiedenen Arten von Variablen und deren Tücken. Im dritten Teil schließlich geht es um die statistischen Werkzeuge die benutzt werden und deren Abhängigkeit von der Art der gewählten Variable und der Häufigkeitsverteilung. Da ich aus der Biologie (genauer der Genetik) komme, werde ich vorwiegend Beispiele aus diesem Fachbereich bringen. Die Leitidee ist, sich in die Lage des Forschers zu versetzen, der eine bestimmte Forschungsfrage experimentell angeht.

Zehn Schritte zum Ziel

1. Formuliere so detailliert wie möglich die Forschungsfrage.

2. Überführe die Frage aus Schritt 1 in die Form einer biologischen, medizinischen, soziologischen, ökonomischen Nullhypothese und einer alternativen Hypothese.

3. Überführe die Frage aus Schritt 2 in die Form einer statistischen Nullhypothese und einer alternativen Hypothese.

4. Wähle die Variablen, die relevant für die Beantwortung der Frage aus Schritt 1 sind. Hier ist es besonders wichtig so viele Störfaktoren (Confounder) wie möglich zu identifizieren wie z.B. sozioökonomischer Status, Geschlecht, Bildung. Nicht immer gelingt das, weil manche Confounder einfach nicht bekannt sind.

5. Bestimme die Art der Variablen aus Schritt 4.

6. Wähle abhängig von der Anzahl und Art der Variablen, der erwarteten Verteilung (Normalverteilung oder nicht bzw. parametrisch/nicht-parametrisch) und den Hypothesen den statistischen Test. In tierexperimentellen Studien ist N normalerweise recht klein und die Gruppengröße n oft < 10. Bei einer klinischen Studie mit Menschen würde man sich hier allerdings um die Stichprobengröße Gedanken machen. Diese hängt ab von der Größe der betroffenen Patientenpopulation in der Bevölkerung bzw. Region, dem Konfidenzniveau, dem Konfidenzintervall, der Fehlertoleranz und der Varianz.

7. Führe das Experiment durch

8. Vergleiche die Ergebnisse mit den Annahmen des statistischen Tests, den Du gewählt hast. Bei schlechter Übereinstimmung wähle einen statistischen Test, der besser zu deinen Ergebnissen passt und gehe davon, dass bestimmte Annahmen in deinem Experiment keine Gültigkeit haben und/oder die gewählten Variablen nicht den vermuteten Zusammenhang haben.. häufig stellt sich z.B. heraus, dass ein Surrogatmarker, doch nicht das ist, was man sich erhofft.

9. Wende den besseren statistischen Test an und interpretiere die Ergebnisse.

10. Präsentiere deine Ergebnisse in einem Schaubild oder einer Tabelle.

Das soll erstmal als grobe Orientierung dienen und Anhaltspunkte geben, wo denn bei einer Studie der Schuh drücken könnte. Meistens liegen die Fehler in einem oder mehreren der Schritte 1 bis 4. Wenn ihr euch selber in die Lage des Forschers versetzt, werdet ihr schnell merken, dass manches nicht so trivial ist, wie es ausschaut. Man gerät leicht in tiefes Wasser. Du wirst schnell feststellen, man kann nicht alles haben. An dieser Stelle wird ein guter und wohlmeinender Reviewer eures Papers konstruktive Kritik üben und die ganze Geschichte nicht direkt in die Tonne kloppen.

Aber jetzt ans Eingemachte, ich möchte die Anwendung des Leitfadens an einem Beispiel zeigen. Da das Münchner Oktoberfest vor der Tür steht und ich das Gesicht eines bekannten SPD-Politikers nur im Suff ertragen kann geht es in meinem Beispiel um Alkoholkonsum. Prost!

Sarrazinrezeptorgenpolymorphismus und Bierkonsum

Dramiga et al. messen wie viele Liter Bier einzelne Männer pro Woche trinken. Die Männer sind polymorph für den Sarrazinrezeptor (SR). An Position 52 der Proteinsequenz von SR gibt es entweder Valin oder Alanin. An der Position 484 befindet sich entweder Valin oder Leucin. Bei den untersuchten Männern sind alle vier Kombinationen von Aminosäuren repräsentiert: Valin-Valin (V-V), Valin–Leucin (V-L), Alanin-Valin (A-V), Alanin-Leucin (A-L). Da das Sarrazinrezeptorgen in zweifacher Ausführung vorhanden ist (eins von der Mutter, eins vom Vater) gibt es insgesamt 16 Kombinationen, die alle repräsentiert sind. Ich zeige der Einfachheit halber, die Aminosäuren die durch die spezifischen DNA-Sequenzen kodiert werden, nicht die kodierenden DNA-Sequenzen selbst.

1. V-V
V-V

2. V-V
V-L

3. V-V
A-V

4. V-V
A-L

5. V-L
V-V

6. V-V
V-L

7. V-L
A-V

8. V-L
A-L

9. A-V
V-V

10. A-V
V-L

11. A-V
A-V

12. A-V
A-L

13. A-L
V-V

14. A-L
V-L

15. A-L
A-V

16. A-L
A-L

1. Hat der Polymorphismus im Sarrazinrezeptor eine Auswirkung auf das Volumen von getrunkenem Bier?

2. Biologische Nullhypothese: Der Polymorphismus im Sarrazinrezeptorgen hat keine Auswirkung auf das Volumen von getrunkenem Bier. Alternativhypothese: Der Polymorphismus im Sarrazinrezeptoren hat eine Auswirkung auf das Volumen von getrunkenem Bier.

3. Statistische Nullhypothese: Männer mit unterschiedlichen Sequenzen des Sarrazinrezeptorgens trinken im Durchschnitt das gleiche Volumen Bier. Alternativhypothese: Männer mit unterschiedlichen Sequenzen des Sarrazinrezeptorgens trinken im Durchschnitt unterschiedliche Volumina von Bier.

4. Ich habe zwei Variablen: Die Sarrazinrezeptorgensequenz (nominale Variable) und das Volumen an getrunkenem Bier (messbare Variable). Ein Störfaktor wie das Alter ist entweder kontrolliert, indem alle Männer das gleiche Alter haben oder randomisiert indem Männer mit einer bestimmten Sarrazinrezeptorgensequenz zufällig aus verschiedenen standardisierten Altersgruppen gezogen werden. (Leider gibt es viele Confounder, die den Bierkonsum beeinflussen. Wenn man die alle identifizieren und deren Einfluss gewichten könnte, hätte man ein Modell mit höherer Validität aber auch höherer Komplexitität-man wäre bereits bei einer multiplen Regressionsanalyse angelangt.)

5. Die Männer lassen sich anhand der Sarrazinrezeptorgensequenzen in 16 Gruppen einteilen. In jeder Gruppe wird das durchschnittliche Volumen an getrunkenem Bier in Litern pro Woche gemessen. Die Gruppengrößen, die Anzahl der Männer in jeder Gruppe, sind gleich. Weder die Forscher noch die Studienteilnehmer wissen, zu welcher Gruppe die Männer gehören.

6. Ich möchte die Durchschnittsvolumina (arithmetisches Mittel) an getrunkenem Bier der einzelnen Gruppen miteinander vergleichen. Ich habe eine nominale Variable und mehr als zwei Gruppen, deshalb wähle ich als statistischen Test meiner statistischen Hypothesen den Model I One Way- ANOVA. (Wo es Model I gibt es natürlich auch Model II aber auf den Unterschied werde ich hier nicht eingehen, denn dann begeben wir uns auf vermintes Gelände. Ich habe aber nichts dagegen, wenn Spezialisten sich dazu in der Kommentarspalte miteinander austauschen wollen.)

7. Das Experiment wird wie beschrieben durchgeführt.

8. Der One Way-Anova ist ein parametrischer Test geht also davon aus, dass die gemessene Variable, hier das Volumen an getrunkenem Bier, normalverteilt ist. Zusätzlich nimmt er an, dass die Varianz in jeder Gruppe gleich ist. Ich schaue mir die Histogramme und Ergebnisse für jede Gruppe an und sehe das diese Bedingungen erfüllt sind. Wäre das nicht der Fall gewesen, hätte ich den Kruskal-Wallis-Test genommen.

9. Der ANOVA ergibt einen p-Wert, der kleiner als 0.05 ist. Das bedeutet, die statistische Alternativhypothese trifft zu. Ich interpretiere das so, dass die unterschiedlichen Gruppen im Durchschnitt unterschiedliche Volumina an Bier trinken. Von da aus gehe ich zu meiner biologischen Alternativhypothese und postuliere, dass es eine Korrelation zwischen der Sarrazinrezeptorgensequenz und der Menge an getrunkenem Bier gibt. Eine Kausalität kann ich hier noch nicht postulieren dafür bedarf es weiterer Studien, ich habe aber bereits ein Indiz.

10. Ich präsentiere meine Ergebnisse mit einem Histogramm und Fehlerbalken. Auf der X-Achse sind die 16 Genotypen repräsentiert auf der Y-Achse das Volumen von Bier in Litern. Der Balken jeder Gruppe zeigt das Durchschnittsvolumen an getrunkenem Bier. Die Fehlerbalken repräsentieren ± 2 Standardfehler des gemessenen Durchschnitts.

Diskussion der Studie

Meine Studie war praktisch das Gegenstück zu einer GWAS, bei der man Unterschiede in einem spezifischen Phänotyp feststellt z. B. Bierkonsum und dann schaut ob diese mit Allelen eines spezifischen Gens oder mit bestimmten SNPs korrelieren. Ich hingegen habe unterschiedliche Allele eines Gens entdeckt und dann geschaut ob sie mit Unterschieden in dem spezifischen Phänotyp Bierkonsum korrelieren.

Eine Kontrollgruppe (Referenzgruppe?) gab es bei mir in dem Sinne nicht, man könnte künstlich eine konstruieren und sagen, die Gruppe deren Sarrazinrezeptorgensequenz am häufigsten in der Bevölkerung vorkommt ist die Norm und deren Durchschnittsbierkonsum als die Norm nehmen, den Phänotyp also durch den Genotyp normieren – mit allen sich daraus ergebenden praktischen und ethischen Konsequenzen. Für einen Pharmakonzern, der eine Abteilung für Personal Medicine und Pharmakogenomik hat, wäre das interessant. Wer eine evolutionsbiologische Fragestellung hat, würde vielleicht eine externe Kontrollgruppe nehmen z.B. männliche Bier trinkende Schimpansen – was aber wegen den zusätzlichen vielen Confoundern auch problematisch ist.

Ich habe in meiner Studie die Proteinebene übersprungen. Sehr wahrscheinlich werden ja gar nicht alle Genvarianten exprimiert (Stichwort Genomische Prägung) sondern es gibt auf Proteinebene nur die vier Varianten Valin-Valin (V-V), Valin–Leucin (V-L,), Alanin-Valin (A-V), Alanin-Leucin (A-L). Man hätte auch diese als nominale Variable nehmen können und zusätzlich die Anzahl der Gruppen verringern können. Es kommt immer darauf an wieviel man schon weiß und in seinem Labor umsetzen kann. Ist man z.B. in der Lage ausreichende Mengen Protein zu extrahieren und zu sequenzieren?

Ich hoffe meine Beispielstudie war wenigstens Typ 2 ;-).  Ich weiß, dass sie weitere Fragen aufwirft und das ist ja das Schöne an der Forschung man fängt an tiefer zu bohren – so funktioniert Wissenschaft.

So das war’s erstmal …im zweiten Teil geht es dann weiter mit Variablen. Ich gehe dann noch etwas genauer auf Schritt 4 und 5 ein.

 

 

 

 

 

Joe Dramiga

Veröffentlicht von

Joe Dramiga ist Neurogenetiker und hat Biologie an der Universität Köln und am King’s College London studiert. In seiner Doktorarbeit beschäftigte er sich mit der Genexpression in einem Mausmodell für die Frontotemporale Demenz. Die Frontotemporale Demenz ist eine Erkrankung des Gehirns, die sowohl Ähnlichkeit mit Alzheimer als auch mit Parkinson hat. Kontakt: jdramiga [at] googlemail [dot] com

2 Kommentare

  1. Sarrazin

    hat sich da “ein wenig” verrannt, was die Weitergabe und Interpretation biologisch, biologistischer Theorien betrifft; ansonsten war sein Buch hauptsächlich wegen der Zusammenführung unliebsamer statistischer Ergebnisse empörend.

    Es hätte genügt kulturzentristisch wie gehabt zusammenzufassen. – BTW: Sarrazin legte Wert darauf Ergebnisse zusammenzufassen.

    MFG
    Dr. W

Schreibe einen Kommentar