Die positiven Nebenwirkungen von Genotypisierungen
BLOG: Bierologie
Laut eigenen Aussagen hat 23andme mittlerweile über 100.000 Menschen mit Hilfe von DNA-Chips genotypisiert. Ganze 76 % davon haben ihr Einverständnis dafür gegeben, dass die Daten auch zu Forschungszwecken benutzt werden können und 59 % der Leute haben auch an Umfragen zu ihren Phänotypen teilgenommen. Vorausgesetzt, dass alle Teilnehmer von den Umfragen ebenfalls grünes Licht für die Forschung gegeben haben, macht das immer noch eine beeindruckende Zahl von 59.000 Personen, deren Geno- und Phänotypen zur Forschung verwenden kann. Und einer der Wege, wie man solche Daten nutzen kann, um neue Erkenntnisse über Krankheiten und Krankheitsrisiken zu erfahren sind die sogenannten Genome Wide Association Studies (GWAS), die in den meisten Fällen auch die Quellen sind, mit denen 23andme und andere Personal Genomics-Firmen die Risiko-Werte für ihre Kunden berechnen.
Der einfachste Weg solche Assoziations-Studien durchzuführen ist es, sich 2 verschiedene Populationen zu nehmen: Jene, die unter einer bestimmten Krankheit leiden und eine gesunde Kontrollgruppe. Jetzt analysiert man die genetische Varianz, z.B. eben über SNP-Genotypisierungen, die innerhalb der gesunden und der kranken Population zu finden ist und vergleicht dann die beiden Populationen miteinander: Solche Varianten, die man in der kranken Population häufiger, als durch Zufall allein zu erwarten, findet sind positiv mit einer Krankheit assoziiert. Menschen, die so eine Variante tragen haben also ein um einen bestimmten Satz erhöhtes Risiko auch an der untersuchten Krankheit zu erkranken. Varianten, die man in der gesunden Population häufiger findet, sind hingegen negativ mit einer Krankheit assoziiert: Wer diese Variante trägt, der hat ein geringeres Risiko zu erkranken.
Solche GWAS sind also nicht unbedingt Rocket Science, allerdings gibt es einige Fallstricke die man beachten sollte: Als aller erstes muss man auch hier darauf hinweisen, dass Korrelation keine Kausalität bedeutet. Nur weil eine bestimmte Variante mit einer Krankheit assoziiert ist, heisst dies noch lange nicht, dass die entsprechende Variante auch ursächlich für die Erkrankung verantwortlich ist. Entsprechende Assoziationen können z.B. auch durch Linkage Disequilibrium entstehen. Dazu kommt die Tatsache, dass GWAS, prinzipbedingt, ohne a priori Hypothese auskommen müssen. Das hat wiederum Auswirkungen auf die entsprechenden Statistiken die man rechnet. Und zu guter letzt benötigt man auch einfach noch eine ausreichend große Stichprobe, damit man überhaupt aussagekräftige Assoziationen finden kann.
Trotz dieser potentiellen Probleme erfreuen sich die GWAS in den letzten Jahren einer gewissen Popularität. Denn zum einen sind sie vergleichsweise günstig durchzuführen. Und zum anderen kann man sie gut benutzen um Kandidaten-Gene zu finden, die man dann genauer beleuchten kann um herauszufinden ob und wie sie eine Rolle bei einer Krankheit spielen. Im Fall von 23andme hat man natürlich das große Glück, dass die GWAS nicht nur günstig ist, sondern sogar noch Geld bringt. Denn immerhin hat man einen riesigen Kundenstamm, der freiwillig Geld dafür bezahlt, dass man die entsprechenden, genetischen Rohdaten für sie produziert. Und die Teilnahme an den Umfragen zu Phänotypen werden ebenfalls umsonst von den Kunden selbst durchgeführt.
Es ist also nicht überraschend, dass 23andme in dieser Woche 2 Veröffentlichungen in PLoS Genetics hatte. In der ersten, mit dem Bandwurmtitel Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits, hat man sich 22 verschiedene Phänotypen angeschaut, darunter den photischen Niesreflex, die Haar-Morphologie und natürlich auch den Spargel-Urin, also genauer die Fähigkeit zur Methanthiol-Wahrnehmung. Für diese Phänotypen konnte man über die GWAS neue Assoziationen finden. Und darüber hinaus konnte man auch die Ergebnisse von älteren GWAS replizieren und so festigen, dass diese Assoziationen bestehen.
Das sind so weit schon mal ermutigende Ergebnisse, aber darüber hinaus hat sich 23andme auch mit dem Parkinson’s Institute zusammengetan, und versucht über die eigene Daten- und Kunden-Basis neue Assoziationen für Parkinson zu finden. Da das Thema etwas sensibler ist, als die Frage danach ob man Spargelgeruch im Urin wahrnehmen kann oder nicht, hat man sich in diesem Fall nämlich nicht allein auf die Fragebögen, die von den Kunden selbst ausgefüllt wurden, verlassen. Sondern hat darüber hinaus auch extra Parkinson-Patienten angesprochen, die ihre Genotypisierung gegen einen symbolischen Betrag durchführen lassen konnten. So konnte man 3,426 Parkinson-Patienten und 29,624 Kontrollen in die Analyse mit einbeziehen. Und schlussendlich auch 2 neue SNPs finden, die wohl mit Parkinson assoziiert sind.
Ich finde es toll, dass 23andme die Kunden-Daten, auf denen sie so oder so sitzen, nicht nur einfach rumliegen lassen, sondern damit auch ihren Beitrag zur Forschung leisten. Und genauso begrüßenswert ist es, dass sie ihre Ergebnisse als echte Open Access-Publikationen veröffentlichen. Sollte man dieses Vorgehen so beibehalten, dann kann wird man – mit neuen Umfragen und mehr Kundendaten – sicherlich noch so einige spannende Studien anstellen können. Da gibt es eigentlich nur einen Punkt, an dem man als Verfechter von Open Science meckern kann: Es gibt keinen freien Zugriff auf die Rohdaten. Natürlich ist das sicherlich nicht nur böses Firmengehabe, sondern auch ein Datenschutz- und Haftungsproblem (welches man sich als kommerzielles Unternehmen nicht unbedingt freiwillig antun will).
So bleibt der Datenschatz leider recht verschlossen in den Händen von 23andme und andere Wissenschaftler bekommen keinen Zugriff. In welche Richtung man weitere GWAS anstellen wird liegt bislang also alleine an 23andme, auch wenn man dort schon mitbekommen hat, dass immer mehr Leute ihre Daten außerhalb des firmeneigenen Walled Gardens veröffentlichen. Hoffentlich erkennt 23andme das entsprechende Potential auch bald und gibt den Kunden die Möglichkeit ihre Daten allgemein zugänglich zu machen. Genauso wie die Option für Wissenschaftler & Co entsprechende Fragebögen zu Phänotypen simpel in das System einzupflegen. Denn damit könnte man Humangenetik einfach und günstig zu einem tollen Crowd-Sourcing-Projekt machen.
Eriksson, N., Macpherson, J., Tung, J., Hon, L., Naughton, B., Saxonov, S., Avey, L., Wojcicki, A., Pe’er, I., & Mountain, J. (2010). Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits PLoS Genetics, 6 (6) DOI: 10.1371/journal.pgen.1000993
Do, C., Tung, J., Dorfman, E., Kiefer, A., Drabant, E., Francke, U., Mountain, J., Goldman, S., Tanner, C., Langston, J., Wojcicki, A., & Eriksson, N. (2011). Web-Based Genome-Wide Association Study Identifies Two Novel Loci and a Substantial Genetic Component for Parkinson’s Disease PLoS Genetics, 7 (6) DOI: 10.1371/journal.pgen.1002141
Hm, das muss ich mir dann irgendwann mal anschauen, wie man seine Daten außerhalb von 23andme zugänglich machen kann.
Offene Daten
Leider gibt es da noch keinen einheitlichen Standard. Manche Leute laden das Zeug einfach auf ihren Webspace hoch, andere legen so wie ich bei GitHub ein Repository an. In der SNPedia wird dank der Arbeit von einigen Leuten eine per Hand gepflegte Liste mit Download-Links angeboten: http://www.snpedia.com/index.php/Genomes
Aber wirklich ideal ist das alles nicht. Viele Links gehen doch nicht mehr, es gibt nur die Genotypen und kaum Phänotypische Daten, nicht alle Leute tragen sich dort ein/werden gefunden. Und außerdem ist das ganze nicht einfach zugänglich. Deshalb haben Philipp und ich gerade mal angefangen ein kleines Repository in Rails zu schreiben, das diese Lücke erstmal schliessen soll.
Also eine zentrale Stelle wo man die Daten hoch und runterladen kann (per Web und im Idealfall auch per API), per RSS über neue Datensätze informiert wird und wo die User auch Phänotypen angeben können (auch solche, die vorher noch nicht abgefragt wurden). Vielleicht hilft es ja ein bisschen dabei, dass man die Bewegung etwas noch vorne bringt (oder überzeugt 23andme damit so etwas doch gleich selbst anzubieten, was das einfachste wäre).