openSNP ist da!

Von Basti im letzten Beitrag angedeutet ist es endlich fertig: openSNP ist da! Ein Projekt, von Basti und mir begonnen, dass über die Zeit die Mitstreiter Fabian Zimmer und Helge Rausch gewonnen hat und jetzt endlich präsentirer-fertig ist. OpenSNP soll eine zentrale, offene Sammelstelle für Genotypisierungen der beiden amerikanischen Unternehmen 23andme und deCODEme werden. Kunden der beiden Unternehmen können ihre Genotypisierungen hochladen und bekommen dann von uns zusätzliche Informationen zu ihren Varianten von der Literaturverwaltungsdatenbank Mendeley, des Veröffentlichungsprojektes PLoS und des Wiki-Projektes SNPedia. Wissenschaftler, die an solchen Daten forschen, können Genotypisierungen (verbunden mit Phänotypen wie Augenfarbe, Neigungen zu bestimmten Krankheiten etc.) kostenlos für ihre eigene Forschung herunterladen. Damit Nutzer zum Eintragen der Phänotypen animiert werden haben wir ein kleines Erfolgs/Achievement-System gebastelt.

openSNP

Mit diesem Projekt wollen wir die Wissenschaft um Genotypisierungen offener gestalten – Benutzer können mehr über ihre Genotypisierungen erfahren und sich mit anderen Benutzern darüber austauschen, während Wissenschaftler annotierte Genotypisierungen erhalten. Man sollte allerdings nicht vergessen, dass dieses Projekt auch seine Schattenseiten hat – wer seine Genotypisierungen hochlädt, zeigt damit der Welt seine Anfälligkeiten für Krankheiten, was üblicherweise auch für Familienmitglieder gilt. Natürlich muss man für seinen Account nicht seinen Klarnamen angeben (wir sind nicht Google+), aber trotzdem sollten sich Nutzer über die möglichen Folgen klar sein – weswegen wir auf der Seite auch gleich doppelt warnen.

Anders als Facebook löschen wir auf Anfrage des Benutzers auch alles, was zum Benutzer gehört – Genotypisierung, Ergebnisse der Auslesung etc. Nicht gelöscht wird, was von anderen Benutzern vorhanden ist – wenn sich z.B. zwei User ein SNP teilen, wird beim Löschen des ersten Benutzers der Verweis von Benutzer eins zum SNP gelöscht, nicht aber das SNP selbst. Dabei sollte man im Hinterkopf bewahren dass wir keinerlei Kontrolle darüber haben, wer was wohin runterlädt. Es könnte zum Beispiel sein, dass sich jemand schon die Genotypisierung eines Nutzers auf seinen eigenen PC heruntergeladen hat bevor derjenige Nutzer seine Genotypisierung von unserem Server löscht.

Die Idee für das Projekt stammt von Basti, der hier schon öfter über seine Genotypisierungen berichtete (hier, hier und hier) und zusammen haben wir uns über die letzten paar Monate an das System gesetzt, was die Post-Flaute hier bei Bierologie erklären sollte. Glücklicherweise läuft auch momentan der PLoS-Mendeley-API-Wettbewerb, bei dem Projekte, die Schnittstellen zu PLoS/Mendeley benutzen, eingereicht werden können. Um überhaupt teilnehmen zu können (schließlich brauchen wir einen Server, um die Seite laufen zu lassen) hat uns das Unternehmen NephoScale freundlicherweise einen Server für die Dauer des Wettbewerbes zur Verfügung gestellt.

Wir hoffen, dass wir soviele Nutzer wie möglich zusammenbekommen, damit die Seite Wissenschaftlern auf aller Welt in ihrer Arbeit helfen kann. Die Seite ist momentan komplett in Englisch gehalten, aber vielleicht ändert sich das ja noch. Besucht uns auf openSNP!

Für Technik-Freunde: Die Seite läuft auf Ruby On Rails v3.0.10, wir benutzen Redis für das Parsen der Genotypisierungen, PostgreSQL als Datenbank, Solr/Sunspot für die Suchanfragen, jQuery für ein paar JavaScript-Spielereien und Twitter’s Bootstrap als Grundlage für das CSS-Design. Leider ist der Server recht mager an Ressourcen, was sich insbesondere beim Parsen der Genotypisierungen schnell bemerkbar macht. Aber da sollten wir bald Abhilfe schaffen. Wer sich für den Code interessiert kann ihn bei github finden.

Veröffentlicht von

Philipp hat einen Bachelor in Biologie, ein Graduate Certificate in IT und studiert momentan für seinen Master in IT in einem übertrieben großen Land voller Spinnen und Schafe. Für die Bierologie schreibt er zumeist über Biologie, Evolution und allem was an den Rändern der Gebiete noch so angeschwemmt wird.

8 Kommentare Schreibe einen Kommentar

  1. @WeiterGen: Danke für den Tipp, wir wollten das ganze noch weiter ankündigen, aber erstmal hab ich heute dann doch das Augenmerk auf das Bugfixing gerichtet.

    Wie das so ist, da spielt man einen Monat lang auf seiner eigenen Maschine in der Entwicklungsumgebung mit verschiedenen Benutzern damit rum und 5 Minuten nach dem Einsatz in der Produktivumgebung finden die ersten Benutzer schwerwiegende Bugs 😉

    @Sebastian: Danke! 🙂

  2. Ein sehr spannender Ansatz. Spannend vor allem insofern, wie viele Kunden bereit sein werden, ihre SNPs so weit offenzulegen, auch wenn ihr keine Klarnamen nennt. Wo und wie macht ihr diese auf euer Projekt aufmerksam? Und für mich ungelöst bleibt die Frage der fundierten Beratung, der sich Unternehmen wie 23andme und deCODEme immer wieder stellen müssen. Bei Euch kann der Einzelne im Laufe der Zeit mehr aktualisierte Backgroundinfos finden, richtig? Doch wer kann mit diesen Infos als Laie gut umgehen? Abgesehen von diesem Bedenkenträgertum: Ein vernetzendes Projekt für die Wissenschaft.

  3. Wir haben während der Entwicklung ja eine kleine Umfrage dazu gemacht wie viele Leute prinzipiell dazu bereit wären ihre Daten komplett zu veröffentlichen und im Startblogpost von openSNP haben wir das auch kurz angerissen: http://opensnp.wordpress.com/…elcome-to-opensnp/

    out of 88 people that are already a customer of a DTC company 15 % already shared their information and in total 75 % would be willing to do so. Additionally, out of 72 individuals who are planning to take a DTC test in the future, 61 % would be willing to share their results and some linked data.

    Unsere Stichprobengröße ist natürlich nicht so berauschend riesig, um es freundlich auszudrücken, aber zumindest scheint es schon mal nicht so zu sein, dass man gar keine Leute dafür finden könnte. Und es gibt ja auch bei SNPedia eine Übersicht von bereits verfügbaren Datensätzen (leider fast alle ohne linked phenotypes).

    Groß angekündigt haben wir das ganze bislang noch nicht wirklich, unter anderem auch deshalb weil es zumindest mir ganz recht war erstmal mit wenigen Leuten zu starten um die Bugs rauszukriegen, weil irgendwas übersieht man ja bei den Tests in der Entwicklungsumgebung immer und dann ist es gut wenn nicht gleichzeitig 1000 Leute versuchen eine kaputte Seite zu erreichen (Wie sich gezeigt hat war das auch eine kluge Entscheidung. ;)).

    Jetzt wo die gröbsten Fehler ausgemerzt sind kann man dann auch an die Nutzerwerbung gehen: Ich habe das Projekt jetzt aber schon einmal auf der DIYBio-Mailingliste angekündigt, Philipp sitzt gerade an einer Mail an GenomesUnzipped und ich werde auch noch ein paar entsprechende DTC-Blogger anschreiben (vor allem jene die schon bei unserer Umfrage geholfen haben). Darüber hinaus kann man natürlich auch in den 23andMe-Foren mal Werbung für das Projekt machen, zumindest bei der Umfrage war der Anklang da auch sehr gut.

    Es ist zumindest mein Wunsch, dass man im Laufe der Zeit mehr Informationen auf der Plattform zu den einzelnen SNPs finden kann. Dazu haben wir ein relativ simples Ranking der SNPs eingeführt bei dem wir gewichten aus welchen Quellen die Informationen kommen, siehe http://opensnp.org/snps

    Ein Eintrag in der SNPedia (als User-Curated Content der bereits von Menschen ausgewertet wurde) ist 5 Punkte wert, ein Open Access-Paper in der PLoS ist 2 Punkte wert, ein Paper bei Mendeley nur einen Punkt, da hier viele Veröffentlichungen bei sind an die Nicht-Wissenschaftler gar nicht/nur gegen Bezahlung ran kommen. Alleine die Anzahl der Paper und Links in der SNPedia ist schon eine ganz gute Metrik um zu Wissen wie „gesichert“ Erkenntnisse zu den Auswirkungen dieses Polymorphismus sind. Außerdem haben wir zu den Papern in der PLoS und in Mendeley auch die Leserzahlen, das ist auch noch mal ein guter Indikator.

    Wie gut einzelne mit diesen Quellen umgehen können ist natürlich eine wichtige Frage, abe dazu kann ich dir auch keine wirkliche Bewertung geben. Allerdings weiss ich, dass verschiedene Gruppen von Sozialwissenschaftlern sich mit diesen Fragen auseinandersetzen. Die Leute von TeGALSI sind z.B. damit beschäftigt: http://tegalsi.hypotheses.org/?lang=en_GB

    Meine persönliche Einschätzung dazu ist allerdings, dass sich der Bereich der Personal Genomics noch sehr in den Kinderschuhen befindet, auch was die persönliche Auseinandersetzung mit den Ergebnissen angeht. Wobei ich jetzt bei der Arbeit an openSNP viele „Laien“ getroffen habe, die sich schon intensiv mit Genetik, GWAS und Co beschäftigt haben. Ich denke auch, dass sich auch Personal Genomics in eine Richtung bewegen wird (gerade bei den sinkenden Kosten, 23andMe hat ja gerade erst das $999 Exom angekündigt) in der es zum Alltag gehören wird sich mit so etwas zumindest am Rande auseinanderzusetzen.

    Ich hoffe das gibt zumindest einen kleinen Einblick ins Projekt. Sonst einfach weiterfragen 🙂

  4. Neugierig wäre ich ja. Kann man sich eigentlich freiwillig ‚genotypisieren‘ lassen um seine Daten sozusagen der Wissenschaft zur Verfügung zu stellen?

  5. @Grautvornix Also Wissenschaftler suchen normalerweise direkt in Kooperation mit Krankenhäusern etc. nach Teilnehmern für ihre Case-Control-Studies, in den Fällen ist die Teilnahme für Probanden in der Regel natürlich kostenfrei.

    Bei den Typisierungen wie wir sie hier verwenden wollen kann natürlich jeder mitmachen, der das Kleingeld dafür aufbringen kann/will.

    Für ~200 € kann man sich bei den auf dem Markt befindlichen Direct To Consumer-Gentest-Firmen typisieren lassen. Die Daten kann man dann wiederum selbst veröffentlichen. Und das ist ja genau was wir mit openSNP erreichen wollen 🙂

  6. Ein besseres Horoskop. Zumindest so lange nicht eindeutige Marker verwendet werden. Aber was das dann mit Wissenschaft zu tun haben sollte, begreiffe ich beim besten Willen noch nicht.

Schreibe einen Kommentar




Bitte ausrechnen und die Zahl (Ziffern) eingeben