Doktorand im achten Monat

In den letzten paar Monaten war dieses Blog verdächtig ruhig, das hat seine Gründe: Basti hängt in den letzten paar Monaten seiner Masterarbeit und ich bin Doktorand im achten Monat, und das bisschen Zeit das da noch übrig bleibt wird in openSNP investiert (oder: Schock, ins Privatleben!). Was mach ich eigentlich den ganzen Tag?

Doktoranden-Dasein

“Angestellt” bin ich bei der School of Agriculture and Food Sciences an der University of Queensland (UQ), Brisbane, Australien, in der Bioinformatik-Arbeitsgruppe. Unsere Haupttätigkeiten sind die Arbeit am Weizen, Raps, Gemüsekohl, Rübsen und Kichererbsen-Genoms, dazu kommt noch ein Haufen anderer Tätigkeiten (SNP-basierte Analysen z.B.). ich bin momentan am meisten mit dem Brassica napus, also dem Raps-Genom beschäftigt. Wirtschaftlich sind die Pflanzen alle enorm wichtig – trotzdem gibt es kaum “fertige” Genome in dem Bereich, was viele Gründe hat.

Probleme beim Genombasteln

Leider sind wir noch nicht soweit, dass wir eine Pflanze in eine Maschine stopfen können und nach 10 Minuten ein USB-stick mit dem kompletten Genom aus der Maschine purzelt. Die meisten Sequenzierer heutzutage produzieren “reads” mit einer Länge von 100 Nukleotiden, einer sehr kurzen Länge. Zum Vergleich: Das Weizen-Genom ist ungefähr 17.000.000 Nukleotide lang! Man braucht also eine ganze Menge “reads”, um das Genom einmal abzudecken. Aber einmal abdecken wär ja einfach, soweit kommt’s noch – natürlich sind die meisten Planzengenome zu 50% – 70% repetitiv, d.h., kurze Nukleotidsequenzen, die sich wiederholen, z.B. GCGCGCGCGCGCGCGC. Dies bedeutet, dass viele dieser “reads” nicht genau einer Stelle zuordbar sind, wenn sie größtenteils aus repetitiven Elementen bestehen. Zum Vergleich: das menschliche Genom dagegen besteht nur zu ca. 8% aus repetitiven Elementen, deswegen ist das auch schon fast fertig.

Dazu erschwerend kommt noch die Polyploidie der meisten Pflanzen. Menschen sind diploid, also haben sie von jedem Chromosom zwei Kopien, Weizen ist dagegen polyploid: Einkorn ist diploid, Weichweizen (auch Brotweizen) ist dagegen hexaploid (also sechs Kopien), das macht das ganze natürlich nochmal schwieriger – durch viele Kopien und komplette Genomduplikationen in der Geschichte der Pflanzen gibt es viele Regionen auf unterschiedlichen Chromosomen, die voneinander kaum zu unterscheiden sind. Das macht es natürlich schwer, die “reads” irgendwo eindeutig zu positionieren!

Man kann sich die Problematik ungefähr wie die manuelle Rekonstruktion der Stasi-Akten vorstellen – lauter kleine Schnipsel, vieles ist schwer zuzuordnen, viel fehlt, viele Floskeln andere Teile, die sich wiederholen: ein Haufen Arbeit, um das wieder hinzubekommen. Glücklicherweise machen wir das auch nicht manuell, dafür gibt es mehrere Programme mit so unromantischen Namen wie ALLPATHS-LG, MIRA oder Velvet, die mithilfe der Graphentheorie Ordnung in den Wald der “reads” bekommen. Der Hauptteil meiner Arbeit liegt im Säubern der “rads”, z.B. durch Entfernen fehlerbehafteter “reads” oder dem Abschneiden unsicherer Regionen, und im Bewerten der Ergebnisse – die obengenannten Programme verbinden manchmal Regionen, die nicht zusammen gehören, oder ordnen Regionen falschrum an. Die genauen Details der Algorithmen sprengen den Rahmen – falls die einer lesen möchte, bitte anfragen, dann setz ich mich nochmal hin.

Genauere Beschreibungen der jeweiligen Projekte gibts hier noch nicht, das mach ich, sobald die jeweiligen Publikationen veröffentlicht werden – irgendwann bald müsste auch das openSNP-Paper irgendwo publiziert werden….

Arbeits- und Lebenssituation

Das Stipendium der Uni reicht aus, um von meinen Eltern unabhängig leben zu können, was nach 26 Jahren auch mal an der Zeit war. Es reicht auch, um die Miete für ein kleines Häuschen mit meiner Freundin in einem Vorort zu teilen, dann ist das Geld auch meistens kurz vor der nächsten Zahlung alle. Die Visumssituation ist (für Deutsche) auch relativ einfach, solange ich an der Uni eingeschrieben bin “darf” ich bleiben.

Die Arbeit an sich ist auch sehr angenehm – so zwischen 8 und 10 Uhr morgens mit Kaffee im Büro vor den PC setzen, eMails beantworten, den Server kaputtmachen, eine halb ausgegorene Bioinformatik-pipeline anstellen die dann mit einer obskuren Fehlermeldung abbricht, rausfinden, was der Fehler ist, Mittagessen, dann am eigenen Code arbeiten, schauen, ob der Assembler fertig-gerechnet hat, und auf einmal ist es dunkel, und weil die Essenswissenschaftler mal wieder ihr Labor in Flammen gesetzt haben wird man vom Feueralarm so um 5-6 nach Hause geschickt (schon dreimal passiert! In acht Monaten!).

Unsere Arbeitsgruppe hat so gut wie nichts mit Lehre zu tun, deswegen muss ich auch keine Kurse halten. Bis jetzt hab ich freiwillig eine halbstündige Vorlesung vor 8 Bioinformatik-Bachelor-Studenten über “genome-wide association studies” gehalten, da kommt sicher noch mehr. Am Wochenende arbeite ich manchmal, je nachdem wie die Deadlines sind, am Wochenende ist meist der Cluster auch schön leer für größere Prozesse. Dank SSH kann ich das auch alles von zuhause erledigen.

Im Unterschied zur Laborarbeit hat meiner Meinung nach die Arbeit in der Bioinformatik ein oberes Zeitlimit – nach 6 bis 7 Stunden durchgehendem Programmieren muss ich nach Hause gehen, sonst bastel ich nur noch die schwachsinnigsten Datenstrukturen und brauch den halben nächsten Tag, um die Fehler des vorherigen auszubügeln. Dementsprechend kann ich nur so 40 bis 50 Stunden die Woche arbeiten, weniger als der durchschnittliche Doktorand.

In der Arbeitsgruppe sind wir momentan 9 Leute (mit Professor 10), davon der Großteil Doktoranden, momentan nur ein Post-Doc (bald kommt noch einer) und ein research assistant, also definitiv noch Platz für mehr – wer will, findet hier mehr Informationen.

Veröffentlicht von

Philipp hat einen Bachelor in Biologie, ein Graduate Certificate in IT und studiert momentan für seinen Master in IT in einem übertrieben großen Land voller Spinnen und Schafe. Für die Bierologie schreibt er zumeist über Biologie, Evolution und allem was an den Rändern der Gebiete noch so angeschwemmt wird.

2 Kommentare Schreibe einen Kommentar

  1. Heute sequenziert Morgen mutiert

    Als ich las, dass Du Pflanzengenome sequenzierst war mein erster Gedanke: Herzliches Beileid! Aber wenigstens ist die Arbeitsatmossphäre in Ordnung.

Schreibe einen Kommentar