Vergleich zwischen einer CD Rom und dem menschlichen Genom

BLOG: Die Sankore Schriften

Die Welt ist voller Rätsel
Die Sankore Schriften

Die digitale Einheit der Information

Der Begriff Bit (binary digit) wird in der Informatik als Maßeinheit für den Informationsgehalt verwendet. Dabei ist 1 Bit der Informationsgehalt, der in einer Auswahl aus zwei gleich wahrscheinlichen Zuständen enthalten ist. 1 Bit kann lediglich zwei Zustände speichern: Entweder eine „Null“ oder eine „Eins“. Acht solcher Bits werden zu einer Einheit – sozusagen einem Datenpäckchen – zusammengefasst und allgemein Byte (Binary digits unite) genannt. Also 1 Byte = 8 Bit.

CD ROM Menschliches Genom
700 MB 1359 MB
3,6 x 105 Datenblöcke 2,3 x 101 Datenblöcke
Brennen:

6,5 x 107 Bits pro Sekunde

DNA-Replikation:

2 x 102 Bits pro Sekunde

Block Error Rate:

1 Fehler/3 x 105 Bit

Fehlerrate der DNA-Replikation:

1 Fehler/2 x 1010 Bits

Die CD ROM

Das Byte ist die Standardeinheit, um Speicherkapazitäten zu bezeichnen. Dazu gehören die Kapazität von Festplatten, CDs, DVDs, USB-Sticks usw. Eine herkömmliche CD-ROM hat 700 MB Speicherplatz. Die komplette CD wird dabei in gleich große Datenblöcke von jeweils 2,048 Bytes (0.00195313 MB) aufgeteilt. Das sind 3,58 x 105 Datenblöcke.

Das menschliche Genom

Als Genom oder auch Erbgut eines Lebewesens wird die Gesamtheit der vererbbaren Informationen bezeichnet, die in der DNA enthalten ist. Diese Informationen sind in der Basensequenz der DNA enthalten. Eine Base auf einem DNA-Strang hat einen Informationsgehalt von 2 Bit, da sie 22 = 4 Zustände (A / T / G / C) annehmen kann. Ausgehend von 2,85 x 109 Basenpaaren hat das Genom des Menschen einen Informationsgehalt von 1,14 x 1010 Bit = 1,425 x 109 Byte das entspricht 1359 Megabyte (MB). Die Datenmenge des menschlichen Genom hat also auf zwei CDs Platz.

Der Mensch hat seine genetische Information auf 23 unterschiedlich große Datenblöcke, den Chromosomen, aufgeteilt. Die menschlichen Keimzellen, die Eizelle und das Spermium kombinieren bei der Befruchtung der Eizelle ihre genetische Information, so dass die befruchtete Eizelle, die Zygote, 46 Chromosomen enthält. Durch Zellteilungen entstehen aus dieser Zygote die Körperzellen des Kindes. In jeder dieser Körperzelle sind die 23 Chromosomen des Menschen deshalb doppelt vorhanden (Sicherheitskopien). Das eine stammt vom Vater, das andere von der Mutter.

Human to genes
Abb.: Das menschliche Genom

Das längste menschliche Chromosom ist Chromosom 1 mit 237,6 Millionen Basenpaaren. Das sind 9,504 x 108 Bit und das entspricht 113,2 MB. Die Forscher konnten 3141 Gene auf Chromosom 1 entdecken. Die erste kodierende Base des Chromosoms ist Cytosin – das menschliche Erbgut beginnt also mit dem Buchstaben „C“.

Mit insgesamt etwa 34 Millionen Basenpaaren ist das Chromosom 21 das kleinste menschliche Chromosom, das sind 1,36 x 108 Bit und das entspricht 16,2 MB. Das Chromosom 21 hat 225 Gene.

Das menschliche Genom hat 19 041 Gene. Nur 3% des Genoms kodieren für Gene. 97 % des Genoms kodieren Informationen dafür, wie, wo und wann diese Gene exprimiert werden. Noch immer ist das menschliche Genom nicht vollständig seqenziert. Mehr berichte ich dazu in meinem Artikel „Nach zehn Jahren immer noch Lücken im menschlichen Genom„.

Es gibt einen direkten Zusammenhang zwischen diesem Anteil der DNA, der nicht Gene kodiert und der Komplexität des Organisationsgrades eines Organismus.

NIchtgenmenge
Abb.: Anteil der genomischen DNA der nicht für Gene kodiert

Das Brennen

Beim Brennen wird die Information vom Computer auf eine CD kopiert. Die Information wird also erst verdoppelt und dann auf ein anderes Speichermedium übertragen.

Die Geschwindigkeit des Brennvorgangs, wird in Vielfachen von 1,445 x 106 Bits/s (Raw-bzw. Musik-Daten; entspricht 1,229 x 106 Bits/s Nutzdaten) angegeben, wobei dies 1-fach der Lesegeschwindigkeit einer normalen CD entspricht.

Schnellste Schreibgeschwindigkeit (52x) 7,8 Megabyte (6,543 x 107 Bits) pro Sekunde

Die Block Error Rate

Da beim Brennen auf einen Rohling immer auch Fehler passieren, gibt es eine Fehlerkorrektur bei CD-Laufwerken. Die Block Error Rate (BLER) gibt an, wie viele Fehler pro Sekunde auftreten. Liegt die Fehlerrate höher als 220 Fehler/Sekunde, dann kann es trotz Fehlerkorrektur zu Beeinträchtigungen bei der Wiedergabe kommen.

Beim Brennen (52X) = 220 Fehler/6,543 x 107 Bits = 1 Fehler/2,974 x 105 Bits

Brenngeschwindigkeit 4X = 1 Fehler/3,866 x 106 Bits

E22-Fehler und E32-Fehler

Ein E22-Fehler gehört zu den Defekten eines Rohlings, die sich nicht unmittelbar auf die Qualität eines CD-Rohlings auswirken. Sie bemerken die Fehler nicht, da die Fehlerkorrektur diese vollständig abfängt. Häufen sich solche Defekte allerdings zu stark, ist die Fehlerkorrektur massiv gefordert. Und mit der Zeit, wenn sich die Qualität einer CD allein durch ihren Gebrauch und Umwelteinflüsse wie Hitze und starkes Licht verschlechtert, können aus E22-Fehler E32-Fehler werden. Diese E32-Fehler kann die Korrektur des Laufwerks nicht mehr ausbügeln und verschlechtern die Qualität eines Rohlings so stark, dass dieser sehr wahrscheinlich irgendwann unbrauchbar wird, weil die Fehlerkorrektur die gespeicherten Daten nicht mehr rekonstruieren kann. Bei einer Musik-CD ist der Fehler theoretisch schon hörbar. Stellen Sie sich diesen Fehler einfach wie einen Knackser auf einer Vinyl-Schallplatte vor.

Die DNA-Replikation

Bei Zellteilungen wird die Erbinformation der Mutterzelle an jede der beiden Tochterzellen weitergegeben. Es erfolgt eine originalgetreue Verdopplung der DNA. Diese Verdopplung der DNA wird DNA-Replikation genannt.

DNA-Replikation 100 Nukleotide/s = 200 Bit/s

Die Fehlerrate der DNA-Replikation

Fehlerrate bei der DNA Replikation 10-10 Nukleotide = 1 Fehler/2 x 1010 Bit

Die DNA-Replikation ist 5,173 x 103 mal genauer als der langsamste Brenner (4X).

Die DNA-Replikation ist 6,725 x 104 mal genauer als der schnellste Brenner (52X).

Mutationen und Krankheiten

Jeden Tag sammeln sich in unserer DNA durch Viren, UV-Licht oder Chemikalien, aber auch ohne äußere Einwirkungen Mutationen an. Auf molekularem Niveau handelt es sich bei einer Mutation um eine Veränderung der DNA-Basensequenz. Glücklicherweise sind diese spontanen Mutationen der DNA zum größten Teil nur von kurzer Dauer und verursachen keine Erkrankungen. Tatsächlich repariert die Zellmaschinerie Mutationen sofort, denn die Stabilität der DNA ist lebensnotwendig für die Gesundheit eines jeden Menschen. Mutationen betreffen nicht nur die Zelle, in welcher die Veränderung stattfindet, sondern auch deren Nachkommen: die Mutation wird in allen künftigen Generationen kopiert werden, weil die „falschen“ Basensequenzen ebenso repliziert werden wie die „richtigen“. DNA-Reparatur ist also essentiell dafür, dass unser Erbgut fehlerfrei von Generation zu Generation weitergegeben werden kann. Fehlerhafte DNA-Reparatur führt zu Mutationen und nachfolgend entweder zum Zelltod oder zur Krebsentstehung.

Um Mutationen im menschlichen Genom zu finden, muss man die DNA sequenzieren. Die Methoden zur DNA-Sequenzierung haben sich in den letzten Jahren rasant entwickelt. Tobias Maier schreibt auf WeiterGen über die aktuellsten Methoden der DNA-Sequenzierung.

Mutationen und Evolution

Mutationen sind eine wesentliche Grundlage der Evolution. Durch Veränderungen im Genbestand einer Population erhöht sich die genetische Variabilität in der Population.

Die Präzision der DNA-Replikation limitiert die mögliche Komplexität eines Organismus. Bei einer Fehlerrate von 10-9 kann ein Genom nicht mehr als 60 000 Gene enthalten. D.h. es können 60 000 Gene genügend oft fehlerfrei repliziert werden ohne dass es zur Fehlerkatastrophe kommt. Beachte, dass in der Theorie der Ausfall eines der 60 000 essenziellen Gene bereits die ganze Zelle bzw. den Organismus lahm legt. Beträgt die Fehlerrate „nur“ 10-6 reicht es für ca. 6000 Gene.

Bei der DNA-Replikation im Bakterium E. coli beträgt die Fehlerrate 10-6 und die Anzahl der Gene 4600. Diese Gene befinden sich alle auf einem Chromosom, dem sogenannten Plasmid. Zusätzlich zur Komplexität (Multizellularität) des Organismus verlangt auch dessen Langlebigkeit (Zeit bis zur Fortpflanzung) eine erhöhte Präzision. Eine hohe Präzision begünstigt die Entwicklung und das Überleben eines multizellulären Organismus wie dem Menschen aber bei einem Einzeller, wie dem Bakterium E.coli, spielt es keine Rolle, wenn einige der Tochterzellen sterben, da die Tochterzellen voneinander unabhängig sind. Die hohe Präzision vermindert aber die genetische Variation, die Voraussetzung dafür das eine Population von Zellen oder Organismen sich an die verändernde Umwelt anpassen kann. Vom Standpunkt der Population (und nicht des Individuums) betrachtet ist die genetische Variation vorteilhaft. Sie ermöglicht es zum Beispiel einer Population von E.coli-Bakterien Antibiotikaresistenzen zu entwickeln.

Weiterführende Links

Der Informationsgehalt von Sperma

 

 

Bildnachweis

Bild „Das menschliche Genom“

Plociam, „Human genome to genes“

Some rights reserved

Quelle: Wikimedia

Bild „Anteil der genomischen DNA der nicht für Gene kodiert“

Hati, „NichtGenmenge“

Quelle: Wikipedia

Avatar-Foto

Veröffentlicht von

Joe Dramiga ist Neurogenetiker und hat Biologie an der Universität Köln und am King’s College London studiert. In seiner Doktorarbeit beschäftigte er sich mit der Genexpression in einem Mausmodell für die Frontotemporale Demenz. Die Frontotemporale Demenz ist eine Erkrankung des Gehirns, die sowohl Ähnlichkeit mit Alzheimer als auch mit Parkinson hat. Kontakt: jdramiga [at] googlemail [dot] com

8 Kommentare

  1. Conclusio für extraterrestrische Hirne?

    Sehr interessanter Artikel und Abschätzungen! Zwei Sachen find ich besonders interessant:

    Tatsächlich repariert die Zellmaschinerie Mutationen sofort, denn die Stabilität der DNA ist lebensnotwendig für die Gesundheit eines jeden Menschen

    Wie muss man sich das vorstellen, ist das wirklich ein aktiver Prüf- und Reparaturprozess, dazu müsste doch ein Vergleich Original – Fälschung stattfinden, wie sich so ein Prozess evolutionstechnisch und von der Biophysik herauskristallisiert hat ist für mich schwer vorstellbar, oder muss man es sich so vorstellen, das mutierte DNA gedämpft/weniger stark repliziert wird als intakte.

    Die Präzision der DNA-Replikation limitiert die mögliche Komplexität eines Organismus. Bei einer Fehlerrate von 10-9 kann ein Genom nicht mehr als 60 000 Gene enthalten

    Vor kurzem wurde die Human Brain Map veröffentlicht, nach der über 80% aller Gene im Hirn exprimiert sind. Die genetische Komplexität unseres Hirn ist also wahrscheinlich wenn auch nicht linear in unserem Hirn widergespiegelt. Sie schreiben, einerseits ist Mutation z.B. durch kosmische Strahlung, UV-Licht fördernd und bedingend in der Evolution für eine variable Entwicklung der Lebewesen (Mutation & Selektion), andererseits aber limitieren diese externen Faktoren dann ja auch die Fehlerrate und damit Genomgrösse bei der lebenswichtigen DNA-Replikation.

    Daraus liese sich doch ableiten, dass extraterr. Lebewesen auf Kohlenstoffbasis wahrscheinlich auch keine wesentlich höhere genetische Komplexität/Intelligenz besitzen als wir sie haben momentan (unter Annahme das Hirne ähnlich bio-chemisch strukturiert sind), wenn nicht völlig andere Umweltbedingungen (Atmosphäreschutzschicht, bestimmter Abstand-Range Erde-Sonne) gelten.

    Hoffe die Frage kommt nicht zu spät 😉

  2. Ich denke, in obiger Rechnung des Informationsgehalts des Genoms des Menschen steckt ein Fehler: Ein Basenpaar hat nicht den doppelten Informationsgehalt einer einzelnen Base der DNA, weil die Base des zugehörigen Nukleotids immer das Gegenstück zu jener ist, also nicht frei gewählt werden kann. A T gehört immer zusammen und G C gehört immer zusammen. Somit darf man nur mit 2 multiplizieren, um auf den Informationsgehalt in Bits zu kommen. Es ergibt sich also “nur” etwa der Inhalt EINER CD, nicht von zwei. Die 1,14 x 10^10 Bit und die folgenden Zahlen sind also um den Faktor 2 zu hoch.

  3. Richtig romedi ich habe es nachgerechnet. Du hast praktisch zwei komplementär identische, also spiegelbildlich gleiche CDs in dem kompletten gehen Rom danke Google genom – vorliegen.

    Ob das die Erklärung für die gigantisch gute fehlerkorrektur ist? Eigentlich wird der DNA-Strang ja verdoppelt indem er aufgespalten und dann die Basenpaare ergänzt werden.

    Es ist natürlich physikalisch ganz verständlich dass wenig Fehler auftreten können weil chemisch immer nur eine einzige von vier Basen angelagert werden kann.

    Nicht nur darum ist auch die ganze Theorie von der Krebsentstehung so unsinnig.

    moonray gottjoker GERRiTsoft.de

    • Eigentlich wird es ja schon richtig beschrieben: Ein Basenpaar hat den Informationsgelhalt von 2 bit, also 4 Zustände. Nur es wird der falsche Schluss gezogen, denn 1 bit hat auch schon 2 Zustände. Deswegen ist der Informationsgehalt des Genoms = Basenpaare × 2 bit.

  4. Noch eine Kleinigkeit wenn der nervt doch mal jetzt nicht mit Werbung wenn eine Zelle sich geteilt hat und in einem Chromosom ein Fehler aufgetreten war bei der Replikation, so dass irgendein Eiweiß nicht richtig gebildet wird, und die Zelle durch dieses falsche Eiweiß geschädigt wird, oder eine wichtige Funktion nicht hat stirbt sie einfach. Oder der Fehler bewirkt dass die Zelle sich gar nicht mehr neu reproduzieren kann. Bestimmte Fehler an bestimmten Stellen treten damit schon seltener auf bzw. werden nicht weitergegeben.

  5. “Fehlerhafte DNA-Reparatur führt zu Mutationen und nachfolgend entweder zum Zelltod oder zur Krebsentstehung.”

    Das erklärt aber nicht, warum bestimmte Schicksalsschläge oder auch biologische Konfliktinhalte immer die gleiche Art von Krebs oder aber Zell-Minus machen, am gleichen Organ je nach Händigkeit, Geschlecht und Hormonlage respektive Vorkonflikten. Genau betrachtet ist Krebs immer ein biologisch sinnvolles Geschehen, das dem Individuum einen 80 prozentigen Überlebensvorteil bringt.

Schreibe einen Kommentar