Schattenblick →INFOPOOL →MEDIZIN → KRANKHEIT

FORSCHUNG/130: Das Erbgut der Krebszellen (einblick - DKFZ)


"einblick" - die Zeitschrift des Deutschen Krebsforschungszentrums (DKFZ), Ausgabe 2/2011

Das Erbgut der Krebszellen

Von Philipp Grätzel von Grätz


Es ist eines der größten biomedizinischen Forschungsprojekte aller Zeiten: Beim Internationalen Krebsgenomprojekt (ICGC) soll das Erbgut von 25.000 Krebspatienten entziffert (sequenziert) werden. Rund 1000 Patienten kommen aus Deutschland. Wissenschaftler des Deutschen Krebsforschungszentrums leiten zwei Teilvorhaben des ICGC, und sie stellen Rechenkapazität bereit, um die gigantischen Datenmengen zu verarbeiten, die das Projekt abwirft. Hierfür arbeitet das Krebsforschungszentrum mit der Firma IBM zusammen.


Der Fuhrpark von Dr. Stephan Wolf umfasst 15 Maschinen mit kryptischen Typenbezeichnungen. Der "SOLiD 4" beispielsweise ist in der Flotte gleich achtmal vertreten. Vom "HiSeq 2000" gibt es vier Exemplare. Zwei "SOLiD 5500xl" und ein "454" komplettieren das Feld. Dass all diese Kürzel nicht in den PR-Abteilungen von Autoherstellern entstanden sind, merkt man sofort. Hier waren bei der Namensgebung Techniker am Werk.

Stephan Wolf leitet im DKFZ die Dienstleistungseinheit "Hochdurchsatz-Sequenzierung". SOLiD, HiSeq und 454 sind Sequenziermaschinen der nächsten Generation, hoch spezialisierte Roboter für Genanalysen, gefertigt in den Hallen der drei Hersteller Life Technologies, Illumina und Roche. Die besten Maschinen können in zehn bis zwölf Tagen zwei komplette menschliche Genome parallel entziffern. "Die 15 Maschinen, die wir hier haben, schaffen zusammen pro Monat etwa vierzig Genome, damit gehören wir zu den größten Sequenzierzentren Europas", sagt Wolf. Seine Dienstleistungseinheit führt sämtliche Sequenzierungen durch, die innerhalb des Krebsforschungszentrums laufen.

Es ist gerade mal zehn Jahre her, dass ein menschliches Genom erstmals vollständig entziffert wurde. Hunderte Forscher aus aller Welt waren damit mehrere Jahre beschäftigt - ein enormer Kraftakt namens "Humangenomprojekt". Heute ist der Aufwand sehr viel überschaubarer. Ein Techniker betreut zwei Maschinen, für die komplette Sequenzierung eines menschlichen Genoms sind nur wenige Handgriffe nötig.


Gesucht: Der genetische Fingerabdruck des Tumors

"Ohne die neue Technik wäre das Internationale Krebsgenomprojekt undenkbar", sagt Professor Peter Lichter, Leiter der Abteilung "Molekulare Genetik" am Deutschen Krebsforschungszentrum. Er koordiniert das ICGC-Teilprojekt zu kindlichen Hirntumoren, das am Krebsforschungszentrum angesiedelt ist. Allein bei diesem Vorhaben wird in den nächsten Jahren das vollständige Genom von 500 Hirntumoren entziffert. Zusätzlich analysieren die Forscher bei jedem teilnehmenden Patienten noch das Genom einer gesunden Körperzelle - als Vergleich. "Das ist nötig, um zu belegen, dass eine bestimmte genetische Veränderung wirklich tumorspezi ist", betont Lichter. Nicht jede Mutation, die in einer Tumorzelle gefunden wird, muss mit dem Krebs zusammenhängen. Erst wenn die Mutation in gesunden Zellen desselben Patienten nicht auftritt, kann davon ausgegangen werden, dass sie etwas mit dem Krebsgeschehen zu tun hat.

Neben den Forschungen zu kindlichen Hirntumoren sind zwei weitere ICGC-Teilprojekte in Deutschland angesiedelt. Dr. Holger Sültmann, Leiter der Arbeitsgruppe "Krebsgenomforschung" in der Abteilung von Professor Lichter, zeichnet verantwortlich für den Forschungsverbund Prostatakrebs, der gemeinsam mit dem Universitätsklinikum Hamburg-Eppendorf die Genome von 250 Prostatakrebs-Patienten analysieren wird. Eine wichtige Frage dabei lautet, welche genetischen Veränderungen mit einer hohen Aggressivität der Erkrankung einhergehen. Deshalb sollen ausschließlich Patienten untersucht werden, die jünger sind als 50 Jahre. "Diese Patienten sind vergleichsweise selten, bei ihnen verläuft die Krankheit aber oft aggressiv", betont Sültmann. Die Wissenschaftler hoffen, bei diesen Patienten am ehesten jene Mutationen zu finden, die wirklich relevant für einen schweren Verlauf der Erkrankung sind. Eine andere Forschergruppe um Professor Reiner Siebert von der Christian-Albrechts-Universität zu Kiel wird die Genome von 250 Patienten mit Lymphomen (Tumorerkrankungen des Lymphsystems) entziffern.


Datenwust

Egal ob Prostatakarzinome oder kindliche Hirntumoren - wenn Stephan Wolf seine Sequenziermaschinen anwirft, dann produzieren sie vor allem eins: Daten, Daten, Daten. Bei Professor Roland Eils, Leiter der Abteilung "Theoretische Bioinformatik" am Deutschen Krebsforschungszentrum sowie Professor für Bioinformatik und funktionelle Genomik an der Universität Heidelberg, laufen alle Daten der deutschen ICGC-Teilprojekte auf. "Der Umgang mit diesen Daten ist eine immense Herausforderung. Die Forschung, die wir hier betreiben, ist nicht nur Krebsforschung, sondern auch und vor allem Forschung im Bereich Bioinformatik."

Die Größenordnungen, mit denen die Krebsforscher hantieren müssen, lassen sich nur noch schwer anschaulich machen. Ein menschliches Genom hat drei Milliarden Basenpaare. Um Fehler so weit wie möglich auszuschließen, wird jedes Genom 30-mal entziffert. Pro Basenpaar entstehen 30 Byte an Daten. Damit erzeugt jedes Genom, das durch die ICGC-Sequenzierung läuft, einen Informationsberg von 2,7 Terabyte. Grob geschätzt sind das zwanzig handelsübliche Festplatten mit einer Kapazität von 120 bis 150 Gigabyte. "Für die deutschen ICGC-Teilprojekte gehen wir davon aus, dass wir insgesamt 2200 Genome sequenzieren werden, wir landen also bei mehreren Petabyte an Rohdaten", so Eils. Das entspricht mehreren zehntausend Festplatten.

Um diese Informationsmenge zu bewältigen, werden in Heidelberg zwei gewaltige Einrichtungen für die Datenverarbeitung aufgebaut, so genannte Large Scale Data Facilities. Am BioQuant, dem Systembiologie-Zentrum der Universität Heidelberg, stehen den Genomforschern in der Endausbaustufe 6 Petabyte Speicher zur Verfügung. Das Rechenzentrum des Deutschen Krebsforschungszentrums liefert pro Jahr ein weiteres Petabyte. Die Speicherkapazität reicht also aus. Das Problem ist, dass mit diesen Daten auch irgendwie gearbeitet werden muss. "Die Sequenziermaschinen liefern uns DNA-Bruchstücke von 30 bis 50 Basenpaaren", so Eils. Die müssen zunächst in die richtige Reihenfolge gebracht werden. Dann wird in einem zweiten Schritt die Erbinformation des Tumorgewebes mit der von gesunden Zellen desselben Individuums verglichen. Dabei werden die Forscher verschiedene Abweichungen feststellen, etwa Punktmutationen, fehlende Genabschnitte (Deletionen) oder Genabschnitte, die während der Krebsentstehung neu hinzugekommen sind (Insertionen).

Für weiterführende Analysen kann es aber durchaus nötig sein, nicht nur zwei, sondern vielleicht hundert Genome miteinander zu vergleichen. Und das wird dann richtig schwierig. Wieder ein Beispiel: Angenommen, es sollen hundert Genome miteinander verglichen werden, macht hundertmal 2,7 Terabyte. Um diese Datenflut überhaupt in den Arbeitsspeicher zu bekommen, wäre eine 10-Gigabit-Standleitung über mehrere Tage hinweg komplett ausgelastet. "Die Universität Heidelberg hat derzeit eine einzige solche Leitung, die sich mehrere tausend Nutzer teilen", beschreibt Eils. Das wird auf keinen Fall reichen. Eine mögliche Lösung besteht darin, weitere 10-Gigabit-Leitungen aufzubauen, die parallel geschaltet und ausschließlich für das Krebsgenomprojekt genutzt werden. Eine andere Möglichkeit ist, den Datenspeicher sehr nahe an die Rechner heranzubringen und die Daten dann mit neuen Verfahren zu übertragen, die auf der Hochgeschwindigkeits-Technologie Fibre Channel gründen.


Schritt halten mit den Maschinen

"Unser Anspruch ist es, die Rohdaten mindestens genauso schnell auszuwerten, wie die Sequenziermaschinen sie erzeugen", so Eils. Bisher, bei rund 100 entzifferten Genomen, ist das gelungen: "Aktuell können wir einige hundert Genompaare pro Jahr bewältigen." Wenn das Krebsgenomprojekt allerdings erst auf Hochtouren läuft, müssen es deutlich mehr sein. Ganz auf sich allein gestellt sind die Bioinformatiker des Deutschen Krebsforschungszentrums dabei nicht. Bei der Computermesse CeBIT 2011 in Hannover schloss das Zentrum einen Kooperationsvertrag mit der Firma IBM ab. Gemeinsam wollen die Partner daran arbeiten, die Schwierigkeiten bei der Datenübertragung zu überwinden. Außerdem soll ein neues Verfahren für die Datenkompression entwickelt werden. "Was uns vorschwebt, ist eine Art MP3-Standard für die molekulargenetische Forschung. Dabei muss biologisches Hintergrundwissen in die Komprimierung einfließen, damit keine relevanten Daten verloren gehen", erläutert Eils.

Der dritte Bereich, in dem die Zusammenarbeit zwischen dem Krebsforschungszentrum und IBM Früchte tragen soll, ist die klinische Nutzung der Genomdaten. Der behandelnde Arzt soll bei der Diagnose und der Therapie unterstützt werden. "Dazu ist es nötig, ihm das gesammelte molekulargenetische Wissen in einer Form zur Verfügung zu stellen, die eine rasche Entscheidung über die optimale Therapie ermöglicht", erläutert Professor Christoph von Kalle, Sprecher des Direktoriums am Nationalen Centrum für Tumorerkrankungen (NCT) Heidelberg. Zum Einsatz kommen soll hier die von IBM entwickelte Watson-Technologie, mit deren Hilfe unlängst ein Computer in der US-Quizshow Jeopardy (einer Art "Wer wird Millionär?") gegen zwei menschliche Kandidaten gewann. Die Watson-Technologie erlaubt es, mit hocheffizienten Filtertechniken aus großen Datenmengen die jeweils relevanten Informationen herauszufischen. "Wir stehen hier noch ganz am Anfang. Aber natürlich kommt es am Ende darauf an, dass das, was wir im Krebsgenomprojekt herausfinden, auch klinisch anwendbar ist", betont Eils.


Recht und Ethos: noch schwieriger als die Technik

Jenseits aller technischen Probleme wirft die komplette Entzifferung menschlicher Genome auch ethische Fragen auf, die derzeit ähnlich ungelöst sind wie Datendurchsatz und Komprimierung. Falls es bei Krebspatienten in einigen Jahren üblich werden sollte, das vollständige Krebsgenom zu entziffern und daraus die beste Therapie zu ermitteln, stellt sich unter anderem die Frage, was mit den zahlreichen nicht-krebsbezogenen Informationen anzufangen ist, die eine solche Analyse zwangsläufig mitliefert. Bei einer vollständigen Sequenzierung ließen sich im Prinzip alle genetischen Anlagen finden, die für irgendwelche Krankheiten anfällig machen. Nur: Was soll mit solchen Informationen geschehen? Gar nicht erst danach suchen? Nur dann danach suchen, wenn der Patient es wünscht?

"Es gibt derzeit noch keine guten Antworten darauf", betont Peter Lichter. Krebsforscher allein können diese Antworten auch nicht geben. Deswegen ist im Rahmen des Marsilius-Kollegs der Universität Heidelberg eine Expertengruppe zusammengetreten, die sich mit den ethischen und rechtlichen Aspekten der Komplettsequenzierung des menschlichen Genoms befassen soll. Beteiligt sind Onkologen, Bioinformatiker, Ethiker, Theologen und Juristen. Das bekannteste Mitglied ist der ehemalige Verfassungsrichter Professor Paul Kirchhof. "Unser Ziel ist es, in etwa zweieinhalb Jahren das Feld aufgearbeitet zu haben, um dann im Hinblick auf mögliche gesetzliche Regelungen belastbare Empfehlungen an die Politik geben zu können", umreißt Peter Lichter das weitere Vorgehen.


*


Bildunterschriften der im Schattenblick nicht veröffentlichten Abbildungen der Originalpublikation:

Abb. S. 20
Wie entsteht Krebs? Forscher arbeiten weltweit zusammen, um Proben von den häufigsten Tumoren zu nehmen und die Erbinformationen darin zu entziffern.

Abb. S. 21
Stephan Wolf leitet eines der größten Sequenzierzentren Europas. Die Maschinen in seiner Abteilung entziffern zusammen etwa 40 Genome pro Monat, also 40-mal das komplette Erbgut einer menschlichen Zelle.

Abb. S. 22
Ergebnis einer DNA-Sequenzierung. Jeder der vier Grundbausteine der DNA wurde mit einem anderen Farbstoff markiert. Anschließend ermittelte ein Messgerät die Abfolge der Farbsignale, sie entspricht der Reihenfolge der Grundbausteine und damit dem genetischen Code.

Abb. S. 23
Räumliche Darstellung eines DNA-Moleküls. Die Atome sind durch farbige Kugelausschnitte (Kalotten) wiedergegeben, deshalb heißt diese Darstellung Kalottenmodell.


*


Quelle:
"einblick" - die Zeitschrift des Deutschen Krebsforschungszentrums (DKFZ)
Ausgabe 2/2011, Seite 20 - 23
Herausgeber: Deutsches Krebsforschungszentrum in der
Helmholtz-Gemeinschaft
Abteilung für Presse- und Öffentlichkeitsarbeit
Im Neuenheimer Feld 280, 69120 Heidelberg
Telefon: 06221 / 42 28 54, Fax: 06221 / 42 29 68
E-Mail: einblick@dkfz.de
Internet: www.dkfz.de/einblick

"einblick" erscheint drei- bis viermal pro Jahr
und kann kostenlos abonniert werden


veröffentlicht im Schattenblick zum 29. Dezember 2011