CeBiTec: Grenzen überwinden, um Grenzen zu erweitern
Weltweit sind Genomforscher den Bauplänen des Lebens auf der Spur. Viele ihrer Arbeiten koordiniert und unterstützt das Centrum für Biotechnologie (CeBiTec) an der Universität Bielefeld. Dabei spielt die Informatik eine entscheidende Rolle – u. a. mit Unterstützung von MCS.
Im Centrum für Biotechnologie zählt Kooperation. Hier arbeiten jene, die in Laboren durch Mikroskope blicken, Hand in Hand mit jenen, die in Rechenzentren Server bestücken. Alles dreht sich um die kleinsten Bauteile der Biologie, dennoch geht es den Forschern um die großen Zusammenhänge des Lebens. Denn die Schwerpunkte des Instituts liegen zum einen in der Genomforschung, also in der Gewinnung von Erkenntnissen zur Gesamtheit aller Erbinformationen, und zum anderen in der Systembiologie, die jeden Organismus als komplexe Einheit zu verstehen versucht.
In diesem Rahmen hilft das CeBiTec internationalen Forschungsgruppen bei der Entschlüsselung der Erbinformation von Pflanzen, Mikroorganismen und höher entwickelten Zellen und sucht nach Anwendungsmöglichkeiten in der Landwirtschaft, im Umweltschutz und in der Biotechnologie. Es unterstützt auch Projekte der medizinischen Biologie, die krankheitserregenden und antibiotikaresistenten Mikroorganismen auf die Schliche zu kommen versuchen.
Das CeBiTec gilt als eine der größten und bekanntesten Einrichtungen der Universität Bielefeld. Es besteht seit 1998 und ist das Dach für Wissenschaftler, die sich der Genomforschung, der Biophysik und Nanowissenschaften, der Biochemie und dem Bioengineering sowie der Bioinformatik widmen. Die Besonderheit dabei ist die interdisziplinäre Ausrichtung: Das CeBiTec hilft, Grenzen zwischen den Disziplinen zu überwinden, um die Grenzen für biotechnologische Anwendungen zu erweitern. Es koordiniert Forschungsgruppen u. a. aus den Fachbereichen Biologie, Chemie, Physik und Informatik.
Wichtig ist die IT insbesondere in der Genomforschung. Die Gesamtheit aller Gene bzw. Erbinformationen in einer DNA bildet den Code für den Bauplan des Lebens. Um ihn zu entschlüsseln, bedarf es neben hoch spezialisierter Laborgeräte auch computergestützter Methoden. Schließlich gilt es, eine große Menge an Daten zu gewinnen, zu speichern und zu analysieren.
Daher schuf das CeBiTec verschiedene Technologie-Plattformen. So verfügt zum Beispiel die Genomik-Plattform über mehrere Hochdurchsatz-Sequenziersysteme, die für die Erfassung eines Genoms nötig sind: Hierbei wird im Labor anhand einer Probe die DNA von Zellen erst isoliert und dann in einem Hochdurchsatzgerät analysiert. Die so ermittelten DNA-Sequenzen werden daraufhin in einer Datenbank abgelegt. Dies dauert bis zu zehn Tage und erzeugt eine Datenmenge von bis zu drei Terabyte, verrät Dr. Alexander Goesmann, Leiter der Technologie- Plattform Bioinformatik am CeBiTec. Die Datenmenge variiert, je nachdem ob die DNA eines Bakteriums oder die weitaus komplexere Erbinformation einer Pflanze oder zum Beispiel – wie geschehen – des chinesischen Hamsters ausgelesen werden soll.
Die Speicherung ist ein komplexer Vorgang mit automatisierter Datenauswertung. So nimmt ein Steuerungsrechner zunächst die Rohdaten entgegen und führt eine Qualitätskontrolle durch, bevor sie in Speichernetzwerken abgelegt werden. In der späteren Analyse werden diese Daten u. a. mit anderen verfügbaren Sequenzdatenbanken verglichen, um Ähnlichkeiten zu finden.
Sowohl für die Sequenzanalyse als auch für die weitergehende Auswertung entwickelten die Bioinformatik-Gruppen des CeBiTec Algorithmen und Software – etwa auf Basis webbasierter Tools. Speziell bei der komplexen Genomanalyse setzt Dr. Goesmann auf Virtualisierung und verteiltes Rechnen. Seine Vision ist es, eine vollkommen virtuelle Infrastruktur aufzubauen, sodass jeder Forscher von jedem Platz an jedem Ort der Welt mit Online-Zugang an den Projekten mitarbeiten kann.
Zur Bewältigung der Analysen und zur Speicherung der Daten betreibt das CeBiTec ein eigenes Rechenzentrum, zu dessen stetiger Erweiterung MCS unter anderem auch als Oracle-F&L-Partner seit rund zehn Jahren seinen Teil beiträgt. Auch die Installation von Solaris- und Linux-Betriebssystemen sowie Consulting- Dienstleistungen vor Ort gehören zum Leistungsumfang von MCS.
Derzeit sind im Rechenzentrum des CeBiTec an der Universität Bielefeld ca. 320 Rechenknoten mit rund 4.200 Rechenkernen aktiv. Die Rechenknoten haben bis zu 2 TB Arbeitsspeicher und greifen auf ca. 650 TB Speicherplatz zu. Allein die Backups beanspruchen noch einmal 1,4 Petabyte Speicher. Der Bedarf an Storage-Kapazitäten wächst aber stetig. Etwa alle ein- bis eineinhalb Jahre verdoppelt sich die Datenmenge, sagt Dr. Goesmann. Und es gibt noch sehr viele Genomfunktionen zu entschlüsseln. Nur so lernen die Wissenschaftler zu verstehen, was in Biogasanlagen geschieht, wie die Herstellung pharmazeutischer Wirkstoffe verbessert, der Ertrag von Nutzpflanzen gesteigert und sie resistenter gegen Schädlinge gemacht werden können.
Weitere Informationen über CeBiTec auf der Homepage CeBiTec Uni Bielefeld