Zellbiochemie Martinsried


HumanZytomProjekt

G.Valet 1) , A.Tárnok 2)

1) Max-Planck-Institut für Biochemie, Martinsried
2) Pädiatrische Kardiologie, Herzzentrum Leipzig GmbH, Universitätskliniken Leipzig

  • < Zytomikkonzepte

       = externe Verbindungen

    Einleitung

    Die Sequenzierung der Humangenoms hat zu einem deutlichen Wissenszuwachs bezüglich der biomolekularen Kapazität von Organismen geführt. Trotzdem kann bisher nur ein sehr begrenzter Teil der strukturell und funktionell vielschichtigen Biokomplexität von Zellen und Zellsystemen (Zytome) durch dieses Wissen erklärt werden.

    Die Vorhersage dreidimensionaler (3D) Proteinstrukturen aus ihren Aminosäuresequenzen ist ein typisches Beispiel für das bereits auf biomolekularer Ebene auftretende Komplexitätsproblem, welches noch weit von der strukturellen und funktionellen Komplexität von Zellen und Zellsystemen entfernt ist. Genaue Vorhersagen der Proteinstruktur aus Aminosäuresequenzen sind auch nach über 30 Jahren intensiver Forschung und trotz der explosiven Entwicklung von Hard- und Softwarekapazität in der Zwischenzeit. immer noch schwierig.

    Problemstellung

    Betrachtet man die weit schwierigeren Vorhersagen über die Assoziation und Funktionalität von Biomolekülen in lebenden Zellen als Produkte der 20-30.000 kodierenden Gensequenzen, so erscheint es gegenwärtig außerhalb Reichweite, die enorme Biokomplexität von Zellen oder Zellsystemen (Zytome) in kürzeren Zeiträumen allein durch die traditionelle deduktiv von oben nach unten gerichtete Hypothesenbildung mit anschließender experimenteller Verifizierung zu verstehen. Die hohe Redundanz molekularer Reaktionswege wie z.B. beim cell signalling, bei der Zellproliferation oder während der Apoptose erfordert eine Vielzahl von Hypothesen induzierten Untersuchungen zur Sammlung einer großen Menge von Details, ohne die Sicherheit sich auf letztlich relevante Krankheits-assoziierte Stoffwechselwege, molekulare Brennpunkte oder pharmazeutische Zielmoleküle fokussiert zu haben.

    Alternativ repräsentiert die von unten nach oben gerichtete Vorgehensweise der molekularen Einzelzellphänotypanalyse ganzer Zellsysteme (Zytomik) als molekulare Zellsystemforschung eine Art vielschichtiger reverse engineering Strategie zur induktiven Komplementierung (fig.1) deduktiver Vorgehensweisen. Auf diese Weise kann ein standardisiertes relationales Rahmenwerk direkt krankheitsbezogener molekularer Wechselbeziehungen etabliert und anschließend mit den erforderlichen Details komplementiert werden.

    Das Konzept der Prädiktivmedizin mittels Zytomik (L1-L3) wurde als Konsequenz aus diesen Überlegungen entwickelt. Es führte kürzlich zu Gedanken über ein menschliches Zytomprojekt, die Interesse ( siehe Details) gefunden haben.

    Informationssammlung

    Zellsysteme sind aus verschiedenen Arten von Einzelzellen als Elementareinheiten der Organe und Organismen zusammengesetzt. Die Einzelzellanalyse vermeidet das Problem gemittelter Resultate aus Zell- oder Gewebshomogenaten, bei denen gemessene molekulare Veränderungen falsch interpretiert werden können, da sie auf Änderungen in allen Zellen oder lediglich in spezifischen Subpopulationen beruhen können, während der Nachweis von Änderungen in anteilig gering vertretenen Zellpopulationen infolge Verdünnung möglicherweise wegen Absinken unter die Nachweisgrenze unmöglich werden kann. Diese Probleme werden durch die Einzelzellanalyse des molekularen Zellphänotyps als Resultat von Genotyp und Exposition zuverlässig vermieden

    Die anhaltende Entwicklung neuer bild- und durchflußzytometrischer Instrumentation, wie konfokale oder Laserscanning Mikroskopie mit Mehrfarbenbandpass- oder spektraler Bildgebung, Multiphotonenfluoreszenzanregung, Fluoreszenzenergietransfer (FRET), schnelle durchflußzytometrische Fluoreszenzbildaufnahme, optische Zelldehnungsmessung im Durchfluß, miniaturisierte Durchflußzytometrie auf Laborchips oder die Lasermikrodissektion von Geweben stellt einen erheblichen Fortschritt für die molekulare Einzelzellanalyse dar. Biomolekulare Analysetechniken, wie Partikelmatrixanalyse (bead arrays), Einzelzell-Polymerasekettenreaktion (PCR), Tyramid-Signalamplifikation, oder Biomolekülmarkierung durch Quantumdots, magnetische Nanopartikel und Aptamere eröffnen neue Horizonte der molekularen Spezifität und Sensitivität.

    Die Dimensionalität von Zelldaten kann bei der Erhebung vielschichtiger molekularer Zellprofile erheblich sein z.B. bei der wiederholter Anwendung von Vielfarben-Fluoreszenzfärbeprotokollen in Gegenwart von zahlreichen unterschiedlichen Zellpopulationen. Zunächst können mehrere Zellfunktionen vitaler Zellen, wie z.B. intrazellulärer pH-Wert, Transmembranpotentiale oder Ca2+-Spiegel angefärbt werden, gefolgt von Zellfixation zur Beseitigung der Vitalfärbungen und Anfärbung intrazellulärer Bestandteile, wie Antigene, Lipide oder Kohlenhydratstrukturen. Nach erneuter Entfärbung können spezifische Nukleinsäuren gefärbt werden. Mikroskopische Bildaufnahme- und Analysegeräte mit ihren Relokalisierungsmöglichkeiten werden zunehmend solche Färbesequenzen ermöglichen. Die traditionelle visuelle oder quantitative Erfassung der Inhalte von Auswertefenstern in zwei- oder dreidimensionalen zytometrischen Histogrammen sammeln nur eine sehr begrenzte Menge der verfügbaren Information, und es ist dabei niemals sicher, ob die wirklich wichtige Information überhaupt erfaßt wurde. Zusätzlich zeigt die Erfahrung, daß es nicht einfach ist, qualitätskontrollierte Konsensusstrategien für die Multiparameterdatenanalyse zu entwickeln. Außerdem gibt es wenig Interpretationswissen über sehr komplexe zytometrische Vielparameterdatenräume. Wesentliche Information kann deshalb einfach durch einen Mangel an Bewußtsein über deren Existenz verlorengehen.

    Datenanalysestrategien

    Betrachtet man die Anstrengungen für Probensammlung, Färbung, Messung und Datenanalyse, so erscheint es routinemäßig erforderlich, automatische Auswertestrategien mit selbsteinstellenden Auswertefenstern zu verwenden, um möglichst den gesamten Informationsgehalt aller gemessenen Zellen für die nachfolgende Wissensextraktion zu erfassen. Das bedeutet z.B. für die Durchflußzytometrie in der Praxis, daß neben der prozentualen Häufigkeit von Zellen auch die Mediane und Mittelwerte von Lichtstreuungs- und Fluoreszenzsignalen sowie die Lichtstreuungs- und Fluoreszenzsignalverhältnisse, ebenso wie die Variationskoeffizienten aller ausgewerteten Parameter in allen Auswertefenstern ausgerechnet und die jeweiligen Werte in Datenbanken abgelegt werden sollten. Das Bemühen sollte es sein, die Information von mehr als 95% aller gemessenen Zellen zu erfassen, um ausreichend sicher zu sein, daß keine relevante Information verloren geht.

    Dabei ist es z.B. empirisch ratsam, für durchflußzytometrisch durch Vorwärts- (FSC) und Seitwärtslichtstreuung (SSC) oder typische Antigenexpression z.B. CD45 eindeutig charakterisierte Zellpopulationen, wie Lympho-, Mono- oder Granulozyten, selbsteinstellende, sich nahtlos berührende Auswertefenster für die automatische Analyse zu benutzen. Die anschließende Bestimmung weiterer Eigenschaften dieser Zellpopulationen bezüglich der Expression Fluoreszenz-gefärbter Eigenschaftsmuster in den jeweils durch Projektion ermittelten Zweiparameterhistogrammen kann durch Quadrantenanalyse mit feststehenden Grenzen ebenfalls automatisiert werden. Hierbei ist es nicht von vorrangiger Bedeutung, daß eventuelle Zellpopulationsgrenzen genau respektiert werden, da relevante Informationen in der nachfolgenden Datensiebung zur Ermittlung der diskriminantesten Datenmuster in jedem Falle erfaßt werden, vorausgesetzt die Information von mehr als 95% aller Zellen wurde während der Phase der Informationssammlung eingebracht.

    Bioinformatische Wissensextraktion

    Die Wissensextraktion nach der allgemeinen Informationssammlung stellt eine sehr wesentliche Aufgabe dar. Die gesammelte Information kann ohne weiteres mehrere tausend Datenkolonnen umfassen. Die Klassifzierung von solchen Anzahlen von Datenkolonnen mittels statistischer Vorgehensweise, Hauptkomponentenanalyse, Fuzzy-Logik, neuronalen Netzwerken oder selbstorganisierende Matrizen überschreitet häufig die Kapazität typischer Softwarepakete. Die Klassifizierungsresulte dieser Analysestrategien können auch bis zu einem gewissen Grad von Annahmen über die mathematische Verteiltheit von Parameterwerten oder von vordefinierten Schwellwerten der Korrelationskoeffizienten bei Clusteranalysen abhängen. Fehlende experimentelle Werte müssen unter Umständen unter Verwendung von Annahmen ergänzt werden, oder diesbezügliche Datensätze sind nicht verwendbar, was das Klassifizierungsresultat beeinflussen kann.

    Die Datensiebung als alternative nicht-statistische Wissensextraktionsstrategie erfordert keine mathematischen Annahmen über Werteverteilungen, fehlende Experimentalwerte müssen nicht ergänzt werden, die Analyse ist für Parallelprozessierung geeignet und inhärent schnell, da nur Schwellwertvergleiche zur Klassifizierung erforderlich sind.

    Relationales Zellklassifizierungssystem

    Multiparametrische Durchflußzytometer und Mikroskope stellen komplexe Instrumente dar, bei denen auch zwei Instrumente aus derselben Bauserie, obwohl sie aus denselben Bauteilen zusammengesetzt sind, keine identischen Resultate für die Messung gleicher Proben oder Einzelzellen ergeben. Diese Ungleichheit entsteht durch die Toleranzbereiche der vielen elektronischen, optischen und mechanischen Komponenten solcher Meßsysteme. Fluoreszenz- und Lichtstreusignale werden unter Verwendung relativer Skalen gemessen und die Zellpopulations-orientierten Bemessung der Auswertefenster bei der Histogrammanalyse ist zu einem gewissen Grade willkürlich. Diese Richtigkeitsfehler verschwinden zum größten Teil, wenn alle Meßwerte relational als Bruchteil der jeweiligen Mittelwerte von geeigneten Referenzgruppen ausgedrückt werden. Der relationale Bezug erhält die relativen individuellen Postionen der Parametermittelwerte und auch ihrer Variationskoeffizienten als Dispersionsmaß der Werteverteilungen.

    Wenn Referenzgruppen desselben Typs in verschiedenen Laboratorien vermessen werden, sind sie bei Klassifizierung gegeneinander nicht voneinander unterscheidbar, vorausgesetzt sie sind aus repräsentativen Referenzpersonen oder Proben zusammengesetzt und mit Langzeitpräzision und spezifischen Reagenzien vermessen worden. Referenzgruppen können durch Konsensus definiert werden. Auf diese Weise ist eine standardisierte und laborunabhängige Klassifizierung relationaler Daten möglich und relationale Datenbanken aus verschiedenen Labors können in größeren Datenbanken zusammengeführt werden. Ergeben sich bei der Klassifizierzung Unterschiede zwischen korrekt zusammengesetzten Referenzgruppen aus verschiedenen Labors, so ist dies ein Anzeichen für methodische oder ethnische Unterschiede.

    Auf diese Weise kann ein relationales System zur objektiven molekularen Beschreibung von Krankheiten oder von elementaren Zellzuständen wie Differenzierung, Reifung, Teilung oder Malignität auf Zellniveau erstellt werden. Verschiedene Zelltypen stehen in einer standardisierten Bezug zueinander in einer Art periodischem System der Zellen.

    Humanzytomprojekt

    Mit diesen Gedanken im Hintergrund können bei einem Humanzytomprojekt gegenwärtig drei Hauptebenen unterschieden werden.

    Auf der ersten Ebene wird das Zellverhalten im Lebenszyklus angesprochen unter Einschluß von Zellzykluskontrolle, Biomolekülsynthese, Molekülimport und Export, Energie- und oxido-reduktive Bilanz sowie Organellenfunktion um nur einige wichtige Phänomene anzusprechnen. Es erscheint ebenfalls wichtig, die signifikante Dispersion vieler Zellpopulationsparameter im Bereich zwischen 1:10 bis zu 1:10.000 anzusprechen, wie sie durch die Variationskoeffizienten ihrer Werteverteilungen angezeigt wird. Die multiparametrische Heterogenität von Zellen in ihrer kombinatorischen Multiplizität kann von hoher Bedeutung für die zuverlässige Anpassung von Zellen an neue Umgebungsbedingungen und für die Empfänglichkeit oder Resistenz gegenüber Krankheiten oder Therapie sein.

    Auf der zweiten Ebene werden Einzelzellpräparationen entweder wie gesammelt oder nach mechanischer bzw. enzymatischer Aufarbeitung mittels Durchfluß- oder Bildzytometrie untersucht, um den Molekularstatus normaler oder kranker Zellen als Deskriptoren für Gesundheit und Krankheit zu bestimmen. Diese Unterscheidung hängt nicht notwendigerweise von der originalen in-situ Anordnung det Zellen im Gewebe ab, wenn die Schlußfolgerungen aus dem Molekularstatus spezifischer Zellen oder Zellkombinationen gezogen werden.

    Die dritte Ebene betrifft Zellen in assemblierten Geweben. Hierbei können die molekularen Zwischenbeziehungen und die Nähe der Zellen bei Gesundheit oder Krankheit innerhalb einer intakter Zellarchitektur und unter den komplexesten Bedingungen auf höchstem Organisationsniveau untersucht werden.

    Schlußfolgerungen

    - Da Krankheiten durch Abweichungen von typischen molekularen Prozessen in Zellen oder Zellsystemen entstehen, ist ein detailliertes molekulares Wissen über die enorme Biokomplexität solcher Systeme unter den Bedingungen von Normalität und Krankheit erforderlich, um die Mechanismen von Krankheitsprozessen zu verstehen.

    - Das notwendigte Wissen kann durch eine vielschichtige molekulare Einzelzellanalyse nahe an den in-vivo Bedingungen im Zusammenhang mit einer erschöpfenden bioinformatischen Wissensextraktion (Zytomik) gewonnen werden.

    - Die Untersuchungsresultate werden in ein relationalen Wissenssystem oder Rahmenwerk eingebracht und stehen für die wissenschaftliche Hypothesenbildung, ebenso wie für direkt Medizin-bezogene Verwendungen, wie Prädiktivmedizin mittels Zytomik d.h. Vorhersagen über den Therapie-abhängigen zukünftigen Krankheitsverlauf beim Einzelpatienten sowie personalisierte Therapiemöglichkeiten und die Suche nach neuen pharmazeutischen Zielmolekülen zur Verfügung.

    - Die Einrichtung eines derartigen relationalen Wissenssystems bei gleichzeitiger Weiterentwicklung Einzelzell-orientierter instrumenteller Untersuchungstechniken sowie empfindlicher Biomolekülmarkierungen in einem Humanzytomprojekt stellt eine für verschiedenste Bereich der Bioforschung vielversprechende Herausforderung an Wissenschaft, Medizin und Technologieinnovation dar.

    Literaturhinweise

    L1. Valet G: Predictive Medicine by Cytomics: Potential and Challenges. J.Biol.Regulators 2002, 16:164-167 (
    PDF)
    L2. Valet G, Tárnok A: Cytomics in Predictive Medicine. Cytometry 2003; 53B:1-3 (PDF)
    L3. Valet G, Repp R, Link H, Ehninger G, Gramatzki M and SHG-AML study group: Pretherapeutic identification of high risk acute myeloid leukemia (AML) patients from immunophenotype, cytogenetic and clinical parameters. Cytometry 2003, 53B:4-10 (PDF)
    L4. Valet G, Tárnok A: Cytomics - New technologies: Towards a human cytome project. Cytometry (2004), in press
    L5. Valet G, Hoeffkes HG: Data pattern analysis for the individualised pretherapeutic identification of high-risk diffuse large B-cell lymphoma (DLBCL) patients by cytomics. Cytometry (2004), in press


  • < Concepts in Cytomics


    © 2004 G.Valet
    Max-Planck-Institut für Biochemie, Am Klopferspitz 18a, D-82152 Martinsried, Germany, Tel: +49/89/8578-2518, -2525, Fax: +49/89/8578-2563, INTERNET: http://www.biochem.mpg.de/valet/cellbio.html
    Letzte Aufdatierung: 10.04.2004