Stomach Health > Magen Gesundheit >  > Gastric Cancer > Magenkrebs

PLoS ONE: Gene-Expression Signaturen können Magenkrebs unterscheiden Grades und Stages

Abstrakt

Microarray-Gen-Expressionsdaten von 54 gepaart Magenkrebs und benachbarten noncancerous Magengewebe wurden analysiert, mit dem Ziel, Gensignaturen zu etablieren für Krebs-Typen (gut, moderately-, poorly- oder un-differenziert) und Stufen (I, II, III und IV), die von den Pathologen festgestellt wurden. Unsere statistische Analyse führte zur Identifizierung einer Anzahl von Genkombinationen, deren Expressionsmuster dienen und Signaturen von verschiedenen Qualitäten und verschiedenen Stadien von Magenkrebs. Es wurde eine 19-Gen-Signatur bei 79,6% haben anspruchsvolle Leistung zwischen High- und Low-Grade-Magenkrebs in der Regel mit Gesamtklassifikationsgenauigkeit gefunden. Eine erweiterte 198-Gen-Panel ermöglicht die Schichtung von Krebserkrankungen in vier Grade und Kontrolle, was zu einer Gesamtwertung Vereinbarung von 74,2% zwischen jeder Klasse bezeichnet die von den Pathologen und unsere Vorhersage führt. Zwei Unterschriften für Cancer Staging, bestehend aus 10 Genen und 9 Gene bzw. bieten eine hohe Klassifikationsgenauigkeiten bei 90,0% und 84,0%, unter Früh-, im fortgeschrittenen Stadium Krebs und Kontrolle. Funktionelle und Pathway-Analysen auf diese Unterschrift Gene, die die wesentliche Relevanz der abgeleiteten Signaturen zu Krebs-Typen und die Progression zu offenbaren. Nach bestem Wissen ist dies die erste Studie zur Identifizierung von Genen, deren Expressionsmuster können als Marker für Krebs-Typen und Stufen dienen

Citation:. Cui J, Li F, Wang G, Fang X, Puett JD, Xu Y (2011) Gene-Expression Signaturen können Magenkrebs Grades und Stufen unterscheiden. PLoS ONE 6 (3): e17819. doi: 10.1371 /journal.pone.0017819

Editor: Amanda Toland, Ohio State University Medical Center, Vereinigte Staaten von Amerika

Empfangen: 24. November 2010; Akzeptiert: 9. Februar 2011; Veröffentlicht: 18. März 2011

© 2011 Cui et al. Dies ist eine Open-Access-Artikel unter den Bedingungen der Lizenz Creative Commons, die uneingeschränkte Nutzung erlaubt, die Verteilung und Vervielfältigung in jedem Medium, vorausgesetzt, der ursprüngliche Autor und Quelle genannt werden

Finanzierung:. Diese Studie wurde teilweise von der National Science Foundation (DEB-0830024, DBI-0542119), die National Institutes of Health (1R01GM075331), einen "Distinguished Scholar" Zuschuss von der Georgia Cancer Coalition und ein seed-Fonds gemeinsam vom Präsidenten Venture Fund unterstützt und das Amt des Vizepräsidenten für Forschung der Universität von Georgia. Die Geldgeber hatten keine Rolle in Studiendesign, Datenerfassung und Analyse, Entscheidung oder Vorbereitung des Manuskripts zur Veröffentlichung

Konkurrierende Interessen:.. Die Autoren haben erklärt, dass keine Interessenkonflikte bestehen

Einführung

Cancer Einstufung ist ein Maß für die Bösartigkeit und Aggressivität des Krebses. Eine beliebte Grading System verwendet vier Stufen von Malignität (G1-G4), die Gesamtmenge der zell Aussehen Abnormalität, Abweichung der Wachstumsrate von den normalen Zellen und das Ausmaß der Invasivität und Verbreitung widerspiegelt. Diese pathologischen Maßnahmen wurden im allgemeinen Übereinstimmung zu sein mit dem Niveau der Zelldifferenzierung (American Joint Commission on Cancer) [1]. Daher {G1, G2, G3, G4} werden auch als gut bezeichnet, moderately-, poorly- und un-differenziert sind. Ab heute gibt es ein universelles Grading-System für alle Krebsarten nicht gewesen. Stattdessen haben verschiedene Bewertungssysteme für verschiedene Krebsarten vorgeschlagen. Zum Beispiel ist das Gleason-System [2] wahrscheinlich die bekanntesten für das Adenokarzinom Zellen bei Prostatakrebs Gehalt, während die Bloom-Richardson-System [3] für Brustkrebs verwendet wird, und die Fuhrman System [4] für die Nierenkrebs verwendet .

Magenkrebs, die zweithäufigste Ursache für den weltweiten Krebs-Todesfälle ist besonders häufig in den asiatischen Ländern, darunter China, Korea und Japan [5]. In den USA, diese asymptomatisch Krankheit hatte ~21,500 neue Fälle im Jahr 2008 zusammen mit 10.800 Todesfälle [6]. Im Gegensatz zu anderen Krebsarten, ist Magenkrebs noch nicht eine im Allgemeinen Einstufungsschema akzeptiert. Die Einstufung wurde auf Basis von eher allgemein bei Krebs Zustand Richtlinien von Organisationen wie der American Joint Commission on Cancer meist getan worden. Es gibt ein paar Systeme für Magenkrebs in histologischen Subtypen Klassifizierung, einschließlich der von der Lauren [7], der Weltgesundheitsorganisation (WHO) [8] und Goseki, et al. [9], [10], die definiert Subtypen entsprechend den strukturellen Merkmalen des Krebses, die histopathologische Erscheinungen der Zellen, und die Höhe der Schleim, respectively. Es ist jedoch weitgehend umstritten darüber, ob eines dieser Systeme ist sehr relevant für den Grad der Bösartigkeit und Überlebensfähigkeit, also nicht weit verbreitet zur Einstufung von Magenkrebs verwendet wurde [11]. Das Fehlen von einem gut etablierten Grading-System für Magenkrebs bleibt als ein wesentliches Hindernis behindert den Fortschritt auf diesem Gebiet.

Wir präsentieren eine theoretische Studie hier, richtet eine Reihe von Genen, deren Expressionsmuster zu identifizieren, kann gut unterscheiden unter Magenkrebs von verschiedenen Qualitäten, wie Oncotype DX, ein 21-Gen-Panel für Low-Brustkrebs-Risiko zu identifizieren [12]. Diese Gene, deren Expressionsmuster unterscheiden Magenkrebs von verschiedenen Qualitäten, bieten nützliche Informationen zu einem Gen-Expression-basierte Grading-System für Magenkrebs zu entwickeln. Darüber hinaus präsentieren wir unsere Erkenntnisse über die Genexpressionsmuster auch gemeinsam Krebserkrankungen in verschiedenen Entwicklungsstadien, die möglicherweise als molekulare Signaturen für Magenkrebs Staging dienen.

Ergebnisse |

A. Identifizierung von Genen, die mit Expression Veränderungen korreliert mit Krebs-Typen

17.800 menschlichen Gene wurden in dieser Studie profiliert, Affymatrix Exon Arrays verwenden. Von den 54 Krebsproben, 8 sind gut differenziert (WD), 9 mäßig differenzierten (MD), 35 schlecht differenzierten (PD) und 2 undifferenzierten (UD). Insgesamt 452 Gene wurden gefunden unterschiedlich exprimiert werden, wie anhand der folgenden Kriterien bestimmt: die Expressionsniveaus in der Krebstherapie und die entsprechenden Kontrollgewebe zeigen mindestens 2-fache Veränderung, und die statistische Signifikanz, P
-Wertes , dieses Niveau der Expression Wechsel mit < 0,05 (siehe Material und Methoden; Gen-Namen in der Tabelle S1 aufgeführt sind). Unter den 452 Genen, 97 eindeutig in UD, 62 in PD, 8 in MD und 16 eindeutig in WD stellen eine Kernsatz
von differentiell exprimierten Genen, die durch die Anwendung unterschiedlicher Klassifikationsstrategien konsequent identifiziert werden mit dem paired- Beispielinformationen oder nicht. Dieses Set enthält Gene, die die konsequenteste Ausdruck Veränderung aufweisen (mehr als 2-fach) in der Krebs im Vergleich zu
Kontrollgeweben, die unterschiedlich Gene mit hoher Zuverlässigkeit ausgedrückt werden wurden, gilt, durch mehrere statistische Tests abgeleitet. Im Gegensatz dazu stellen die ganze Reihe von 452 Genen einen erweiterten Satz. Wir haben festgestellt, dass es ein allgemeiner Trend, daß die Anzahl der differentiell exprimierten Gene erhöht als Magenkrebs, relativ zu normalem Gewebe, mehr schlecht differenziert ist, wie in Abbildung 1. Diese Beobachtung in Übereinstimmung mit unseren allgemeinen Wissen wird gezeigt, dass Less- differenzierte Krebsarten neigen dazu, mehr differentiell exprimierte Gene zu haben und sind aggressiver; die Ausnahme für WD, wie in Abbildung 1 dargestellt, könnten die kleinen Größen der WD und die MD Gruppen widerspiegeln.

Wir überprüften dann, wenn einige Gene ihre Expression Veränderungen korrelieren mit den Krebs-Typen haben können. Um dies zu tun, haben wir den Spearman Korrelationskoeffizient (CC) zwischen dem durchschnittlichen Expression jedes Gens in allen Proben von jeder Sorte und den vier Krebs-Typen berechnet. Es wurde festgestellt, dass die Expression Änderungen von 99 Genen korrelieren perfekt mit den Noten WD-MD-PD-UD (| CC
| = 1, P
-Wert < 0,05) (siehe Details in Tabelle S2). Unter diesen Genen sind POF1B
, MET
, CEACAM6
, ZNF367
, GKN1
, LIPF
, SLC5A5
, MUC13
, CLDN1
, MMP7 und ATP4A
, die alle bekannt sind, Krebs zu beziehen. Figur 2 zeigt vier Beispiele mit entweder positive oder negative Korrelation. Unter ihnen MUC13
hat als guter Marker für das Ausmaß der Differenzierung von Magen-Darm-Schleimhaut berichtet [13]. Erhöht MUC13-Expression wurde gefunden, morphologischen Veränderungen zu induzieren, einschließlich der Streuung von Zellen, die durch Interferenz mit der Funktion von Zelladhäsionsmolekülen [14]; Somit kann eine erhöhte Expression zusammen mit Differenzierungs Zell-Zell-Adhäsion hinweisen kann verbessert

Wir haben festgestellt, dass Gene, die mit ihrer Expression Veränderungen mit Krebs-Typen korreliert sind unter sezerniertes oder Membranproteine ​​stark angereichert. (P-Wert < 0,05) , die in mehrere Signalwege wie ErbB, FAS, NOD-like receptor, PPAR und Wnt-Signalisierung, sowie Zelladhäsionsmoleküle (CAMs) und tight junctions teilnehmen. Dies ist nicht überraschend, da diese Wege im wesentlichen in Zellwachstum und Zelltod beteiligt sind, sowie von Krebsmetastasen. Solche Veränderungen in der Gen-Expressionsmuster dieser Wege in der Signaltransduktion und extrazelluläre Kommunikation beteiligt sind, können Hinweise darauf geben, über Krebs Progression.

B. Identifizierung von Gen-Signaturen für Krebs-Typen

Wir haben die 452 differentiell exprimierten Gene untersucht haben, mit dem Ziel, Gene zu identifizieren, deren Expressionsmuster können mit hoher Genauigkeit und Zuverlässigkeit, unterscheiden Magenkrebs von verschiedenen Qualitäten. Die Klassifikationsanalyse (siehe Methoden) wurde zunächst zwischen zwei Krebsgruppen (hoch und schlecht differenziert) durchgeführt, und dann auf fünf Gruppen erweitert, nämlich vier Krebs-Typen und die Kontrolle. Ein Support-Vektor-Maschine (SVM) -basierte regressive Funktion Beseitigung Ansatz angewendet wurde, eine lineare Kernel für Krebs-Klassifikation (siehe Methoden).

Am Ende ein 19-Gen-Gruppe identifiziert, die zwischen sehr unterscheiden kann und schlecht Krebserkrankungen mit einer Gesamteinigung differenziert bei 79,2%, bezogen auf die Expression fold change in Krebs im Vergleich zu
Kontrollgewebe. In ähnlicher Weise eine 198-Gen-Gruppe kann unter den vier verschiedenen Krebsnoten und der Kontrollgruppe nach ihrer Genexpression, was zu 74,2% Gesamtklassifikationsgenauigkeit unterscheiden. Beide Gen-Sets wurden auf einer Mehrheit Auserwählter Basis (mindestens 70% Konsistenz) Schema von den Klassifikationsergebnisse auf 500 Sätze zufällig aus den Sätzen 54 Probe abgetastet, zusammen mit ihrer Bedeutung Ranking (siehe Methoden für Details).

der 19-Gen-Signatur besteht aus ADIPOQ, COL6A3, TNS1, SCN7A, dES, VIL1, COL3A1, C2orf40, SMYD1, ACTG2, MEIS1, C7, GPR174, SHCBP1, DUSP1, DNAJB5, HIATL1, IL17RB und FAT. Ein genauer Blick auf die funktionelle Annotation dieser Gene zeigte, dass ihre Proteinprodukte in Zellwachstum und Differenzierung beteiligt sind (IL17RB, SMYD1, SHCBP1), Zell-Motilität (ACTG2), Angiogenese und Gewebeumbau (ADIPOQ), Karzinogenese (ECRG4), Matrix Proteinsynthese (COL3A1, COL6A3), und andere, wie G-Protein-gekoppelten Rezeptor 174 (GPR174), Bürstensaum Zytoskelett (VIL1), Membranangriffskomplex (C7) und Natriumkanal (SCn7A).

17 aus der 19 Gene, plus weitere 181 Gene bilden eine 198-Gen-Gruppe Expressionsmuster, dessen können die vier Krebs-Typen und die Steuerung unterscheiden. Ihre Funktionen decken die Zellteilung, die Immunantwort, Signalübertragung und die Transkriptionsregulation, zusätzlich zu den oben genannten Kategorien. Insgesamt 39 von 99 Grad korrelierten Gene sind Teil dieser 198-Gen-Signatur, einschließlich CLDN1, MUC13, VIL1, HIATL1, CDCA7, HIST1H2BM und FAT (siehe die vollständige Liste in Tabelle S3).

Zusätzlich zu dieser catch-all-Signatur für fünf-Wege-Klassifizierung, wir auch Klasse-spezifische Gen-Signaturen für jeden Krebs Klasse identifiziert und analysiert. Zum Beispiel ist LAPTM4B ein solcher Vertreter. Dieses Gen ergibt eine hohe Klassifikationsgenauigkeit für Caner und Kontrollproben in der WD-Gruppe mit der AUC (Fläche unter der Kurve) = 0,97 (Abbildung 3). Mit 7,04 als Ausdruck Cutoff, kann dieses Gen auch Krebs von den Kontrollproben in der WD-Gruppe mit Empfindlichkeit unterscheiden = 87,5% und eine Spezifität = 100%. Dieses Ergebnis ist nicht überraschend, da bekannt ist, dass LAPTM4B für das Zellwachstum und das Überleben wesentlich ist, und die Hochregulierung gefunden wurde, mit dem Grad der Differenzierung von hepatozellulärem Karzinom [15] zu korrelieren. Insgesamt 40 solcher Signatur Gene sind speziell für die WD-Gruppe gefunden; 18, 20 und 255 Gene sind spezifisch für die MD, PD und UD-Gruppe, bzw. (siehe Details in der Tabelle S4).

Wir haben auch einzelne Gen Scheidern für jede Klasse Gruppe gegen den Rest der Proben identifiziert, einschließlich der Kontrolle, wie in Tabelle 1 zusammengefasst Beispiel umfassen die Signaturen für die PD-Gruppe, die hochreguliert Gene MYO1B
für WD; GKN2
für MD; CTSA
für PD; und ein nach unten reguliert Gen, RHOJ, Portal für die UD-Gruppe. Diese Single-Gen Scheidern zeigen signifikante AUCs reicht von 0,76 bis 0,99, während die Gesamtwertung Genauigkeiten, die durch 5-fach Kreuzvalidierung Bereich von 70,0% bis 97,0% für verschiedene Gruppen. Eine anschließende Suche nach k
-Gen Kombinationen (k = 2, 3, 4) für jede Gruppe Krebs durch erschöpfend alle Kombinationen von gehen durch k
-Gen Gruppen auch identifiziert.

C. Identifizierung von Gen-Signaturen für pathologische Stadium

Mit ähnlichen Analysen zu denen der oben haben wir Gensignaturen für frühzeitig erkannt (Stufe I + II) und fortgeschrittenen Stadium Krebs (Stadium III + IV). Tabelle 2 zeigt die meisten unterscheidenden einzelnen Gen-Marker, mit der Klassifikationsgenauigkeit im Bereich von 75,0% bis 81,4%. Multi-Gen-Signaturen wurden auch für Cancer Staging geprüft. Zum Beispiel wurden zwei Unterschriften als besonders wirksam bei der Krebs Inszenierung gefunden, nämlich eine 10-Gen-Gruppe (CPS1 + DEFA5 + DES + DMN + GFRA3 + MUC17 + OR9G1 + REEP3 + TMED6 + TTN) und ein 9-Gen-Gruppe (DPT + EIF1AX + FAM26D + IFITM2 + LOC401498 + OR2AE1 + PRRG1 + REEP3 + RTKN2) , die die frühen und die fortgeschrittenen Magenkrebs von dem Rest der Proben (einschließlich Kontrollproben) mit Vereinbarungen von 90,0% und 84,0% zu unterscheiden sind. Die Gesamtklassifikationsgenauigkeit auf den drei Gruppen, früh, erweiterte und Kontrolle, ist 71,4%.

Eine funktionelle Analyse dieser Unterschrift Gene etwas Interessantes aufgedeckt. Zum Beispiel unter den Proteinprodukte von Frühphasen-Signatur Gene, GFRA3
, MUC17
, OR9G1
, REEP3 und TMED6 Was sind Membranproteine , meist Rezeptoren, die extrazelluläre Signale transduzieren. DEFA5
ist ein Mikrobizid Peptid glaubte in der Wirtsabwehr beteiligt zu sein, die hoch im Ileum exprimiert wird [16]. CPS1
, DES und TTN Was sind in mehreren Stoffwechselprozessen beteiligt, die Muskelfunktion und die M-Phase des mitotischen Zellzyklus sind. Wir vermuten, dass diese SIGNAL und Immun- verwandte Gene im Allgemeinen die frühe Abnormalität von Gewebezellen während oncogenesis darstellen.

Einige Gene gefunden wurden, um sowohl die Krebs Grading und Staging-Signaturen, wie CPS1, DES, GFRA3, TMED6 und DPT, einige biologische Relevanz zwischen Krebs Differenzierung und Progression hindeutet. Wir untersuchten dann, ob die Genexpression von Aufenthaltsorten Signaturen mit pathologischen Stufen zugeordnet sind. Unter ihnen sind die stark korreliert mit verschiedenen pathologischen Stadien LANCL3
, MFAp2 und PPA1
(Abbildung 4), die zeigen, konsistente Up- und Down-Regulation jeweils zusammen mit der Tumorprogression.

D. Identifizierung von differentiell exprimierten Genen unabhängig von Krebs-Typen und Stufen

Neben der differentiellen Expression spezifisch für bestimmte Untergruppen von Magenkrebs, wir auch, wenn einige Gene untersucht bei Magenkrebs im allgemeinen unterschiedlich exprimiert, unabhängig von Noten und Bühnen. 62 solcher Gene wurden mit konsistenter differentielle Expression von mindestens 2-fach Veränderungen in Krebs Vergleich
entsprechenden Bezugs Geweben gefunden. Wir stellten fest, dass sie in der extrazellulären Prozessen wie focal adhesion meist beteiligt sind, CAMs, tight junction, Zytokin-Zytokin-Rezeptor-Interaktion und ECM-Rezeptor-Wechselwirkung, der Plasminogen-Aktivierungskaskade sowie Signalwege einschließlich Wnt-Signal und Integrin-Signalisierung, welche eng relevanten Zellwachstum und die Zellproliferationskontrolle. Suche gegen unsere hauseigene Datenbank (http://bioinfosrv1.bmb.uga.edu/DMarker/), die Datensätze von GEO öffentlichen Microarray enthält [17], Oncomine [18] und SMD [19], mit über 53 Krankheiten beim Menschen, einschließlich Krebs, fanden wir, dass die differentiellen Expressionsmuster von 15 Genen, Magenkrebs hochspezifisch sind, wie GKN2, CLDN7, THY1, GIF und PGA4, während die meisten anderen allgemeinen auf mehrere Krebsarten sind. Zum Beispiel umfassen die allgemeinsten diejenigen einige Mitglieder des Kollagen-Genfamilie (COL1A2, COL3A1 und COL1A1), das carcinoembryonic antigen-verwandte Zelladhäsionsmolekül (CEACAM6), Matrix-Metalloproteinasen (MMP1, MMP7 und MMP12), Topoisomerase (TOP2A) und sezerniert Phosphoprotein (SPP1).

Nur drei, CLDN7
, CLDN1 und DPT
, dieser Gene werden in allen Klassen oder Stufen von Magenkrebs signifikant unterschieden. Wir können aus 5A und 5B zu sehen, dass sowohl CLDN7 und CLDN1
in Krebs stark exprimiert werden im Vergleich zu
Kontrollproben in allen Qualitäten und Bühnen, mit einem moderaten Anstieg in der frühen Krebsgewebe, während DPT
wurde herunterreguliert, in all diesen Gruppen. Die konsequente Expressionsmuster über alle Krebs Untergruppen kann darauf hindeuten, dass diese Gene in vielen wichtigen biologischen Wegen beteiligt sind bei der Krebsentstehung und Progression teilnehmen. Wie allgemein bekannt ist, sind die beiden claudin Proteine, claudin-1 und claudin-7, sind integrale Membranproteine ​​von entscheidender Bedeutung für die Bildung von tight junctions, die Aufrechterhaltung Zell-zu-Zell-Adhäsion und Regelparazellulären und transzellulären Transport von gelösten Stoffen durch menschliche Epithelien und Endothelien, welche differentiell in verschiedenen Krebsarten, wie beispielsweise zervikale Neoplasie [20], Nierenkarzinom [21] und einer intestinalen Typ von Magenkrebs [22] ausgedrückt. Dermatopontin ( DPT
) ist ein extrazelluläres Matrixprotein als eine Kommunikationsverbindung zwischen der Fibroblasten- Zelloberfläche dermal dient und seiner extrazellulären Matrix. Seine reduzierte Expression wurde auch in beiden Uterusleiomyomen und Keloiden [23] gefunden. Die ROC in 5C gezeigt ist zeigt an, dass diese Gene möglicherweise als wirksame Marker für Magenkrebsdiagnose im Allgemeinen verwendet werden könnte.

E. Die Überprüfung der identifizierten Unterschriften auf öffentliche Datensätze

Die Expressionsmuster unserer identifizierten Signatur Gene gegen zwei öffentliche Datensätze überprüft wurden, nämlich die Kim
und Takeno
Datensätze (siehe Materialien und Methoden), die Allgemeingültigkeit dieser Gensignaturen zu bestimmen. Wie in 6 gezeigt ist, die Verteilung der Expressionsunterschiede zwischen unseren Daten und die Kim
Datenmenge erheblich konkordant ist, was anzeigt, daß die allgemeine Anwendbarkeit der identifizierten Marker. Von den 19 und 12 überlappenden Genen aus den oben genannten Klassen korreliert und bühnen korrelierte Genliste, 10 und 5 zeigen ähnliche Expressionsmuster über Krebserkrankungen von G1-2 /G3-4 Qualitäten und I-IV-Stadien in der Kim
Daten bzw. reflektieren eine hohe Konsistenz in Expressionsmuster dieser Gene zwischen verschiedenen Sample-Sets.

Insgesamt sind unsere 19-Gen-Signatur für Krebs-Typen eine gute Leistung auf dem Kim
Daten und erhalten 78,0% Klassifikationsgenauigkeit auf 5-fach Kreuzvalidierung in Bezug auf schlecht von hoch differenzierten Krebsarten zu unterscheiden. In ähnlicher Weise erhalten die zweistufigen Signaturen (10-Gen und 9-Gengruppen) jeweils Genauigkeiten von 84,0% und 76,0% auf die Kim
-Datensatz. Das 198-Gen-Signatur wurde nicht, da das aufgegebene Kim
-Datensatz liefert nur klappbare Veränderung statt roher Expressionsdaten.

Interessanterweise haben wir festgestellt, dass es moderate Korrelation zwischen der Genexpression unserer identifiziert Signaturgruppen und Krebsrezidiv basierend auf der Bauchrückfall Informationen von Takenos Daten [24]. Genauer gesagt, die vier Signaturen, 19-, 198-, 10- und 9-Gengruppen, mit einer Gesamtgenauigkeit von 66,0%, 87,2%, 73,0% und 55,3% der peritonealen Rezidiv vorherzusagen, die jeweils von zwischen dem relapse- Unterscheiden frei und Peritonealdialyse-Rückfall-Patienten in Takenos Studie [24].

Diskussion

Microarray-Gen-Expressionsanalysen auf Magenkrebs haben zuvor Genexpression identifiziert Muster für die Prognose Vorhersage [25], [26] und allgemeine Krebsdiagnose [27], [28] (wie in Tabelle S6 überprüft), aber keine für Magenkrebs Subtyping oder Einstufung. Hier stellten wir eine Analyse von 54 Paaren von Krebs und benachbarten Referenz Gewebe aus der gleichen Anzahl von Patienten mit Magenkrebs, und identifiziert molekulare Signaturen für Krebs-Typen und Stufen.

Es ist bekannt, dass unterschiedliche Einstufung und Genselektion Analysen kann auf verschiedene Gen-Signaturen führen, ein ernstes Problem hinsichtlich der Stabilität und Nützlichkeit der ausgewählten Gensignaturen aufwirft. Um mit diesem Problem zu begegnen, haben wir Anspruch auf Vollständigkeit sucht nach k-Gensignaturen angewendet (k < = 4), gekoppelt mit einer robusten Merkmalsauswahlverfahren mit Mehrheit für k > 4, die die Stabilität der identifizierten Signatur Gene gewährleistet. Auf der anderen Seite, aufgrund der komplexen Natur der Krebs-Gen-Expressionsdaten hat eine allgemeine Überzeugung gewesen, daß verschiedene Klassifikationstechniken zu unterschiedlichen Signaturen führen kann, aber von gleicher Wichtigkeit, da sie auf verschiedene Wege im Zusammenhang mit verschiedenen Aspekten eines Krebs entsprechen . Neben diesen technischen Abweichungen, die begrenzte Probengröße und die Heterogenität unter den Krebsuntergruppen bestehende als andere wichtige Faktoren beachten, um die ausgewählten Marker zu beeinflussen.

Abschließend haben wir hier, dass die Gen-Expressionsmuster nachgewiesen werden als wirksame Unterschriften für Magenkrebs Grading und Staging sowie prognostische Vorhersage. Zwei Arten von Unterschriften wurden vorgeschlagen verschiedenen diagnostischen Zwecken dienen, die jeweils eine bestimmte Bedeutung für Krebs Bösartigkeit und Krebsprogression zeigt. Solche Versuche von UPW-und bühnen Signaturen verwenden voraussichtlich deutlich die Entwicklung der personalisierten Medizin profitieren und neue Serummarker führen kann.

Materialien und Methoden

Gewebeproben

die Proben wurden von primären bösartigen Magenkrebs von nicht-behandelten Patienten während der ersten chirurgischen Eingriff bei drei angeschlossenen Krankenhäusern der Jilin University College of Medicine und der Provinz Jilin Cancer Hospital, Changchun, China. Für jede Krebsgewebeprobe wurde ein passendes Bezugsgewebeprobe aus dem benachbarten noncancerous Region gesammelt, die der Chirurg, um reseziert positive Margen gewährleisten. Alle Proben wurden schockgefroren in flüssigem Stickstoff innerhalb von 10 Minuten nach der Exzision und bei -196C bis zur RNA-Extraktion gelagert. Für die RNA-Isolierung 100 um Abschnitte von jeder Probe verwendet wurden.

Alle medizinischen Aufzeichnungen und Krebs Schnitte wurden durch ein chirurgisches Pathologen untersucht, und die histologische Diagnose und TNM-Klassifikation wurden nach Worldwide Health Organization (WHO) Kriterien und das Klassifizierungssystem der Internationalen Union gegen Krebs. Die Referenzproben wurden auf eine sorgfältige histologische Analyse unterworfen, um die vollständige Abwesenheit von Krebszellen zu gewährleisten. Eine schriftliche Einverständniserklärung wurde von allen Patienten erhalten, die von der Institutional Review Board an der University of Georgia, Athens, Georgia, USA und von der chinesischen IRB Aufsicht am Menschen an der Jilin University College of Medicine und der Provinz Jilin Cancer Hospital, Changchun genehmigt wurde , China.

Detaillierte Patienteninformationen wie Alter, Geschlecht, histologischen Typ, Differential grade, pathologische Stadium und die Geschichte der Verwendung von Alkohol /Rauchen in Tabelle S5 aufgeführt ist.

Microarray-Experimenten

die RNA-Proben wurden die GenChip Menschen Exon 1.0 ST (Affymetrix) analysiert, nach dem Protokoll detailliert in der Genechip Expression Analysis Technical Manual (P /N 900223) für das Array-Experiment und einem früheren Bericht [29]. Die Mikroarrays wurden mit dem GeneChip® Scanner 3000 mit GeneChip® Betriebssoftware (GCOS) gescannt. Alle Daten sind MIAME konform und die Rohdaten in GEO-Datenbank (ID: GSE27342) hinterlegt.

Microarray Datenanalyse

Die Genexpression Ergebnisse wurden basierend auf rohen Sondenintensitäten zusammengefasst die Robust Multi-Chip mit Durchschnittlich [30] und die APT-Paket (http://www.affymetrix.com/partnerSupplementaryprograms/programs/developer/tools/powertools.affx), folgende drei Hauptschritte einschließlich Hintergrundkorrektur, Quantil Normalisierung und log2-Transformation. Gene sehr geringe Expression wurden in beiden Krebs und Referenzproben mit entfernt werden; Insbesondere wurde ein Gen entfernt, wenn seine Maximum (Expr.cancer, Expr.normal)
(Intensität normalisierte Signal) unter 4 war.

Zwei verschiedene Strategien für die Beurteilung der Gen Bedeutung angewandt wurden, je auf was waren Bedingungen verglichen und ob gepaart oder ungepaarte Proben verwendet werden soll. Zum Vergleich von Krebserkrankungen gegen Kontrollprobengruppen wurden ungepaarten Tests durchgeführt, um zu untersuchen, ob zwei Gruppen von Ausdruck verschieden sind, während gepaart Tests, um die Konsistenz des Ausdrucks Änderungen über alle Paare zu untersuchen, angewendet wurden. Neben dem Wilcoxon-Test-Rank unterzeichnet, auch wir einen weiteren einfachen statistischen Test zur Erkennung Gene mit konsistenten differentielle Expression bei Krebs angewendet im Vergleich zu
Referenz Gewebe, wie folgt. Für jedes Gen, K exp
, die Anzahl der Paare von Krebs /Referenz Gewebe, deren Expression fold change (FC) ist größer als k
(zB k
= 2) untersucht; wenn der P-Wert für die beobachtete K exp
wurde weniger als 0,05 ist, wurde das Gen als differentiell in der Mehrzahl der Krebs und Referenzgewebepaare (siehe Hintergrundinformationen) ausgedrückt werden. Unsere berechneten P-Wert wurde auf mehrere Hypothesen Tests, um einen Verlust von Genen zu vermeiden, nicht angepasst, die in der nachfolgenden Klassifikationsschritt potentiell wirksam sein können.

Gene und Klassifikation

Für k -Gen Signaturen (k < = 4), führten wir eine umfassende Suche für alle k-Gen-Kombinationen unter den differentiell exprimierten Gene, aus dem vorherigen Schritt identifiziert, eine lineare SVM basierenden Klassifizierungsansatz verwenden, und die Gesamtgenauigkeit wurde ausgewertet 5-fach Kreuzvalidierung. Für k > 4, einen anderen Ansatz eine heuristische Suche unter Verwendung angewendet wurde, da die erschöpfende Suche zu zeitaufwendig ist für unser Problem praktisch zu sein. Die Details sind wie folgt.

Die ganze Ausdruck Datensatz zufällig wurde Trainings- und Testsätze aufgeteilt in, die jeweils die Hälfte der Proben. Dieser wurde 500 mal wiederholt, für die Klassifizierung 500 Sätze von Trainings /Testdaten zu erzeugen. Eine lineare SVM wurde zum Trainieren eines Klassifikators [31], [32] verwendet. Es konstruiert eine Hyperebene, die zwei verschiedene Klassen von Merkmalsvektoren mit einer maximalen Marge trennt. Diese Hyperebene wird durch Auffinden eines Vektors w und eine variable konstruiert b dass minimieren, die die folgenden Bedingungen erfüllt:

, für (Krebsproben) und (normale Proben). Hier wird ein Merkmalsvektor ist, ist der Gruppenindex, w ein Vektor normal auf die Hyperebene, der Abstand von der Hyperebene zum Ursprung und ist die euklidische Norm von w. Nach der Bestimmung von w und b-Werte kann ein gegebener Vektor x durch Verwendung klassifiziert werden; ein positiver oder negativer Wert zeigt an, daß der Vektor x in die positive oder negative Klasse gehört, respectively. Gene Signaturen jedes Trainingssatz wurden unter Verwendung der rekursiven Funktion Beseitigung Verfahren (RFE) ausgewählt, die ein Wrapper ist die Prädiktor Gene selektiert durch die Beseitigung nicht-Prädiktor Gene nach einem Gen-Ranking-Funktion aus dem Klassifizierungssystem erzeugt [33]. Die Rangkriterium wird in der Zielfunktion auf der Basis der Änderung bei der jedes Gen zu entfernen. Um die Effizienz der Ausbildung zu verbessern, diese Zielfunktion wird als Kostenfunktion dargestellt J
für die i
-te Funktion berechnet, indem die Ausbildung mit nur gesetzt. Wenn ein Gen entfernt oder ihr Gewicht w i auf Null reduziert wird, die Änderung der Kostenfunktion J (i) und Videos gegeben wird. Der Fall entspricht der Entfernung von der i -ten
Gens. Die Änderung der Kostenfunktion gibt den Beitrag des Gens in die Entscheidungsfunktion und dient als Indikator für die Gen-Ranking.

Die 500 Training /Test-Sets zufällig in 10 Probengruppen aufgeteilt wurden. Jede Probengruppe wurde dann verwendet, um eine Signatur abzuleiten, basierend auf Mehrheitsentscheidungen und Bewertung von Gen-Ranking die Konsistenz zwischen den 50 Trainings- und Testsätze. Die 10 verschiedenen Signaturen aus den 10 Gruppen abgeleitet wurden verglichen, um den Grad der Konsistenz zwischen den ausgewählten Genen zu bewerten. In jeder Gruppe Untergruppen von Genen wurden von RFE-SVM aus jedem Trainingssatz ausgewählt, und die Leistung auf den Untergruppen wurde von der zugehörigen Testsatz bewertet. Zur Ableitung wurde ein Gen-Ranking Kriterium konsistent für alle Iterationen, ein RFE-Ranking-Funktion bei jedem Iterationsschritt aus einem SVM-Klassifikator abgeleitet, die die beste durchschnittliche Klassifikationsgenauigkeit über den 50 Test-Sets gab.

Öffentliche Microarray-Daten von Magenkrebs

Zwei öffentliche Microarray-Datensätze wurden für vergleichende Studien aus der GEO-Datenbank heruntergeladen, die Kim
(GSE3438) und die Takeno
(GSE15081) Datensätze. Die erste [34] umfasst die Genexpression von 50 Magenkrebs-Patienten (aus Korea) in verschiedenen Stadien und Differenzierungsgrad, der verwendet wurde, um die Konsistenz unserer identifiziert Signaturen zu überprüfen. Die Takeno Daten [24] umfasst 141 primäre Magenkrebsgewebe nach kurativer Operation, mit Follow-up Peritonealdialyse Rezidiv Informationen. Diese Datensätze liefern den normierten log2 Verhältnis von Tumor- und Normal Ausdruck.

Hintergrundinformationen
Tabelle S1.
Statistik von 452 Genen, die in jeder der vier Klassen Gruppe unterschiedlich exprimiert werden, bestimmt anhand der folgenden Kriterien: Expressionsniveaus in der Krebstherapie und die entsprechende Show Kontrollgewebe mindestens 2-fache Veränderung, und die Cutoff für statistische Signifikanz aufweisen dieses Niveau der Expression Änderung ist P
-Wert < 0,05
doi:. 10.1371 /journal.pone.0017819.s001
(XLSX)
Tabelle S2.
99 Gene haben ihren Ausdruck perfekt ändert sich mit den Noten korrelieren WD-MD-PD-UD (| CC
| = 1, p
-Wert < 0,05).
doi: 10.1371 /journal.pone.0017819.s002
(XLSX)
Tabelle S3.
Liste der Gen-Namen des 198-Gen-Signatur, unter denen 39 Grad korreliert Gen. CC:. Korrelationskoeffizient
doi: 10.1371 /journal.pone.0017819.s003
(XLSX)
Tabelle S4.
Liste der 40 Unterschrift Gene, die speziell für die WD-Gruppe zu finden sind; 18, 20 und 255 Gene sind spezifisch für die MD, PD und UD-Gruppe, jeweils
doi:. 10.1371 /journal.pone.0017819.s004
(XLSX)
Tabelle S5.

Other Languages