žalúdok zdravie > žalúdočné Cancer > Ploche ONE: Gene-expression Signatures možno rozlíšiť Stupne rakovinou žalúdka a Stages

Ploche ONE: Gene-expression Signatures možno rozlíšiť Stupne rakovinou žalúdka a Stages


abstraktné

Microarray génovej expresie dát 54 spárované rakovinou žalúdka a priľahlých noncancerous žalúdočné tkaniva boli analyzované, s cieľom vytvoriť génových podpisov stupňa rakovina (dobre, moderately-, poorly- alebo un-diferencovaná) a stupňa (I, II, III a IV), ktoré boli stanovené podľa patológov. Naša štatistická analýza viedla k identifikácii niekoľkých génových kombinácií, ktorých expresia vzory dobre slúžiť ako podpisov rôznych tried a rôznych štádiách rakoviny žalúdka. Bolo zistené, že podpis 19-gen majú náročné silu medzi karcinómov žalúdka high a low-grade všeobecne, s celkovou presnosť klasifikácie na 79,6%. Rozšírená 198-Gen panel umožňuje stratifikácii rakoviny do štyroch stupňov a kontroly, čo vedie k celkovej dohode klasifikácii 74,2% medzi jednotlivými stupňami určí patológov a našej predikcie. Dva podpisy pre rakovinu predstavovať, skladajúci sa z 10 génov a 9 gény, respektíve poskytujú vysokú presnosť klasifikácie na 90,0% a 84,0%, pri počiatočných fázach ich existencie, rakovina v pokročilom štádiu a kontroly. Funkčné a cesta analýzy na tieto gény podpis odhaľujú značnú relevantnosť získaných podpisov do stupňov s rakovinou a progresie. Podľa našich najlepších vedomostí, čo predstavuje prvú štúdiu o identifikácii génov, ktorých expresia vzory môžu slúžiť ako markery pre stupňov a štádií rakovinových

Citácia :. Cui J, Li F, G Wang, Fang X, Puett JD, Xu Y (2011) Gene-expression Signatures možno rozlíšiť Stupne rakovinou žalúdka a fáz. PLoS ONE 6 (3): e17819. doi: 10,1371 /journal.pone.0017819

Editor: Amanda Toland, Ohio State University Medical Center, Spojené štáty |

prijatá: 24.novembra 2010; Prijaté: 09.02.2011; Uverejnené: 18. marca 2011

Copyright: © 2011 Cui et al. Toto je článok o otvorený prístup distribuovaný pod podmienkami Creative Commons Attribution licencie, ktorá umožňuje neobmedzené použitie, distribúciu a reprodukciu v nejakom médiu, za predpokladu, že pôvodný autor a zdroj sú pripísané

Financovanie :. Táto štúdia bol podporený v rámci Národnej vedeckú nadácií (DEB-0830024, DBI-0542119), National Institutes of Health (1R01GM075331), čo je "Distinguished Scholar" grantom z Gruzínska koalície proti rakovine, a seed fondu spolu z prezidentovho Venture fondu a úrad viceprezidenta pre výskum z University of Georgia. Platcovia mal žiadnu úlohu v dizajne štúdie, zber a analýzu dát, rozhodnutie publikovať, alebo prípravu rukopisu

Konkurenčné záujmy: .. Autori vyhlásili, že žiadne konkurenčné záujmy neexistujú

Úvod

rakovina triedenie je mierou malignity a agresivity rakovina je. Populárna triedenie systém používa štyri úrovne zhubného bujnenia (G1-G4), pretože odráža kombinovaný úroveň bunkovej abnormality vzhľad, odchýlky v rýchlosti rastu od normálnych buniek a na stupni invazívnosti a šírenie. Bolo zistené, že sa tieto patologické opatrenia, aby sa vo všeobecnom zhode s úrovňou diferenciácie buniek (American Spoločnej komisie rakoviny) [1]. Z tohto dôvodu {G1, G2, G3, G4} sú tiež označovaná ako dobre, moderately-, poorly- a un-diferencované, resp. Ako teraz, tam nebol univerzálny systém triedenia pre všetky rakoviny. Namiesto toho boli navrhnuté rôzne systémy triedenia rôznych druhov rakoviny. Napríklad, systém Gleason [2] je pravdepodobne najviac dobre známy pre triedenie bunky adenokarcinómu v karcinómu prostaty, keď je systém Bloom-Richardson [3] sa používa k rakovine prsníka, a systém Fuhrman [4] sa používa pre rakoviny obličiek
.

karcinóm žalúdka, druhou najčastejšou príčinou úmrtí na rakovinu súvisiace na celom svete, prevláda najmä v ázijských krajinách, vrátane Číny, Kórey a Japonska [5]. V Spojených štátoch to bez príznakov ochorenia mal ~ 21,500 nových prípadov v roku 2008 spolu s 10,800 smrťou [6]. Na rozdiel od iných druhov rakoviny, rakovina žalúdka ešte nemá všeobecne prijímanej schému triedenia. Triedenia bolo väčšinou vykonáva na základe skôr všeobecnými zásadami rakovinu triedenia od organizácií, ako je American Joint Commission rakoviny. Existuje niekoľko systémov pre klasifikáciu karcinómov žalúdka do histologických podtypov, vrátane tých, ktoré Lauren [7], Svetová zdravotnícka organizácia (WHO) [8] a Goseki, et al. [9], [10], ktoré definujú podtypov podľa štrukturálnych rysov rakoviny, na histopatologických vzhľade buniek a úroveň hlienu, v danom poradí. Avšak, to je veľmi sporné, pokiaľ ide o tom, či niektorý z týchto systémov je veľmi dôležité pre stupňu malignance a prežitie, tak ktorý nebol široko používané pre triedenie karcinómu žalúdka [11]. Chýbajúce z dobre zavedeného systému triedenia na rakovinu žalúdka zostáva ako hlavná prekážka, ktorá ohrozuje pokrok v tejto oblasti.

Predstavujeme výpočtovej štúdiu v tomto dokumente, s cieľom identifikovať sadu génov, ktorých expresia vzory môžu dobre rozlíšiť medzi karcinómov žalúdka rôznych tried, ako Oncotype DX, 21-génu panel pre identifikáciu rakoviny prsníka s nízkym rizikom [12]. Tieto gény, ktorých expresia vzory rozlíšiť žalúdočné rakoviny rôznych tried, poskytovať užitočné informácie k rozvoju génovej expresie na základe klasifikačný systém pre rakovinu žalúdka. Okrem toho sme tiež prezentovať naše poznatky o génovej expresie vzory, ktoré sú spoločné nádorov v rôznych vývojových štádiách, môžu slúžiť ako molekulárne podpisov pre vznik žalúdočného karcinómu staging.

Výsledky

A. Identifikácia génov expresnými zmenami koreláciu s rakovinou stupňa

17,800 ľudských génov boli profilované v tejto štúdii, za použitia Affymatrix Exon matice. Z karcinómov 54, 8 sú dobre diferencovaný (WD), 9 mierne diferencované (MD), 35 zle diferencovaný (PD) a 2 nediferencovanej (UD). Zistilo sa celkom 452 génov, ktoré majú byť rôzne vyjadrený, ako je stanovené na základe nasledujúcich kritérií: úrovne expresie v karcinómu a zodpovedajúce kontrolné tkanivá prehliadku aspoň 2-násobne zmeniť a štatistickú významnosť, P-hodnota
, mať túto úroveň zmeny expresie je menšia než 0,05 (pozri Materiál a metódy; názvy génov sú uvedené v tabuľke S1). Medzi 452 génov, 97 jedinečne v UD, 62 v PD, 8 v MD a 16 unikátne v pracovnom dokumente predstavujú základnú sadu
z rozdielne exprimovaných génov, ktoré sú použité konzistentným spôsobom pri použití rôznych klasifikačných stratégie pomocou paired- informácie o vzorke, alebo nie. Táto sada obsahuje gény, ktoré vykazujú najkonzistentnejšiu zmenu výraz (viac ako 2-krát) pri rakovine oproti
kontrolných tkanív, ktoré boli považované za odlišne exprimovaných génov s vysokou spoľahlivosťou, odvodených prostredníctvom niekoľkých štatistických testov. Naproti tomu celá sada 452 génov predstavuje rozšírenú sadu. Zistili sme, že existuje všeobecný trend, že sa počet odlišne exprimovaných génov sa zvyšuje ako rakovina žalúdka, vztiahnuté na normálne tkanivá, je zle diferencované, ako je znázornené na obrázku 1. Toto pozorovanie je v súlade s našou všeobecné vedomosti, že less- diferencované nádory majú tendenciu mať viac odlišne exprimovaných génov a sú viac agresívne; výnimka pre WD, ako je znázornené na obrázku 1, môže odrážať malej veľkosti WD a MD skupín.

potom kontroluje, či niektoré gény môžu mať ich výraz sa zmení v korelácii s akosťou s rakovinou. K tomu sme vypočítali korelačný Spearmanův koeficient (CC) medzi priemerným expresie každého génu naprieč všetkými vzorkami každej triedy a štyrmi triedami s rakovinou. Bolo zistené, že výraz sa zmení z 99 génov koreluje perfektne s akosťou WD-MD-PD-UD (| CC
| = 1, P
-hodnota & lt; 0,05) (pozri podrobnosti v tabuľke S2). Medzi tieto gény sú POF1B
MET
CEACAM6
ZNF367
GKN1
LIPF
, SLC5A5
MUC13
CLDN1
MMP7 a ATP4A
, ktoré sú známe ako rakovina súvisí. Obrázok 2 ukazuje štyri príklady s buď pozitívne alebo negatívne korelácie. Medzi nimi, MUC13
bola označená ako dobrý indikátor úrovne diferenciácie sliznicu gastrointestinálneho traktu [13]. Bolo zistené, zvýšená expresia MUC13 indukovať morfologické zmeny vrátane rozptyl buniek prostredníctvom interferencie s funkciou bunkových adhéznych molekúl, [14]; Tak, zvýšená expresia spolu s diferenciáciou môžu ukazovať zvýšenú adhéziu bunka-bunka

Zistili sme, že gény s ich expresných zmeny korelovala so stupňami s rakovinou sú vysoko obohatené medzi sekretovaných alebo membránových proteínov. (P-hodnoty menšie ako 0,05) , ktoré sa zúčastňujú rôznych signálnych dráh, ako sú ErbB, FAS, NOD-like receptora, PPAR a Wnt signalizácie, ako aj bunkových adhéznych molekúl (CAM) a tesných spojenie. To nie je prekvapujúce, pretože tieto cesty sú v podstate podieľa na raste buniek a bunkovej smrti, rovnako ako nádorových metastáz. Takéto zmeny v génovej expresie vzory týchto dráh, podieľajúce sa na prenose signálu a extracelulárnej komunikáciu, môžu poskytnúť indície o progresii rakoviny.

B. Identifikácia génov podpisov pre stupňa s rakovinou

sme skúmali 452 rozdielne exprimovanými gény, ktorých cieľom je identifikovať gény, ktorých expresia vzory môžu, s dobrou presnosťou a spoľahlivosťou, rozlíšiť žalúdočné rakoviny rôznych tried. Analýza klasifikácie (pozri metódy) bol prvýkrát vykonal medzi dvoma skupinami s nádorovým ochorením (vysoko diferencované a zle), a potom sa rozšíril do piatich skupín, a to štyri tried s rakovinou a kontroly. Nosný vektor stroj (SVM) založené bola použitá regresná funkcia eliminácie prístupu, použitie lineárneho jadro klasifikácie rakoviny (pozri metódy).

Na konci 19-gen bol identifikovaný skupina, ktoré sú schopné rozlíšiť medzi vysoko a zle diferencované karcinómy sa celkovú dohodu na 79,2%, vztiahnuté na výraze rozkladací zmeny v rakovine oproti
kontrolných tkanív. Podobne, 198-gen skupina môže rozlišovať medzi štyrmi rôznymi stupňami rakovinových a kontrolnej skupiny podľa ich génovej expresie, čo vedie k 74,2% celkovej presnosti klasifikácie. Obe génové sady boli vybrané na základe hlasovania väčšinou (aspoň 70% konzistencia) schému z výsledkov klasifikácie na 500 sád náhodne vzorky zo vzorky sád 54, spolu s ich významom poradí (pozri Metódy pre podrobnosti).

podpis 19-gén sa skladá z ADIPOQ, COL6A3, TNS1, SCN7A, DES VIL1, COL3A1, C2orf40, SMYD1, ACTG2, MEIS1, C7, GPR174, SHCBP1, DUSP1, DNAJB5, HIATL1, IL17RB a FAT. Bližší pohľad na funkčné anotáciu týchto génov sa zistilo, že ich proteínové výrobky sú zapojené do bunkového rastu a diferenciácie (IL17RB, SMYD1, SHCBP1), pohyblivosti buniek (ACTG2), angiogenézy a tkanivová remodelácia (ADIPOQ), karcinogénneho potenciálu (ECRG4), matice syntézu bielkovín (COL3A1, COL6A3), a iní, ako spriahnutého s G proteínom receptor 174 (GPR174), kefa hraničné cytoskeletu (VIL1), membrána útoku komplexu (C7), a kanál sodný (SCn7A).

17 out z 19 génov, plus ďalších 181 génov, tvorí 198-génovej expresie skupinu, ktorej vzor možno rozlíšiť štyri stupne rakovinové a kontrolu. Ich funkcie zahŕňajú delenie buniek, imunitnú odpoveď, prenos signálu a reguláciu transkripcie, okrem vyššie uvedených kategórií. Celkovo 39 z 99 stupeň-korelovaná gény sú súčasťou tohto 198-génu podpisu, vrátane CLDN1, MUC13, VIL1, HIATL1, CDCA7, HIST1H2BM a tuku (pozri úplný zoznam v tabuľke S3).

okrem tejto catch-all podpisu pre klasifikáciu päť-cesta, my tiež identifikovať a analyzovať stupňa špecifické génové signatúry pre každú platovú triedu rakoviny. Napríklad LAPTM4B je jeden taký reprezentatívny. Tento gén poskytuje vysoký stupeň presnosti klasifikácie pre Caner a kontrolných vzoriek v skupine WD s AUC (plocha pod krivkou) = 0,97 (obrázok 3). Za použitia 7,04 ako výraz cut-off, tento gén môže tiež odlíšiť rakoviny od kontrolných vzoriek v skupine WD s citlivosťou = 87,5% a špecifickosťou = 100%. Tento výsledok nie je prekvapivé, pretože je známe, že LAPTM4B je esenciálna pre bunkový rast a prežitie, a bolo zistené, jeho up-regulácia, ktoré majú byť v korelácii s úrovňou diferenciácie hepatocelulárneho karcinómu [15]. Celkom 40 tohto podpisu gény sa vyskytujú špeciálne pre skupinu WD; 18, 20 a 255 sú špecifické gény k skupine MD, PD a UD, v danom poradí (viď údaje v tabuľke S4).

Tiež sme identifikované jediný gén voliča pre jednotlivé triedy skupiny proti zvyšku vzoriek, vrátane kontroly, ako je zhrnuté v tabuľke 1. napríklad podpisy pre skupinu PD patrí up-regulované gény, MYO1B
pre WD; GKN2
pre MD; CTSA
PD; a gén down-regulované, RHOJ,
pre skupinu UD. Tieto jednogenové rozlišovače ukazujú významné AUC v rozmedzí od 0,76 do 0,99, zatiaľ čo celkovej klasifikácii presnosti získa 5-násobným rozsahom cross-validačnú z 70,0% na 97,0% u rôznych skupín. Následné hľadanie k
-Gene kombinácií (k = 2, 3, 4) pre každú skupinu rakoviny vyčerpávajúco prechádza všetkými kombináciami k
-Gene skupiny tiež identifikované.

C. Identifikácia génov podpisov pre patologické štádium

Použitie podobné analýzy tým z vyššie uvedeného, ​​sme identifikovali gén podpisy ranom štádiu (štádium I + II) a pokročilej rakoviny etapa (štádium III + IV). Tabuľka 2 poukazuje na najviac diskriminativních jediný gén markerov, s presnosťou klasifikácie v rozmedzí od 75,0% do 81,4%. Multi-génové signatúry boli kontrolované na rakovinu predstavovať. Napríklad bolo zistené, že dva podpisy byť obzvlášť účinné pri rakovine predstavovať, a síce 10-génovej skupiny (CPS1 + DEFA5 + DES + DMN + GFRA3 + MUC17 + OR9G1 + REEP3 + TMED6 + TTN) a 9-gen skupina A (DPT + EIF1AX + FAM26D + IFITM2 + LOC401498 + OR2AE1 + PRRG1 + REEP3 + RTKN2) , ktoré môže rozlíšiť na začiatku a pokročilých karcinómov žalúdka od zvyšku vzoriek (vrátane kontrolných vzoriek) sa dohody o 90,0% a 84,0% v uvedenom poradí. Celková presnosť klasifikácie na základe troch skupín, zavčasu, pokročilé a kontrolu, je 71,4%.

Funkčná analýza v nasledujúcich podpise génoch odhalila niečo zaujímavé. Napríklad medzi proteínových produktov v ranej fáze podpisu génov, GFRA3
MUC17
OR9G1
REEP3 a TMED6
sú membránové proteíny , väčšinou receptory, ktoré prenášajú extracelulárne signály. DEFA5
je mikrobicídna peptid veril byť zapojený do obrany hostiteľa, ktorý je vysoko vyjadrený v ileu [16]. CPS1
, DES a TTN
sa podieľa na mnohých metabolických procesov, svalové funkcie a M fázy mitotického bunkového cyklu, resp. Domnievame sa, že tieto signalizácie a imunitným systémom príbuzné gény môžu predstavovať predčasné abnormalitu tkanivových buniek počas onkogenézy všeobecne.

Neboli nájdené Niekoľko génov byť v oboch triedení rakoviny a stagingu podpisy, ako CPS1, DES, GFRA3, TMED6 a DPT, čo naznačuje určitý biologický význam medzi diferenciácie nádorových ochorení a progresii. Potom sme skúmali, či je expresia génu zo zastávok podpisy sú spojené s patologickým štádiom. Medzi nimi, tie, ktoré úzko súvisia s rôznymi patologickými fázou sú LANCL3
, MFAP2 a PPA1
(obrázok 4), ktoré ukazujú konzistentné pozitívne a negatívne regulácie, v tomto poradí, spolu s progresiou rakoviny.

D. Identifikácia diferenciálne exprimovaných génov, ktoré sú nezávislé na stupňov a fáz s rakovinou

Okrem diferenciálnej expresiu špecifickú pre určité podskupiny rakoviny žalúdka, sme skúmali, či niektoré gény rozdielne exprimované v karcinómu žalúdka všeobecne, bez ohľadu na to stupňov a etapy. 62 také gény boli nájdené s dôslednou diferenciálnej expresie aspoň 2krát zmeny v rakovine oproti
príslušné referenčné tkaniva. Zistili sme, že väčšinou ide o zapojenie do extracelulárnych procesov, ako je fokálna adhézia, vačky, pevné spojenie, interakcia receptora cytokínu cytokínov a interakcie ECM-receptora, aktivácia plazminogénu kaskády, ako aj signálnych dráh, vrátane Wnt signalizácie a integrinové signalizáciu, ktoré sú úzko súvisiace s rastom buniek a kontroly bunkovej proliferácie. Vyhľadávanie proti našej in-house databázy (http://bioinfosrv1.bmb.uga.edu/DMarker/), ktorý zahŕňa verejné dátové súbory microarray z GEO [17], Oncomine [18] a SMD [19], ktoré pokrývajú viac ako 53 ľudských ochorení, vrátane rakovina, sme zistili, že rozdiel expresné vzory 15 génov sú vysoko špecifické pre karcinóm žalúdka, ako je napríklad GKN2, CLDN7, THY1, GIF a PGA4, zatiaľ čo väčšina ostatných sú všeobecne viac typov rakoviny. Napríklad, tie najvšeobecnejšie zahŕňať niekoľko členov rodiny kolagénu génu (COL1A2, COL3A1 a COL1A1) sa karcinoembryonální antigén súvisiaci s adhéznou molekula (CEACAM6), matrix metaloproteinázy (MMP1, MMP7 a MMP12), topoizomerázy (Top2) a vylučovaný fosfoproteínov (SPP1).

iba tri, CLDN7
CLDN1 a DPT
z týchto génov sú výrazne diferencované všetkých stupňov alebo fáz rakoviny žalúdka. Môžeme vidieť z obrázku 5A a 5B, že obaja CLDN7 a CLDN1
sú vysoko vyjadrený v rakoviny oproti
kontrolných vzoriek naprieč všetkými stupňov a fáz, s miernym zvýšením včasného karcinómu tkanivách, zatiaľ čo < em> DPT
bola down-regulované vo všetkých týchto skupín. Dôsledné výraz vzor naprieč všetkými podskupinami s nádorovým ochorením na môže naznačovať, že tieto gény sa zúčastňuje mnohých dôležitých biologických dráh podieľajúcich sa na tvorbe rakoviny a progresii. Ako je dobre známe, dve Claudin proteíny, Claudin-1 a Claudin-7, sú integrálne membránové proteíny, nevyhnutné pre tvorbu tesných spojenie, udržiavať bunky do bunky, adhéziu a regulačné paracelulární a transcelulární transport rozpustených látok v celej ľudskej epitelu a endotelu, ktoré sú rozdielne exprimované v rôznych druhov rakoviny, ako je cervikálny neoplázie [20], renálny karcinóm [21] a črevného typu rakoviny žalúdka [22]. Dermatopontin ( DPT
) je extracelulárnej matrix proteín slúžiaci ako komunikačného spojenia medzi povrchom dermálnej fibroblasty bunky a extracelulárnej matrix. Jeho znížená expresia bola tiež nájdená v oboch maternicových leiomyómov a keloidy [23]. ROC je znázornené na obrázku 5C ukazuje, že tieto gény by mohli byť použité ako markery pre efektívne žalúdka diagnostiku rakoviny všeobecne.

E. Overenie identifikovaných podpisov na verejných dátových sád

expresné vzory našich identifikovaných podpisových gény boli kontrolované proti dvom verejných dátových sád, a síce Kim stroje a Taken
dátové súbory (pozri materiály a metódy), na určenie všeobecnosti takýchto podpisov génov. Ako je znázornené na obrázku 6, distribúcia expresných rozdielov medzi našimi dátami a Kim
sada dát je výrazne ekvivalenčná, čo naznačuje, že všeobecná použiteľnosť našich identifikovaných markerov. Z celkových 19 až 12 prekrývajúcich sa génov z vyššie identifikovaných tried koreláciu a zoznam génu javiskové koreláciu, 10 a 5 ukazujú podobných expresných vzoroch naprieč rakoviny tried G1-2 /G3-4 a fáz I-IV v Kim
dát, respektíve, čo odráža vysokú konzistenciu v expresných vzoroch týchto génov medzi rôznymi sadami vzoriek.

Celkovo možno povedať, náš 19-gén podpis pre stupňa s rakovinou viedla dobre na Kim
dáta a získal 78,0% presnosť klasifikácie na 5-násobným overenie krížové pokiaľ ide o rozlišovanie zle z vysoko diferencovaných nádorov. Podobne, podpisy dvojstupňové (10-gen a 9-gen skupiny) získať príslušné presnosti 84,0% a 76,0% na Kim
dátovom súbore. Podpis 198-gen bol nekontroluje, pretože Kim
dátový súbor obsahuje len rozkladacie zmena namiesto nespracovaných expresných dát.

Zaujímavé je, že sme zistili, že existuje mierna korelácia medzi génovej expresie nášho identifikovanej podpis skupiny a recidíva rakoviny na základe peritoneálnej relapsu informácií taken je údajov [24]. Konkrétne, štyri podpisy, 19-, 198-, 10- a 9-génovej skupiny, môže predvídať peritoneálnej relapsu s celkovou presnosťou 66,0%, 87,2%, 73,0% a 55,3% v uvedenom poradí, tým, že rozlišuje medzi relapse- slobodné a peritoneálnej-relapsu pacientov v taken štúdii [24].

Diskusia

Microarray génovej expresie analýzy na rakovinu žalúdka už skôr identifikované génovej expresie vzory pre predikciu prognózy [25], [26] a všeobecne diagnóza rakoviny [27], [28] (vrátane preskúmaná v tabuľke S6), ale nič žalúdku subtypizace rakoviny alebo triedenie. Tu sme predložila analýzu o 54 pároch rakoviny a priľahlých referenčných tkanív z rovnakého počtu pacientov s karcinómom žalúdka, ktorý bol identifikovaný molekulárnych podpisov stupňov a fáz s nádorovým ochorením.

Je známe, že rôzne klasifikácie a selekčný gén analýz môže viesť k rôznym podpisy génov, ktoré predstavujú závažný problém, o stabilite a užitočnosti vybraných podpisov génu. Ak chcete tento problém riešiť, použili sme vyčerpávajúce pátranie po k- génových podpisov (K & lt; = 4) spojený s robustným výberu funkcií postupom s väčšinového hlasovania pre K ^ 4, ktorá zaisťuje stabilitu identifikovaných podpisových génov. Na druhej strane, vzhľadom na komplexnosť rakoviny génovej expresie údajov, všeobecné presvedčenie je, že rôzne klasifikačné postupy môžu viesť k rôznym podpisy, ale rovnako dôležité, pretože môžu zodpovedať rôznym dráh spojených s rôznymi aspektmi rakoviny , Okrem týchto technických odchýlok, obmedzená veľkosť vzorky a heterogenita existujúcu medzi rakovinou podskupiny sú uvedené ako ďalších významných faktorov ovplyvňujúcich vybraných markerov.

Na záver, sme v tomto dokumente preukázané, že sa môžu použiť génovej expresie vzory rovnako účinný podpisy pre žalúdočné triedenie rakoviny a staging, rovnako ako prognostický predikcie. Existujú dva typy podpisov bolo navrhnuté, aby slúžil rôzne diagnostické účely, z ktorých každý ukazuje určitý vzťah k rakovine malignance a progresiu rakoviny. Takéto pokusy s použitím molekulárno čisté-and fáze podpisy ktoré by mali výrazne prispieť k rozvoju personalizované medicíny a môže viesť k novým markerov v sére.

materiáloch a metódach

Tkanivové vzorky
< p> Vzorky boli počas počiatočného chirurgického zákroku prevzaté z primárnych zhubných karcinómov žalúdka z neliečených pacientov v troch pridružených nemocníc Jilin University College of Medicine a Provinčné nemocnice rakoviny Jilin, Changchun, Čína. U každej vzorky tkaniva rakoviny, zodpovedajúce referenčné vzorka tkaniva boli získané od priľahlej nenádorové regiónu, ktorý chirurg resekované, aby bolo zaistené pozitívne okraje. Všetky vzorky boli snap-zmrazený v kvapalnom dusíku počas 10 minút po vyrezanie a skladované pri -196C až do extrakcie RNA. Pre izoláciu RNA bolo použité 100 um rezy každej vzorky.

Všetky lekárske záznamy a profily s rakovinou boli skúmané pomocou chirurgického patológa a histologické diagnózy a TNM klasifikácia bola vykonaná v súlade s Worldwide zdravotníckej organizácie (WHO) kritérií a systém klasifikácie Medzinárodnej únie proti rakovine. Porovnávacie vzorky boli podrobené histologické analýze starostlivé zaručiť úplnú absenciu rakovinových buniek. Písomný informovaný súhlas bol získaný od všetkých pacientov, ktorá bola schválená Institutional Review Board na University of Georgia, Athens v štáte Georgia, USA a čínske IRB dohliadať na ľudské bytosti, v Ťi-lin University College of Medicine a nemocnice Jilin zemskej rakoviny, Changchun , Čína.

Detailné informácie pacienta, ako je vek, pohlavie, histologický typ, diferenciálnej stupeň, patologické fázu a história používanie alkoholu /fajčenie je uvedené v tabuľke S5.

Microarray experimentov

vzorky RNA boli analyzované pomocou GeneChip ľudského exónu 1,0 ST (Affymetrix), podľa protokolu podrobne popísaný v GeneChip Expression Analysis Montážny (P /N 900223) pre pole experimentu a skoršie správe [29]. Tieto čipy boli skenované pomocou skenera GeneChip® 3000 s GeneChip® Operating Software (GCOS). Všetky dáta sú Miami vyhovujúce a surové dáta bola uložená v databáze GEO (ID: GSE27342).

Microarray Analýza dát

génovej expresie výsledky boli zhrnuté na základe neupravených intenzít sond pomocou robustný multičipových priemerný [30] a APT balíček (http://www.affymetrix.com/partnerSupplementaryprograms/programs/developer/tools/powertools.affx), po troch hlavných krokoch vrátane korekciou pozadia, kvantilu normalizácie a log2-transformácie. Gény, ktoré majú veľmi nízku expresiu v oboch rakovinou a referenčné vzorky boli odstránené; konkrétne gén bol odstránený, ak jeho maximum (Expr.cancer, Expr.normal)
bol nižší ako 4 (normalizovaná intenzita signálu).

Dve rôzne stratégie boli použité pre hodnotenie významu génu, v závislosti na tom, čo boli porovnané podmienky, a to, či spárované či nespárované vzorky by mali byť použité. Pre porovnanie rakoviny proti vzorky skupín kontrolných, nepárové testy boli vykonávané za účelom skúmať, či dve skupiny vyjadrenia sú rôzne, pričom párové testy boli použité skúmať súlad expresných zmien naprieč všetkými pary. Okrem Wilcoxonův párový test, tiež aplikované ďalšie jednoduchý štatistický test pre detekciu génov s konzistentným rozdielna expresia v karcinómu proti Referencie tkaniva, a to nasledovne. Pri každom génu, K exp
počet párov rakovina /referenčných tkanív, ktorých expresia fold-change (FC) je väčší ako k
(napríklad k
= 2) bola skúmaná; V prípade, že P-hodnota pre pozorovanú k exp
bola nižšia ako 0,05, gén bol považovaný za rozdielne exprimované vo väčšine párov rakoviny a referenčné tkanív (pozri podkladové informácie). Naše vypočítaná P-hodnota nebola upravená na testovanie niekoľko hypotéz, aby sa zabránilo úniku génov, ktoré môžu byť potenciálne účinné pri následnom triedení kroku.

selekčný gén a klasifikácia

K -Gene podpisy (k- = 4), sme vykonali vyčerpávajúci hľadanie všetkých kombinácií k-gen medzi odlišne exprimovaných génov, identifikovaných z predchádzajúceho kroku, za použitia lineárneho SVM na báze klasifikácie prístup, a celková presnosť bola hodnotená za použitia 5-krát cross-validation. Pre k ^ 4, odlišný prístup pomocou heuristickej prehľadávanie bola použitá, pretože vyčerpávajúci vyhľadávanie je príliš časovo náročné, aby boli praktické pre náš problém. Podrobnosti sú nasledujúce.

Celý súbor Výraz dáta boli náhodne rozdelená do trénovací a testovacie súpravy, z ktorých každá obsahuje polovica vzoriek. To sa opakovalo na 500 krát generovať 500 sád školenie /testovacích dát pre klasifikáciu. Lineárne SVM bol použitý pre výcvik klasifikátor [31] [32]. To buduje hyper-rovinu, ktorá oddeľuje dve rôzne triedy príznakových vektorov s maximálnu medzu. Tento hyper-rovina je konštruovaný tým, že nájde vektora W a premennú b, ktorá minimalizuje, ktorý spĺňa tieto podmienky:

, pre (vzorky s rakovinou) a (normálny vzoriek). Tu, je funkcia vektora, je index skupiny, w je vektor kolmý k hyper-rovine, je vzdialenosť od roviny hyper-na pôvod a je Euklidovská norma w. Po stanovení w a b hodnotách, daný vektor x môžu byť klasifikované pomocou; kladná alebo záporná hodnota znamená, že vektor x patrí do triedy pozitívne alebo negatívne, resp. Génové podpisy každej trénovacej množiny boli vybrané s použitím rekurzívne funkcie odstránenie postup (RFE), čo je obal, ktorý vyberie předpokladové gény tým, že eliminuje non-předpokladové génov podľa funkcie génu postavených generovaného z klasifikačného systému [33]. Poradie kritérium je založené na zmene objektívnej funkcie po odstránení každého génu. Pre zlepšenie účinnosti odbornej prípravy, tento cieľ funkcia je reprezentovaný ako nákladové funkcie J
pre aj
tý funkciu, vypočítaný pomocou školení iba sadu. Ak je gén odstránený alebo jeho váhy w aj je znížená na nulu, je zmena v nákladovej funkcie J (i)
je daná. Prípad zodpovedá odstráneniu aj
teho gen. Zmena v nákladovej funkcie udáva podiel génu na funkciu rozhodovaní a slúži ako indikátor génu poradí.

500 školenie /testovacie súpravy boli náhodne rozdelené do 10 skupín vzoriek. Každá skupina vzorka bola potom použitý na odvodenie podpis, založený na väčšinovom hlasovaní a vyhodnotenie konzistencie génu postavených cez 50 tréningových a testovacích súprav. Na 10 rôznych podpisy odvodené z 10 skupín boli porovnané na posúdenie úrovne súdržnosti medzi vybraných génov. V každej skupine, podmnožiny génov boli vybrané RFE-SVM z každej trénovacej množiny, a výkon na podskupín bola hodnotená od priradeného testovacie sady. Pre odvodenie gén kritérium poradí konzistentné pre všetky počtu iterácií je RFE poradie funkciu na každom kroku iterácie bol odvodený od SVM klasifikátor, ktorý dal najlepšie priemernú presnosť klasifikácie počas skúšobných sád 50.

Údaje Verejné microarray rakoviny žalúdka

dve verejné dátové súbory microarray boli stiahnuté z databázy GEO pre porovnávacie štúdie, Kim
(GSE3438) a taken
(GSE15081) dátovej sady. Prvý z nich [34] zahŕňa génovej expresie 50 pacientov s rakovinou žalúdka (z Kórey) v rôznych fázach a úrovne diferenciácie, ktorý sa používa ku kontrole konzistencie našich zistených podpisov. Údaje taken [24] zahŕňa 141 primárna rakovina žalúdka tkanív po liečebnom zákroku, s nadväzujúcim peritoneálnej relapsu informácií. Tieto súbory dát poskytne normalizovaný pomer log2 nádoru a normálne prejavu.

Podporné informácie
tabuľka S1.
štatistiky 452 génov, ktoré sú rôzne vyjadrené v akejkoľvek skupiny štyri stupne, určí pomocou nasledujúcich kritérií: úrovne expresie v karcinómu a zodpovedajúce kontrolné tkanivá prehliadku aspoň 2-násobne zmeniť, a cut-off pre štatistickej významnosti majúce táto úroveň zmeny expresie je P
-hodnota menšia ako 0,05
doi :. 10,1371 /journal.pone.0017819.s001
(XLSX)
Tabuľka S2.
99 gény majú ich expresie sa mení perfektne korelovať s akosťou WD-MD-PD-UD (| CC
| = 1, p
-hodnota & lt; 0,05).
doi: 10,1371 /journal.pone.0017819.s002
(XLSX)
Tabuľka S3.
Zoznam mien génových podpisu na 198-génu, z ktorých 39 stupeň koreláciu gen. CC :. Korelačný koeficient
doi: 10,1371 /journal.pone.0017819.s003
(XLSX)
Tabuľka S4.
Zoznam 40 podpisových génov, ktoré sa nachádzajú špeciálne pre skupinu WD; 18, 20 a 255 sú špecifické gény k skupine MD, PD a UD, resp
doi :. 10,1371 /journal.pone.0017819.s004
(XLSX)
Tabuľka S5.

Other Languages