Stomach Health > elodec Zdravje >  > Gastric Cancer > želodčni rak

Plos ONE: Gene-Expression Podpisi lahko razlikujemo Rak želodca razredov in Stages

Povzetek

mikromrež podatke gen izraz 54 seznanjeno raka želodca in sosednjih noncancerous želodca tkiva smo analizirali z namenom ugotoviti genskih podpisov rak stopnje (dobro, moderately-, poorly- ali un-diferenciran) in stopnje (I, II, III in IV), ki so bili določeni s patologi. Naša statistična analiza je privedla do identifikacije več genskih kombinacij, katerih izraz vzorci služijo tudi podpisi različnih vrst in različnih stopnjah raka želodca. 19-gen podpis je bilo ugotovljeno, da imajo zahtevnim moči med visoko in nizko razreda želodčnega raka na splošno, z natančnostjo uvrstitvi na 79,6%. Razširjeni 198-gen plošča omogoča stratifikacijo raka v štiri razrede in nadzora, kar je povzročilo splošnega dogovora o tajnosti 74,2% med vsak razred, ki ga patologi in naše napovedi določi. Dve podpisov za raka uprizoritev, ki so sestavljeni iz 10 genov in 9 genov, oziroma, zagotavljajo visoko klasifikacijske natančnosti pri 90,0% in 84,0%, med za zgodnje, napredovalim rakom in nadzora. Funkcionalna in pot analize o teh podpisov geni razkrivajo precejšen pomen pridobljenih podpisov za rakom razredih in napredovanju. Kolikor nam je znano, to predstavlja prvo študijo o identifikaciji genov, katerih izražanje vzorce lahko služijo kot markerji za rakom razredih in stopnjah

Navedba. Cui J, Li F, Wang G, Fang X, Puett JD, Xu Y (2011) Gene-Expression Podpisi lahko razlikujemo Rak želodca razredov in stopenj. PLoS ONE 6 (3): e17819. doi: 10,1371 /journal.pone.0017819

Urednik: Amanda Toland, Ohio State University Medical Center, Združene države Amerike

Prejeto: 24. november 2010; Sprejeto: 9. februarja 2011; Objavljeno: 18. marec 2011

Copyright: © 2011 Cui et al. To je odprtega dostopa članek razširja pod pogoji Creative Commons Attribution License, ki omogoča neomejeno uporabo, distribucijo in razmnoževanje v katerem koli mediju, pod pogojem, da prvotni avtor in vir knjižijo

Financiranje:. Ta študija je bil podprt v okviru National Science Foundation (DEB-0830024, RDT-0542119), National Institutes of Health (1R01GM075331), ki je "Spoštovani Učenjak" donacije iz Gruzije Cancer Coalition in sklada semena skupno iz tveganega sklada za predsednika in Urad podpredsednik za raziskave Univerze v Gruziji. Med financerji imel nobene vloge pri oblikovanju študije, zbiranje in analizo podatkov, sklep, da se objavi, ali pripravi rokopisa

nasprotujočimi si interesi.. Avtorji so izjavili, da ne obstajajo konkurenčni interesi

Uvod

Rak ocenjevanje je merilo maligne bolezni in agresivnosti raka je. Priljubljen razvrščanje sistem uporablja štiri stopnje malignosti (G1-G4), kar kaže, da skupna raven celic videz anomalij, odklon v stopnji rasti iz normalnih celic in stopnjo invazivnosti in razširjanja. je bilo ugotovljeno, da je v splošnem soglasju s stopnjo celične diferenciacije (ameriške skupne komisije raka) Ti patološki ukrepi [1]. Zato {G1, G2, G3, G4} se imenuje tudi dobro, moderately-, poorly- in un-razlikujejo, oz. Do sedaj ni bilo univerzalni sistem ocenjevanja za vse vrste raka. Namesto tega so bili predlagani različni sistemi za razvrščanje, za različne vrste raka. Na primer sistem Gleason [2] je verjetno najbolj znan za razvrščanje adenokarcinom celice raka na prostati, medtem ko je sistem Bloom-Richardson [3], se uporablja za raka dojke, in sistem Fuhrman [4], se uporablja za raka ledvic .

rak želodca, drugi najpogostejši vzrok za smrt, povezane z rakom po celem svetu, je še posebej razširjen v azijskih državah, vključno s Kitajsko, Korejo in Japonsko [5]. V ZDA, je ta brez simptomov bolezni ~21,500 novih zadev v letu 2008 skupaj s 10.800 smrtnih žrtev [6]. Za razliko od drugih vrst raka, raka želodca še nima splošno sprejete sistem razvrščanja. Razvrščanje je večinoma narejeno na osnovi precej splošnih smernicah raka razvrščanje organizacij, kot so skupne komisije ameriškega raka. Obstaja nekaj sistemov za razvrščanje želodčni rak v histoloških podtipov, vključno s tistimi, ki jih je Lauren [7], Svetovna zdravstvena organizacija (WHO) [8] in Goseki, et al. [9], [10], ki določajo podtipe glede na strukturne značilnosti raka, na histopatoloških nastopov celic, in raven sluz oz. Vendar pa je v veliki meri sporna o tem, ali je katera koli od teh sistemov zelo pomembni za stopnjo malignance in preživetja, tako da niso pogosto uporablja za razvrščanje raka želodca, [11]. Manjkajoča od uveljavljenega sistema ocenjevanja za rakom želodca, še vedno velika ovira, ki ovira napredek na tem področju.

Predstavljamo računski študijo dokumentu, katerega namen je določiti nabor genov, katerih izražanje vzorce se lahko tudi razlikuje med želodčnih raka različnih razredov, kot Oncotype DX, ki je 21-gena komisije za ugotavljanje raka na dojki z majhnim tveganjem [12]. Ti geni, katerih izraz vzorci razlikuje želodčni rak različnih razredov, zagotavljajo koristne informacije v smeri razvoja, ki temelji izraz ocenjevalni sistem gen za raka želodca. Poleg tega smo tudi predstavili naše ugotovitve o izražanja genov vzorce, ki so skupna raka na različnih razvojnih stopnjah, lahko služi kot molekularne podpise za želodčne uprizoritve raka.

Rezultati

A. Identifikacija genov z izražanja sprememb soodvisnih z rakom stopnje

17.800 človeških genov so profilirani v tej študiji s pomočjo Affymatrix eksonu Polja. Iz vzorcev rakavih 54, 8 so dobro diferencirani (WD), 9 zmerno razlikuje (MD), 35 slabo diferencirane (PD) in 2 nediferencirani (UD). Ugotovljeno je bilo skupno 452 genov, ki jih je treba različno izražena, kot je določeno na podlagi naslednjih meril: raven izražanja v raka in ustrezne nadzorne tkiva kažejo vsaj 2-krat sprememb in statistične pomembnosti, P
-vrednost , za je s to stopnjo sprememb izražanja < 0,05 (glej Material in metode, genski imena so navedena v tabeli S1). Med 452 genov, 97 edinstveno v UD, 62 v PD, 8 v MD in 16 edinstveno v WD predstavljajo jedro nastavljeno
z različno izraženih genov, ki se dosledno opredeljene z uporabo različnih strategij za razvrščanje pomočjo paired- vzorec informacije ali ne. Ta komplet vsebuje gene, ki kažejo najbolj dosledno spremembo izražanja (več kot 2-krat) v raka v primerjavi
za nadzor tkiv, ki so se šteje, da so različno izražene gene z visoko zanesljivostjo, pridobljenih skozi več statističnih testov. V nasprotju s tem celoten sklop 452 genov predstavljajo razširjeno videz. Ugotovili smo, da obstaja splošna težnja, da je število različno izraženih genov povečuje kot rak želodca, glede na normalno tkivo bolj slabo diferencirana, kot je prikazano na sliki 1. To opažanje je v skladu z našim splošnim znanjem da omejenimi diferencirane raka imajo ponavadi več različno izraženih genov in so bolj agresivni; izjema za WD, kot je prikazano na sliki 1, lahko odraža majhne velikosti v WD in MD skupine.

Nato smo preverili, če imajo lahko nekateri geni njihovi izraženi spremembe v korelaciji z ocenami raka. Da bi to naredili, smo izračunali koeficient korelacije Spearman (CC) med povprečnim izražanja vsakega gena v vseh vzorcih vsakega razreda in štiri raka razredov. Ugotovljeno je bilo, da se izraz spremembe 99 genov ujema povsem z ocenami WD-MD-PD-UD (| CC
| = 1, P
-vrednost < 0,05) (glej podrobnosti v tabeli S2). Med ti geni POF1B
, MET
, CEACAM6
, ZNF367
, GKN1
, LIPF
, SLC5A5
, MUC13
, CLDN1
, MMP7 in ATP4A
, ki so vse znano, da je rak povezan. Slika 2 prikazuje štiri primere z bodisi pozitivne ali negativne korelacije. Med njimi, MUC13
je bila prijavljena kot dober pokazatelj za stopnjo diferenciacije sluznico prebavil [13]. Povečana MUC13 izraz je bilo ugotovljeno, da povzroči morfološke spremembe, vključno razpršitev celice skozi motenj s funkcijo celičnih adhezijskih molekul [14]; Tako lahko povečana ekspresija skupaj z diferenciacijo kažejo izboljšano adhezijo celic celične

Ugotovili smo, da so geni s svojimi izražanja spremembami soodvisnih z rakom razredov visoko obogateni med izloča ali membranskih proteinov. (P-vrednost < 0,05) , ki sodelujejo v več signalnih mehanizmov, kot so ErbB, FAS, NOD-u podobnega receptorja, PPAR in NT signalizacijo, kot tudi celičnih adhezijskih molekul (v živo) in ozkih križiščih. To ni presenetljivo, saj so te poti bistvu vključeni v celično rast in celične smrti, kot tudi raka metastaz. Takšne spremembe v gen vzorcev izražanja teh poti, vpletene v prenos signalov in zunajcelične komunikacije, lahko zagotovi namige o napredovanju raka.

B. Identifikacija genskih podpisov za rakom razrede

Pregledali smo 452 različno izražene gene, katerih namen je ugotoviti gene, katerih izražanje vzorci lahko z dobro natančnost in zanesljivost, razlikovati želodčni rak različnih razredov. Analiza je razvrstitev (glej metode) je bila prvič izvedena med dvema skupinama raka (izrazito in slabo diferenciranih), in nato razširi na pet skupin, in sicer štiri raka razredov in nadzor. Metoda podpornih vektorjev (SVM) bodo temeljile je bil uporabljen pristop odprava funkcija regresivno, uporablja linearno jedro za razvrstitev raka (glej metode).

Na koncu je bil ugotovljen 19-gen skupina, ki se lahko razlikujejo med visoko in slabo diferencirane raka s splošnim dogovorom na 79,2%, glede na izraz kratna sprememba raka v primerjavi
kontrolnih tkiv. Podobno lahko 198-gen skupina razlikovati med štirimi različnimi stopnjami rakom in kontrolno skupino glede na njihovo izražanje genov, ki so podlaga za 74,2% natančnostjo tajnosti. Oba gena nizi so bili izbrani na podlagi glasovanja z večino (vsaj 70% doslednost) Shema iz rezultatov razvrščanja na 500 nizov naključno vzorčenih od 54 vzorčnih sklopov, skupaj z njihovim pomenom razvrstitev (glej metode za podrobnosti).

19-gen podpis je sestavljen iz ADIPOQ, Col6A3, TNS1, SCN7A, DES, VIL1, COL3A1, C2orf40, SMYD1, ACTG2, MEIS1, C7, GPR174, SHCBP1, DUSP1, DNAJB5, HIATL1, IL17RB in FAT. Blizu pogled na funkcionalne označevanje teh genov je pokazala, da so njihovi beljakovinski izdelki vključeni v celično rast in diferenciacijo (IL17RB, SMYD1, SHCBP1), celične gibljivosti (ACTG2), angiogenezo in tkiva preoblikovanje (ADIPOQ), karcinogeneza (ECRG4), matriko sinteze beljakovin (COL3A1, Col6A3), in drugi, kot G-protein pripojenega receptorja 174 (GPR174), krtačo mejnem skeleta (VIL1), membrana napad kompleks (C7), in natrijevega kanala (SCn7A).

17 od 19 genov, plus dodatnih 181 genov, tvorijo 198-gen skupino, katere izraz vzorec lahko razlikuje štiri raka ocene in nadzora. Njihove funkcije pokrivajo celične delitve, imunski odziv, signalno transdukcijo in regulacijo transkripcije, poleg zgoraj navedenih skupin. Na splošno je 39 od 99-razreda povezana genov so del tega 198-genskega podpisa, vključno CLDN1, MUC13, VIL1, HIATL1, CDCA7, HIST1H2BM in FAT (glej celoten seznam v tabeli S3).

Poleg tega bo zajela vso podpisom za pet-način razvrščanja, smo tudi ugotoviti in analizirati razred specifičnih genskih podpisov za vsako vrsto raka. Na primer, LAPTM4B je en tak predstavnik. Ta gen daje visoko natančnost klasifikacije CANER in kontrolnih vzorcev v skupini WD z AUC (površina pod krivuljo) = 0,97 (slika 3). Uporabi 7,04 kot izraz limitom, lahko ta gen dobro loči raka iz kontrolnih vzorcev v skupini WD z občutljivostjo = 87,5% in specifičnostjo = 100%. Ta rezultat ni presenetljivo, saj je znano, da je LAPTM4B bistvenega pomena za celično rast in preživetje, ter je bila najdena njena navzgor regulacija biti povezana s stopnjo diferenciacije hepatocelularnega karcinoma [15]. Skupaj je 40 takih podpis geni našel posebej za skupino WD; 18, 20 in 255 geni so značilni za skupino MD, PD in UD, v tem zaporedju (glej podrobnosti v tabeli S4).

smo ugotovili tudi sam gen discriminators za vsak razred skupino proti ostalim vzorcev, vključno z nadzorom, kot je povzeto v tabeli 1. za primer, podpisi za skupino PD vključujejo up-urejena gene, MYO1B
za WD; GKN2
za MD; CTSA
za PD; in gen-down urejeno, RHOJ
za skupino UD. Te enim gena discriminators kažejo znatne AUC, ki segajo od 0,76 do 0,99, medtem ko je celotna klasifikacijske točnosti pridobljen s 5-kratno območju prečnega validacije od 70,0% do 97,0% za različne skupine. Naknadna iskanje k
gen kombinacije (k = 2, 3, 4) za vsako skupino raka, ki ga izčrpno skozi vse kombinacije k
gen skupine prav tako opredeljena.

C. Identifikacija genskih podpisov za patološko fazi

Uporaba podobne analize za tiste zgoraj, smo identificirali gen podpisov v zgodnji fazi (faza I + II) in faza raka (stadij III + IV). Tabela 2 kaže najbolj diskriminatorno posamezne genskih označevalcev, s točnostjo razvrščanjem v razponu od 75,0% na 81,4%. Multi-gena podpisi so preverili tudi raka uprizoritve. Na primer, sta bili podpisi ugotovljeno, da je še posebej učinkovit pri uprizoritvi raka, in sicer 10-gena skupine (CPS1 + DEFA5 + DES + DMN + GFRA3 + MUC17 + OR9G1 + REEP3 + TMED6 + TTN) in 9-gen skupina (DPT + EIF1AX + FAM26D + IFITM2 + LOC401498 + OR2AE1 + PRRG1 + REEP3 + RTKN2) , ki se lahko razlikuje zgodaj in napredne želodca raka od ostalega vzorcev (vključno kontrolnih vzorcev) s sporazumi 90,0% in 84,0%, oz. Skupna natančnost razvrstitev na tri skupine, zgodaj, napredne in nadzor, je 71,4%.

A funkcionalna analiza teh virusnih genov je pokazala, kaj zanimivega. Na primer, med beljakovinskih proizvodov na začetku poklicne poti virusnih genov, GFRA3
, MUC17
, OR9G1
, REEP3 in TMED6
so membranski proteini , predvsem receptorji, ki transducira zunajceličnih signalov. DEFA5
je Mikrobicidni peptid verjel, da se vključijo v gostiteljski obrambe, ki je zelo izražena v ileum [16]. CPS1
, DES in TTN
so vključeni v različnih presnovnih procesih, delovanju mišic in fazo M cikla mitotićne celic, oz. Predvidevamo, da lahko te signaling- in imunsko povezane geni predstavljajo zgodnje anomalij tkivnih celic v onkogenezo na splošno.

Nekaj ​​geni bilo ugotovljeno, da tako razvrščanje raka in uprizarjanju podpisov, kot so CPS1, DES, GFRA3, TMED6 in DPT, ki navaja nekatere biološko ustreznost med diferenciacijo in napredovanja raka. Nato smo pregledali, ali so genski izraz počivališč podpisov, povezanih s patološkimi fazah. Med njimi je tisti, dobro sovpada z različnimi patološkimi fazah so LANCL3
, MFAP2 and PPA1
(slika 4), ki prikazuje skladu gor in dol-uredbo, v tem zaporedju, skupaj z napredovanje raka.

D. Identifikacija diferencialno-izraženih genov neodvisna rakavih razredov in stopenj

Poleg diferencialnega izražanja, značilnih za nekatere podskupine raka želodca, prav tako proučujejo, če nekateri geni so različno izraženih raka želodca na splošno, ne glede na razrede in faze. 62 ti geni so bile ugotovljene z dosledno diferencialno izražanja vsaj 2-kratnih sprememb pri raku v primerjavi
ustreznih referenčnih tkiva. Ugotovili smo, da so večinoma vključeni v zunajcelični procesi, kot osrednja adhezijo, naperki, tesen spoj, interakcijo receptorjev citokinov citokinov in interakcijo ECM-receptorja, za aktivacijo plazminogena kaskade, kot tudi signalnih poti, vključno z NT signalizacijo in integrinu signalizacije, ki so tesno pomembne za rast celic in kontrolo celične proliferacije. Iskanje proti naši in-house baze podatkov (http://bioinfosrv1.bmb.uga.edu/DMarker/), ki vključuje javne nabore podatkov mikromrež iz GSO [17], Oncomine [18] in SMD [19], ki pokriva več kot 53 človeških bolezni, vključno z rak, smo ugotovili, da so razlika izraz vzorci 15 genov zelo značilne za raka želodca, kot GKN2, CLDN7, THY1, GIF in PGA4, večina drugih pa so na splošno na več vrst raka. Na primer, večina splošnih tisti vključuje nekaj članov kolagena družini genov (COL1A2, COL3A1 in COL1A1) je karcinoembrionski povezan antigen celične adhezijske molekule (CEACAM6), matrične metaloproteinaze (MMP1, MMP7 in MMP12), topoizomeraza (TOP2A) in izloča fosfoprotein (SPP1).

le tri, CLDN7
, CLDN1 in DPT
, od teh genov se zelo razlikujejo v vseh razredih ali stopnjah raka želodca. Vidimo lahko, iz sliki 5A in 5B, da tako CLDN7 in CLDN1
so zelo izražene v raku v primerjavi
kontrolnih vzorcev v vseh razredih in stopnjah, z zmerno rastjo v zgodnjih tkivih rakom, medtem ko DPT
je navzdol urejeno po vseh teh skupin. Dosledno izraz vzorec v vseh podskupinah rakavih lahko pomeni, da so ti geni sodelujejo pri mnogih pomembnih bioloških poti, ki sodelujejo pri oblikovanju in napredovanja raka. Kot je znano, sta claudin proteini, claudin-1 in claudin-7 so integralni membranski proteini ključna za tvorbo tesen križiščih, ohranitev adhezijo celic na celici in regulacijske paracelični in transcelularni transport topljencev preko človeškega epitelij in endothelia, ki so različno izražena v različnih vrst raka materničnega vratu kot neoplazije [20], ledvični karcinom [21] in črevesni vrste raka želodca [22]. Dermatopontin ( DPT
) je zunajcelični matriks protein služi kot komunikacijsko povezavo med površino kožo fibroblastov celic in njeno ekstracelularnega matriksa. Njena zmanjšana ekspresija je bilo ugotovljeno tudi v obeh materničnih leiomiomatozno in keloidov [23]. Prikazana na sliki 5C ROC kažejo, da bi ti geni lahko uporabijo kot učinkovitih markerji za želodčni diagnozo raka na splošno.

E. Preverjanje opredeljenih podpisov na javnih podatkovnih bazah

Z izrazom vzorce naših identificiranih virusnih genov so bile preverjene na podlagi dveh javnih podatkovnih bazah, in sicer Kim
in Takeno
podatkovni nizi (glej materiali in metode), za določanje splošne veljavnosti teh genskih podpisov. Kot je prikazano na sliki 6, porazdelitev izraz razlike med našimi podatki in Kim
nabor podatkov je bistveno skladnih, kar kaže, da splošna uporaba naših ugotovljenih markerjev. Od 19 do 12 prekrivajočih genov iz zgoraj opredeljenih razredov-soodvisnih in fazi povezana seznama genov, 10 in 5 je razvidno, podobnih vzorcev izražanja prek raka G1-2 /G3-4 razredov in I-IV stopnje v Kim
podatkov, oziroma, kar kaže na visoko skladnost pri vzorcev izražanja teh genov med različnimi vzorčnih nizov.

na splošno, naš 19-gen podpis za rakom razredov izvedli tudi na Kim
podatkov in pridobil 78,0% klasifikacijsko točnost na 5-kratno potrjevanje navzkrižne v smislu razlikovanja slabo iz visoko diferenciranih raka. Podobno podpisi dvostopenjskega (10 gena in 9-genskih skupin) dobimo ustrezne točnosti 84,0% in 76,0% več kot v Kim
CCD. 198-gen Podpis ni bil preverjen, saj je Kim
nabor podatkov zagotavlja le raztegljiv sprememba namesto neobdelanih podatkov izražanja.

Zanimivo je, da smo opazili, da obstaja zmerna povezanost med genske ekspresije našega identificirane podpis skupine in raka ponovitev temelji na peritonealno recidivno informacijami Takeno je podatkov [24]. Natančneje, štirje podpisi, 19-, 198-, 10- in 9-genskih skupin, ne more napovedati peritonealno ponovitev z natančnostjo za 66,0%, 87,2%, 73,0% in 55,3%, v tem zaporedju, z razlikovanjem med relapse- svobodne in peritonealno-ponovitev bolezni pri bolnikih v študiji Takeno v [24].

Pogovor

Mikromrežni gensko izražanje analize na raka želodca so predhodno ugotovljene genske ekspresije vzorce za napoved prognoze [25], [26] in splošna diagnoza raka [27], [28] (kot je pregledala v tabeli S6), vendar nobeden za želodčne serotipizacija raka ali sortiranju. Tukaj smo predstavili analizo na 54 parov raka in sosednjimi referenčnimi tkiv enako število bolnikov z rakom želodca in ugotovljenih molekularnih podpisov za rakom razredov in stopenj.

Znano je, da različnih analiz izbor razvrščanja in genov lahko privedejo do različnih genskih podpisov, kar predstavlja resno vprašanje o stabilnosti in uporabnosti izbranih genskih podpisov. Za obravnavo tega vprašanja, smo uporabili izčrpne išče k gena podpisi (k < = 4), skupaj z močnim izbirnega značilnost postopka z večino glasov za k > 4, ki zagotavlja stabilnost ugotovljenih podpisa genov. Po drugi strani, zaradi kompleksne narave podatkov rak gen izraz, je splošno prepričanje je, da lahko različne tehnike razvrščanja privedejo do različnih podpisov, vendar enakega pomena, saj lahko ustrezajo različne poti, povezane z različnimi vidiki raka . Poleg teh tehničnih varianc, so omejena velikost vzorca in heterogenost obstoječih med podskupinami raka ugotovil drugih pomembnih dejavnikov, ki vplivajo na izbranih označevalcev.

Na koncu smo pokazali, tu se lahko uporablja, da se genski izraz vzorci kot učinkovito podpisov za želodčne razvrščanje raka in uprizoritve, pa tudi prognostičnih napovedi. bili predlagani dve vrsti podpisov, da služi različne diagnostične namene, vsaka kaže določen pomen za malignance raka in napredovanju raka. Taki poskusi z uporabo molekularnih razred, in Odrska podpise bistveno pa naj bi prispevala k razvoju prilagojene medicine in lahko vodi do novih serumskih markerjev.

Materiali in metode

tkiv Vzorci

Vzorci so bili odvzeti iz primarnih malignih želodčnega raka pri bolnikih, ki niso obdelani v začetnem kirurškim posegom na treh odvisnih bolnišnicah Jilin University College of Medicine in Jilin Provincial Cancer Hospital, Changchun, China. Za vsak vzorec rak tkiva, je ujemanje referenčni vzorec tkiva zbirajo iz sosednje noncancerous regiji, da kirurg odstranjenimi za zagotovitev pozitivne marže. Vsi vzorci so bili snap-zamrznemo v tekočem dušiku v 10 minutah po izrezu in shranimo na -196C do ekstrakcijo RNA. Za izolacije RNA smo uporabili 100 mikrometrov odseka vsakega vzorca.

Vsi zdravstvene kartoteke in profili raka so bile pregledane s kirurškim patolog, in so narejena histološka diagnoza in klasifikacija TNM po svetu zdravstvene organizacije meril (WHO) in sistem razvrščanja Mednarodne zveze za boj proti raku. Referenčne vzorce podvržemo natančna histološko analizo, da se zagotovi popolno odsotnost rakavih celic. Pisna privolitev je bila pridobljena iz vseh bolnikov, ki ga je odobril Institutional Review Board na University of Georgia, Athens, Georgia, ZDA in kitajski IRB nadzor človekovih motivov Jilin University College of Medicine in Cancer Hospital Jilin Provincial, Changchun , Kitajska.

Podrobne informacije pacientov, kot so starost, spol, histološki tip, diferencialni razred, patološko fazi in zgodovino uporabe alkohola /kajenje je iz tabele S5.

mikromrež poskusi

vzorce RNA smo analizirali s pomočjo GeneChip Human eXON 1.0 ST (Affymetrix), po protokolu je podrobno opisano v Genechip Expression Analiza Vgradni (P /N 900223) za matrike eksperimenta in prejšnje poročilo [29]. V mikromreže so skenirane z GeneChip® Scanner 3000 z GeneChip® operacijski programski opremi (GCOS). Vsi podatki so v skladu MIAME in surovi podatki so deponirana pri GEO bazi podatkov (ID: GSE27342).

Mikromrežni Analiza podatkov

Gene rezultati izraz so povzeti na podlagi surovin intenzivnosti sonde uporabo Robustno Veććipno Povprečje [30] in APT paket (http://www.affymetrix.com/partnerSupplementaryprograms/programs/developer/tools/powertools.affx), po treh glavnih faz, vključno korekcijo ozadja, kvantil normalizaciji in log2-transformacijo. so bili odstranjeni geni, ki imajo zelo nizko izražanje v obeh raka in referenčnih vzorcev; Natančneje, je bil odstranjen gen, če je njegova najvišja (Expr.cancer, Expr.normal)
je pod 4 (normalizirana jakost signala).

so bili uporabljeni dve različni strategiji za oceno genskega pomen, odvisno od tega, kaj smo primerjali pogoje in ali v paru, ali je treba uporabiti brez para vzorcev. Za primerjavo raka proti kontrolnih vzorčnih skupin, so bili izvedeni brez para preskuse za ugotavljanje, če sta dve skupini izraza različni, medtem ko so v parih, testi uporabljajo preučiti doslednost izražanja sprememb v vseh parih. Poleg Wilcoxonov podpisan-rang test, smo uporabili tudi druge preprost statističnega testa za odkrivanje genov z doslednim diferencialno izražanje pri raku v primerjavi
referenčne tkiva, kot sledi. Za vsako gena, K exp
, število parov rak /referenčnih tkiv, katerih izraz kratna sprememba (FC) je večja kot k
(npr k = 2); če je P-vrednost v opazovanem K exp
je manj kot 0,05, gen je štelo, da se različno izražena v večini rak in reference tkiv parov (glej podporne informacije). Naša izračunana P-vrednost ni bila prilagojena na testiranje več domnev, da bi se izognili izgubi genov, ki so lahko potencialno učinkovita v naslednji stopnji tajnosti.

izbor Gene in klasifikacija

Za k gen podpisov (k < = 4), smo izvedli izčrpno iskanje vseh k-genskih kombinacij med različno izraženih genov, opredeljenih v prejšnjem koraku, z uporabo pristopa linearni, ki temelji na SVM tajnosti in splošno natančnost je bila ocenjena s pomočjo 5-krat navzkrižne validacije. Za k > 4, je bil uporabljen drugačen pristop uporablja hevristično iskanje, saj je izčrpno iskanje je preveč zamudno, da je praktično za naš problem. Podatki so naslednji.

Celoten sklop izraz podatki so bili naključno razdeljeni v usposabljanje in testnih nizov, od katerih vsaka vsebuje polovico vzorcev. To smo ponovili 500-krat ustvariti 500 nizov podatkov trening /test za razvrstitev. Linearni SVM je bila uporabljena v usposabljanje klasifikator [31], [32]. Konstruira hiper-ravnino, ki ločuje dve različne razrede vektorji lastnosti z najvišjo maržo. Ta hiper-ravnina je zgrajena z iskanjem vektor w in spremenljivko b, ki zmanjšujejo, ki izpolnjuje naslednje pogoje:

za (vzorci z rakom) in, (normalne vzorcev). Tukaj je funkcija vektor, je indeks skupina, w je vektor pravokotno na hiper-ravnini, je razdalja od hiper-ravnini izvora in je evklidski norma w. Po določanje w in b vrednot, lahko glede na vektor x razvrstijo z uporabo; pozitivna ali negativna vrednost kaže, da je vektor x pripada pozitivno ali negativno razreda oz. Gene podpisi vsakega niza usposabljanja so bili izbrani po postopku, rekurzivno izločanja funkcija (RZP), ki je ovoj, ki izbere napovednik gene z odpravo non-napovednik genov glede na genom razvrstitev funkcije, proizvedeni iz klasifikacijskega sistema [33]. Razvrstitev merilo temelji na spremembo namenske funkcije ob odstranjevanju vsak gen. Za izboljšanje učinkovitosti treninga, je ta cilj funkcija predstavljena kot stroškovne funkcije J
za i
-ti funkcijo, s pomočjo usposabljanja nastavljeno samo izračunan. Ko je gen odstranjen ali njegova teža w i se zniža na nič, je sprememba stroškovne funkcije J (i)
je podana s. Primer ustreza k odstranitvi i
-ti gen. Sprememba v funkciji stroškov kaže prispevek gena za funkcijo odločanja in služi kot indikator genov uvrstitev.

500 trening /testni kompleti so bili naključno razdeljeni v 10 vzorčnih skupin. Vsaka skupina vzorcev je bila nato uporabljena za izpeljavo podpis, ki temelji na večinsko odločanje in ocenjevanje genom razvrstitev usklajenosti preko usposabljanja in testnih nizov 50. V 10 različnih podpisov, ki izhajajo iz 10 skupin so se v primerjavi z oceno stopnje skladnosti med izbranimi genov. V vsaki skupini so podmnožice genov s RZP-SVM izberemo iz vsakega sklopa usposabljanja in uspešnosti na podskupinah je bila ocenjena s pripadajočo testni množici. Za izpeljavo gen uvrstitev merilo dosledno za vse iteracij je bil RFE razvrstitev funkcije na vsakem ponovitve koraku izhaja iz SVM klasifikatorja, ki je dal najboljšo povprečno klasifikacijsko točnost preko testnih nizov 50.

Podatki Javne mikromrež raka želodca

Dve javni nabori podatkov mikromrež so bile prenesene iz podatkovne baze GEO za primerjalne študije, Kim
(GSE3438) in Takeno
(GSE15081) podatkovnih nizov. Prva [34] vključuje izražanje genov 50 želodčnih bolnikih z rakom (iz Koreje) na različnih stopnjah in stopnjo diferenciacije, ki je bila uporabljena za preverjanje skladnosti naših ugotovljenih podpisov. Podatki Takeno [24] vključuje 141 osnovnih želodčne rakavih tkiv po kurativno operacijo, s nadaljnjih peritonealno recidivno informacij. Ti nabori podatkov zagotavljajo normalizirano razmerje log2 tumorja in normalnega izražanja.

Podpora Informacije
Tabela S1.
Statistika 452 genov, ki so različno izraženih v kateri koli skupini štiri razrede, ki se določi na podlagi naslednjih meril: raven izražanja v raka in ustrezne nadzorne tkiva kažejo vsaj 2-krat sprememb in cutoff za statistične značilnosti ob ta stopnja sprememb izražanja je P
-vrednost < 0,05
doi:. 10,1371 /journal.pone.0017819.s001
(XLSX)
Tabela S2.
99 geni imajo svoje izražanje spreminja popolnoma ujemajo z ocenami WD-MD-PD-UD (| CC
| = 1, p
-vrednost < 0,05).
doi: 10,1371 /journal.pone.0017819.s002
(XLSX)
Tabela S3.
Seznam imen genskih v 198-genskega podpisa, med katerimi so 39 gen-grade povezana. CC. Korelacijskim koeficientom
doi: 10,1371 /journal.pone.0017819.s003
(XLSX)
Tabela S4.
Seznam 40 podpisov genov, ki jih najdemo posebej za skupino WD; 18, 20 in 255 geni so značilni za skupino MD, PD in UD, oziroma
doi:. 10,1371 /journal.pone.0017819.s004
(XLSX)
Tabela S5.

Other Languages