Stomach Health > Maag Gezondheid >  > Gastric Cancer > Maagkanker

PLoS ONE: Gene Expression-Signatures kan onderscheiden maagkanker kwaliteiten en Stages

Abstract

microarray-gen-expressie data van 54 gepaarde maagkanker en aangrenzende goedaardige maag weefsels werden geanalyseerd, met als doel gen handtekeningen vast te stellen voor kanker kwaliteiten (goed, moderately-, slecht-of niet-gedifferentieerd) en stages (I, II, III en IV), die zijn vastgesteld door pathologen. De statistische analyse leidde tot de identificatie van een aantal genen waarvan de expressie patronen combinaties dienen verder handtekeningen van verschillende kwaliteiten en stadia van maagkanker. Een handtekening 19-gen bleek veeleisende macht tussen high- en low-grade maagkanker in het algemeen, met algemeen klassement nauwkeurigheid hebben op 79,6%. Een uitgebreide 198-gen paneel laat de gelaagdheid van kanker in vier categorieën en controle, die aanleiding geven tot een algemeen klassement instemming van 74,2% tussen de door de pathologen en onze voorspelling aangewezen klas. Twee handtekeningen voor kanker enscenering, bestaande uit 10 genen en 9 genen, respectievelijk, bieden een hoge classificatie nauwkeurigheid bij 90,0% en 84,0%, onder vroeg-, gevorderd stadium van kanker en controle. Functionele en route analyses over deze karakteristieke genen onthullen de grote relevantie van de afgeleide handtekeningen om kanker kwaliteiten en progressie. Om het beste van onze kennis, dit is de eerste studie naar de identificatie van genen waarvan de expressie patronen kunnen als markers voor kanker kwaliteiten en podia dienen

Visum:. Cui J, Li F, G Wang, Fang X, Puett JD, Xu Y (2011) Gene Expression-Signatures kan onderscheiden maagkanker rangen en Stages. PLoS ONE 6 (3): e17819. doi: 10.1371 /journal.pone.0017819

Editor: Amanda Toland, Ohio State University Medical Center, de Verenigde Staten van Amerika

Ontvangen: 24 november 2010; Aanvaard: 9 februari 2011; Gepubliceerd: 18 maart 2011

Copyright: © 2011 Cui et al. Dit is een open-access artikel gedistribueerd onder de voorwaarden van de Creative Commons Attribution License, die onbeperkt gebruik, distributie en reproductie maakt in elk medium, op voorwaarde dat de oorspronkelijke auteur en de bron worden gecrediteerd

Financiering:. Deze studie werd mede ondersteund door de National Science Foundation (DEB-0.830.024, DBI-0542119), de National Institutes of Health (1R01GM075331), een 'Distinguished Scholar "subsidie ​​van het Georgia Cancer Coalition en een seed fonds gezamenlijk uit de president's Venture Fund en het Bureau van de vice-president voor onderzoek van de Universiteit van Georgia. De financiers hadden geen rol in de studie design, het verzamelen van gegevens en analyse, besluit te publiceren, of de voorbereiding van het manuscript

Competing belangen:.. De auteurs hebben verklaard dat er geen tegenstrijdige belangen bestaan ​​

Introductie

grading kanker is een maat voor de kwaadaardigheid en agressiviteit van een kanker. Een populaire indeling systeem maakt gebruik van vier niveaus van maligniteit (G1-G4), als gevolg van het gecombineerde niveau van de cel-verschijning abnormaliteit, afwijking in de groei van de normale cellen en de mate van invasiviteit en verspreiding. Deze pathologische maatregelen zijn gevonden te zijn in het algemeen overeenstemming met het niveau van celdifferentiatie (Amerikaanse Joint Commission on Cancer) [1]. Vandaar {G1, G2, G3, G4} wordt ook wel goed, moderately-, slecht-en niet-gedifferentieerde, respectievelijk. Vanaf nu is er geen universele indeling systeem voor alle vormen van kanker geweest. In plaats daarvan hebben verschillende grading systemen voorgesteld voor verschillende vormen van kanker. Bijvoorbeeld, de Gleason systeem [2] is waarschijnlijk het meest bekende voor de indeling adenocarcinoma cellen bij prostaatkanker terwijl de Bloom-Richardson systeem [3] wordt gebruikt voor borstkanker, en Fuhrman systeem [4] wordt gebruikt voor nierkanker .

Maagkanker, de tweede belangrijke oorzaak van kanker-gerelateerde sterfgevallen wereldwijd, is vooral voor in Aziatische landen, waaronder China, Korea en Japan [5]. In de Verenigde Staten, deze asymptomatische ziekte had ~21,500 nieuwe gevallen in 2008, samen met 10.800 sterfgevallen [6]. In tegenstelling tot andere vormen van kanker, maagkanker heeft nog geen algemeen geaccepteerde indeling regeling. Grading is meestal gedaan op basis van vrij algemeen kanker-grading richtlijnen van organisaties zoals de Amerikaanse Joint Commission on Cancer. Er zijn een aantal systemen voor de classificatie maagkanker in histologische subtypen, waaronder die van de Lauren [7], de World Health Organization (WHO) [8] en Goseki, et al. [9], [10], die subtypen vast op basis van de structurele kenmerken van de kanker, de histopathologische verschijningen van de cellen en het niveau van slijm, respectievelijk. Het is echter controversieel grotendeels over de vraag of een van deze systemen is erg relevant is voor de mate van kwaadaardigheid en de overlevingskansen, dus die niet op grote schaal gebruikt voor de indeling van maagkanker [11]. Het ontbreken van een gevestigde beoordelingssysteem voor maagkanker blijft als een belangrijke hinderpaal voor de vooruitgang op dit gebied.

We presenteren een computationele studie hierin, gericht op een set van genen waarvan de expressie patronen kunnen goed onderscheiden identificeren onder gastrische kanker van verschillende soorten, zoals Oncotype DX, een 21-gen paneel voor het identificeren van laag-risico op borstkanker [12]. Deze genen, waarvan de expressie patronen onderscheiden maagkanker van verschillende rangen, nuttige informatie naar de ontwikkeling van een gen-expressie gebaseerde beoordelingssysteem voor maagkanker. In Daarnaast hebben we onze bevindingen ook op de genexpressie patronen voorkomende kankers in de verschillende ontwikkelingsstadia, kunnen bedienen als moleculaire handtekeningen voor maagkanker enscenering.

Resultaten

A. Identificatie van genen met expressie veranderingen gecorreleerd met kanker kwaliteiten

17.800 menselijke genen werden geprofileerd in deze studie gebruikt Affymatrix Exon Arrays. Van de 54 monsters kanker, 8 zijn goed gedifferentieerd (WD), 9 matig gedifferentieerd (MD), 35 slecht gedifferentieerde (PD) en 2 ongedifferentieerde (UD). Een totaal van 452 genen bleken differentieel tot expressie worden gebracht als bepaald met de volgende criteria: de expressieniveaus bij kanker en de bijbehorende controleweefsel toont tenminste 2-voudige verandering en de statistische significantie, P
-waarde , van het hebben van dit niveau van meningsuiting verandering is < 0,05 (zie Material and Methods; gen namen zijn vermeld in tabel S1). Onder de 452 genen, 97 uniek in UD, 62 in PD, 8 in MD en 16 uniek in WD vertegenwoordigen een kernset
van differentieel tot expressie van genen, die consequent worden geïdentificeerd door het toepassen van verschillende indeling strategieën door middel van de paired- monster informatie of niet. Deze set bevat genen tentoonstelling van de meest consistente uitdrukking verandering (meer dan 2-voudig) bij kanker versus de kwaliteitscontrole weefsels, die werden geacht te verschillend tot expressie van genen met een hoge betrouwbaarheid, verkregen door middel van meerdere statistische tests. In tegenstelling tot de hele set van 452 genen vertegenwoordigen een uitgebreide set. We vastgesteld dat er een algemene trend dat het aantal van de differentieel tot expressie gebrachte genen toeneemt als maagkanker, ten opzichte van normaal weefsel, is slecht gedifferentieerde, zoals getoond in figuur 1. Deze waarneming is in overeenstemming met onze algemene kennis dat probleemgebieden gedifferentieerde kankers hebben de neiging om meer differentieel tot expressie genen en zijn agressiever; behalve voor WD, zoals weergegeven in figuur 1, kan tijdens de geringe omvang van de WD en MD groepen.

Vervolgens controleert of bepaalde genen kunnen hun expressie veranderingen correleren met de kanker graden. Om dit te doen, hebben we berekend dat de Spearman correlatiecoëfficiënt (CC) tussen de gemiddelde expressie van elk gen in alle monsters van elke rang en de vier kanker rangen. Het bleek dat de expressie veranderingen van 99 genen die correleren perfect aan bij de kwaliteiten WD-MD-PD-UD (| CC
| = 1, P
-waarde < 0,05) (zie details Tabel S2). Onder deze genen zijn POF1B
, BMO
, CEACAM6
, ZNF367
, GKN1
, LIPF
, SLC5A5
, MUC13
, CLDN1
, MMP7 en ATP4A
, die allemaal bekend is dat ze kanker gerelateerde zijn. Figuur 2 toont vier voorbeelden met positieve of negatieve correlaties. Onder hen, MUC13
is gemeld als een goede marker voor het niveau van differentiatie van gastro-intestinale slijmvlies [13]. MUC13 verhoogde expressie werd gevonden morfologische veranderingen, zoals verstrooiing van cellen door interferentie met de functie van celadhesiemoleculen induceren [14]; dus kan een verhoogde expressie samen met differentiatie indicate verbeterde cel-cel adhesie

We hebben geconstateerd dat de genen met hun expressie veranderingen gecorreleerd met kanker kwaliteiten sterk zijn verrijkt onder uitgescheiden of membraaneiwitten. (P-waarde < 0,05) , die deelnemen aan verschillende signaalroutes zoals ErbB, FAS, NOD-achtige receptor, PPAR en Wnt signalering, en celadhesiemoleculen (CAM's) en tight junctions. Dit is niet verrassend aangezien deze processen wezenlijk betrokken bij celgroei en celdood, en metastase. Dergelijke veranderingen in genexpressie patronen van deze routes, betrokken bij signaaltransductie en cellulaire communicatie, kan aanwijzingen over de progressie van kanker verschaffen.

B. Identificatie van gen handtekeningen voor kanker kwaliteiten

We hebben de 452-differentieel tot expressie van genen onderzocht, gericht op genen waarvan de expressie patronen, met een goede nauwkeurigheid en betrouwbaarheid, onderscheiden maag kanker van verschillende rangen te identificeren. De classificatie-analyse (zie Methoden) werd voor het eerst uitgevoerd tussen twee kanker groepen (sterk en slecht gedifferentieerd), en vervolgens uitgebreid tot vijf groepen, namelijk vier kanker kwaliteiten en de controle. Een Support Vector Machine (SVM) gebaseerde regressieve feature eliminatie benadering werd toegepast, met een lineaire kernel kanker indeling (zie werkwijzen).

Eind, een 19-gen groep geïdentificeerd die onderscheid kan maken tussen sterk en slecht gedifferentieerde vormen van kanker met een algemene overeenkomst op 79,2%, op basis van de expressie fold-change in kanker versus de kwaliteitscontrole weefsels. Evenzo kan een 198-gen groep onderscheid te maken tussen de vier verschillende soorten kanker en de controlegroep volgens hun genexpressie, die tot 74,2% totale classificatie nauwkeurigheid. Beide genen sets werden gekozen op basis van een meerderheid (ten minste 70% consistentie) regeling van de indeling resultaten op 500 sets willekeurig bemonsterd uit de 54 sample sets, samen met hun betekenis ranking (zie Methoden voor details).

De handtekening 19-gen bestaat uit ADIPOQ, COL6A3, TNS1, SCN7A, DES, VIL1, COL3A1, C2orf40, SMYD1, ACTG2, MEIS1, C7, GPR174, SHCBP1, DUSP1, DNAJB5, HIATL1, IL17RB en FAT. Een korte blik op de functionele annotatie van deze genen bleek dat hun eiwitproducten zijn betrokken bij celgroei en differentiatie (IL17RB, SMYD1, SHCBP1), celmotiliteit (ACTG2), angiogenese en weefsel remodeling (ADIPOQ), carcinogenese (ECRG4), matrix eiwitsynthese (COL3A1, COL6A3), en anderen, zoals G-eiwit gekoppelde receptor 174 (GPR174), brush border cytoskelet (VIL1), membraan attack complex (C7), en natrium kanaal (SCn7A).

17 uit van de 19 genen, plus een extra 181 genen vormen een 198-gen groep waarvan expressiepatroon kunnen onderscheiden vier soorten kanker en de controle. Hun functies omvatten celdeling, immuunrespons, signaaltransductie en genexpressie, naast de genoemde categorieën. Overall, 39 van de 99-grade gecorreleerde genen maken deel uit van deze 198-gen handtekening, waaronder CLDN1, MUC13, VIL1, HIATL1, CDCA7, HIST1H2BM en FAT (zie de volledige lijst in tabel S3).

In Naast deze catch-all signatuur voor vijf-weg classificatie, hebben we ook geïdentificeerd en geanalyseerd klasse-specifiek gen handtekening voor elke kanker leerjaar. Bijvoorbeeld, LAPTM4B is een dergelijke vertegenwoordiger. Dit gen geeft een hoge classificatie nauwkeurigheid voor caner en controlemonsters de WD groep met de AUC (oppervlak onder kromme) = 0,97 (figuur 3). Met behulp van 7.04 als de uitdrukking cutoff, kan dit gen goed te onderscheiden van kanker van de controlemonsters in de WD-groep met gevoeligheid = 87,5% en een specificiteit = 100%. Dit resultaat is niet verrassend aangezien het bekend is dat LAPTM4B essentieel is voor celgroei en overleving, en up-regulation is gebleken te correleren met het niveau van differentiatie van hepatocellulair carcinoom [15]. In totaal worden 40 dergelijke handtekening genen die specifiek gevonden voor de WD-groep; 18, 20 en 255 genen zijn specifiek voor de MD, PD en UD groep, respectievelijk (zie details in tabel S4).

We hebben ook vastgesteld enkel gen onderscheidende voor elke klasse groep tegen de rest van de monsters, omvattende het toezicht, zoals samengevat in Tabel 1. bijvoorbeeld, de signaturen voor de PD groep omvatten de up-gereguleerde genen, MYO1B
voor WD; GKN2
voor MD; CTSA
voor PD; en een down-gereguleerd gen, RHOJ,
voor de UD-groep. Deze enkel gen onderscheidende tonen significante AUC, variërend 0,76-0,99, terwijl de algemene indeling nauwkeurigheid verkregen door 5-voudig kruisvalidatieset bereik van 70,0% tot 97,0% voor verschillende groepen. Een verdere zoektocht naar k
-gen combinaties (k = 2, 3, 4) voor elke kanker groep door uitputtend gaan door alle combinaties van k
-gen groepen ook geïdentificeerd.

C. Identificatie van gen handtekeningen voor pathologisch stadium

Een soortgelijke analyse met die van de bovenstaande hebben we handtekeningen gen geïdentificeerd vroeg stadium (stadium I + II) en vergevorderde kanker (stadium III + IV). Tabel 2 wijst op de meest discriminerende enkel gen markers, met de indeling nauwkeurigheid, variërend van 75,0% tot 81,4%. Multi-gen handtekeningen werden ook gecontroleerd op kanker enscenering. Zo werden twee handtekeningen gevonden bijzonder effectief in kanker enscenering, namelijk een 10-gen groep (CPS1 + DEFA5 + DES + DMN + GFRA3 + MUC17 + OR9G1 + REEP3 + TMED6 + TTN) en een 9-gen groep (DPT + EIF1AX + FAM26D + IFITM2 + LOC401498 + OR2AE1 + PRRG1 + REEP3 + RTKN2) te zijn dat de eerste en de geavanceerde maagkanker van de rest van de monsters (met inbegrip van controlemonsters) met overeenkomsten van 90,0% en 84,0%, respectievelijk kunnen onderscheiden. Het algemeen klassement nauwkeurigheid van de drie groepen, vroeg, geavanceerde en controle, is 71,4%.

Een functionele analyse van deze karakteristieke genen bleek iets interessants. Bijvoorbeeld, een van de eiwitproducten van een vroeg stadium handtekening genen, GFRA3
, MUC17
, OR9G1
, REEP3 en TMED6 Wat zijn membraaneiwitten meestal extracellulaire receptoren die signalen transduceren. DEFA5
is een microbicide peptide geloofd te worden betrokken bij de afweer die in hoge mate wordt uitgedrukt in de ileum [16]. CPS1
, DES en TTN
zijn betrokken bij meerdere metabole processen, spierfunctie en de M fase van de mitotische celcyclus, respectievelijk. Wij speculeren dat deze SIGNALISERINGSGERELATEERDE en immuun-gerelateerde genen begin abnormaliteit van weefselcellen in oncogenese kunnen in het algemeen.

Enkele genen bleken zowel de kanker sorteren en opvoeren handtekeningen, zoals CPS1, DES, GFRA3, TMED6 en DPT, met vermelding van een aantal biologische relevantie tussen kanker differentiatie en progressie. Vervolgens hebben we onderzocht of de genexpressie van enscenering handtekeningen worden geassocieerd met pathologische fasen. Onder hen, die sterk gecorreleerd met verschillende pathologische stadia zijn LANCL3
, MFAP2 en PPA1
(figuur 4), waaruit consequente omhoog en omlaag-regulering, respectievelijk, met de progressie van kanker.

D. Identificatie van differentieel tot expressie gebrachte genen onafhankelijk van kanker status en fasen

Naast de differentiële expressie specifiek zijn voor bepaalde subgroepen van maagkanker, we ook onderzocht als enkele genen verschillend bij maagkanker in algemene, ongeacht kwaliteiten en podia. 62 dergelijke genen bleken consistente differentiële expressie met ten minste 2-voudige veranderingen in kanker versus
overeenkomstige referentie weefsels. We vastgesteld dat ze meestal betrokken bij cellulaire processen zoals focal adhesion, CAM, tight junction, cytokine-cytokine receptor interactie en ECM-receptor interactie de plasminogeen activatie cascade, evenals signaalroutes zoals Wnt signalering en integrine signalering, die nauw betrokken bij celgroei en celproliferatie controle. Zoeken tegen onze in-house database (http://bioinfosrv1.bmb.uga.edu/DMarker/) waarin de openbare microarray datasets van GEO [17], Oncomine [18] en SMD [19] omvat, die meer dan 53 ziekten bij de mens met inbegrip kanker, vonden we dat de differentiële expressiepatronen van 15 genen zeer specifiek maagkanker, zoals GKN2, CLDN7, Thy1, GIF en PGA4, terwijl de meeste andere zijn algemeen om meerdere kankersoorten. Bijvoorbeeld, de meest algemene effecten behoren enkele leden van de collageen genfamilie (COL1A2, COL3A1 en COL1A1), het carcino-antigeen gerelateerde celadhesie molecuul (CEACAM6), matrix metalloproteinases (MMP1, MMP7 en MMP12), topoisomerase (TOP2A) en uitgescheiden fosfoproteïne (SPP1).

Slechts drie, CLDN7
, CLDN1 en DPT
, van deze genen aanzienlijk gedifferentieerd in alle rangen en stadia van maagkanker. We zien uit figuur 5A en 5B dat zowel de CLDN7 en CLDN1
zijn sterk uitgedrukt in kanker versus
controlemonsters over alle kwaliteiten en podia, met een matige toename in het begin van kanker weefsels, terwijl DPT
werd down-gereguleerd in al deze groepen. De consistente expressiepatroon in alle subgroepen kanker kunnen wijzen dat deze genen deelnemen aan vele belangrijke biologische routes die betrokken zijn bij de vorming en progressie van kanker. Zoals bekend, de twee claudin eiwitten, claudine-1 en claudine-7, zijn integrale membraaneiwitten essentieel voor de vorming van tight junctions, behoud cel-celadhesie en afstellen paracellulair en transcellulair transport van opgeloste stoffen in menselijke epitheel en endotheel, die differentieel uitgedrukt in verschillende kankers zoals baarmoederhals [20], niercarcinoom [21] en een intestinale type maagkanker [22]. Dermatopontin ( DPT
) een extracellulaire matrix eiwit dient als een communicatieverbinding tussen de dermale fibroblast celoppervlak en de extracellulaire matrix. De verminderde expressie is ook gevonden in zowel uteriene leiomyomen en keloïden [23]. De in figuur 5C ROC geeft aan dat deze genen zou kunnen worden gebruikt als merkers voor effectieve maagkanker diagnose in het algemeen.

E. Verificatie van de geïdentificeerde handtekeningen op publieke datasets

De expressie patronen van ons geïdentificeerde handtekening genen werden getoetst aan twee openbare datasets, namelijk de Kim Kopen en Takeno
datasets (zie materialen en Werkwijzen) om de algemeenheid van deze genproducten handtekeningen bepalen. Zoals getoond in figuur 6, de verdeling van expressie verschillen tussen onze gegevens en de Kim
dataset significant concordante, wat aangeeft dat de algemene toepasbaarheid van onze geïdentificeerde merkers. Van de 19 en 12 overlappende genen van de boven geïdentificeerde-kwaliteiten gecorreleerde en fasen gecorreleerde genen lijst, 10 en 5 tonen vergelijkbare expressiepatronen in kanker van G1-2 /G3-4 status en I-IV stadia in de Kim
data, respectievelijk, als gevolg van een hoge consistentie in expressiepatronen van deze genen tussen verschillende sample sets.

Kortom, onze 19-gen handtekening voor kanker kwaliteiten goed gepresteerd op de Kim
data en behaalde 78,0% indeling nauwkeurigheid van 5-voudige kruis validatie in termen van slecht te onderscheiden van gedifferentieerde kankers. Ook de tweetraps handtekeningen (10-gen en 9 gen groepen) verkregen respectievelijke nauwkeurigheid van 84,0% en 76,0% op de Kim
dataset. De handtekening 198-gen werd niet gecontroleerd omdat de Kim
dataset geeft alleen veelvoudverandering plaats van ruwe data expressie.

Interessant we vastgesteld dat er een matige correlatie tussen de genexpressie van onze geïdentificeerd signatuurgroepen en kankerherhaling basis van de peritoneale terugval informatie Takeno de gegevens [24]. Met name de vier handtekeningen, 19-, 198-, 10- en 9-groepen genen, kan de peritoneale terugval voorspellen een algehele nauwkeurigheid van 66,0%, 87,2%, 73,0% en 55,3%, respectievelijk, onderscheidt ze relapse- gratis en peritoneale-terugval patiënten in Takeno de studie [24].

Discussie

Microarray genexpressie analyses over maagkanker hebben eerder geïdentificeerd gen expressie patronen voor prognose voorspelling [25], [26] en algemene diagnose van kanker [27], [28] (zoals beoordeeld in Tabel S6), maar geen voor maagkanker subtypering of sorteren. Hier presenteerden wij een analyse van 54 paren van kanker en nabijgelegen referentiewaarden weefsel van hetzelfde aantal maagkanker patiënten en die moleculaire signaturen voor kanker soorten en stadia.

Het is bekend dat verschillende indeling en gen selectie analyses kan leiden tot een ander gen handtekeningen, die een ernstig probleem over de stabiliteit en het nut van de geselecteerde gen handtekeningen. Om te gaan met dit probleem, hebben we uitputtende zoekopdrachten aangevraagd k-gen handtekeningen (k < = 4) in combinatie met een robuuste feature selectieprocedure met meerderheid van stemmen voor k > 4, die de stabiliteit van de geïdentificeerde handtekening genen zorgt. Anderzijds, vanwege de complexiteit van kanker genexpressie data is een algemene overtuiging is dat verschillende classificatietechnieken tot verschillende signaturen maar even belangrijk kunnen geven zij corresponderen met verschillende paden geassocieerd met verschillende aspecten van kanker . Naast deze technische verschillen, de beperkte monstergrootte en de heterogeniteit van de bestaande kanker subgroepen worden genoteerd als andere belangrijke factoren die de geselecteerde markers.

Concluderend, hebben wij aangetoond dat hierin genexpressie patronen kunnen worden gebruikt zo effectief handtekeningen voor maagkanker sorteren en opvoeren, alsook prognostische voorspelling. Twee handtekeningen voorgesteld om verschillende diagnostische doeleinden, die elk een bepaalde relevantie voor kanker kwaadaardigheid en kanker progressie. Dergelijke pogingen van het gebruik van moleculair-biologische kwaliteit-en stage-handtekeningen worden naar verwachting aanzienlijk ten goede aan de ontwikkeling van gepersonaliseerde geneeskunde en kan leiden tot nieuwe serum markers.

Materialen en methoden

Tissue Monsters

de monsters werden genomen van primaire kwaadaardige maagkanker uit niet-behandelde patiënten tijdens de initiële chirurgische procedure op drie aangesloten ziekenhuizen van de Jilin University College of Medicine en Jilin Provincial kanker ziekenhuis, Changchun, China. Voor elk kankerweefsel monster, werd een passende verwijzing weefselmonster verzameld uit de aangrenzende noncancerous regio die de chirurg weggesneden om tot positieve marges te waarborgen. Alle monsters werden snel bevroren in vloeibare stikstof binnen 10 minuten na excisie en bewaard bij -196C tot RNA-extractie. Voor RNA-isolatie werden 100 urn secties van elk monster gebruikt.

Alle medische dossiers en kanker secties werden onderzocht door een chirurgische patholoog en de histologische diagnose en TNM werden volgens Worldwide Health Organization (WHO) criteria en het classificatiesysteem van de Internationale Unie tegen kanker. De referentiemonsters werden onderworpen aan een zorgvuldige histologische analyse de volledige afwezigheid van kankercellen garanderen. Schriftelijke toestemming werd verkregen van alle patiënten, die door de Institutional Review Board van de Universiteit van Georgia, Athens, Georgia, Verenigde Staten werd goedgekeurd en door de Chinese IRB toezicht op menselijke proefpersonen aan Jilin University College of Medicine en de Jilin Provincial kanker ziekenhuis, Changchun , China.

Gedetailleerde patiënt informatie, zoals leeftijd, geslacht, histologische type, de differentiële rang, pathologische stadium en de geschiedenis van het gebruik van alcohol /roken is opgenomen in Tabel S5.

microarray experimenten

het RNA monsters werden geanalyseerd met behulp van de GeneChip Human Exon 1,0 ST (Affymetrix), volgens het protocol beschreven in de GeneChip Expression Analysis technische handleiding (P /N 900223) voor de array experiment en een eerder rapport [29]. De microarrays werden gescand met behulp van de GeneChip® Scanner 3000 met GeneChip® Operating Software (GCOS). Alle gegevens voldoet MIAME en de ruwe data is in GEO-database (ID: GSE27342) afgezet.

Microarray Data Analysis

genexpressie resultaten werden samengevat op basis van rauwe probe intensiteiten met behulp van de Robust Multichip gemiddeld [30] en de APT-pakket (http://www.affymetrix.com/partnerSupplementaryprograms/programs/developer/tools/powertools.affx), volgende drie belangrijke stappen met inbegrip van achtergrond correctie, kwantiel normalisatie en log2-transformatie. Genen die zeer lage expressie in zowel kanker en referentie-monsters werden verwijderd; in het bijzonder, werd een gen verwijderd als de maximum (Expr.cancer, Expr.normal)
was onder de 4 (genormaliseerde intensiteit van het signaal).

Twee verschillende strategieën werden toegepast voor het beoordelen van gen betekenis, afhankelijk op welke voorwaarden werden vergeleken en of gepaarde of ongepaarde monsters worden gebruikt. Ter vergelijking van kanker tegen controlemonster groepen werden ongepaarde testen uitgevoerd om te onderzoeken of expressie van twee groepen verschillen, terwijl gepaarde tests werden toegepast om de consistentie van veranderingen expressie voor alle paren onderzoeken. Naast de rangtekentoets we ook toegepast een eenvoudige statistische test om genen met constante differentiële expressie detecteren kanker versus
referentie weefsels, als volgt. Voor elk gen, K exp
, het aantal paren van kanker /verwijzing weefsels waarvan de expressie fold-change (FC) is groter dan k
(bijvoorbeeld k
= 2) werd onderzocht; Als de P-waarde voor de waargenomen K exp
was minder dan 0,05, het gen werd als verschillend tot expressie in de meeste van de kanker en vindplaats weefsel paren (zie de ondersteunende informatie). De berekende P-waarde werd niet aangepast aan de verschillende hypotheses proeven om elk verlies van genen die mogelijk effectief bij de daaropvolgende classificatiestap kunnen veroorzaken.

Gene selectie en indeling

Voor k -Gene handtekeningen (k < = 4), voerden we een uitputtende zoektocht voor alle k-gencombinaties de onder de differentieel tot expressie gebrachte genen, die uit de vorige stap, met een lineaire-SVM gebaseerde classificatie benadering, en de algehele nauwkeurigheid werd geëvalueerd met behulp 5-voudig kruisvalidatie. Voor k > 4, een andere benadering met behulp van een heuristische zoektocht werd toegepast, aangezien de uitputtende zoektocht is te tijdrovend praktisch voor ons probleem te zijn. De details zijn als volgt.

De hele uitdrukking dataset werd willekeurig verdeeld in opleiding en test sets, die elk de helft van de monsters. Dit werd herhaald voor 500 keer tot 500 sets van training /testgegevens voor indeling genereren. Een lineaire SVM werd gebruikt voor het trainen van een classificator [31], [32]. Construeert een hyper-vlak dat twee verschillende klassen van vectoren scheidt met een maximale marge. Deze hyper-vlak wordt gevormd door het vinden van een vector w en een variabele b die minimaliseren, die aan de volgende voorwaarden voldoet:

, voor (kanker monsters) en (normale monsters). Hier, is een functie vector, is het groepsindexnummer, w is een vector loodrecht op de hyper-vlak, is de afstand van de hyper-vlak om de oorsprong en de Euclidische norm van w. Na de vaststelling van de w en b waarden, kan een gegeven vector x worden ingedeeld met behulp van; een positieve of negatieve waarde geeft aan dat de vector x behoort tot de positieve of negatieve klasse respectievelijk. Gene handtekeningen van elke training set werden geselecteerd met behulp van de recursieve functie eliminatie procedure (RFE), dat is een wrapper dat predictor genen geselecteerd door het elimineren van niet-predictor genen op basis van een gen-ranking functie gegenereerd op basis van de classificatie systeem [33]. De rangschikkingscriterium is gebaseerd op de verandering in de doelfunctie op het verwijderen van elk gen. Om de efficiëntie van de opleiding te verbeteren, wordt deze doelstelling functie weergegeven als een kostenpost functie J
voor de i
-de functie, berekend met behulp van de alleen instellen training. Wanneer een gen wordt verwijderd en het gewicht w i wordt gereduceerd tot nul, de wijziging van de kostenfunctie J (i)
wordt gegeven. Voor overeen met het verwijderen van de i
-de gen. De ontwikkeling van de kosten-functie geeft aan dat de bijdrage van het gen om de beslissing functie en dient als een indicator van gen-ranking.

De 500 training /test sets werden willekeurig verdeeld in 10 groepen monster. Elke testgroep werd vervolgens gebruikt om een ​​handtekening te leiden, op basis van meerderheid en evaluatie van gen-rangschikking consistentie tussen 50 opleiding en testsets. De 10 verschillende handtekeningen afkomstig van de 10 groepen werden vergeleken met de mate gelijk de geselecteerde genen beoordelen. In elke groep subsets van genen die werden geselecteerd door RFE-SVM uit elke training set, en de prestaties op de subsets werd beoordeeld op basis van de bijbehorende test set. Om een ​​gen ranking criterium consistent zijn voor alle iteraties te leiden, een RFE ranking functie bij elke iteratie stap werd afgeleid van een SVM classifier die de beste gemiddelde classificatie nauwkeurigheid over de 50 testsets gaf.

Openbare microarray gegevens van maagkanker

Twee openbare microarray datasets werden gedownload van de GEO-database voor vergelijkende studies, de Kim
(GSE3438) en de Takeno
(GSE15081) datasets. De eerste [34] omvat genexpressie van 50 maagkanker patiënten (uit Korea) in verschillende fasen en differentiatieniveau, die werd gebruikt om de consistentie van onze geïdentificeerd handtekening controleren. De Takeno data [24] bevat 141 primaire maagkanker weefsels na curatieve chirurgie, met een follow-up peritoneale terugval informatie. Deze datasets bieden de genormaliseerde log2 verhouding van de tumor en de normale uitdrukking.

Ondersteunende informatie
Tabel S1. &statistieken van 452 genen die differentieel in willekeurig welke van de groep vier graden, bepaald met de volgende criteria: expressieniveaus bij kanker en de bijbehorende controleweefsel toont tenminste 2-voudige verandering en de cutoff voor statistische significantie van het hebben dit niveau van meningsuiting verandering is P
-waarde < 0.05
doi:. 10.1371 /journal.pone.0017819.s001
(XLSX)
tabel S2.
99 genen hun expressie verandert perfect correleren met de kwaliteiten WD-MD-PD-UD (| CC
| = 1, p
-waarde < 0,05).
doi: 10.1371 /journal.pone.0017819.s002
(XLSX)
tabel S3. Nederlands Lijst van het gen namen van de handtekening 198-gen, waaronder 39 zijn-grade gecorreleerd gen. CC:. Correlatiecoëfficiënt
doi: 10.1371 /journal.pone.0017819.s003
(XLSX)
Tabel S4. Nederlands Lijst van 40 handtekening genen die specifiek worden gevonden voor de WD-groep; 18, 20 en 255 genen zijn specifiek voor de MD, PD en UD-groep, respectievelijk
doi:. 10.1371 /journal.pone.0017819.s004
(XLSX)
Tabel S5.

Other Languages