Stomach Health > Stomaco Salute >  > Gastric Cancer > Tumore gastrico

PLoS ONE: firme di espressione genica può distinguere i gradi cancro gastrico e Stages

Estratto

microarray dati di espressione genica di 54 accoppiato cancro gastrico e tessuti non tumorali gastriche adiacenti sono stati analizzati, con l'obiettivo di stabilire le firme genetiche per gradi cancro (ben, moderately-, poorly- o non-differenziato) e gli stadi (I, II, III e IV), che sono stati determinati dai patologi. La nostra analisi statistica ha portato all'identificazione di una serie di combinazioni di geni la cui espressione modelli servire bene come le firme di diversi gradi e le diverse fasi del cancro gastrico. Una firma 19-gene è stato trovato per avere potere discernere tra alto e basso grado tumori gastrici, in generale, con la precisione globale classificazione a 79,6%. Un pannello 198-gene espansa permette la stratificazione dei tumori in quattro gradi e il controllo, dando luogo a un accordo classifica generale del 74,2% tra ogni grado designato dalle patologi e la nostra previsione. Due firme per la stadiazione del cancro, composto da 10 geni e 9 geni, rispettivamente, forniscono una precisione elevata classificazione al 90,0% e 84,0%, tra precoce, il cancro in stadio avanzato e controllo. Funzionale e percorso analisi su questi geni firma rivelano la rilevanza significativa delle firme derivati ​​per gradi e progressione del cancro. Per quanto a nostra conoscenza, questo rappresenta il primo studio sulla identificazione di geni la cui pattern di espressione può servire come marcatori per gradi del cancro e le fasi

Visto:. Cui J, Li F, G Wang, Fang X, Puett JD, Xu Y (2011) firme di espressione genica può distinguere i gradi cancro gastrico e fasi. PLoS ONE 6 (3): e17819. doi: 10.1371 /journal.pone.0017819

Editor: Amanda Toland, Ohio State University Medical Center, Stati Uniti d'America

Ricevuto: 24 novembre 2010; Accettato: 9 febbraio 2011; Pubblicato: 18 Marzo, 2011

Copyright: © 2011 Cui et al. Questo è un articolo ad accesso libero distribuito sotto i termini della Creative Commons Attribution License, che permette l'uso senza restrizioni, la distribuzione e la riproduzione con qualsiasi mezzo, a condizione che l'autore originale e la fonte sono accreditati

Finanziamento:. Questo studio è stato sostenuto in parte dalla National Science Foundation (DEB-0.830.024, DBI-0.542.119), il National Institutes of Health (1R01GM075331), un "Distinguished Scholar" sovvenzione da parte della Georgia Cancer Coalition, e un fondo di seed congiuntamente dal Venture Fund del Presidente e l'Ufficio del Vice Presidente per la ricerca dell'Università della Georgia. I finanziatori avevano alcun ruolo nel disegno dello studio, la raccolta e l'analisi dei dati, la decisione di pubblicare, o preparazione del manoscritto

Competere interessi:.. Gli autori hanno dichiarato che non esistono interessi in competizione

Introduzione

grading Il cancro è una misura di malignità e l'aggressività di un tumore. Un sistema di classificazione popolare utilizza quattro livelli di malignità (G1-G4), che riflette il livello combinato di cellule aspetto anomalia, deviazione del tasso di crescita delle cellule normali e il grado di invasività e di diffusione. Tali misure patologici sono stati trovati per essere in accordo generale con il livello di differenziazione cellulare (Joint Commission on Cancer) [1]. Quindi {G1, G2, G3, G4} sono anche indicato come ben, moderately-, poorly- e poco differenziati, rispettivamente. A partire da ora, non vi è stato un sistema di classificazione universale per tutti i tumori. Invece, sono stati proposti diversi sistemi di classificazione per i diversi tipi di cancro. Ad esempio, il sistema [2] Gleason è probabilmente il più noto per la classificazione delle cellule di adenocarcinoma nel cancro alla prostata, mentre il sistema di Bloom-Richardson [3] è usato per il cancro al seno, e il sistema di Fuhrman [4] viene usato per il cancro del rene
.

cancro gastrico, la seconda causa di morte per cancro in tutto il mondo, è particolarmente diffuso nei paesi asiatici, tra cui Cina, Corea e Giappone [5]. Negli Stati Uniti, questa malattia asintomatica aveva ~21,500 nuovi casi nel 2008 con 10.800 morti [6]. A differenza di altri tipi di tumore, il cancro gastrico non c'è ancora un sistema di classificazione generalmente accettata. La classificazione è stata fatta per lo più sulla base di linee guida piuttosto generali cancro-grading da parte di organizzazioni come la Commissione paritetica on Cancer. Ci sono alcuni sistemi di classificazione dei tumori gastrici in sottotipi istologici, compresi quelli dal Lauren [7], l'Organizzazione Mondiale della Sanità (OMS) [8] e Goseki, et al. [9], [10], che definiscono sottotipi secondo le caratteristiche strutturali del cancro, le caratteristiche istopatologiche delle cellule, e il livello di muco, rispettivamente. Tuttavia, è molto controversi per quanto riguarda se uno qualsiasi di questi sistemi è molto rilevante al grado di malignance e sopravvivenza, non essendo state quindi ampiamente utilizzati per la classificazione cancro gastrico [11]. La mancanza di un sistema di classificazione consolidato per il cancro gastrico rimane come uno dei principali ostacoli che ostacolano i progressi in questo campo.

Vi presentiamo uno studio computazionale nel presente documento, finalizzato ad individuare un insieme di geni la cui espressione modelli in grado di distinguere bene Tra i tumori gastrici di diversi gradi, come Oncotype DX, un pannello 21-gene per l'identificazione del cancro al seno a basso rischio [12]. Questi geni, il cui pattern di espressione distinguere i tumori gastrici di diversi gradi, forniscono informazioni utili verso lo sviluppo di un sistema di valutazione di espressione a base genica per il cancro gastrico. Inoltre, abbiamo anche presentiamo i nostri risultati sui modelli di espressione genica comuni di tumori in diversi stadi di sviluppo, potrebbero servire le firme molecolari per gastrica stadiazione del cancro.

Risultati

A. L'identificazione di geni con cambiamenti di espressione correlata con il cancro gradi

17.800 geni umani sono stati profilato in questo studio, utilizzando Affymatrix Exon Array. Dei campioni di cancro 54, 8 sono ben differenziato (WD), 9 moderatamente differenziato (MD), 35 scarsamente differenziato (PD) e 2 indifferenziata (UD). Un totale di 452 geni sono stati trovati ad essere differenzialmente espressi come determinato utilizzando i seguenti criteri: i livelli di espressione in Cancro e il corrispondente tessuto spettacolo di controllo delle modifiche almeno 2 volte, e la significatività statistica, P
-value , di avere questo livello di cambiamento espressione è < 0,05 (vedi materiali e Metodi; nomi gene sono elencati nella Tabella S1). Tra i 452 geni, 97 unicamente in UD, 62 nel PD, 8 nel DM e 16 unicamente in WD rappresentano una Set base
di geni espressi in modo differenziale, che sono costantemente identificati mediante l'applicazione di diverse strategie di classificazione secondo la paired- informazioni campione o no. Questo set comprende geni che mostrano il cambiamento espressione più consistente (oltre 2 volte) nel cancro contro
tessuti di controllo, che sono stati ritenuti essere differenzialmente espressi geni con alta affidabilità, derivate attraverso molteplici test statistici. Al contrario, l'intero insieme di 452 geni rappresentano un insieme esteso. Abbiamo notato che vi è una tendenza generale che il numero dei geni differenzialmente espressi aumenta come un cancro gastrico, rispetto al tessuto normale, è più scarsamente differenziato, come mostrato in Figura 1. Questa osservazione è in accordo con la nostra conoscenza generale che Lessing differenziati tumori tendono ad avere più geni espressi in modo differenziale e sono più aggressivi; eccezione per WD, come mostrato in figura 1, potrebbe riflettere le piccole dimensioni del WD e dei gruppi MD.

Abbiamo poi controllato se alcuni geni possono avere i loro espressione cambia correlazione con i gradi di cancro. Per fare questo, abbiamo calcolato il coefficiente di correlazione Spearman (CC) tra l'espressione media di ciascun gene in tutti i campioni di ogni grado e quattro gradi tumorali. Si è constatato che i cambiamenti di espressione di 99 geni correlati alla perfezione con i gradi di WD-MD-PD-UD (| CC
| = 1, P
-value < 0,05) (vedi dettagli in Tabella S2). Tra questi geni sono POF1B
, MET
, CEACAM6
, ZNF367
, GKN1
, LIPF
, SLC5A5
, MUC13
, CLDN1
, MMP7 e ATP4A
, che sono tutti noti per essere correlati cancro. La figura 2 mostra quattro esempi sia con correlazioni positive o negative. Tra questi, MUC13
stato segnalato come un buon indicatore per il livello di differenziazione della mucosa gastrointestinale [13]. L'espressione aumentata MUC13 è stato trovato per indurre cambiamenti morfologici, tra cui dispersione delle cellule attraverso l'interferenza con la funzione di molecole di adesione delle cellule [14]; in tal modo, un aumento dell'espressione con differenziazione può indicare una maggiore adesione cellula-cellula

Abbiamo notato che i geni con i loro cambiamenti di espressione correlata con gradi tumorali sono altamente arricchito tra proteine ​​secrete o di membrana. (p-value < 0,05) , che partecipare a più percorsi di segnalazione, come ErbB, FAS, il recettore NOD-like, PPAR e segnalazione Wnt, così come molecole di adesione cellulare (CAM) e le giunzioni strette. Ciò non è sorprendente poiché questi percorsi sono essenzialmente coinvolte nella crescita cellulare e morte cellulare, così come metastasi del cancro. Tali cambiamenti nei modelli di espressione genica di queste vie, coinvolte nella trasduzione del segnale e comunicazione extracellulare, possono fornire indizi sulla progressione del cancro.

B. L'identificazione delle firme genetiche per i gradi di cancro

Abbiamo esaminato i 452 geni differenzialmente-espressi, al fine di identificare i geni la cui pattern di espressione può, con buona precisione e affidabilità, di distinguere i tumori gastrici di diversi gradi. L'analisi di classificazione (vedi Metodi) è stato condotto tra due gruppi di cancro (altamente e scarsamente differenziati), e poi prolungato fino a cinque gruppi, vale a dire quattro gradi di cancro e il controllo. Una macchina Support Vector (SVM) a base di regressiva approccio caratteristica eliminazione è stato applicato, utilizzando un kernel lineare per la classificazione del cancro (vedi Metodi).

Alla fine, un gruppo di 19-gene è stato identificato in grado di distinguere tra altamente e scarsamente differenziato tumori con un accordo globale al 79,2%, in base all'espressione pieghevole cambiamento nel cancro contro
tessuti di controllo. Analogamente, un gruppo 198-gene in grado di distinguere tra i quattro diversi tipi di cancro e il gruppo di controllo secondo la loro espressione genica, dando origine al 74,2% precisione complessiva classificazione. Entrambi i gruppi di geni sono stati scelti sulla base di un voto a maggioranza (almeno il 70% di coerenza) schema dai risultati della classificazione su 500 set campionati a caso da 54 serie di campioni, insieme con il loro significato classifica (vedi Metodi per i dettagli).

La firma 19-gene è costituito da ADIPOQ, COL6A3, TNS1, SCN7A, DES, VIL1, COL3A1, C2orf40, SMYD1, ACTG2, MEIS1, C7, GPR174, SHCBP1, DUSP1, DNAJB5, HIATL1, IL17RB, e FAT. Uno sguardo da vicino l'annotazione funzionale di questi geni ha rivelato che i loro prodotti proteici sono coinvolti nella crescita cellulare e la differenziazione (IL17RB, SMYD1, SHCBP1), motilità cellulare (ACTG2), l'angiogenesi e rimodellamento tissutale (ADIPOQ), carcinogenesi (ECRG4), matrice la sintesi proteica (COL3A1, COL6A3), e altri come recettori accoppiati a proteine ​​g 174 (GPR174), citoscheletro pennello confine (VIL1), complesso di attacco alla membrana (C7), e il canale del sodio (SCn7A).

17 fuori dei 19 geni, più altri 181 geni, formare un gruppo 198-gene la cui pattern di espressione in grado di distinguere i quattro gradi di cancro e il controllo. Le loro funzioni comprendono la divisione cellulare, la risposta immunitaria, trasduzione del segnale e regolazione della trascrizione, in aggiunta alle suddette categorie. Nel complesso, 39 dei 99 geni qualità-correlato sono parte di questa firma 198 geni, tra cui CLDN1, MUC13, VIL1, HIATL1, CDCA7, HIST1H2BM e FAT (vedere l'elenco completo nella tabella S3).

Oltre a questo catch-all firma per la classificazione a cinque direzioni, abbiamo anche identificato ed analizzato le firme specifico gene-grade per ciascun grado del cancro. Ad esempio, LAPTM4B è una tale rappresentante. Questo gene dà un'elevata precisione di classificazione per i campioni Caner e di controllo nel gruppo di WD con l'AUC (area sotto la curva) = 0.97 (figura 3). Utilizzando 7.04 come cutoff espressione, questo gene può ben distinguere il cancro dai campioni di controllo nel gruppo di WD con sensibilità = 87,5% e una specificità = 100%. Questo risultato non è sorprendente in quanto è noto che LAPTM4B è essenziale per la crescita cellulare e la sopravvivenza, e il suo up-regulation è stato trovato per essere correlata con il livello di differenziazione del carcinoma epatocellulare [15]. In totale, 40 di tali geni di firma sono presenti appositamente per il gruppo WD; 18, 20 e 255 geni sono specifici per il gruppo MD, PD e UD, rispettivamente (vedi dettagli nella tabella S4).

Abbiamo anche identificato discriminatori singolo gene per ogni gruppo di grado contro il resto dei campioni, compreso il controllo, come riassunto nella tabella 1. per esempio, le firme per il gruppo PD comprendono i geni up-regolati, MYO1B Compra di WD; GKN2 Compra di MD; CTSA Compra di PD; e un gene down-regolato, RHOJ,
per il gruppo UD. Questi discriminatori singolo-gene mostrano significativi AUC, che vanno 0,76-0,99, mentre le precisioni globali di classificazione ottenuti da 5-fold gamma convalida incrociata dal 70,0% al 97,0% per i diversi gruppi. Una ricerca successiva per k
combinazioni -Gene (k = 2, 3, 4) per ogni gruppo di cancro in modo esauriente passando attraverso tutte le combinazioni di k
gruppi -Gene anche identificati.

C. L'identificazione delle firme gene per patologico fase

Utilizzando analisi simili a quelli di cui sopra, abbiamo individuato le firme genetiche per la fase precoce (stadio I + II) e il cancro stadio avanzato (stadio III + IV). La tabella 2 mette in evidenza i marcatori più discriminanti singolo gene, con la precisione di classificazione vanno dal 75,0% al 81,4%. firme Multi-gene sono stati controllati per la stadiazione del cancro. Ad esempio, due firme sono risultati essere particolarmente efficace nella stadiazione del cancro, vale a dire un gruppo di 10-gene (CPS1 + DEFA5 + DES + DMN + GFRA3 + MUC17 + OR9G1 + REEP3 + TMED6 + TTN) e un gruppo 9-gene (DPT + EIF1AX + FAM26D + IFITM2 + LOC401498 + OR2AE1 + PRRG1 + REEP3 + RTKN2) , che può distinguere la precoce e avanzati tumori gastrici dal resto dei campioni (compresi campioni di controllo) con contratti di 90,0% e 84,0% rispettivamente. La precisione classifica generale sui tre gruppi, in anticipo, avanzata e di controllo, è il 71,4%.

L'analisi funzionale su questi geni firma rivelato qualcosa di interessante. Per esempio, tra i prodotti proteici di early-stage firma geni, GFRA3
, MUC17
, OR9G1
, REEP3 e TMED6
sono proteine ​​di membrana , per lo più recettori che trasducono segnali extracellulari. DEFA5
è un peptide microbicida creduto di essere coinvolti in difesa ospite che è altamente espresso nel ileo [16]. CPS1
, DES e TTN
sono coinvolti in molteplici processi metabolici, la funzione muscolare e la fase M del ciclo cellulare mitotico, rispettivamente. Noi ipotizziamo che questi geni SEGNALAZIONE e immuno-correlate possono rappresentare l'anomalia precoce delle cellule dei tessuti durante l'oncogenesi in generale.

Alcuni geni sono risultate sia la classificazione del cancro e le firme di sosta, come CPS1, DES, GFRA3, TMED6 e DPT, indicando una certa rilevanza biologica tra differenziazione e la progressione del cancro. Abbiamo poi esaminato se l'espressione genica di firme di sosta sono associati con fasi patologiche. Tra questi, quelli altamente correlato con diverse fasi patologiche sono LANCL3
, MFAP2 e PPA1
(figura 4), che mostra coerente monte ea down-regulation, rispettivamente, con la progressione del cancro.

D. L'identificazione di geni differenzialmente espressi-indipendente dei gradi di cancro e delle fasi

In aggiunta alla espressione differenziale specifico per alcuni sottogruppi di cancro gastrico, abbiamo anche esaminato se alcuni geni differenzialmente espressi nel carcinoma gastrico in generale, a prescindere gradi e le fasi. 62 tali geni sono stati trovati con l'espressione differenziale coerente da parte a cambiamenti almeno 2 volte nel cancro contro
corrispondenti tessuti di riferimento. Abbiamo notato che sono per lo più coinvolti nei processi extracellulari, come adesione focale, CAM, giunzione a tenuta, recettore citochina-citochine e l'interazione ECM-recettore, la cascata di attivazione del plasminogeno, così come i percorsi di segnalazione, compresi segnalazione Wnt e segnalazione integrina, che sono strettamente pertinenti crescita cellulare e controllo della proliferazione cellulare. Ricerca contro il nostro database in-house (http://bioinfosrv1.bmb.uga.edu/DMarker/), che comprende i set di dati di microarray pubbliche da GEO [17], Oncomine [18] e SMD [19], che copre oltre 53 malattie umane, tra cui il cancro, abbiamo scoperto che i pattern di espressione differenziale di 15 geni sono altamente specifico per il cancro gastrico, come ad esempio GKN2, CLDN7, Thy1, GIF e PGA4, mentre molti altri sono generali a più tipi di cancro. Ad esempio, i più generali includono alcuni membri della famiglia del gene del collagene (COL1A2, COL3A1 e COL1A1), il Carcinoembrionario legati molecole di adesione cellulare (CEACAM6), metalloproteinasi della matrice (MMP1, MMP7 e MMP12), topoisomerasi (TOP2A) e fosfoproteina secreto (SPP1).

Solo tre, CLDN7
, CLDN1 e DPT
, di questi geni sono significativamente differenziata in tutti i gradi o fasi di cancro gastrico. Possiamo vedere dalla Figura 5A e 5B che sia CLDN7 e CLDN1 Quali sono altamente espresso nel cancro contro
campioni di controllo attraverso tutti i gradi e fasi, con un moderato aumento nei tessuti precoce del cancro, mentre DPT
è stato down-regolato in tutti questi gruppi. Il pattern di espressione coerente in tutti i sottogruppi di cancro può indicare che questi geni partecipano a molte delle principali vie biologiche coinvolte nella formazione del cancro e nella progressione. Come è noto, le due proteine ​​Claudin, claudina-1 e claudina-7, sono proteine ​​integrali di membrana fondamentale per la formazione di giunzioni strette, mantenendo adesione cellula-cellula e regolare paracellular e trasporto transcellulare di soluti attraverso epiteli umana e endoteli, che sono differenzialmente espressi in vari tipi di cancro, come neoplasia cervicale [20], il carcinoma renale [21] e un tipo intestinale del cancro gastrico [22]. Dermatopontin ( TPD
) è una proteina della matrice extracellulare funge da collegamento di comunicazione tra la superficie cutanea delle cellule dei fibroblasti e la sua matrice extracellulare. La sua espressione ridotta è stata trovata anche in entrambi i leiomiomi uterini e cheloidi [23]. Il ROC mostrato in Figura 5C indica che questi geni potrebbero eventualmente essere usati come marcatori efficaci per la diagnosi del cancro gastrico in generale.

E. La verifica delle firme identificati sulla serie di dati pubblici

I pattern di espressione dei nostri geni firma identificati sono stati controllati nei confronti di due set di dati pubblici, vale a dire, il Kim
e Takeno
set di dati (vedi Materiali e Metodi), per determinare la generalità di queste firme gene. Come mostrato in figura 6, la distribuzione dei differenziali di espressione tra i nostri dati e la Kim
set di dati è significativamente concordante, indicando che l'applicabilità generale dei nostri marcatori identificati. Su 19 e 12 geni sovrapposte dalle sopra individuate gradi-correlati e l'elenco gene fase-correlato, 10 e modelli di espressione 5 mostrano simili in tutta tumori di grado G1-2 /G3-4 e le fasi I-IV in Kim
dati, rispettivamente, che riflette una elevata consistenza in pattern di espressione di questi geni tra i diversi set di campioni.

nel complesso, la nostra firma 19-gene per i gradi di cancro buoni risultati sul Kim
dati e ha ottenuto 78,0% di precisione di classificazione sulla convalida incrociata di 5 volte in termini di distinguere mal di tumori altamente differenziati. Allo stesso modo, le firme due stadi (10-gene e gene-9 gruppi) ottenuti rispettivi precisioni di 84,0% e del 76,0% sul Kim
set di dati. La firma 198-gene non è stato controllato dal momento che il Kim
dataset fornisce solo piegare-cambiamento, invece di dati di espressione grezzi.

È interessante notare, abbiamo notato che non vi è moderata correlazione tra l'espressione genica della nostra gruppi firma identificati e recidiva del cancro sulla base delle informazioni recidiva peritoneale dei dati di Takeno [24]. In particolare, le quattro firme, 19-, 198-, 10- e 9-gene gruppi, in grado di prevedere la recidiva peritoneale con una precisione complessiva del 66,0%, 87,2%, 73,0% e 55,3%, rispettivamente, distinguendo tra la relapse- pazienti liberi e peritoneale-recidiva nello studio di Takeno [24].

Discussione

microarray di espressione genica analisi su cancro gastrico hanno precedentemente identificato modelli di espressione genica per la prognosi previsione [25], [26] e la diagnosi del cancro in generale [27], [28] (come nella Tabella recensione S6), ma nessuno per gastrica sottotipo di cancro o di classificazione. Qui, abbiamo presentato una analisi su 54 coppie di tumore e dei tessuti adiacenti di riferimento dallo stesso numero di pazienti affetti da cancro gastrico, e firme molecolari identificate per gradi di cancro e tappe.

E 'noto che diverse di classificazione e analisi dei geni di selezione può portare a diverse firme genetiche, che presentano un grave problema per la stabilità e l'utilità delle firme geni selezionati. Per far fronte a questo problema, abbiamo applicato le ricerche esaustive per le firme k-gene (k < = 4) accoppiato con un robusto procedura di selezione funzione con voto a maggioranza per k > 4, che garantisce la stabilità dei geni firma identificati. D'altra parte, a causa della natura complessa dei dati cancro espressione genica, la convinzione generale è che diverse tecniche di classificazione possono dar luogo a diverse segnature ma di pari importanza in quanto possono corrispondere a differenti percorsi associati ai diversi aspetti di un cancro . In aggiunta a queste variazioni tecniche, la dimensione del campione limitato e l'eterogeneità esistente fra i sottogruppi di cancro sono noti come altri importanti fattori che influenzano gli indicatori selezionati.

In conclusione, abbiamo dimostrato qui che i modelli di espressione genica può essere utilizzato come firme efficaci per gastrico grading cancro e staging, nonché previsione prognostico. Sono stati proposti due tipi di firme per servire diversi scopi diagnostici, ciascuna delle quali mostra una certa rilevanza per malignance cancro e nella progressione del cancro. Tali tentativi di utilizzare molecolari di grado e stadio firme sono tenuti a beneficiare in modo significativo allo sviluppo della medicina personalizzata e possono portare a nuovi marcatori sierici.

Materiali e Metodi

tessuto Campioni

I campioni sono stati prelevati da tumori gastrici maligni primitivi da pazienti non trattati durante la procedura chirurgica iniziale a tre ospedali affiliati del Jilin University college of Medicine e Jilin Provinciale Cancer Hospital, Changchun, in Cina. Per ogni campione di tessuto del cancro, un campione di tessuto di riferimento corrispondente è stato raccolto dalla regione noncancerous adiacente che il chirurgo resecato per assicurare margini positivi. Tutti i campioni sono stati snap-congelati in azoto liquido entro 10 minuti dopo escissione e conservati a -196C fino estrazione di RNA. Per l'isolamento di RNA, sono stati utilizzati 100 sezioni micron di ciascun campione.

Tutte le cartelle cliniche e le sezioni di cancro sono stati esaminati da un patologo chirurgica, e la diagnosi istologica e la classificazione TNM sono state fatte in base ad universalmente Health Organization (OMS) criteri e il sistema di classificazione dell'Unione Internazionale contro il Cancro. I campioni di riferimento sono stati sottoposti ad analisi istologica meticolosa per garantire la completa assenza di cellule tumorali. Consenso informato scritto è stato ottenuto da tutti i pazienti, che è stato approvato dal Consiglio Institutional Review presso l'Università della Georgia, Athens, Georgia, Stati Uniti d'America e dalla IRB cinese supervisione soggetti umani a Jilin University College of Medicine e l'Ospedale di Jilin Provinciale Cancro, Changchun , Cina.

informazioni dettagliate paziente come l'età, il sesso, il tipo istologico, grado differenziale, stadio patologico e la storia di uso di alcol /fumare è elencato nella tabella S5.
esperimenti

microarray

I campioni di RNA sono stati analizzati utilizzando il GeneChip umano Exon 1.0 ST (Affymetrix), seguendo il protocollo dettagliato nel Espressione GeneChip manuale Analisi tecnica (P /N 900.223) per l'esperimento matrice e una precedente relazione [29]. I microarray sono stati digitalizzati utilizzando lo scanner GeneChip 3000 con GeneChip Operating Software (GCOS). Tutti i dati è conforme MIAME e dati grezzi è stato depositato nel database GEO (ID: GSE27342).

microarray analisi dei dati

Risultati di espressione genica sono stati sintetizzati in base a intensità sonda prime che utilizzano il Multichip Robust medio [30] e il pacchetto APT (http://www.affymetrix.com/partnerSupplementaryprograms/programs/developer/tools/powertools.affx), seguendo tre fasi principali, tra cui correzione del fondo, la normalizzazione quantile e log2-trasformazione. I geni che hanno molto bassa espressione in entrambi i campioni di cancro e di riferimento sono stati rimossi; nello specifico, un gene è stato rimosso se massima (Expr.cancer, Expr.normal)
era inferiore a 4 (intensità del segnale normalizzato).

Due diverse strategie sono state applicate per la valutazione del gene significato, a seconda upon quali condizioni sono stati confrontati e se accoppiati o campioni spaiati devono essere utilizzati. Per il confronto dei tumori contro i gruppi campione di controllo, i test non appaiati sono stati condotti per verificare se due gruppi di espressione sono diversi, mentre i test appaiati sono stati applicati per esaminare la consistenza di cambiamenti di espressione in tutte le coppie. Oltre al Wilcoxon test, abbiamo anche applicato un altro test statistico semplice per individuare geni con espressione differenziale consistente nel cancro contro
tessuti di riferimento, come segue. Per ogni gene, K exp
, il numero di coppie di tessuti cancro /di riferimento la cui espressione fold-cambio (FC) è più grande di k
(ad esempio, k
= 2) è stato esaminato; se il valore P per l'osservato K exp
è inferiore a 0,05, il gene è stato considerato essere differenzialmente espressi nella maggioranza delle coppie cancro e riferimento tissutali (visualizzare le informazioni di supporto). Il nostro P-value calcolato non è stato regolato sul test ipotesi multiple per evitare perdite di geni che possono essere potenzialmente efficace nella fase di classificazione successiva.

selezione Gene e classificazione

Per k firme -Gene (k < = 4), abbiamo condotto una ricerca esaustiva per tutte le combinazioni di k-gene tra i geni differenzialmente espressi, identificati dal passaggio precedente, utilizzando un SVM approccio basato classificazione lineare e la precisione complessiva è stata valutata usando 5 volte la convalida incrociata. Per k > 4, un approccio diverso utilizzando una ricerca euristica è stato applicato dal momento che la ricerca esaustiva è troppo tempo per essere pratico per il nostro problema. I dettagli sono i seguenti.

L'intero set di dati di espressione è stato suddiviso casualmente in gruppi di formazione e di prova, ciascuna delle quali contiene la metà dei campioni. Questo è stato ripetuto per 500 volte per generare 500 set di dati di training /test per la classificazione. Un SVM lineare, è stato utilizzato per la formazione di un classificatore [31], [32]. Si costruisce una iper-aereo che separa due differenti classi di vettori di caratteristiche con un margine massimo. Questa iper-piano è costruito trovando un vettore w e una variabile b che riducono al minimo, che soddisfa le seguenti condizioni:

, per (campioni di cancro) e, (campioni normali). Qui, è una funzione vettoriale, è l'indice di gruppo, w è un vettore normale alla iper-plane, è la distanza dalla iper-plane all'origine ed è la norma euclidea w. Dopo la determinazione dei valori di W e B, un dato vettore x possono essere classificati utilizzando; un valore positivo o negativo indica che il vettore x appartiene alla classe positivo o negativo, rispettivamente. firme Gene di ogni training set sono stati selezionati utilizzando la procedura di eliminazione funzione ricorsiva (RFE), che è un wrapper che seleziona i geni predittore eliminando i geni non predittori secondo una funzione del gene rango generato dal sistema di classificazione [33]. Il criterio classifica si basa sulla variazione della funzione obiettivo sulla rimozione ciascun gene. Per migliorare l'efficienza della formazione, tale funzione obiettivo è rappresentato come una funzione di costo J
per il I
caratteristica -esimo, calcolato utilizzando l'allenamento impostato solo. Quando un gene viene rimosso o il suo peso w i è ridotto a zero, il cambiamento nella funzione di costo J (i)
è dato da. Il caso corrisponde alla rimozione del i
gene -esimo. La variazione della funzione di costo indica il contributo del gene alla funzione di decisione e serve come un indicatore della graduatoria gene
.

I 500 insiemi formazione /test sono stati divisi casualmente in 10 gruppi di campioni. Ogni campione è stato poi utilizzato per ricavare una firma, basato sul voto di maggioranza e valutazione della consistenza gene rango tra i set di formazione e di prova 50. I 10 firme diverse derivati ​​dai 10 gruppi sono stati confrontati per valutare il livello di coerenza tra i geni selezionati. In ogni gruppo, sottoinsiemi di geni sono stati selezionati da RFE-SVM da ogni training set, e la performance sui sottoinsiemi è stato valutato dal set di test associato. Per derivare un gene classifica criterio coerente per tutte le iterazioni, un RFE funzione di rango ad ogni iterazione passo è stato derivato da un classificatore SVM che ha dato la migliore precisione media classificazione negli set di test 50.

dati di microarray pubblici del cancro gastrico

Due set di dati di microarray pubblici sono stati scaricati dalla banca dati GEO per gli studi comparativi, il Kim
(GSE3438) e le serie di dati Takeno
(GSE15081). Il primo [34] include l'espressione genica di 50 pazienti affetti da cancro gastrico (dalla Corea) in diverse fasi e livello di differenziazione, che è stato utilizzato per verificare la coerenza delle nostre firme identificati. I dati Takeno [24] include 141 primari tessuti di cancro gastrico dopo l'intervento chirurgico curativo, con informazioni recidiva peritoneale di follow-up. Questi gruppi di dati forniscono il rapporto log2 normalizzato di tumore e di espressione normale.

Informazioni di supporto
Tabella S1.
Statistiche di 452 geni che sono differenzialmente espressi in qualsiasi gruppo di quattro gradi, determinato utilizzando i seguenti criteri: i livelli di espressione in Cancro e il corrispondente tessuto spettacolo di controllo delle modifiche almeno 2 volte, e il cutoff per la significatività statistica di avere questo livello di cambiamento di espressione è P
-value < 0.05
doi:. 10.1371 /journal.pone.0017819.s001
(XLSX)
Tabella S2.
99 geni hanno la loro espressione cambia perfettamente in correlazione con i gradi di WD-MD-PD-UD (| CC
| = 1, p
-value < 0,05).
doi: 10.1371 /journal.pone.0017819.s002
(XLSX)
Tabella S3.
Lista dei nomi gene della firma 198-gene, tra i quali 39 sono gene grado-correlato. CC:. Coefficiente di correlazione
doi: 10.1371 /journal.pone.0017819.s003
(XLSX)
Tabella S4.
Elenco dei 40 geni di firma che si trovano in particolare per il gruppo WD; 18, 20 e 255 geni sono specifici per il gruppo MD, PD e UD rispettivamente
doi:. 10.1371 /journal.pone.0017819.s004
(XLSX)
Tabella S5.

Other Languages