Stomach Health > želudac Zdravlje >  > Gastric Cancer > Rak želuca

PLoS ONE: računalna je metoda za prognozu za izlučivanje proteina i primjenom na Identifikacija rak želuca markere u mokraći

Sažetak pregled

A nova računalna metoda za predviđanje proteina izlučuje u urinu je predstavljena. Metoda se temelji na identifikaciji liste razlikovnih značajki između proteina pronađenih u urinu zdravih ljudi i proteina za koje se smatra da ne bude urin za izlučivanje. Te značajke koriste trenirati klasifikator razlikovati dvije klase proteina. Kada se koristi u kombinaciji s podacima od kojih su proteini različito izraženi su u oboljelim tkivima određenog tipa u odnosu na pregled kontrolnih tkiva, ova metoda se može koristiti za predviđanje potencijalnih urina markera za bolesti. Ovdje smo izvješće s pojedinostima algoritam ove metode, a zahtjev za utvrđivanje markera urina za rak želuca. Performanse trenirao klasifikatora na 163 proteina eksperimentalno provjerena pomoću polja antitijela, postizanje > 80% istina pozitivnu stopu. Primjenom klasifikator na različito izraženim genima kod raka želuca vs pregled normalnim želučanog tkiva, utvrđeno je da endotelne lipaze (EL) znatno je potisnuto u uzorcima urina od 21 bolesnika s rakom želuca u odnosu na pregled 21 zdravih pojedinaca. Sve u svemu, mi smo pokazali da naša prediktor urina excretory proteina je vrlo učinkovit i može potencijalno služiti kao moćan alat u potragu za bolesti biomarkera u urinu u cjelini pregled

Izvor:. Hong CS, Cui J, Ni Z, Su Y, Puett D, Li F, et al. (2011) računalna je metoda za prognozu za izlučivanje proteina i primjenom na Identifikacija rak želuca markere u mokraći. PLoS ONE 6 (2): e16875. doi: 10,1371 /journal.pone.0016875 pregled

Urednik: Vladimir Brusić, Dana-Farber Cancer Institute, United States of America pregled

Primljeno: 22. rujna 2010; Prihvaćeno: 31. prosinca 2010. godine; Objavljeno: 18. veljača 2011 pregled

Ovo je otvorenog pristupa članak distribuirati pod uvjetima deklaracije Creative Commons Public Domain koja kaže da, jednom stavljen u javnoj domeni, ovaj rad može slobodno reproducirati, distribuirati, prenositi, mijenjati, izgrađena na, ili na drugi način koristiti bilo tko za bilo koju zakonitu svrhu pregled

Financiranje:. Ova studija je podržan u sklopu koje je Nacionalna zaklada za znanost (CCF-0621700, DBI0542119004, 1R01GM075331), Jilin sveučilište, Sveučilište u Gruziji, Georgia Rak koalicija, Georgia Research Alliance i National Institutes of Health (1R01GM075331, DK69711). U financijeri nisu imali ulogu u studiju dizajna, prikupljanja i analize podataka, Odluka o objavi, ili pripremu rukopisa pregled

U konkurenciji interese.. Autori su izjavili da ne postoje suprotstavljeni interesi pregled

Uvod pregled

brz napredak omic
tehnike u posljednjih nekoliko godina je napravio to moguće za pretragu biomarkera za određene bolesti ljudi na sustavan i sveobuhvatan način, što znatno poboljšava našu sposobnost otkrivanja bolesti u ranim fazama. Većina ranijih istraživanja biomarkera bile su usmjerene na serumskih markera [1], uglavnom zbog poznatog bogatstvu serumu sadrži signale za razne fizioloških i patofizioloških stanja. Pregled

U usporedbi s serumskih markera, postojeće mokraćnog markeri su uglavnom se odnosi na poremećaj urinarnog trakta, ili blisko povezanih bolesti. Samo u posljednjih nekoliko godina poboljšala proteomsku analize uzoraka urina pokazala da je, kao serumu, urinu je također bogat izvor informacija za otkrivanje ljudskih bolesti poput graft- u odnosu na
-host bolesti i bolesti koronarnih arterija [2], [3], [4]. Imajte na umu da mokraća nastaje filtracijom krvi kroz bubrege; pa neki proteini u krvi mogu proći kroz filtre te se izlučuje u urinu. Kao rezultat toga, mokraćnog proteina ne samo odražavaju uvjete bubrega i urogenitalnog trakta, ali i onih iz drugih organa koji mogu biti udaljeniji od bubrega, što je najmanje 30% mokraćnih proteina nisu porijeklom iz urogenitalnog trakta [5], [6]. Pletora informacija u urinu atraktivnim izvor biomarkera screening od čini, u odnosu na serum, sastav urina je relativno jednostavna, i prikupljanje urina je lakše i neinvazivna [7], [8]. Pregled

Marker identifikacija u mokraći potencijalno moglo biti učinjeno kroz komparativne proteomsku analizu uzoraka mokraće bolesnika s određenim skupinama bolesti i kontrole. Izazov u takvim potragama za urinarnog markera u slijepoj način je dvojak. (A) Mokraća može imati veliki broj proteine ​​/peptide (za razliku od prethodnog razumijevanja [8]), s relativno niskim izobilju. (B) dinamički raspon u obilju tih proteina može obuhvatiti nekoliko redova veličine, širi od raspona obično pokriveno masovne [9] spektrometru. Iz tih razloga, usporedne analize, konkretno (polu) kvantitativna analiza, od proteomskom podataka uzoraka urina može biti vrlo izazovna. To bi mogao biti ključni razlog da ne postoje pouzdani urina markeri za dijagnozu raka. Pregled

Naša studija fokusira na razvoj računalnom metodom za točno predviđanje proteina koji su urin za izlučivanje (vidi sliku 1 za obrisa pristupa ). Ovi proteini moraju imati specifična svojstva koja omogućuju im da se luče iz stanica, a zatim se filtrira kroz glomerula membrane u bubrezima. Nedavna proteomske Studija je utvrdila više od 1.500 proteine ​​/peptide koji se izlučuju u urin kroz zdrave glomerularnim membrane [8]. Koristeći ovaj skup proteina i proteina za koje se smatra da ne bude urin za izlučivanje, identificirali smo popis određena svojstva između ovih dviju klasa proteina i osposobljeni za podršku vektor stroja (SVM) temelji se klasifikator za predviđanje li dati protein može se izlučuje u urinu , Metoda predviđanja eksperimentalno provjerena pomoću polja antitijela u suradnji s Western blot, a rezultati su vrlo ohrabrujući. Pregled

Ovaj klasifikator je primijenjen predvidjeti proteine ​​koji mogu biti prisutni u mokraći na temelju identificiranih različito izraženim gena u raka želuca u odnosu na pregled referentni želučane tkiva; a broj potencijalnih urina markera za rak želuca su identificirani. Ključni doprinos u ovom radu je da pruža novi i učinkovit način voditi proteomsku studije urina sugerirajući marker kandidat proteina, a time omogućujući ciljane marker pretraživanja pomoću tehnike posredovane antitijelima kao što su Western blot i Elisa, koji su znatno isplativiji od velikih usporedne proteomsku analizu uzoraka mokraće bez ikakvih ciljeva s kojima se radi. Iako je ovo predviđanje Program primjenjuje se na podatke s rakom želuca u ovoj studiji, bez želuca informacije rak specifičan je korišten u ovom programu; dakle, može se koristiti za urina marker pretraživanja za druge bolesti pregled

Metode pregled

Ova studija sastoji se od tri glavne komponente:. (i) izgradnje klasifikatora za predviđanje urina luči proteine; (Ii) procjena uspješnosti klasifikatora strane primjenjujući ga na skup proteina za koje se zna luči status proteina; i (iii) primjena validirane klasifikatora do genske ekspresije podataka raka želuca da pokaže svoju učinkovitost u rješavanju urin marker za identifikaciju problema. pregled

Ovo je istraživanje odobreno od strane Institutional Review Board na Sveučilištu u Georgiji, Athens, Georgia, SAD (Ured potpredsjednika za istraživanje DHHS Assurance ID. FWA00003901, projekt broj 2009-10705-1) i od strane kineske Institutional Review Board nadgledanje ljudskih predmete u Jilin University College of medicine, Changchun, Kina. Obrazac za pristanak, odobren od strane IRB na Sveučilištu u Georgiji i kineskog IRB, iz svake teme. Svi ispitanici su svjesni da svi podaci iz istraživanja mogu se koristiti za dokumente ili publikacijama kao što je navedeno u obrascu za pristanak. Pregled

a. Algoritam za predviđanje luči proteine ​​pregled

Opća razumijevanje izlučivanje proteina iz tkiva do urina je da su neki proteini luče ili procurila iz stanica u krvotok, a onda dio tih proteina, uz neke prirodne proteine ​​u krvi, može se izlučuje u urinu. Naši ciljevi su prvi identificirati razlučne oznake za takve urina excretory proteina, a zatim izgraditi klasifikator na temelju tih mogućnosti predvidjeti koji proteina u stanicama mogu se izlučuje u urinu. Koliko je nama poznato, nije došlo do bilo objavljeno djelo s ciljem da se riješi ovaj problem. Važnost u vlasništvo takvu mogućnost je da pruža efektivnu vezu u povezivanju omic pregled analize tkiva do markera pretrage u urinu pružajući markere kandidatima u urinu koje se mogu proučavati pomoću pristupa na osnovi antitijela. Pregled

prvi korak u razvoju takve sposobnost predviđanja, odnosno u klasifikator, je da imaju trening skupa podataka koji sadrži proteine ​​koji mogu i da se ne može izlučuje u mokraći, na temelju kojih bi moglo biti identificirani skup razlikovnih obilježja. Srećom, našli smo jednu veliku proteomski skup podataka o uzorcima urina od zdravih ljudi u nedavno objavljenoj studiji [8], koji sadrži više od 1.500 jedinstvenih proteina od kojih je 1.313 imaju ID pristupnih Swissprot. Mi smo koristili te 1.313 proteine ​​i podatke pozitivnim osposobljavanja za to-biti obučeni klasifikatora. Sljedeći postupak je potom korištena za generiranje negativan niz treninga: proizvoljno odabrati najmanje jedan protein iz svake obitelji Pfam koji ne sadrži bilo koji pozitivan podatke treninga, a broj odabranih proteina iz svake obitelji je proporcionalna veličini obitelji [ ,,,0],10], [11]. Kao rezultat toga, 2,627 proteini su odabrani i korišteni kao negativna trening seta. Pregled

Ispitivan 18 fizikalno značajke izračunate iz proteinskih sekvenci koje su potencijalno korisni za problem klasifikacije na temelju opće razumijevanje mokraći proteina , Pojedinosti o 18 mogućnosti i računalnih programa koji se koriste ih izračunati navedene su u tablici S1. Neke značajke su predstavljeni više imaju vrijednosti, na primjer, pripravak aminokiselina u proteinskoj sekvenci predstavljen 20 imaju vrijednosti; Ukupni su 18 značajke su predstavljeni pomoću 243 igranih vrijednosti. Zatim smo identificirali podskup značajke vrijednosti od 243, koji se može razlikovati pozitivne i podataka negativnih treninga pomoću SVM-based klasifikator je. Je RFB kernel se koristi u našoj SVM treninga, obzirom na svoju sposobnost da obrađuju nelinearnih atribute [12], [13]. Pregled

Da bi se ustanovilo koji je od prvobitno smatrali mogućnosti su zapravo korisni, alat za odabir karakteristika koja se dobiva u LIBSVM [12] se koristi za odabir najzahtjevnije značajke među 243. Ostale selekcije značajka alata mogla bi se primijeniti, ali imamo veliko iskustvo u korištenju ovog alata i pronašao da bude adekvatna. Kodovi koji se koriste u ovom su javno dostupni od LIBSVM web stranici (http://www.csie.ntu.edu.tw/~cjlin/libsvm/); Također smo napravili relevantnu programa dostupan na http://seulgi.myweb.uga.edu/files. F-vrijednost [12], definirana na sljedeći način, koristi se za mjerenje svakoj moć svakog igrani vrijednosti za naše klasifikacije problema, pregled

gdje se odnosi na trening ima vrijednosti (k = 1, ..., m); N pregled + i N pregled - je broj proteina u pozitivnom (+) i negativnog (-) trening set podataka, odnosno; ,, Prosjeci su i
th igrani vrijednosti preko cijelog treninga naziv, pozitivan naziv i negativnog naziv, odnosno; a te su i
th značajka k pregled og proteina u podacima o pozitivnim i negativnim trening, respektivno. Općenito, što je veći F-rezultat, više diskriminativan odgovarajući značajka. U našem izboru, sve značajke s F-ocjenama iznad unaprijed odabranog praga su zadržane i koriste u obuci konačnu klasifikatora. Da biste pronašli optimalan prag F-score, smatra da popis mogućih pragova, a zatim se bira najbolji na temelju rezultata obuke. Pregled

Trening našeg SVM-based klasifikatora obavlja se korištenjem standardnog postupka predviđeno u LIBSVM [12] kako bi pronašli vrijednosti dva parametra C pregled i γ koji daju optimalnu klasifikaciju podataka za trening, gdje je C pregled kontrolira kompromis između pogrešaka obuke i klasifikacijskih margine, a γ određuje širinu kernel koristi [12]. Naš postupak trening je sažeti kako slijedi [12]: pregled

  • Nabavite F-rezultat za svaku značajku vrijednosti, pregled
  • Za svaki od prethodno odabrane pragova, učinite sljedeće
  • Uklonite značajka vrijednosti s F-bodova niže od praga, pregled
  • Nasumično podijeliti podatke treninga u pod-trening i sub-validation setovi s jednake veličine; pregled
  • Vlak je SVM s RFB kernel na sub-trening set za traženje optimalnih vrijednosti C Netlogu i y, a zatim ga primijeniti na podatke o sub-validacije i izračunati pogrešku klasifikacije; pregled
  • Ponovite korake (i) - (iii) pet puta, a izračunati prosječnu pogrešku valjanosti;
  • Odaberite prag koji daje najnižu prosječnu pogrešku provjere valjanosti, a zadržati značajke s F-score iznad odabranog praga; i pregled
  • Ponovo je SVM na temelju odabranih značajki kao konačni klasifikatora.

    b. Skupovi podataka koji se koriste za procjenu uspješnosti klasifikatora Netlogu

    Nezavisni skup podataka korišten je za procjenu učinkovitosti trenirao klasifikatora za koje je poznato luči status svakog proteina. Pozitivna Podskup ovog skupa podataka je 460 humanih proteina koji se nalaze u mokraći zdravih osoba tri mokraćnog proteomike studije [14], [15], [16], a negativna podskup sadrži 2.148 proteine ​​izabrane koristeći isti postupak je prije opisano, ali ne ne preklapaju s negativnom set koji se koristi za obuku pregled

    korištene su sljedeće mjere za procjenu klasifikacije točnosti. osjetljivost, specifičnost, točnost, koeficijent korelacije je Matejev, a AUC [17]. Tablica 1 sažima klasifikacije točnosti treniranog klasifikatora na oba treninga a test skupova podataka [17]. Iz klasifikacijski točnosti na dva skupa podataka, vjerujemo da je naša obučeni klasifikator zarobljeni ključne različite značajke luči proteine ​​u urinu. Pregled

    Osim toga, naš klasifikator je testirana na posebnom skupu podataka, podskup 274 proteini pričvršćuju na pre-made niz proteina antitijelo (RayBio Human G-serije Array 4000 (RayBiotech, Inc., Norcross, GA)). Od 274 proteina, 111 Poznato je da su za izlučivanje i bili uključeni u našem treningu ili neovisnog podataka. Primijenili smo klasifikatora na preostalim 163 proteina za koje se luči je status nepoznat (vidi rezultate i Tablica S2). Ovaj protein polje omogućava relativne razine ekspresije za svaki protein na polje kada je testiran na (mokraće) uzorka, koja se mjeri s obzirom na intenzitet signala, kvantifikacija se vrši u densitometrijom. Pozadina polja se koristi kao kontrola za određivanje stvarne prisustvo proteina u (mokraće) uzorka. Intenzitet signala za protein se smatra kao pravi signal ako je barem 5 puta viša od one kontrole, kao što je predložen po preporuci proizvođača. Usredotočili smo našu eksperimentalnu provjeru valjanosti potvrđuje pozitivna predviđanja samo jer je gotovo nemoguće dokazati protein nije prisutan u uzorku urina zbog ograničenja u osjetljivosti detekcije trenutnom tehnologijom, kada je protein vrlo niske koncentracije u uzorku.

    c. Urin uzorak skup /priprema pregled

    uzorcima urina iz pacijenata oboljelih od raka želuca i zdravih kontrola prikupljeni su na Medicinskom fakultetu Sveučilišta Jilin, Changchun, Kina. bolesnici rak želuca, od koga su prikupljeni uzorci iz, sve su to u kasnoj fazi bolesnika (vidjeti Tablicu S3 za podatke pacijenta). Ovi uzorci su odmah liofilizirane i pohranjeni na -80 ° C do daljnje upotrebe nakon njihove kirurško uklanjanje iz pacijenata. Su zatim otopiti i centrifugira (3.000 xg pregled tijekom 25 minuta na 4 ° C) da se ukloni stanični komponente. Supernatanti su sakupljeni i dijaliziran na 4 ° C protiv Millipore ultra čiste vode (tri promjene pufera, a zatim preko noći dijalizom) pomoću Slide-A-Lyzer dijalizu kaseta (Thermo Fisher Scientific, Rockford, IL). Koncentracija proteina je mjerena pomoću Bio-Rad protein assay (Bio-Rad, Hercules, CA) s goveđim serumskim albuminom kao standardom. pregled

    d. Identifikacija gena koji su različito izraženi u rak želuca i kontrole tkiva pregled

    Ukupno 80 želučanog tkiva raka i njihovih susjednih noncancerous tkiva iz 80 pacijenata prikupljenih na Medicinskom fakultetu Sveučilišta Jilin. Pokusi microarray su provedena na ovim tkivima pomoću Affymetrix GeneChip Ljudski egzona 1.0 ST Array, koji pokriva 17,800 ljudskih gena. Algoritam PLIER [18] je korišten sažeti sonde signale gena na razini izraza. Za svakog gena, ispitali smo distribuciju izraza višestruki broj promjena između uparenih raka i kontrole tkiva u svim 80 pari tkiva. Neka K exp,
    se broj parova tkiva čiji preklopive promjena najmanje 2. gen smatra različito izražena pregled ako je p
    -vrijednost promatrane K exp pregled je manji od 0,05. Koristeći taj kriterij, pronađeno je ukupno 715 gena koji se različito izraženo kod raka želuca u svim ljudskim genima, a imena 715 gena, zajedno s pripadajućim K exp pregled i p
    -values, dani su u tablici S4. Detaljna studija podataka microarray je prijavljen drugdje [19]. Pregled

    e. Funkcija i put obogaćivanje analizira pregled

    David Bioinformatika resursi i Kobaš web server [20], [21] su radili funkcionalnu i put za obogaćivanje analizu, odnosno, za sve predvidjeti urin-excretory proteina u, koristeći čitav niz ljudskih proteina kao pozadinu. Upućujemo čitatelje na [20], [21] Za detalje o metodama za analizu funkcionalne i put obogaćivanje. Korištenje David Bioinformatika Resources, obogaćivanje ocjenu za određene skupine proteina određen je lakoćom rezultatom [20], [22]. Kobaš je komplementarna alat za DAVID jer proširuje gena napomenu pomoću KEGG Orthology (KO) uvjete. Kobaš web server, uz napomena sustava za KO-based [21], [23], je bio korišten kako bi pronašli statistički obogatiti i podzastupljeni putova među predviđenim urin izlučuje proteine. Kobaš uzima u skup proteinskih sekvenci i bilješku o njima, koristeći izraze KO. Točku KO uvjeti su tada u odnosu na sve ljudske proteine ​​kao pozadinska set za procjenu ako su obogaćeni ili nedovoljno zastupljene. Pregled

    f. Western hibridizacija pregled

    mokraćnog proteina iz svakog uzorka (ukupno 2 ug) kombinirane su sa 3x uzorka boje. Svaka epruveta se kuha se 5 minuta i stavi se na SDS-PAGE gelovima, zajedno s 10 ul standarda i trajala 1 sat pri 200 volti. Membrana je aktiviran sa 100% metanola, nakon prijenosa iz gela na membranu (100 volti tijekom 1 h). Nakon prijenosa završeno, membrana se ostavi da se osuši, rewetted u 100% metanolu, a isprane 2X 5 min svaki s Tris-pufer otopini (TBS). Membrana je potom inkubirana u 3% otopinu mlijeko za blokiranje tijekom 2 sata na sobnoj temperaturi. Sljedeći je membrana inkubirana na prvom otopine antitijela (1:200 razrijeđenja u 1,5% mlijeka za blokiranje) tijekom 1 sata na sobnoj temperaturi, a nevezanog protutijela se ukloni ispiranjem membrana 3x sa TBS-Tween 20 (TBST) otopinu 10 min svaki. Tada je membrana inkubirana na 1:10,000 razrjeđenje sekundarnih protutijela u 1,5% otopini mlijeka za blokiranje tijekom 1 sata na sobnoj temperaturi. Membrana je isprana 3x s TBST i 2x sa TBS-om (10 min svaki put). Konačno, membrana je bila potpuno prekrivena s jednakom količinom prolaska i peroksida iz Pierce Western blot-a komplet za 5 minuta i izložena na filmu. Svaki eksperiment je ponovljen više puta kako bi se osiguralo reproducibilnost [24]. Intenziteta signala određene su pomoću softvera ImageJ [25]. Za svaku membranu, prazan linija korišten za normalizaciju intenziteta signala preko membrane. Predstava je ispitana je pomoću ROC i vlas-box zemljište. Pregled

    Rezultati i rasprava

    a. signalni peptid i sekundarne strukture su ključne značajke urin izluči proteina pregled

    Inicijalni popis značajki je pažljivo odabrana kako bi uključio ono što vjeruje da su karakteristike proteina važnih za mokraći na temelju pretraživanja literature i naše trenutno razumijevanje mokraćnog proteina. Na primjer, negativno nabijene glomerularne zid bubrega će omogućiti filtraciju samo pozitivno ili neutralno naelektriziranih proteina. Dakle, naboj proteina je jedna od značajki koje smo odabrali. Uzimajući dostupne informacije u obzir ukupan broj igranih vrijednosti prikupljenih u početku je bio 243, što predstavlja osnovna svojstva slijed, motive, fizikalno-kemijska svojstva i strukturna svojstva (tablica S1). Pri utvrđivanju značajke koje su učinkovite u diskriminirati urina luči proteine ​​od onih koji nisu excretory, jednostavan i učinkovit način kako bi se uklonili značajke koje pokazuju malo ili nimalo svakoj snage za naš klasifikacija problem bio zaposlen; 74 igranih vrijednosti su izabrani korištenjem postupka navedenih u odjeljku A od metoda (Tablica S5). Ove značajke su vrijednosti koriste za obuku konačni klasifikatora. Pregled

    Među odabranim značajkama, najviše diskriminirajući jedan je prisutnost signala peptida. Razumljivo je da proteini koji se izlučuju putem ER ima signala peptide i prodaju se na svoje odredište u skladu s posebnim signalnih peptida; dakle, nije iznenađujuće, većina izlučuju proteini imaju ovu značajku. Druga istaknuta značajka je tip sekundarne strukture; Naime, postotak alfa uzvojnice u nizu proteina bio je rangiran kao broj 2, igrani vrijednosti među odabranim 74 (Tablica S5). Kao što se i očekivalo, naboj proteina bio je među top rangirani mogućnosti za izlučuju proteine. To je u skladu s općim razumijevanjem da je potrošač čimbenik u određivanju koji proteini mogu se filtrirati kroz glomerularne membrane [26] kao i proteini unutar glomerularnim membrana i podocyte proreze su negativno nabijeni, a time i negativno nabijene proteini imaju niske šanse za filtriranje kroz bubrezi. Doista, značajka vrijednosti pozitivnih aminokiselina i zadužena su među top rangirani imaju vrijednosti. Pregled

    Zanimljivo je, međutim, molekularne težine, koja je zauzela na 232 od 243, nije uključena u krajnje 74 igranih vrijednosti. To bi se moglo objasniti u nastavku. Proteini prisutni u serumu može već prošli kroz rascjep ili su djelomično razgrađuje, te stoga ne mogu biti u netaknutoj ili potpunom obliku kada uđu u bubreg. To je, u stvari, utvrđeno je da je većina proteina pronađenih u urinu intenzivno razgrađuju [27]. Dok netaknuti protein ne može biti u mogućnosti filtrirati kroz glomerula zbog svoje veličine ili oblika, peptid protein-izvedeni može lako proći kroz podocyte proreze. Kao rezultat toga, molekulska težina netaknutog proteina je ne-faktor u predviđanju da se protein je urin izlučivanje. Pregled

    Treba napomenuti da se u urinu izlučivanja proteina i izlučeni proteini imaju neke zajedničke karakteristike kao neke od karakteristike korištene za identifikaciju krvi izlučuju proteine ​​u prethodnom istraživanju [10] su odabrani u predviđanju mokraćnog proteina u ovoj studiji. Na primjer, značajke kao što su pristupačnost otapala, polariteta i signalnih peptida bili uključeni u oba klasifikatora. Međutim, postoji jasna razlika između značajke koriste u dva klasifikatora. Dok značajke kao što su beta-cjedilu-sadržaja, značajke povezane s beta-barrel transmembranski protein i omjer proteina, TatP motiva, transmembransku domenu, veličini proteina i najduži neuređeni regije bili su među najboljim značajkama za predviđanje krvi izlučuje proteine ​​[10 ], oni nisu uključeni u završnoj mogućnosti za predviđanje mokraćnog proteina. Nadalje, karakteristike koje se odnose na pozitivni naboj, kao što je pripravak pozitivno nabijenih aminokiselina, bili su poznati u predviđanju mokraćnog proteina ali nisu odabrani u predviđanja sekrecije krvi. Slično tome, alfa-heliks-Sadržaj i zavojnica-sadržaj proteina bili su među glavnim značajkama za predviđanje mokraćnog proteina, ali oni nisu bili odabrani za predviđanje proteina u krvi izlučuje. Zanimljivo je napomenuti da za razliku od nalaza da beta trake su čest tip sekundarne strukture među izvodnih proteina u krvi, mokraćnog proteini imaju tendenciju da imaju višu alfa-uzvojnicu i sadržaj svitka, što ukazuje da su urinarni proteini posjeduju svojstva ne dijeli po krvnim izlučivanje proteina u cjelini. pregled

    b. Nastup klasifikatora Netlogu

    Da bi odredili točnost konačnog klasifikatora, mi ga testirali na neovisnog testa, koji se sastoji od 460 eksperimentalno potvrđene urina excretory proteina i 2.148 ne-urina excretory proteina. Naš klasifikator ima predviđenu osjetljivost i specifičnost na ovom neovisnog postavljena na 0,78, odnosno 0,92 (tablica 1). Pregled

    Nakon toga je vodio klasifikator na 163 od ukupno 274 proteina fiksne na pre-made protutijela niz (vidi Metode), za koje se luči status nije poznat. Od 163 proteina, 112 proteini su predviđeni da se urin za izlučivanje naš klasifikator. Za procjenu učinkovitosti ovog predviđanja, antitijela eksperimenti array-based su provedena na 14 uzoraka urina, sedam iz zdravih osoba i sedam od pacijenata s rakom želuca. Od 112 predviđenih urin-excretory proteina u 92 pronađeni su u najmanje jednom od uzoraka urina (tablica S6), što daje pozitivan predviđanja stopu 0,81, što je u skladu s razinom izvedbe na prvom ispitnom skupu. Pregled

    treba napomenuti da je jedan ograničenje ove klasifikatora je da neki proteini su možda djelomično razgrađuje prije nego što se izlučuje u urinu ili urinu, što je teško za naš klasifikator detektirati tako nastalih peptide kao što je bio uperen u cjelini netaknutih proteina. Ovo pitanje će se rješavati u budućnosti kroz izvođenje značajke vrijednosti temelji se na stvarnim proteine ​​/peptide identificirane u prethodnim mokraćnog proteomskom studija, a ne njihovih odgovarajućih full-length proteina kao što je učinio u ovoj studiji. Iako je očito prostor za daljnja poboljšanja, rezultati predviđanje tekuće klasifikatora su vrlo ohrabrujući. Pregled

    c. Primjena klasifikatora za rak želuca podataka Netlogu

    Naša ranija istraživanja na 160 kompleta microarray genske ekspresije podacima raka želuca od identificirao 715 različito izražene gene s najmanje 2-slojnim promjene karcinoma želuca u odnosu na
    kontrolni uzorci tkiva [19]. Iako bi bilo poželjno imati proteomsku podatke uzoraka tkiva, imamo samo genske ekspresije podataka dostupnih u ovoj studiji. Dakle, ekspresiju gena podaci se koriste kao aproksimacija za ekspresiju proteina u ovoj metodologiji orijentirana istraživanju. Naš klasifikator je primijenjena na tim 715 proteina, a to predvidio da 201 od 715 proteina su urin za izlučivanje. Tablica S7 pruža detaljne informacije o 201 proteina. Budući da je nerealno da provjerite sve 201 proteina u ovim istraživanjem kako bi se utvrdilo jesu li urin za izlučivanje ili ne, nismo analize suziti taj popis. Naime, mi smo provoditi sljedeće analize: (i) funkcionalne i put obogaćivanje analizira kako bi stekli bolje razumijevanje tipova proteina prisutnih u mokraći, (ii) za pretraživanje literature o mokraćnih proteina za prikupljanje podataka o objavljenim marker mokraćnog proteina, ( iii) ispitivanje podataka ekspresije gena za uklanjanje gena koji se nije značajno različito izraženih između raka i kontrolu uzorci tkiva; i (iv) Western blot o proteinima, izabranih između suzio popis 201 proteina. Ovaj postupak je pokazao visoku stopu uspjeha i dovelo do zanimljivog otkrića potencijalnog biomarkera raka želuca. Pregled

    (i), koje smo proveli funkcionalan i put obogaćivanje analize svih 201 proteina u koriste Davida [20 ] i Kobaš [21] poslužitelja, respektivno. Otkrili smo da su obogaćene funkcionalne skupine uključene u izvanstanični matriks (ECM), adheziju stanica i razvoj, staničnu pokretljivost, obrambeni odgovor, angiogeneze, koji su svi poznati da se uključe u razvoju ili u obrani od karcinoma (Slika S1A). Najviše obogaćene putevi su interakcije ECM-receptor i anorganski iona transport i metabolizam putevi (Slika S1B) pregled

    Sljedeći kriterij je korišten za smanjenje popis 201 proteina za korake (ii) - (iii). proteini nisu izvijestili da su povezani s bilo kojim raka na temelju našeg bogatog pretraživanja literature Netlogu koja je dovela do 71 proteina. Popis dodatno je smanjena na temelju prethodno odabranog prekinuta na diferencijalne izraza i funkcionalnih bilješke (potencijalno relevantne za rak želuca, a ne imunološkog odgovora). Pregled

    d. Endotela lipaze znatno je smanjen u uzorcima urina rak želuca pacijentima pregled

    Mi smo izabrali šest proteina (MUC13, COL10A1, AZGP1, LIPF, MMP3 i EL) za eksperimentalnu validaciju iz gore suzio popis. Da biste to učinili, mi smo prikupili uzorke urina od 21 bolesnika želučanog karcinoma i 21 zdravih pojedinaca. Od šest odabranih proteina, pet proteina, MUC13, COL10A1, LIPG, AZGP1 i EL su detektirani Western blot u najmanje jednom urina uzorku. Od pet, MUC13, COL10A1 i EL otkrivene su čak i pri vrlo niskim količine ukupnih mokraćnog proteina (1-2 ug). MMP3 nije pronađen u uzorcima koje smo testirali, što može biti zbog niske koncentracije MMP3 u mokraći ili lažnog predviđanja od strane našeg klasifikatora. Pregled

    Posebno je zanimljivo napomenuti da smo bili u mogućnosti detektirati konzistentne razlike u izobilju EL (kodiran LIPG Netlogu) između dva seta od 21 uzoraka urina. Zapadni mrlje za EL pokazala je značajno smanjenje u svom izobilju u uzorcima urina pacijenata oboljelih od raka želuca 21 u usporedbi s kontrolnim uzorcima. Kao što je prikazano na Slici 2A, većina kontrolnim uzorcima je pokazala prisutnost EL, a većinu uzoraka raka želuca ima razmjerno male količine EL. Ovaj uzorak je ponovilo pregled

    Molekulska težina ovog proteina je određena kao 68 kDa [28]. Tako, homo-dimer se očekuje da će biti 134 kDa. U Western blot, međutim, bendovi koji su dokazani u blizini od 100 kDa. To je vjerojatno odgovara djelomično cijepa homo-dimera, od kojih je aktivni oblik je potvrđeno prethodnom istraživanju [29], iako je mogućnost monomernog oblika EL povezan s drugim proteinom ne može se isključiti. http://csbl.bmb.uga.edu/~juancui/Publications/GC2009/Additional_material.pdf.
    doi:10.1371/journal.pone.0016875.s005
    (XLS)
    Table

  • Other Languages