Stomach Health > žalúdok zdravie >  > Gastric Cancer > žalúdočné Cancer

Ploche ONE: výpočtového modelu pre predikciu vylučovacích proteínov a aplikácie s identifikáciou na žalúdočné rakovinu markerov v Urine

abstraktné

je uvedený Román výpočtovej metódy pre predikciu bielkoviny vylučuje do moču. Metóda je založená na identifikáciu zoznamu rozlišovacích znakov medzi proteíny prítomné v moči zdravých ľudí a proteínov za to, že sa vylučovací moč. Tieto funkcie sú použité k vlaku klasifikátor rozlišovať dve triedy proteínov. Pri použití v spojení s informáciami, ktoré proteíny rozdielne exprimované v chorých tkanivách určitého typu proti
kontrolných tkanív, tento spôsob môže byť použitý pre predikciu potenciálne markery v moči ochorenia. Tu sme správu detailné algoritmus tejto metódy a aplikácie pre identifikáciu markerov v moči na rakovinu žalúdka. Výkon vyškoleného triediče na 163 proteínov bola experimentálne overená pomocou protilátok polí, dosiahnutie > 80% skutočne pozitívny sadzieb. Uplatnením klasifikátor na odlišne exprimovaných génov u karcinómu žalúdka vs
normálne žalúdočné tkaniva, sa zistilo, že endotheliální lipázy (EL) sa v podstate potlačená vo vzorkách moču z 21 pacientov s karcinómom žalúdka proti
21 zdravých jedincov. Celkovo sme preukázali, že naše prediktor pre moču vylučovacích proteínov je vysoko efektívny a mohol potenciálne slúžiť ako účinný nástroj v pátraní po chorobe biomarkerov v moči všeobecne

Citácia :. Hong SK, Cui J, Ni Z, su Y, Puett D, Li F, et al. (2011) výpočtového modelu pre predikciu vylučovacích proteínov a aplikácie s identifikáciou na žalúdočné rakovinu markerov v moči. PLoS ONE 6 (2): e16875. doi: 10,1371 /journal.pone.0016875

Strih: Vladimír brusič, Dana-Farber Cancer Institute, Spojené štáty |

prijatá: 22.září 2010; Prijaté: 31. Decembra 2010; Publikované: 18.február 2011

Toto je článok o otvorený prístup distribuovaný v súlade s podmienkami vyhlásenia Creative Commons Public Domain, ktorý stanovuje, že akonáhle umiestnil vo verejnej doméne, táto práca môže byť voľne reprodukovaný, distribuovaný, prenášaná, upravený, postavený na, alebo inak používať ktokoľvek, pre akýkoľvek zákonný účel

Financovanie :. Táto štúdia bola podporená čiastočne National Science Foundation (CCF-0621700, DBI0542119004, 1R01GM075331), Jilin univerzita, University of Georgia, Gruzínsko koalície proti rakovine, Gruzínsko Research Alliance a National Institutes of Health (1R01GM075331, DK69711). Platcovia mal žiadnu úlohu v dizajne štúdie, zber a analýzu dát, rozhodnutie publikovať, alebo prípravu rukopisu

Konkurenčné záujmy: .. Autori vyhlásili, že žiadne konkurenčné záujmy neexistujú

Úvod

rýchly pokrok vo HOSPODÁRSKE
techniky v posledných rokoch bolo možné hľadať biomarkerov špecifických ľudských chorôb v systematickým a komplexným spôsobom, ktorý je podstatne zlepšuje našu schopnosť detekovať choroby u ranej fáze. Väčšina predchádzajúcich štúdií biomarkerov boli zamerané na plazmatických markerov [1], a to najmä z dôvodu známeho bohatosti séra obsahujúce signály z rôznych fyziologických a patofyziologických podmienok.

V porovnaní s markerov v sére, moči existujúce značky sú väčšinou vzťahujúce sa k močového traktu alebo úzko súvisiacich chorôb. Len v posledných niekoľkých rokoch sa zlepšila proteomické analýzy vzoriek moču sa zistilo, že, rovnako ako séra, moču je tiež bohatým zdrojom informácií pre detekciu ľudských chorôb, ako je napríklad graft- proti
-host ochorenia a ischemickej choroby srdca [2], [3], [4]. Všimnite si, že moč je tvorená filtráciu krvi prostredníctvom obličiek; preto niektoré bielkoviny v krvi sa môžu prejsť filtre a byť vylučovaný do moču. V dôsledku toho, že bielkovín v moči nielen odrážať podmienky obličiek a urogenitálneho traktu, ale aj iných orgánov, ktoré môžu byť odvrátená od obličiek, ako aspoň 30% z bielkovín v moči, nie sú pôvodne z urogenitálneho traktu [5], [6]. Sa veľké množstvo informácií v moči robí atraktívny zdroj pre premietanie biomarkerov, pretože, v porovnaní so sérom, zloženie moču je pomerne jednoduchý, a zber moču je jednoduchšie a neinvazívne [7], [8].

Marker identifikácie v moči by mohlo byť potenciálne dosiahnuť prostredníctvom porovnávacích proteomických analýz vzoriek moču pacientov s konkrétneho ochorenia a kontrolných skupín. Výzvou v týchto prehliadok pre močových markerov v slepej móde je dvojaký. (A) na moč môže mať veľké množstvo proteínov /peptidov (na rozdiel od predchádzajúceho pochopenia [8]), s relatívne nízkou hojnosti. (B) Dynamický rozsah v množstve týchto proteínov mohla preklenúť niekoľko rádov, širšie, než je rozsah zvyčajne vzťahuje hmotnostným spektrometrom [9]. Z týchto dôvodov, porovnávacie analýzy, najmä (polo) kvantitatívnej analýzy, z proteomických dát vzoriek moču môže byť veľmi náročné. To by mohlo byť kľúčovým dôvodom, že neexistujú spoľahlivé markery v moči pre diagnózu rakoviny.

Naša štúdia sa zameriava na vývoj metódy pre výpočet presné predpovedajú bielkovín, ktoré sú vylučovací moču (pozri obrázok 1 pre obrys prístupu ). Tieto proteíny musia mať osobitné vlastnosti, ktoré umožňujú, aby boli vylučované z buniek a potom sa odfiltruje cez membrány v glomerulárnych obličiek. Nedávna štúdia proteomický identifikovaných viac než 1500 proteínov /peptidov, ktoré sa vylučujú močom cez zdravé glomerulárnych membránach [8]. Použitie tejto sady proteíny a proteíny nepovažuje za vylučovacej moču, sme identifikovali zoznam rozlišovanie funkcií medzi týmito dvoma skupinami bielkovín a cvičil support Vector machines (SVM) na základe klasifikátor predpovedať, či daný proteín môže byť vylučovaný do moču , Spôsob predikcie bol experimentálne overiť pomocou protilátok poľa v spojení s Western bloty, a výsledky sú veľmi povzbudivé.

Toto triedenie bola použitá k predpovede proteíny, ktoré môže byť vylučovaný do moču na základe identifikovaných odlišne exprimovaných génov rakovina žalúdka oproti Referencie žalúdočné tkaniva; a rad potenciálnych markerov moču pre rakovinu žalúdka boli identifikované. Významný príspevok sa v tejto práci je, že poskytuje nový a účinný spôsob pre vedenie proteomických štúdie moču tým, že navrhne kandidáta markerovej proteíny, a preto umožňuje cielené značkovacie vyhľadávanie pomocou techník sprostredkovaných protilátkami, ako je Western blot a ELISA, ktoré sú v podstate reálnejšieho než rozsiahlej porovnávacej proteomické analýzy vzoriek moču bez akýchkoľvek cieľov, s ktorým sa do práce. Aj keď táto predikcia program bol aplikovaný na dáta s karcinómom žalúdka, v tejto štúdii, žiadne žalúdočné informácie špecifické pre karcinóm bol použitý v tomto programe; preto môže byť použitá pre vyhľadávanie moču ukazovateľa pre iné ochorenie

Methods

Táto štúdia sa skladá z troch hlavných zložiek :. (i) konštrukciu triediče pre predikciu moču vylučovacou proteíny; (Ii) hodnotenie výkonnosti triediče o aplikácii na súbor proteínov, pre ktorých je vylučovanie stav proteínov známych; a (iii) aplikácia potvrdeného triedičky ku génovej expresie údajov rakovinou žalúdka, aby preukázala svoju účinnosť pri riešení moču identifikačná značka problém.

Tento výskum bol schválený Institutional Review Board na University of Georgia, Athens, Georgia, USA (úrad viceprezidenta pre výskum DHHS Assurance ID č. FWA00003901, Číslo projektu 2009-10705-1) a čínsky Institutional Review Board dohliada na ľudské bytosti, na Ťi-lin University College of Medicine, Changchun, Čína. Súhlas forma, ktorá bola schválená IRB na University of Georgia a čínske IRB, bola odobraná z každého predmetu. Všetky subjekty sú si vedomí, že všetky údaje z výskumu možno použiť pre dokumenty alebo publikácií, ako je uvedené v podobe súhlasu.

a. Algoritmus pre predikciu vylučovací proteínov

všeobecnom poňatí vylučovanie bielkovín z tkanív do moču je, že niektoré proteíny sú vylučované alebo unikli z buniek do krvného obehu, a potom sa časť z týchto proteínov, spolu s niektorými proteínmi v natívnej krvi, môže byť vylučovaný do moču. Naším cieľom je najprv identifikovať charakteristické rysy také moču vylučovacích proteínov a potom postaviť klasifikátor na základe týchto funkcií predpovedať, ktoré proteíny v bunkách môže byť vylučovaný do moču. Podľa našich najlepších vedomostí, tam nebol žiadny publikovaná kniha zameraná na riešenie tohto problému. Význam v tom, že takúto schopnosť je to, že poskytuje účinnú odkaz v spojovacej HOSPODÁRSKE
analýzy tkanív k hľadaniu markerov v moči tým, že kandidátne markery v moči, ktoré môžu byť skúmané za použitia prístupov na báze protilátok.

prvým krokom vo vývoji takéhoto schopnosť predpokladať, tj klasifikátor, je mať tréningový súbor dát, ktorý obsahuje bielkoviny, ktoré môžu a ktoré nemôžu byť vylúčená do moču, na základe ktorých by mohli byť prípadne zistené sada rozlišovacích znakov. Našťastie sme našli jednu veľkú proteomickou dátový súbor vzoriek moču od zdravých osôb v nedávno publikovanej štúdii [8], ktorý obsahuje viac ako 1500 špecifické bielkoviny, ktoré majú ID 1313 prístupová Swissprot. Použili sme tieto 1,313 proteíny ako pozitívne dáta na výcvik pre to-be-vyškolený triediči. Nasledujúci postup bol potom použitý na vytvorenie negatívnej trénovací množinu: ľubovoľne vybrať aspoň jeden proteín z každej rodiny pfam, ktorý neobsahuje žiadny pozitívny testovacie dáta, a počet vybraných proteínov z každej rodiny je priamo úmerná veľkosti rodiny [ ,,,0],10], [11]. V dôsledku toho boli vybrané a použité ako negatívne trénovacej množiny 2627 proteíny.

sme vyšetrili 18 fyzikálno-chemické vlastnosti, vypočítané z proteínových sekvencií, ktoré sú potenciálne užitočné pre problém klasifikácie je založený na všeobecné porozumenie vylučovanie proteínov , Podrobnosti o 18 funkcií a počítačové programy použité na ich výpočet sú uvedené v tabuľke S1. Niektoré z týchto prvkov sú reprezentované viac hodnôt funkcií, napr. So zloženie aminokyselín v sekvencii proteínu je reprezentovaná 20 zahŕňa hodnoty; Celková funkcia 18 sú reprezentované použitím 243 hraných hodnoty. Potom sme identifikovali podmnožinu funkcií hodnotami z 243, ktoré sú schopné rozlíšiť pozitívne a negatívne dát školenie s využitím klasifikátora SVM založeným na. RBF jadra bola použitá v našej SVM tréningu, s ohľadom na jej schopnosť zvládnuť nelineárne atribútov [12], [13].

Ak chcete zistiť, ktoré z pôvodne uvažovaných funkciách sú skutočne užitočné nástroje pre výber funkcie za predpokladu, v LIBSVM [12] bola použitá k výberu najnáročnejšie funkcií medzi 243. Ostatné funkcie pre výber nástroja by mohli byť prípadne použité, ale máme značné skúsenosti s používaním tohto nástroja a zistil, že je adekvátna. Kódy použité v tomto sú verejne dostupné od LIBSVM internetových stránok (http://www.csie.ntu.edu.tw/~cjlin/libsvm/); sme tiež urobili príslušný program prístupný na http://seulgi.myweb.uga.edu/files. F-score [12], ktoré sú vymedzené takto sa používa na meranie toho veľa každého prvku hodnotu nášho klasifikačného problému,

, kde sa odkazuje na hodnoty tréning zahŕňa: (k = 1, ..., m); n
+ a n
- sú počty bielkovín v kladnom (+) a záporný (-) výcvik dátový súbor, v uvedenom poradí; , Sú priemery aj
teho prvku hodnotu na celom výcvikového dátovej sady, pozitívneho dátovom súbore a zápornú dátovej sady, v uvedenom poradí; a a sú aj
tý funkciu k
th proteínu v kladných a záporných tréningových dát, resp. Všeobecne platí, že čím väčšia F-skóre, tým viac rozlišujúce zodpovedajúce funkcie. V našej ponuke všetky funkcie F-skóre nad vopred zvolenej prahovej hodnoty boli zachované a použité v tréningu konečnej klasifikátor. Ak chcete nájsť optimálnu hranicu F-skóre, sme uvažovali zoznam možných prahov a potom vybrala najlepšie z nich na základe výsledkov vzdelávania.

tréning nášho SVM založené na číselníku sa vykonáva pomocou štandardnej postup stanovený v LIBSVM [12] nájsť hodnoty dvoch parametrov C stroje a γ, ktoré poskytujú optimálnu klasifikáciu na dátach školenia, kde C
riadi kompromis medzi chybami vzdelávania a klasifikácie marže, a γ určuje šírku jadra použitého [12]. Naše školenia postup je zhrnúť takto [12]:

  • Získať F-skóre pre každú funkciu hodnotu;
  • Pri každom z predbežne vybraných prahových hodnôt, urobte nasledovné
  • Odstrániť hrané hodnoty F-skóre nižšie ako prah;
  • náhodne rozdelené tréningové dáta do sub-školenia a sub-validačné sady sa rovná veľkosti;
  • vycvičiť SVM s RBF jadra na sub-školenie nastavená pre vyhľadávanie optimálnych hodnôt C stroje a y, a potom aplikovať ju na dáta sub-overovania a vypočítať chybu klasifikácie;
  • Opakujte kroky (i) - (iii) päťkrát a výpočet priemernej chybu overenie;
  • Vyberte prahovú hodnotu, ktorá dáva najmenšiu priemernú chybu overenie, a zachovať vlastnosti F-skóre nad vybranú prahovú hodnotu; a
  • rekvalifikáciu má SVM na základe vybraných funkcií ako konečné triediči.

    b. Dátové súbory používané na hodnotenie výkonnosti klasifikačného

    Nezávislá dátová sada bola použitá na hodnotenie výkonnosti školeného triediče, pre ktoré je známa vylučovací stav každého proteínu. Pozitívne podskupina tejto dátovej sady má 460 ľudskej proteíny v moči zdravých jedincov tromi moči štúdie proteomiky [14], [15], [16], a negatívne podskupina obsahuje 2,148 proteíny vybrané Za použitia rovnakého postupu bolo popísané vyššie, ale nemá neprekrývajú s negatívnym súprava určená pre tréning

    nasledujúce opatrenia boli použité na posúdenie klasifikačné presnosť :. citlivosti, špecifickosť, presnosť, korelačný koeficient Matthew je, a AUC [17]. Tabuľka 1 sumarizuje klasifikačné presnosti vyškolených klasifikátora na oboch školenia a skúšobné dátovej sady [17]. Z klasifikačné presnosťou na dvoch dátových sád, veríme, že náš vyškolený triedič zachytil kľúčové charakteristické rysy z vylučovacích proteínov v moči.

    Navyše naše klasifikátor bol testovaný na samostatnom dátovom súbore, podmnožiny 274 proteíny pevná na vopred vyrobený proteín protilátky poli (ďalej len RayBio Ľudský G-series Array 4000 (RayBiotech, Inc., Norcross, GA)). Z celkového počtu 274 proteíny, 111 je známe, že vylučovací a boli zaradení do nášho výcviku alebo nezávislou skúšobnou dátovej sady. Použili sme klasifikátor na zostávajúcich 163 proteínov, pri ktorých vylučovací stav nebol známy (pozri výsledky a tabuľka S2). Toto pole proteín poskytuje relatívny hladiny expresie pre každý proteín na poli pri testovaní na (moču) vzorky, ktorý sa meria, pokiaľ ide o intenzitu signálu, kvantifikovaný denzitometria. Pozadie poľa bola použitá ako kontrola pre zistenie skutočného prítomnosť proteínu v moči () vzorky. Intenzita signálu pre proteín bol považovaný za skutočný signál, keby to bolo aspoň 5-krát vyššie ako u kontroly, ako navrhol odporúčania výrobcu. zameraný sme experimentálneho overovania na potvrdenie pozitívnej predpovede len, pretože je prakticky nemožné preukázať proteín nie je prítomný vo vzorke moču s obmedzeniami v citlivosti detekcie súčasné technológie, kedy proteín je veľmi nízkej koncentrácii vo vzorke.

    c. Vzorky moču zbierka /príprava

    vzoriek moču od pacientov s rakovinou žalúdka a zdravých kontrol boli zhromažďované na lekárskej fakulty Univerzity Jilin, Changchun, Čína. Žalúdočné pacientov s rakovinou, od koho boli vzorky odobraté z, sú všetky neskorého štádia pacientov (pozri tabuľku S3 k informáciám pacienta). Tieto vzorky boli okamžite lyofilizovanú a skladované pri -80 ° C až do ďalšieho použitia po ich chirurgické odstránenie z pacientov. Potom boli zmiešať a centrifugovány (3000 xg
    po dobu 25 minút pri teplote 4 ° C) pre odstránenie bunkovej komponenty. Supernatanty boli zhromaždené a dialyzované pri 4 ° C proti Millipore veľmi čistej vody (tri vyrovnávacej pamäti zmeny následnou dialýzou cez noc) za použitia Slide-A-Lyzer dialýzu kaziet (Thermo Fisher Scientific, Rockford, IL). Koncentrácie proteínu boli merané s použitím Bio-Rad Protein Assay (Bio-Rad, Hercules, CA) s hovädzím sérovým albumínom ako štandardom.

    d. Identifikácia génov, ktoré sú rozdielne exprimované v rakovinou žalúdka a kontrolných tkanív

    celkom 80 žalúdočných rakovinových tkanív a ich priľahlých noncancerous tkanív z 80 pacientov boli zhromaždené na lekárskej fakulty Univerzity Jilin. Microarray experimenty boli vykonané na týchto tkanív pomocou Affymetrix GeneChip Human Exon 1.0 ST polia, ktorá pokrýva 17,800 ľudských génov. Algoritmus PLIER [18] bol použitý zhrnúť vzorkovej signály na vyjadrenie génu úrovni. Pri každom génu, sme skúmali rozloženie expresie rozkladací zmeny medzi párovými rakovinových a kontrolných tkanív naprieč všetkými 80 párov tkanív. Nech K exp,
    je počet párov tkanív, ktorých skladacia zmena je aspoň 2. gén je považovaný za rozdielne vyjadrené
    v prípade, že p
    -hodnota pozorovaného k exp
    je menší ako 0,05. Pri použití tohto kritéria, zistilo celkom 715 génov, ktoré majú byť rozdielne exprimované u karcinómu žalúdka vo všetkých ľudských génov, a mená 715 génov, spolu so súvisiacimi k exp stroje a p
    -hodnoty, sú uvedené v tabuľke S4. Podrobný rozbor dát mikromaticovému bolo hlásené inde [19].

    e. Funkcie a cesta obohatenie analýzy

    David Bioinformatika zdroje a webový server Kobas [20], [21] robiť funkčné a cesta obohacovanie analýzy, respektíve pre všetky predikovaných moču vylučovacej proteínom, s využitím boli použité celý súbor ľudských proteínov ako pozadie. Máme na mysli čitateľom [20], [21] Podrobnosti o metódach funkčné a cestou obohatenie analýzy. Za použitie DAVID bioinformatiky zdroja, obohatenie skóre pre určitú skupinu proteínov bola stanovená jednoduchosťou skóre [20], [22]. Kobas je doplnkovým nástrojom k Dávidovi, pretože sa zväčšuje anotáciu génu pomocou KEGG Orthology (KO) termíny. Webový server Kobas, spolu s KO na báze anotácie systéme [21], [23], bol použitý na nájdenie štatisticky obohatené a underrepresented cesty medzi predpokladané proteíny moču-vylučovaný. Kobas berie v sade proteínových sekvencií a anotáciu ich používať termíny KO. Komentovaný KO požiadavky boli potom porovnané proti všetkým ľudských proteínov ako sada pozadie pre posúdenie, či sú obohatené alebo zastúpené.

    f. Western bloty

    močových proteíny z každej vzorky (celkom 2 ug) boli kombinované s 3x vzorky farbiva. Každá skúmavka sa varí po dobu 5 minút a nanesené na SDS-PAGE géloch, spolu s 10 ul normy a spustiť po dobu 1 hodiny pri 200 voltoch. Membrána sa aktivuje 100% metanolom v dôsledku prevodu z gélu na membránu (100 V po dobu 1 hodiny). Potom, čo bol prenos dokončený, bola membrána nechá uschnúť, rewetted v 100% metanolu a premytá 2x po dobu 5 minút každý s Tris-pufrom (TBS). Membrána bola potom inkubovaná pri 3% blokovacím roztoku mlieko po dobu 2 hodín pri teplote miestnosti. Ďalšie bola membrána inkubovaná v prvom roztoku protilátky (1: 200 riedenie v 1,5% blokovacím mlieko) po dobu 1 hodiny pri teplote miestnosti, a neviazané protilátky bol odstránený premytím membrány 3 x TBS-Tween 20 (TBST roztoku) počas 10 min každý. Potom bola membrána inkubovaná v 1: 10,000 riedenie sekundárnej protilátky v 1,5% blokovacím roztoku mlieko po dobu 1 hodiny pri teplote miestnosti. Membrána sa premyje 3 x TBST a 2X s TBS (10 min). A konečne, bola membrána úplne pokrytá rovnakým množstvom zosilňovače a roztoku peroxidu zo súpravy Pierce Western blot po dobu 5 min a vystavené filmu. Každý experiment bol opakovaný niekoľkokrát pre zaistenie reprodukovateľnosti [24]. Tieto intenzity signálu boli určené s použitím programu ImageJ [25]. Pre každé membrány, polotovar pruhu bol použitý pre normalizáciu intenzít signálu cez membrány. Výkon bol skúmaný pomocou ROC a chlp-box plot.

    Výsledky a diskusia

    a. peptidové signál a sekundárne štruktúry sú kľúčové vlastnosti bielkovín v moči vylučované

    Pôvodný zoznam funkcií bolo starostlivo vybraných
    , aby zahŕňala to, čo sme verili, že vlastnosti bielkovín sú relevantné pre vylučovanie založené na literárne rešerše a naše súčasné chápanie močových ciest proteíny. Napríklad záporne nabitý glomerulárnu stena v obličkách umožňujú filtrácii iba pozitívne alebo neutrálne nabité proteíny. Tak, náboj proteínu je jednou z funkcií, ktoré sme vybrali. Ak vezmeme do úvahy dostupné údaje, celkový počet hodnôt zahŕňa zhromaždených na počiatku bolo 243, čo predstavuje základný postupnosti vlastnosti, motívy, fyzikálno-chemické vlastnosti, a štrukturálne vlastnosti (tabuľka S1). Pri identifikácii funkcie, ktoré sú účinné pri rozlišovaní moču vylučovací bielkoviny od tých non-vylučovací, jednoduchý a účinný spôsob, ako odstrániť prvky, ktoré vykazujú malú alebo žiadnu energiu pre náročných bol náš problém klasifikácie činnými; 74 celovečerných hodnoty boli vyberané na základe postupu uvedeného v oddiele A metód (pozri tabuľku S5). Tieto funkcie hodnoty boli použité k vlaku konečnej klasifikátor.

    Medzi vybranými funkciami, najviac diskriminačné jedna bola prítomnosť signálnych peptidov. Rozumie sa, že proteíny, ktoré sú vylučované cez ER majú signálne peptidy a sú obchodované na miesto určenia v súlade s konkrétnym signálnych peptidov; tak nie je divu, že väčšina vylučujú proteíny majú túto funkciu. Ďalšie význačný rys bol sekundárny typ konštrukcie; Konkrétne sa jedná o podiel alfa helix v proteínovej sekvencii bol zaradený ako hodnota počtu 2 majú medzi vybranými 74 (Tabuľka S5). Ako sa dalo očakávať, náboj proteínu bola medzi top zaradil funkcií pre vylučovaných proteínov. To je v súlade so všeobecným tým, že náboj je faktorom pri určovaní, ktoré proteíny môžu byť filtrované cez glomerulárnu membránu [26], ako proteíny vnútri glomerulárnych membrán a podocyt štrbín sú záporne nabité, a tým negatívne nabité proteíny budú mať malú šancu presakovať obličky. V skutočnosti, hrané hodnoty pozitívnych aminokyselín a náboje boli medzi top zaradil hraných hodnôt.

    však zaujímavé, že molekulová hmotnosť, čo ho zaradilo na 232 z 243, nebola zahrnutá do konečných 74 hraných hodnôt. To by mohlo byť vysvetlené ďalej. Proteíny prítomné v sére už podrobené štiepenie, alebo boli čiastočne degradované, a preto nemusí byť vo svojom neporušenom kompletnej podobe pri vstupe do obličky. To v skutočnosti bolo zistené, že väčšina proteínov, nájdených v moči, sa vo veľkej miere degradované [27]. Kým intaktnej proteín nemusí byť schopný filtrovať cez glomerulárnych vzhľadom na jeho veľkosť alebo tvaru, peptid proteín odvodený môže ľahko prechádzať podocyt štrbinami. Výsledkom je, že molekulová hmotnosť intaktného proteínu je non-faktor v predikciu v prípade, že proteín je vylučovacia moč.

    Je potrebné poznamenať, že moču vylučovací proteíny a vylučované proteíny zdieľajú niektoré spoločné vlastnosti, ako niektoré z funkcia na identifikáciu krv vylučovaný proteínov v našej predchádzajúcej štúdii [10] boli vybrané v predikciu vylučovaním proteínov v tejto štúdii. Napríklad, funkcie, ako sú rozpúšťadlá, prístupnosť, polarity, a signálnych peptidov boli do oboch klasifikátorov. Avšak existuje jasný rozdiel medzi funkciou používaných v dvoch číselníkov. Kým funkcie, ako je beta-Strand-obsahu, k dispozícii sú spojené s beta-barel transmembránového proteínu a pomer bielkovín, TATP motívom, transmembránovú doménu, veľkosť proteínu a najdlhšia neusporiadaným regióne boli medzi najlepšími vlastnosťami pre predikciu krvných-sekrečné proteíny [10 ], ktoré neboli zahrnuté do konečných vlastností pre predikciu močového proteínu. Okrem toho, funkcie súvisiace s kladnými nábojmi, ako je zloženie kladne nabitých aminokyselín, boli prominentnú v predikciu vylučovaním proteínov, ale nie je vybratá v predikciu sekrécie v krvi. Podobne, alfa-helix-obsahu a cievka, obsah bielkovín boli jednou z hlavných prvkov pre predikciu vylučovaním proteínov, ale ktoré neboli vybrané pre predikciu proteínu krvou sekrečnú. Je zaujímavé poznamenať, že na rozdiel od zistení, že beta-reťazce sú bežným sekundárne typ konštrukcie medzi sekrečných proteínov v krvi, moči proteíny majú tendenciu mať vyššiu alfa-helix a obsah cievky, čo znamená, že v moči proteíny majú vlastnosti, ktoré nie sú zdieľané krvnými sekrečnú proteíny všeobecne.

    b. Výkonnosť klasifikačného

    Ak chcete zistiť správnosť konečného triediče, sme to testovaný na nezávislú skúšobnej súprava, ktorá sa skladá z 460 experimentálne overená moču vylučovacích proteínov a 2,148 non-moču vylučovacích proteínov. Naša triedenie má svoju citlivosť a špecifickosť predikcie na tejto nezávislej testovacej sady na 0,78 a 0,92, respektíve (tabuľka 1).

    sme potom bežal klasifikátor na 163 z celkových 274 proteínov stanovená na vopred vyrobené protilátky array (pozri metódy), pre ktoré je vylučovacia stav bol neznámy. 163 bielkovín, 112 proteíny boli predpovedať, či bude vylučovací moču našej triediči. Aby bolo možné posúdiť plnenie tohto predpokladu, protilátok experimenty založená na poli boli vykonávané na 14 vzoriek moču, sedem zdravých jedincov a sedem z pacientov s karcinómom žalúdka. Z 112 predikovaných moču vylučovacích proteínov, 92 boli nájdené v aspoň jednej zo vzoriek moču (tabuľka S6), čo pozitívne predikcia rýchlosti 0,81, čo je v súlade s úrovňou výkonu v prvej testovacej sady.

    je potrebné poznamenať, že jeden obmedzenia tohto triediča je, že niektoré proteíny by mohli byť čiastočne degradované predtým, ako sa vylúči do moču alebo v moči, čo je ťažké pre naše klasifikátor pre detekciu takto vytvorené peptidy tak, ako bol vyškolený na celých intaktných proteínov. Tento problém bude vyriešený v budúcnosti cez odvodzovania hodnoty funkcií na základe skutočných proteínov /peptidov, identifikovaných v predošlých močových proteomických štúdií, skôr než ich zodpovedajúce plnej dĺžky proteínov ako hotové v tejto štúdii. Kým tam je jasne priestor pre ďalšie zlepšovanie, výsledky predikcie aktuálneho číselníku sú veľmi povzbudivé.

    c. Aplikácia triediče k rakovine žalúdka dát

    Naše predchádzajúce štúdie o 160 sád microarray gén dáta výrazu rakoviny žalúdka o určila 715 rozdielne exprimovaných génov s aspoň 2-násobnom zmeny v karcinómu žalúdka oproti
    kontrolné vzorky tkaniva [19]. Aj keď by bolo výhodnejšie mať epigenomických údaje z tkanivových vzoriek, máme k dispozícii v rámci tejto štúdie iba génovej expresie dáta. Z tohto dôvodu génovej expresie údaje sú používané ako približovanie sa k expresii proteínu v tejto metodike orientovaného štúdia. Naša klasifikátor bola aplikovaná na tieto 715 proteínov, a to predpovedal, že 201 zo 715 proteínov sú vylučovací moču. Tabuľka S7 poskytuje podrobné informácie o 201 proteínov. Vzhľadom k tomu, že je nereálne, aby nechajte si zobraziť všetky 201 proteínov v tejto štúdii zistiť, či sú vylučovací moču alebo nie, sme urobili analýzy zúžiť tento zoznam. Konkrétne sme vykonali nasledujúce analýzy: (i) funkčná a cesta obohatenie analýzy k získaniu lepšieho porozumenia typov proteínov prítomných v moči, (ii) rešerše na močových proteínov zhromažďovať informácie o publikovaných močových markerových proteínov ( iii) skúmanie dát génovej expresie odstrániť gény, ktoré nie sú podstatne rozdielne exprimovaných medzi rakovinou a kontrolné vzorky tkaniva; a (iv) Western blot na proteíny vybrané zo zúžil zoznam 201 proteínov. Tento postup ukázali vysokú úspešnosť a viedol k zaujímavému objavu potenciálneho biomarkeru pre rakovinu žalúdka.

    (i), sme vykonali funkčné a cesta obohatenie analýzy na všetkých 201 proteínov pomocou Davida [20 ] a [21] Kobas servery, resp. Zistili sme, že obohatené funkčné skupiny súčasťou extracelulárnej matrix (ECM), bunkovú adhéziu, a vývoj, pohyblivosť buniek, obranné reakcie, angiogenézy, ktoré sú známe, aby sa podieľa na vývoji, alebo v obrane rakoviny (obr S1A). Najviac obohatené cesty boli interakcie ECM-receptor a anorganických iónov, dopravy a metabolizmus dráhy (obr S1B)

    Nasledujúce kritériá sa použili na zníženie zoznam 201 proteínov pre kroky (ii) - (iii) :. proteíny neboli hlásené v spojení so žiadnym rakoviny založené na našej rozsiahlej literatúry vyhľadávanie |, čo dáva vzniknúť 71 proteínov. Tento zoznam bol ďalej znížený na základe vopred zvolenej cut-off o diferenciálnych výrazov a funkčných anotácií (potenciálne dôležité pre rakovinu žalúdka, skôr než imunitných reakcií).

    d. Endoteliálny lipáza sa podstatne zníži vo vzorkách moču rakovina žalúdka u pacientov

    Vybrali sme šesť proteíny (MUC13, COL10A1, AZGP1, LIPF, MMP3 a EI) pre experimentálne potvrdenie od vyššie uvedeného zoznamu zúžil. K tomu sme získali vzorky moču z 21 pacientov s rakovinou žalúdka a 21 zdravých jedincov. Zo šiestich vybraných proteínov, päť proteínov, MUC13, COL10A1, LIPG, AZGP1 a EL boli detekované pomocou Western blot aspoň v jednej vzorke moču. Z piatich, MUC13, COL10A1 a EL boli zistené aj pri veľmi nízkom množstve celkových bielkovín v moči (1-2 ug). MMP3 nebol nájdený vo vzorkách, ktoré sme testovali, ktoré môžu byť vzhľadom na nízku koncentráciu MMP3 v moči alebo falošnú predikciu naším triediči.

    Je zvlášť zaujímavé, že sme boli schopní detekovať konzistentné rozdiely v EL hojnosti (kódovaný LIPG
    ) medzi dvoma sadami 21 vzoriek moču. Je westernový prenos pre EL vykázali podstatné zníženie jeho množstva v moči pacientov s rakovinou žalúdka 21 v porovnaní s kontrolnými vzorkami. Ako je ukázané na obrázku 2A, väčšina kontrolných vzoriek preukázala prítomnosť EL, zatiaľ čo väčšina vzoriek s karcinómom žalúdka, mal relatívne malé množstvo EL. Tento vzor bol opakovane pozorovaný

    Molekulová hmotnosť tohto proteínu bola stanovená na 68 kDa [28] .; Tak, homo-dimérov sa očakáva, že bude 134 kDa. Na Western blot, však, pásy boli detekované pri takmer 100 kDa. To pravdepodobne zodpovedá čiastočne rozštiepeného homo-dimérov, aktívna forma, ktorá bola potvrdená predchádzajúca štúdia [29], aj keď možnosť monomérne formy EL spojené s ďalším proteínom nemožno vylúčiť. http://csbl.bmb.uga.edu/~juancui/Publications/GC2009/Additional_material.pdf.
    doi:10.1371/journal.pone.0016875.s005
    (XLS)
    Table

  • Other Languages