Stomach Health > želudac Zdravlje >  > Gastric Cancer > Rak želuca

PLoS ONE: Procjena ugroženosti rak želuca uzrokuje bakterija Helicobacter pylori Korištenje CagA sekvencu markera

Sažetak pregled

Pozadina pregled

Kao biljeg Helicobacter pylori pregled, citotiksin povezane gen A (CagA) je objavljeno da je glavni čimbenik koji uzrokuje virulencije gastroduodenalnog bolesti , Međutim, molekularni mehanizmi koji su osnova za razvoj različitih gastroduodenalnih bolesti izazvanih CagA pozitivnim H. pylori pregled infekcija ostaje nepoznata. Nedavne studije su ograničene na procjenu povezanosti bolesti i broj Glu-Pro-Ile-Tyr-Ala (EPIYA) motiva u soja CagA. Za daljnje razumijevanje odnosa između CagA slijed i njegove virulencije do raka želuca, predložili smo sustavno entropije-based pristup za identifikaciju ostataka raka povezanih u međuvremenu regijama CagA i zaposleni nadziranog metoda strojnog učenja za rak i ne-raka slučajevima klasifikacija. pregled

Metodologija pregled

Izračun entropije bazi se koristi za otkrivanje ključnih ostatke CagA međuvremenu redom želučanu biomarkera raka. Za svaki ostatak, i kombinatorni entropije i pozadine entropije su izračunate i entropije razlika je korišten kao kriterij za odabir značajka ostatak. Značajka vrijednosti su tada puni u Support Vector Machines (SVM) sa Radial Basis Function (RBF) kernel, a dvije su parametri podešeni da se dobije optimalna vrijednost F pomoću pretraživanja rešetke. Druge dvije popularne metode klasifikacija, BLAST i HMMER, također se primjenjuju na iste podatke za usporedbu. pregled

Zaključak

Naša metoda postiže 76% i 71% točnosti klasifikacije za zapadne i istočne Azije podvrste, odnosno, što je znatno bolje rezultate od eksplozije i HMMER. Ovo istraživanje pokazuje da male varijacije aminokiselina u tim važnim ostataka moglo dovesti do virulencije varijance CagA sojeva rezultira različitim gastroduodenalnog bolesti. Ova studija daje ne samo koristan alat za predviđanje korelaciju između novog CagA napora i bolesti, ali i općeg novi okvir za otkrivanje bioloških biomarkera slijed u istraživanjima populacije pregled

Izvor:. Zhang C, Xu S, Xu D (2012) Procjena ugroženosti rak želuca uzrokovane Helicobacter pylori
Korištenje CagA Sequence markera. PLoS ONE 7 (5): e36844. doi: 10,1371 /journal.pone.0036844 pregled

Urednik: Niyaz Ahmed, Sveučilište u Hyderabad, Indija pregled

Primljeno: 13. studenog 2011; Prihvaćeno: 11. travnja 2012; Objavljeno: 15. svibanj 2012 pregled

Copyright: © 2012 Zhang i sur. Ovo je otvorenog pristupa članak distribuirati pod uvjetima Creative Commons Imenovanje License, koja omogućuje neograničeno korištenje, distribuciju i reprodukciju u bilo kojem mediju, pod uvjetom da je izvorni autor i izvor su zaslužan

financiranja. Ovo djelo je djelomično podržan od strane američkog Nacionalnog instituta za zdravlje [broj dozvole R21 /R33 GM078601] i međunarodnu razmjenu i Ureda za suradnju Nanjing Medical University, Kina. U financijeri nisu imali ulogu u studiju dizajna, prikupljanja i analize podataka, Odluka o objavi, ili pripremu rukopisa pregled

U konkurenciji interese.. Autori su izjavili da ne postoje suprotstavljeni interesi pregled

Uvod pregled

Helicobacter pylori (H. pylori) pregled je gram-negativne spirale u obliku bakterija nastanjuje ljudski želudac i zaraziti više od polovice svjetske populacije [1], [2], [ ,,,0],3]. Nedavne studije su pokazale da je povezana s gastroduodenalnog bolesti, uključujući i dvanaesnika [4], želučanog ulkusa [5] i kronični gastritis. Što je još važnije, to je značajan faktor rizika za razvoj karcinoma želuca [6], [7], [8]. To je klasificiran kao Class 1 kancerogenih od strane Svjetske zdravstvene organizacije od 1994. godine [1]. Pregled

Kao biljeg H. pylori pregled je citotiksin povezane gen A (CagA) je otkriveno daljnje analize da je glavni virulencije faktor. H. pylori pregled sojevi koji nose CagA gen povećati faktor rizika gastroduodenalnog bolesti tri nabora tijekom CagA negativni sojevi [6], [9], [10]. CagA, koji je kodiran genom CAGA je 125-140 kDa protein. Sadrži aminokiseline 1142-1320 i ima varijabilnu regiju na području C-terminala u kojima različiti kratke sekvencije (kao EPIYA motiva) ponavlja 1-7 puta. Nakon H. pylori
kolonizaciji na površini želučanog epitela CagA može premještena u želučanom epitelne stanice kroz sustav za tip IV sekrecije. Jednom ubrizgava u stanicu domaćina, CagA localizes za plazma membranu i mogu se fosforiliraju Src obitelj tirozin kinaza na specifičnim tirozinskim dijelovima pet amino-kiselina (EPIYA) motiv [11], [12], [13] , [14]. Tirozin-fosforiliran CagA zatim se specifično veže na SHP-2 tirozin fosfataze 11,15 za aktiviranje fosforilaze, što uzrokuje kaskadni učinak koji interferira sa staze transdukcije signala u stanici domaćinu, što dovodi do reorganizacije stanice domaćina citoskeleta i formiranje Hummingbird fenotip [11], [16]. Istovremeno kroz aktiviranje mitogenom-aktiviranu protein kinazu (MAPK), ekstracelularna kinaze signalom-regulirane (ERK) [17] i fokalna adhezijska kinaza (FAK) CagA može uzrokovati disocijaciju stanica i rast inflitrativni tumora [18], [19 ], [20], [21]. Takav proces čini CagA najvažniji čimbenik virulencije u H. pylori pregled [22]. pregled

Unutar promjenjivog područja CagA, postoje različiti interventne sekvence između ta EPIYA motiva. Jedan primjerak EPIYA plus intervenira slijed identificiran kao EPIYA segmentu. Četiri jedinstvena vrste EPIYA segmenata su pronađeni u CagA, definiran kao EPIYA-A, -B, -C i D [11]. CagA izoliran od istočno-azijskih zemalja, označene kao istočnoazijskog CagA, sadrži EPIYA-A, EPIYA-B i EPIYA-D motivi. CagA iz zapadnih zemalja, EPIYA-D, zamjenjuje EPIYA-C. Jači fosforilacija motiv vezanja aktivnost EPIYA-D motiva dovodi do veće morfološke promjene nego što je EPIYA-C motiv može dovesti u inficiranim stanicama [11]. To je povećana aktivnost vezanja ovog EPIYA-D motiv i posljedični morfološke promjene koje ga identificira kao potencijalni faktor objasniti veću učestalost raka želuca u istočno-azijskih zemalja [23], [24].

Prethodne studije su pokazale varijacija u broju EPIYA motivom ponavljanja za oba istočne Azije i zapadne CagA, što može utjecati na biološke aktivnosti. Yamaoka et al. [25] je utvrdio da se u Kolumbiji i SAD-u, sposobnost CagA pozitivnog H. pylori
uzrokovati želučane sluznice atrofije i intestinalne metaplazije može biti povezano s brojem EPIYA motiva u soja CagA. Srebrnom et al. [16] je došao do istog zaključka kasnije. Međutim, suprotno mišljenje objavili su Lai i sur. [26] na temelju nalaza bez odnosa između broja EPIYA motiva u soja CagA i kliničke slike bolesti u roku od 58 izolata iz Tajvana. S obzirom na veličinu i geografsko ograničenje ove studije, valjanost tog zaključka je upitna. Osim broju EPIYA motivom ponavlja, razlika slijed sojeva pri razlicitim regijama također može uzrokovati značajnu razliku virulencije, što bi moglo odnositi na različite patogene sposobnosti H. pylori pregled [27]. pregled

Zbog složene i varijante sekvence u CagA, odnosi između polimorfizma CagA i kliničkih bolesti postala je vrlo zanimljiv problem istraživanja. Međutim, molekularni mehanizmi koji su osnova za različite gastroduodenalnih bolesti uzrokovanih CagA pozitivnim H. pylori pregled infekcija ostaje nepoznata. Do sada većina istraživanja još uvijek su ograničeni do otkrića odnosno ocjenu o korelaciji između broja CagA EPIYA motiva i bolesti [28]. Pregled

U ovom radu predložen sustavan način analizirati ne samo broj EPIYA motivi u CagA sekvencama, ali i specifični slijed obrasci interventnim regijama. Prvo, uvodimo izračun entropije otkriti ostataka unutar varijabilne regije CagA kao želučanog kancerogenih biomarkera. Onda smo zaposliti nadziranog postupak učenja klasificirati rak i ne-raka pomoću informacija otkrivenih ostataka u CagA što su značajke. Biramo podršku strojevi vektor (SVM) kao binarni klasifikator i usporedite našu metodu s drugima. Naš pristup dokazuje ne samo našu hipotezu da je slijed varijabilne regije CagA sadrži informacije za razlikovanje različitih bolesti, ali također pruža koristan alat za predviđanje korelaciju između sojeva roman CagA i bolesti i za otkrivanje biomarkera kao dobro. Pregled

metode

Podaci predobrada pregled

na temelju prethodnog opisa u ref. [15], nazvan smo EPIYA motiv i sljedeća interventnim regije R1, R2, R3, R3 ', R4 i R4' (slika 1). Slika 2 prikazuje položaj odnos između EPIYA motiva (R1) i druge interventnim regija pomoću vrste CAGA A-B-D (Istočnoazijska podtip) i A-B-C (Western podtip) kao primjera. R2 je relativno konzervirane u oba podtipa, ali postoje značajne razlike između interventnim regijama R3 i R3, kao i između R4 i R4. Istok Azijski Podtip i zapadna podvrsta su tretirani kao dvije nezavisne grupe. Njihovi podaci se zatim obrađuju i rezultati su analizirani unutar svake grupe pojedinačno. Pregled

Sve interventne regije su iz CagA sekvenci i staviti u odgovarajuće podtipu skupinama, a zatim su višestruke slijed poravnanja se primjenjuju za svaku grupu pojedinačno pomoću Clustal X verziju 2.0.3 [29]. Sekvence profili (slika 1) sagrađena je korištenjem Weblogo 3 [30]. Pregled

Ostatak Otkrivanje pregled

Od CagA se odnosi na gotovo sve gastroduodenalnog bolesti i jednostavnom analizom EPIYA motivom ponavlja ne prinos statistički značajne razlike među tim bolestima, informacije ukazuju na određene bolesti mogu biti skriveni u međuvremenu regijama. Ovo istraživanje pretpostavlja da je set ostataka ili ostataka kombinacije koje mogu biti korisne kao marker specifične bolesti. Ova studija se fokusira na rak želuca i koristi skupine rak /ne-raka kao npr. Pregled

Na temelju usklađenih sekvencama za svaku međuvremenu regiju, specifični ostaci su identificirani usporedbom razlika kombinatorne entropije [31] između raka nekanceroznih skupina. Ovaj postupak uključuje sljedeće korake: pregled

Prije svega, podijelimo dane više poravnanje svih proteklih regijama u dvije skupine: rak želuca grupa i ne-raka skupina. Za svaki stupac višestrukog poravnanja računamo pozadine entropije (ekv. 1) i kombinacijske entropije (ekv. 2), opisati na sljedeći način: (1) gdje predstavlja broj sekvenci u grupi k pregled. označava broj ostataka tipa u stupcu i pregled grupe k pregled. je broj ostataka tipa u stupcu i
. predstavlja ukupan broj sekvence u poravnanje (2) gdje je pregled

Tada je Entropija razlika između kombinacijske entropije i pozadinske entropije izračunava.. (3) pregled

Slika 3 prikazuje koncept entropije pomoću tri ekstremnim slučajevima. U slučaju P1, aminokiseline su 'slučajno i ravnomjerno raspoređen "nad svim grupama i ne postoji značajno očuvan uzorak za ovu poziciju. Slučaj P2 predstavlja 'globalno konzervirani' uzorak i sve aminokiseline su isti u obje skupine. U slučaju P3, neke specifične aminokiseline su sačuvana samo u određenim skupinama, te različite grupe imaju različite aminokiseline. Mi to nazivamo slučaj 'lokalno konzerviran'. Pregled

Prema rezultatima proračuna od entropije razlike za gore navedene tri slučaja, kombinatorni entropija je i za "globalno očuvanih 'i' lokalno konzerviranih" predmete. Za 'slučajno i ravnomjerno raspodijeljeni' slučaju dobiva maksimalnu vrijednost. Možemo razlikovati 'konzervirane' i 'slučajno i ravnomjerno raspoređenih' slučajeva na temelju kombinatorni entropije, ali to ne pomaže podići 'lokalno konzervirani' slučaj od svega 'konzervirati' slučajeve. Kada uzmemo u obzir pozadinsku entropije u isto vrijeme, dobiva maksimalnu vrijednost, 0 i srednje vrijednosti za 'slučajno i ravnomjerno raspodijeljeni' slučaju 'globalno konzervirani' slučaj ', lokalno konzervirani' slučaj, respektivno. Konačno, razlike za gore navedene tri slučaja su :, i dobiva minimalnu vrijednost. Dakle, entropija Razlika je pravilno mjerenje za detekciju 'lokalno konzervirani' uzorak slijed. Pregled

Značajka-entropija Izračun pregled

Na temelju gore navedenih izračuna, može se utvrditi da je ispravan grupiranje može smanjiti entropija je razlika za one ostatke koji pripadaju 'lokalno konzerviranog' slučaju. Za izvođenje testa, jedan odsječak odabran dok je ostatak sekvenci su podijeljeni u želučanom skupine raka i nemaju veze s rakom skupine u. Za sve odabrane ostatke, odabrana sekvenca je smještena u želučanom skupine raka izračunati entropije razliku, a zatim se stavlja u grupu koja nije uzrokovana karcinomom bi se dobio odgovarajući entropije razliku. Konačno, dobiva se za sve odabrane ostataka koji se koriste kao igrani entropije. Pregled

Klasifikacija CagA sekvenci

podataka. Pregled

Pretražili smo Nacionalnog centra za biotehnološke informacije (NCBI ), švicarski-prot /tresti i DDBJ proteina baze i dobio 535 sojeva H. pylori
CagA proteina. Među njima, tu su 287 istočne Azije sojevi podtipa i 248 Western sojevi podtipa. U istočnoazijskog podtipa skupine, 47 iz 287 sojeva su od pacijenata s rakom želuca, a ostatak su od drugih bolesti. U zapadnom podtipa skupine, nalazi se 37 sojeva iz pacijenata s rakom želuca, a ostaci su od drugih bolesti ili normalnih kontrola, uključujući 24 sojeva iz volontera čiji zdravstveni (bolest) status nije poznat. Pregled

Tijek rada. pregled

Slika 4 prikazuje tijek postupka razvrstavanja /predviđanja: pregled

  • Odaberite jedan soj kao test soj pregled
  • Primjena bootstrap postupak s ostatkom sojeva dobiti. sojevi trening. pregled
  • izračunati značajka entropiju za ispitno naprezanje na temelju sojeva obuke i spremite ga kao test podaci. pregled
  • izračunati značajka entropiju za svaki soj u setu trening soja na temelju trening naprezanja i spremiti ih kao podatke za trening. pregled
  • Generiranje klasifikacijskog modela korištenjem podataka trening. pregled
  • Razvrstati test podatke u skladu s klasifikacijskom modelu. pregled
  • Ponovite ovaj postupak pet puta, a zatim izračunati prosjek kao konačni rezultat.

    pokretački. pregled

    a glavni problem u izgradnji klasifikacijskog modela, u ovom slučaju je velika razlika od veličine uzorka između rak i ne-raka skupine, koje bi mogle uzrokovati pristranost u rezultate klasifikacije. Postupak početno podizati primijenjen je za rješavanje ovog problema. U svakom podtipa skupine, za svaki trening /test skupova podataka, svi uzorci nisu raka su uključeni, a zatim soja se kontinuirano izvučeni iz skupine raka na slučajnom uzorku dok se ne postigne istu veličinu grupe nemaju veze s rakom. U tom slučaju, svi raspoloživi podaci korišteni su, iako uzorci raka su korištena više puta dao njihove manje veličine u odnosu na skupinu koja nije uzrokovana karcinomom. Ovaj postupak primijenjen je pet puta generirati pet nezavisna seta treninga za svaki ispitni slijed. Rezultat Klasifikacija /predviđanje je prosjek od tih pet nezavisnih rezultatima. Pregled

    Cross-validacije. Pregled

    Budući da je veličina podataka je mali, ostaviti-jedan-out (lu) Postupak križna validacija je izvršena. To nije samo procjena uspješnosti klasifikatora na trening /podaci o ispitivanju, ali i procjena prognostičke snage za nove slučajeve. Pregled

    SVM. Pregled

    Odlučili smo SVM kao binarni klasifikator i koristi značajka-entropije vektori trenirati i testirati klasifikatora. U slučaju dvije klase klasifikacije mekana marže, funkcija odluka je ponderirani linearna kombinacija definirana kako slijedi: (4) gdje predstavlja kernel funkciju korisnički definirane koji mjere sličnosti između ulaznog igranom vektora i hotelu vektora u obuci skup podataka. je težina dodijeljen trening igrani vektora i pokazuje da li je soj CagA je označen s pozitivnim klase (+1) ili negativne klase (-1). Prvotni Problem optimizacije poprima oblik: smanjili (5) U skladu s (6) gdje. m je ukupan broj sojeva. je zatišje varijabla koja mjeri stupanj pogrešne klasifikacije u datumu. je parametar troškova koji omogućuje trgovanje off pogrešku trening protiv složenosti modela. w je vektor normale i B je offset. pregled

    Nakon usporedbe rezultata polinoma, TANH i Gaussove radijalni baznih zrna se rezultati dobiveni s RFB kernel radio najbolje, gdje su Gaussove radijalna bazna zrna (RBF :) su za učenje opće namjene kada nema prethodno znanje o podacima. SVM Paket Svjetlo (http://svmlight.joachims.org/) [32] je upotrijebljen za izgradnju naše aplikacije. Parametri i bili podešeni kako bi dobili najbolji model za podatke za trening kao što je prikazano u nastavku. Svi ostali SVM parametri su postavljeni na zadane vrijednosti pregled procjena

    Performanse pregled

    Da bi se ocijenila uspješnost klasifikatora, primjenjuju se različite mjere uspješnosti:.. Točnost, osjetljivost i specifičnost. Pravi pozitivnih (TP) je sekvencija povezana s rakom razvrstati, a lažno pozitivnih (FP) je non-tumorom sekvenca klasificiran kao povezana s rakom, lažno negativni (FN) je sekvenca tumorom klasificiraju kao -cancer odnose i da pravi negativan (TN) je slijed ne-tumorom klasificiran kao ne-vezani uz karcinom. Točnost, osjetljivost (Sn), specifičnost (SP) i Matthews koeficijent korelacije (MCC) klasifikacije definira na sljedeći način: (7) (8) (9) (10) Budući da postoje samo dva parametra za RFB kernel i oni neovisni, primjenjuju se grid-traženje za utvrđivanje optimalnih parametara klasifikatora. Koristili smo harmonijske sredstva osjetljivosti i specifičnosti kao funkcije cilja za optimiziranje performansi modela za trening seta, koji je definiran na sljedeći način:
    (11)

    Rezultati

    Ostatak otkrivanje i igrani izračun pregled

    u tablici 1 su svi otkriveni ključni ostaci računanjem razlike entropije u svakoj interventnim regiji i za zapadne i istočne Azije podtipova. Iako postoje neke geografske varijacije CagA sekvenci između zapadne i istočne Azije podvrsta, neke zajedničke ostaci i dalje mogu naći razlikovati rak i ne-raka skupine. To sugerira da su ti ostaci mogli biti vrlo važno u određivanju virulencije CagA i odnos između CagA i neke specifične bolesti. Pregled

    Ostatak ponude su prikazani na slici 5. Prethodna studija [27] otkriva da je drugačija EPIYA segmenti mogu vezati na različite kinaze, npr EPIYA-R2 i EPIYA-R3 /R3 'se vežu za C-terminalne Src kinaza (CSK), dok EPIYA-R4 EPIYA-R4 vežu za SHP-2 kinaza uzrokuje Hummingbird fenotip. CagA Csk interakcija podregulira CagA SHP-2 signaliziranja koje remeti stanične funkcije za kontrolu virulencije CagA. Utvrđeno je da je većina otkriveni ostaci pripadaju R2 i R3 /R3 'regija i nekoliko ostataka u R4 /R4' regije su otkrivene. To može biti zbog toga što R4 /R4 ima više sačuvana od R2 i R4 /R4 'je kraći od R3 /R3'. Predlažemo da se različiti ostataka uzoraka u R2 ili R3 /R3 'regija može promijeniti sposobnost podreguliranje CagA SHP-2 signalizacije, dakle mijenja virulencije CagA. Pregled

    Ren et al. pronašao da CagA multimerizes u stanicama sisavaca [33]. To multimerizacija je neovisna do fosforilacije tirozina, ali to se odnosi na "FPLxRxxxVxDLSKVG" motiv koji se zove CM motiv u R3 'interventnim regiji. Budući da je multimerizacija je preduvjet za CagA SHP-2 signalizaciju složeno i naknadnu deregulaciju SHP-2, CM motiv igra važnu ulogu u CagA pozitivni H. pylori pregled posredovanih želuca patogeneza. Sa više CM motivi H. pylori pregled sojevi su mnogo vjerojatnije povezan s teškim gastroduodenalnog bolesti [33], [34], ali ovo opažanje ne može objasniti zašto različiti gastroduodenalnih bolesti mogu se razviti s istim brojem CM motiva. Naša studija otkrivena dva ostatka u CM motivom R3 'interventnim regije, što bi moglo dovesti do promjene multimerizacija, čime se mijenja virulencije CagA. To je u skladu s prethodnim otkrićem [35] koja je razlika između slijeda East Asian CM i zapadne CM određuje afinitet vezanja između CagA i SHP-2. Pregled

    Dok je ključni ostaci otkriveni može otkriti neke razlike između karcinoma i karcinoma ne-skupina, nijedan ostatak može biti marker za rak, kao što je prikazano na slici 5. Ovo istraživanje predviđa da jedna posebna kombinacija svih ili djelomičnim otkrivenih ostataka može imati visoku korelaciju s jednom određenom bolešću. Da biste provjerili je nekoliko linearnih statistički modeli, npr linearna regresija i logistička regresija, primjenjuju se na otkrivene mogućnosti ocijeniti važnost svake taloga i korelaciju između odabranih ostatke i raka. Međutim, niti jedan od gore navedenih modela bila u mogućnosti proizvesti statistički značajan rezultat. Budući da se značajke ne mogu biti opremljeni jednostavnim linearnim modelima za predviđanje raka, primjenom metode strojnog učenja analizirati i klasificirati tih podataka postaje neophodno. Pregled

    parametara Trening za Klasifikacija pregled

    Korištenje Western podtip grupu kao primjer, labava mreža-traženje je prvi put izvedena na i (Slika 6A) te je utvrdio da je najbolje oko da biste dobili najvišu vrijednost F sa stopom Loo cross-valjanosti od 76%. Tada je finija pretraživanja mreža je provedeno na susjedstvo i bolji F vrijednost dobivena s 79,7% Loo unakrsne validacije u. Isti postupak je korišten za istočnoazijskog podtipa skupine i najbolji WC stopa cross-valjanosti 72,6% postignut je. Pregled

    S obzirom da nema prethodnih studija ili računalne metode na istu temu, ocjenjivanje izvedbe ovog Research nova metoda je teško. Za procjenu informacijski sadržaj od sekvenci u smislu njihove uviđavan moći predvidjeti rak, slučajni postupak miješanje se koristi za izgradnju kontrolnu skupinu. Prvo, sve sekvence iz zapadne podvrste su postavljeni zajedno graditi slijed bazen. Drugo, slučajnim odabirom isti broj sekvence kao skupine raka iz bazena odsječka i pomiješa ostatak sekvencija kao što su skupine nisu raka. Zatim, cijela procedura trening je primijenjena na novo miješaju podataka kako bi se pronašli najbolji. Navedene su koraci ponavljaju pet puta generirati pet nezavisnih miješaju skupova podataka. Onaj s najvišim F pregled vrijednosti, što iznosi 46,6% je izabran i njegov konture prikazan je na slici 6B. To slučajno miješanje evaluacija također je primijenjena na istočnoazijske podataka podtipu i najbolji F pregled vrijednost bila na 54,3%. Uspoređujući dvije parcele pokazuje značajnu razliku u F pregled vrijednosti između podataka s ispravnom grupiranju oboljelih od raka i ne-raka predmeta u obuci i najboljim slučajno miješaju podataka. Rezultat sugerira da se interventne regije su informativnog razlikovati od raka i ne-raka grupa i naše metode mogu koristiti informacije na učinkovit način. Pregled

    Klasifikacija Performanse pregled

    Postoje uglavnom tri kategorije klasifikacija metode: značajka based, slijed udaljenost temelji i model koji se temelji. Način da smo u ovom radu pripada značajka-based kategoriju. Odabrali smo dvije od najpopularnijih klasifikacija alata kao tipičnih postupaka drugih dviju kategorija za usporedbu. BLAST [36] je izabran za based kategoriji daljinu slijed, jer je većina naširoko koristi za usporedbu sekvenci alat. Za kategoriju model-based, skriveni Markovljev model je tipična metoda za analizu sekvencija i njegove naširoko koristi alat, HMMER [37], odabran je. Za postupak klasifikacije oba eksplozije i HMMER, koristili smo zadane parametre alata, koji se primjenjuje na isti Loo križne validacije kao naše metode, a koriste iste formule vrednovanja navedene u odjeljku metode. Pregled

    Tablica 2 navodi rezultate klasifikacije sva tri načina. Metoda SVM obavlja znatno bolji od druga dva pristupa. BLAST postiže blizu točnost na Entropija-SVM metoda, ali je predvidio mnoge lažne negativne uz nisku osjetljivost. HAMMER postigli visoku osjetljivost, ali s malo specifičnosti. S obzirom na F pregled vrijednosti i MCC-pregled vrijednosti, rezultati predviđanja od eksplozije i HAMMER su gotovo nasumce. Pregled

    Rezultat klasifikacija i konture (Slika 6) snažno podupiru naš hipoteza, odnosno, informacije o odabranim ostacima u intervenira regije mogu se koristiti za klasificiranje odnos CagA sekvenci i karcinoma želuca, iako je razlika između profila raka i ne-raka skupina nije vrlo jaka. pregled

    Usporedba između različitih bolesti

    H. pylori pregled infekcija povezana s većinom gastroduodenalnog bolesti, među kojima raka želuca je najteži jedan uzrokuje više od 700.000 smrtnih slučajeva u svijetu svake godine [38]. Budući da H. pylori pregled je glavni faktor rizika od raka želuca (GC), otkriće mehanizma H. pylori
    posredovanje GC postaje prioritet zadatak u ovoj oblasti. U usporedbi s drugim bolestima, informacije dijagnoza GC iz javnog podataka je relativno precizan, a to je još jedan važan razlog da se fokusiraju na GC u ovom radu. Naša istraživanja nisu ograničeni na GC, iako. Također smo pokušali procijeniti odnose između varijance CagA sekvenci i različitih bolesti. pregled

    Budući da su većina podataka prikupljeni iz javnih baza podataka bez točnih informacija dijagnoze, prije nanošenja naše metode za CagA podataka, ručno kustos komentare bolesti za sve sojeve pregledom literature. Tablica S1 popis raspodjele glavnih bolesti Za zapadnjačke i East Asain podtipu skupina. Zbog ograničenja naprezanja broja nekih bolesti, kao što su atrofičnog gastritisa (AG) i čira na želucu (gu), na kraju smo podigne kroničnog gastritisa (CG) i dvanaesniku (DU) kao kontrolne skupine za evaluaciju. Du grupa u East Asian podtip sadrži 79 sojeva, a postupak početno podizati se primjenjuje na sve ostale skupine kako bi isti broj sojeva kao istočnoazijske DU grupi. Ovaj korak garantira sve usporedbe na istoj razini, jer je vrijednost kombinatorne entropije ovisi o broju sekvenci. Koristili smo formulu (3) izračunati entropije razliku svakom položaju između GC i CG /DU skupinama, a zatim zbrojiti sve entropije razlike kao ukupne razlike između GC i CG /DU skupina, kao što je prikazano u tablici S2. Usporedbom rezultata između dviju skupina unutar istog geografskog podtip (East Asian ili Western podtip), to je u skladu s kliničkim pogledom koji gastritis ima jače odnose na rak, nego da DU [39] (u pravilu, gastritis slučajevima može sadržavati neke neprijavljeno ili nedijagnostikovan kronični atrofični gastritis i intestinalne metaplazije slučajeva, s kojima pacijenti imaju visok rizik za razvoj GC). Uzimajući u obzir isti bolesnog par između dviju zemljopisnih podtipa, također objasnio je žestok razliku između istočne Azije i zapadnog podtipova. Osim toga, s obzirom na visoku sličnost između različitih bolesti skupina Istok azijske podvrste, čak i sa više podataka, još uvijek ne možemo doći do iste točnosti klasifikacije zapadnog podtipa skupine.

    Na temelju navedenih rezultata, CagA sekvence pokazuju potencijal za razlikovanje više gastroduodenalnog bolesti. Kako bi se ocijenila uspješnost klasifikacije, koristili smo DU grupi zamijeniti bez raka skupinu, a onda opet primijeniti postupak cijeli klasifikacijski bez pokretački, budući da te dvije bolesti skupine imaju usporedive veličine. Tablica S3 prikazuje rezultate klasifikacije. Iako je iz kliničke točke gledišta, DU ima negtive korelaciju s GC među svim gastroduodenalnog bolesti [40], klasifikacija izvedba dva podtipa skupine bio je tek neznatno poboljšana. Tako su povezana s karcinomom sojevi CagA možda ima neke jedinstvene obrasce slijed u usporedbi sa svim ostalim gastroduodenalnog bolesti. Dakle, tuning podskup kontrolnoj skupini ne može biti u mogućnosti poboljšati točnost klasifikacije. Pregled

    Rasprava pregled

    Iako istraživanja pokazuju da postoje markeri slijed razlikovati od raka skupine i nemaju veze s rakom grupe , glavni profili tih dviju skupina su previše slični razlikuju po korištenjem tradicionalnih metoda jer CagA sekvence su sveukupno dobro očuvan. Stoga smo usmjereni na identificiranje informativnih ostataka, kvantificiranje informacije o ovim odabranim ostacima, a zatim ga koristiti za dizajn klasifikator koji može predvidjeti hoće li novi slijed pripada skupini karcinoma ili skupine nemaju veze s rakom. Ova metoda ne samo da baca svjetlo na odnose između CagA sekvenci i raka želuca, ali može poslužiti kao koristan alat za želučane dijagnoze raka ili prognozu. Pregled

    Mehanizmi H. pylori
    uzrokuje različite gastroduodenalnih bolesti su još uvijek nejasni, no vjerojatno je da razni gastroduodenalnih bolesti uzrokovane H. pylori
    infekcije dijele neke obrasce slijed u međuvremenu regijama. Male promjene amino kiselina u važnih ostataka mogu dovesti do virulencije varijance CAGA sojeva rezultiraju različitim gastroduodenalnih bolesti. Dok CagA može biti marker za otkrivanje potencijalni rizik od raka, koristeći CagA sami razlučiti sve gastroduodenalnog bolesti nije realno. Kao buduća proučavanja, mi ćemo razviti nove modele koji razlikovanje različitih gastroduodenalnog bolesti s CagA i drugim genima. Pregled

    popratne podatke pregled Tablica S1. . Pregled, Broj sojeva u svakoj bolesti pregled doi: 10,1371 /journal.pone.0036844.s001 pregled (DOC) pregled Tablica S2. . Pregled Ukupna entropija razlika između raka želuca i drugih dviju grupa bolesti pregled doi: 10,1371 /journal.pone.0036844.s002 pregled (DOC) pregled Tablica S3. izvedba pregled Klasifikacija između raka želuca i čira dvanaesnika skupine za obje zapadne i istočne Azije podtipova pregled doi:. 10,1371 /journal.pone.0036844.s003 pregled (DOC) pregled

  • Other Languages