Stomach Health > skrandžio sveikatos >  > Gastric Cancer > skrandžio vėžys

PLoS ONE: Rizikos vertinimas Skrandžio vėžys, sukeltas Helicobacter pylori Naudojant CagA seka Žymekliai

Anotacija

Fonas

Kaip persekiotoją, Helicobacter pylori
, citotoksinas susijęs genas A (CagA) buvo atskleista, kad didžiausia virulentiškumo faktorius sukelia viršutinės virškinamojo trakto ligų , Tačiau molekulinius mechanizmus, kuriomis grindžiami įvairių skrandžio ligų, kurias sukelia CagA teigiamas H plėtrą. pylori
infekcija lieka nežinoma. Vykdomi tyrimai yra apribota iki tarp ligų koreliacijos vertinimo ir Glu-Pro-Ile-Tyr-Ala (EPIYA) fragmentais skaičiaus CagA padermės. Siekiant dar labiau suprasti skirtumą tarp CagA seka ir jos virulentiškumo skrandžio vėžio santykį, mes pasiūlėme sisteminį entropija pagrįstą požiūrį, siekiant nustatyti vėžio susijusių likučių praėjusius regionuose CagA ir dirbo prižiūrimą mašina mokymosi metodą vėžio ir ne vėžio atvejų klasifikacija.

metodologija

entropija pagrindu buvo apskaičiuoti naudojamas aptikti pagrindinius likučių CagA praėjusius sekas kaip skrandžio vėžio biologinis žymuo. Už kiekvienos medžiagos liekanų, tiek kombinatorinė entropija ir fono entropija buvo apskaičiuotas, ir entropija skirtumas buvo naudojama kaip pagrindas funkcija likučių atrankos kriterijų. tada funkcija vertės buvo įtrauktos į paramos Vector mašinos (SVM) su radialine pagrindas funkcija (RBF) branduolio, ir du parametrai buvo formuojamos taip, kad gauti optimalų F vertę naudojant tinklo paiešką. Du kitų populiarių seka klasifikavimo metodai, sprogimo ir hmmer, taip pat buvo taikomi tais pačiais duomenimis palyginimui.

Išvada

Mūsų metodas pasiekti 76% ir 71% Klasifikacija tikslumas Vakarų ir Rytų Azijos potipiai, atitinkamai, kuri žymiai geresni nei sprogimo ir hmmer. Šis tyrimas rodo, kad mažos variantų amino rūgščių tose svarbiausių likučių gali sukelti virulentiškumo dispersija CagA padermių atsirandančių įvairiose skrandžio ligas. Šis tyrimas suteikia ne tik naudingas įrankis prognozuoti tarp romano CagA deformacijų ir ligų, bet ir plačiajai naują sistemą aptikti biologiniai sekos biologinius žymenis ir gyventojų tyrimų koreliacija

nurodomoji dalis:. Zhang, C, Xu S Xu d (2012) Rizikos vertinimo skrandžio vėžys, sukeltas Helicobacter pylori
Naudojant CagA seka žymekliais. PLoS vieną iš 7 (5): e36844. Doi: 10,1371 /journal.pone.0036844

redaktorius: Niyaz Ahmedas universiteto Hyderabad, Indija

Įstojo: Lapkričio 13, 2011 m Priėmė įnešta 11 balandžio 2012 m Paskelbta: Gegužės 15, 2012

Visos teisės saugomos: © 2012 Zhang et al., Tai atviros prieigos straipsnis platinama pagal Creative Commons Attribution licencija, kuri leidžia nevaržomai naudotis, paskirstymo ir dauginimąsi bet kokioje laikmenoje sąlygomis, su sąlyga, kad pirmasis autorius ir šaltinis įskaitomos

Finansavimas:. Šis darbas buvo iš dalies remiama JAV nacionalinio sveikatos instituto [dotacija numeris R21 /R33 GM078601] ir tarptautinių mainų ir bendradarbiavimo tarnybos Nanjing medicinos universitetas, Kinija. Į finansuotojai neturėjo vaidmenį studijų dizainas, duomenų rinkimo ir analizės, sprendimų skelbti, ar ruošiant rankraštį

konkuruojančių interesų.. Autoriai pareiškė, kad nėra konkuruojantys interesai egzistuoja

Įvadas

Helicobacter pylori (H. pylori)
yra gram-neigiamos spiralės formos bakterija gyvenančios žmogaus skrandį ir užkrėsti daugiau nei pusė pasaulio gyventojų [1], [2], [ ,,,0],3]. Neseniai atlikti tyrimai parodė, kad jis yra susijęs su skrandžio ir dvylikapirštės žarnos ligų, įskaitant dvylikapirštės žarnos opų [4], skrandžio opos [5] ir lėtinio gastrito. Daugiau svarbiau, kad ji yra reikšmingas rizikos veiksnys kuriant skrandžio vėžį [6], [7], [8]. Jis buvo klasifikuojamos kaip 1 klasės žmogaus kancerogenams Pasaulio sveikatos organizacijos, nuo 1994 m [1].

Kaip H persekiotoją. pylori
, The citotoksinas susijęs genas A (CagA) buvo atskleidė tolesnei analizei bus pagrindinė virulentiškumo faktorius. h. pylori
padermių vežančios CagA genas padidina rizikos faktorius skrandžio ligų trys raukšlės virš CagA neigiamas padermių [6], [9], [10]. CagA, kuris yra koduojama CagA geno, yra 125-140 kDa baltymas. Ji yra 1142-1320 amino rūgščių ir turi kintamą sritį, tuo C-galo srities, kurioje yra keli trumpi sekos (pavyzdžiui, EPIYA motyvas) pakartoti 1-7 kartus. Po h. pylori
kolonizavimo nuo skrandžio epitelio paviršiaus, CagA gali būti pernešami į skrandžio epitelio ląstelės per IV tipo sekrecijos sistema. Kartą įpurškiamas į ląstelę-šeimininkę, CagA localizes į plazminės membranos ir gali būti fosforilinamos Scr šeimos tirozino kinazės nuo konkrečių tirozino liekanų penkių-amino-rūgšties (EPIYA) motyvas [11], [12], [13] , [14]. Tirozinas-fosforilinamos CagA tada specifiškai jungiasi prie SHP-2 tirozino fosfatazės 11,15 aktyvuoti fosforilazę, kuris sukelia kaskados efektą, kuris trukdo su signalo perdavimo kelias priimančios ląstelės, todėl iš ląstelės šeimininkės citoskeleto ir formavimo pertvarkymo kolibris fenotipas [11], [16]. Tuo pačiu metu per aktyvavimo mitogeno-aktyvuoto proteino kinazės (MAPK), ekstraląstelinis signalas-reguliuojama kinazės (ERK) [17], ir židinio sukibimo kinazę (FAK), CagA taip pat gali sukelti ląstelių disociacija ir infiltracine naviko augimą [18], [19 ], [20], [21]. Toks procesas leidžia CagA svarbiausias virulentiškumo faktorius H. pylori
[22].

Per kintamojo regione CagA, yra keletas skirtingų bylą įstojusios sekas tarp šių EPIYA motyvais. Vienas iš EPIYA kopija plius įsikišimo seka identifikuojama kaip EPIYA segmente. Keturi unikalūs tipų EPIYA segmentuose buvo rasta CagA, apibrėžiamas kaip EPIYA-A, -B, -C ir -D [11]. CagA izoliuotas nuo Rytų Azijos šalių, paskirtas Rytų Azijos CagA, yra EPIYA-A EPIYA-B ir EPIYA-D motyvai. CagA iš Vakarų šalių, EPIYA D pakeičiama EPIYA-C. Stipresnis fosforilinimo motyvas privalomas veikla EPIYA-D motyvas lemia didesnį morfologinių pokyčių, nei ką EPIYA C motyvas gali sukelti infekuotų ląstelių [11]. Būtent šis EPIYA-D motyvas anketa padidėjo privalomas veikla ir atstojamasis morfologiniai pokyčiai, kuris identifikuoja jį kaip galimą veiksnį paaiškinti dažniau skrandžio vėžio Rytų Azijos šalių [23], [24].

Ankstesni tyrimai parodė, nuostata dėl to EPIYA motyvas kartojasi tiek Rytų Azijos ir Vakarų CagA skaičius, kuris gali turėti įtakos biologiniam aktyvumui variacijos. Yamaoka ir kt. [25] nustatė, kad Kolumbijoje ir JAV, į CagA-teigiamas H galimybes. pylori
sukelti skrandžio gleivinės atrofijos ir žarninės metaplazijos gali būti susijęs su EPIYA motyvų skaičiaus CagA kamieno. Sudrabains ir kt. [16] priėjo prie tos pačios išvados vėliau. Tačiau, priešingai nei nuomonės buvo paskelbtas Lai et al. [26] Remiantis išvadomis tarp EPIYA motyvų skaičiaus CagA kamieno ir klinikinės ligos per 58 izoliatų iš Taivano jokio ryšio. Atsižvelgiant į dydį ir geografinę apribojimų šių tyrimų duomenimis, šios išvados pagrįstumas yra abejotinas. Be nuo EPIYA motyvas kartojasi skaičius, seka skirtumas padermių kintamos regionuose taip pat gali sukelti didelį skirtumą virulentiškumo, kuris gali būti susijęs su įvairių patogeninių gebėjimų H. pylori
[27].

Dėl sudėtingų ir variantas sekas CagA, tarp į CagA ir klinikinių ligų polimorfizmo santykiai tapo labai įdomus tyrimo problema. Tačiau molekulinius mechanizmus, kuriomis grindžiami įvairių viršutinės virškinamojo trakto ligoms, sukeltoms CagA teigiamas H. pylori
infekcija lieka nežinoma. Iki šiol dauguma tyrimų yra dar tik atradimą ar įvertinimo tarp CagA EPIYA motyvais ir ligų [28] koreliacijos.

Šiame darbe mes siūlome sisteminį metodą analizuoti ne tik skaičių EPIYA motyvai CagA sekas, bet ir tikra seka modeliai praėjusius regionuose. Pirma, mes pristatome entropija skaičiavimą aptikti per kintamojo regione CagA likučius kaip skrandžio vėžio biologinius žymenis. Tada mes samdyti prižiūrimą mokymosi tvarką klasifikuoti vėžio ir ne tik vėžio naudojant aptiktų liekanų CagA kaip funkcijų informaciją. Renkamės paramos vektorių mašinos (SVM) kaip dvejetainė klasifikatorių ir palyginkite mūsų metodą su kitais. Mūsų požiūris įrodo ne tik mūsų hipotezę, kad kintamojo regione CagA seka pateikiama informacija atskirti skirtingas ligas, bet taip pat suteikia naudingas įrankis prognozuoti tarp romano CagA padermių ir ligas, ir aptikti biologinis taip pat koreliaciją.

metodų

duomenų Išankstinis apdorojimas

remiantis ankstesniais aprašymas nuorodoje. [15], mes pavadintas EPIYA motyvas ir šiuos įsiterpiančius regionus R1, R2, R3, R3 ', R4 ir R4' (1 pav.) 2 paveikslas rodo padėties ryšį tarp EPIYA motyvas (R1) ir kitos į bylą įstojusios regionuose naudojant CagA įveda-B-D (Rytų Azijos potipio) ir A-B-C (Vakarų potipio) kaip pavyzdžiai. R2 yra santykinai konservatyvios abiejuose potipių, bet yra didelių skirtumų tarp įsiterpusiais regionuose R3 ir R3 ', taip pat tarp R4 ir R4'. Rytų Azijos potipis ir Vakarų potipis buvo traktuojami kaip dviejų nepriklausomų grupių. tada jų duomenys buvo tvarkomi, ir rezultatai buvo analizuojami kiekvienoje grupėje atskirai.

Visos į bylą įstojusios regionai buvo paimti iš CagA sekų ir įdėti į atitinkamą potipio grupių, ir tada daug seka suderinimai buvo taikomi kiekvienai grupei atskirai naudojant Clustar X versiją 2.0.3 [29]. Sekas profiliai (1 paveikslas) buvo pastatytas naudojant Weblogo 3 [30].

Likučių nustatymo

Nuo CagA yra susijęs su beveik visų skrandžio ligų ir paprastą analizę EPIYA motyvas kartojasi nėra duoti jokių statistiškai reikšmingų skirtumų tarp šių ligų, informaciją apie konkrečios ligos gali būti paslėptas į bylą įstojusių regionuose. Šis tyrimas daroma prielaida, kad yra likučių ar likučių derinių, kurie gali būti naudingi kaip tam tikros ligos persekiotoją rinkinys. Šis tyrimas sutelkia dėmesį į skrandžio vėžio ir naudoja vėžys /ne vėžio grupes kaip pvz.

Remiantis suderintas sekų kiekvienos tarpiniu regiono, konkrečios likučiai buvo nustatyti palyginant kombinatorinė entropijos skirtumą [31] tarp vėžio ir ne-vėžio grupės. Ši procedūra apima šiuos veiksmus: Rīga,

Pirmiausia, mes padalinti duotus kelis suderinimai visiems praėjusius regionų į dvi grupes: skrandžio vėžys grupė ir ne vėžys grupė. Už kiekvieną keliais išplanavimai skiltyje apskaičiuojame fono entropiją (. 1 EQ) ir Combinatorial entropiją (. 2 EQ), apibūdinti taip: (1) kur atstovauja sekų skaičių grupėje, K
. rodo likučius tipo stulpelyje skaičių
grupės K
. yra likučių tipą stulpelyje Taškų aš
. atstovauja skaičių sekas suderinti (2), kur

Tada entropija skirtumas tarp kombinatorinė entropijos ir fono entropija yra apskaičiuojama:.. (3)

3 pav entropijos koncepciją naudojant tris ekstremalias atvejus. Tuo atveju, P1, amino rūgštys yra "atsitiktinai ir tolygiai paskirstytą" per visų grupių ir ten yra ne žymiai išsaugoti modelį šioje padėtyje. Atveju P2 reiškia "visame pasaulyje apsaugotą" modelis ir visi amino rūgštys yra tas pats abiejuose grupių. Tuo atveju, P3, kai kurios konkrečios amino rūgštys yra saugomos tik į tam tikras grupes, ir skirtingos grupės turi skirtingus amino rūgščių. Mes tai vadiname atvejis "vietoje užkonservuoti".

Pasak skaičiavimo rezultatus entropijos skirtumo į aukščiau trijų atvejų, kombinatorinė entropija yra tiek "visame pasaulyje užkonservuotas" ir "vietoje užkonservuotas" atvejais. Dėl "atsitiktinai ir tolygiai paskirstyta" atveju, gauna didžiausią vertę. Galime išskirti "konservatyvūs" ir "atsitiktinai ir tolygiai paskirstyta" remiantis kombinatorinė entropijos atvejus, bet tai nepadeda pasiimti "vietoje apsaugotą" bylą iš visų "užkonservuoti" atvejus. Kai mes atsižvelgti į fono entropiją tuo pačiu metu, gauna didžiausią vertė 0, ir vidutinės vertę "atsitiktinai ir vienodai paskirstytos" atveju, "visame pasaulyje išsaugoti" bylą, vietiškai išsaugota "bylą, atitinkamai. Galiausiai, dėl aukščiau trijų atvejų skirtumai :,, ir gauna minimalią vertę. Taigi, entropija skirtumas yra tinkamas matavimas aptikti "vietoje apsaugotą" sekos modelis.

Funkcija entropija apskaičiavimas

Remiantis pirmiau minėtus skaičiavimus, ji gali būti nustatyta, kad informacija grupavimas gali sumažinti entropija skirtumas tiems likučiams, priklausančių "vietos konservuotais" atveju. Atlikti bandymą, vienas seka yra parinktas o sekų likusios yra padalintas į skrandžio vėžio grupės ir ne-vėžio grupės. Visų pasirinktų likučių, pasirinktas seka yra patalpintas į skrandžio vėžio grupės apskaičiuoti entropijos skirtumą, ir tada jis yra patalpintas į ne-vėžio grupės, gauti atitinkamą entropijos skirtumą. Galiausiai gaunamas visų pasirinktų likučių, kurie yra naudojami kaip funkcija entropija.

klasifikacija CagA sekas

rinkinį.

ieškojote Nacionalinės centro biotechnologijos informacija (NCBI ), Šveicarijos-PROT /drebėti ir DDBJ baltymų duomenų ir gavo 535 kamienus H. pylori
CagA baltymų. Tarp jų yra 287 Rytų Azijos potipio atmainos ir 248 Vakarų potipio atmainos. Rytų Azijos potipio grupės 47 iš 287 padermių yra iš skrandžio vėžiu sergančių pacientų, o likusieji yra iš kitų ligų. Vakarų potipio grupės, yra 37 padermės iš skrandžio vėžiu sergančių pacientų, o liekanos yra iš kitų ligų arba įprastinės kontrolės, įskaitant 24 kamienų iš savanorių, kurių sveikata (liga) statusas buvo nežinoma.

Darbo eigos.

4 pav klasifikavimo /prognozavimo procedūros eigą:

  • Pasirinkite vieną įtampą kaip bandymo štamo
  • Taikyti įkrovos procedūra su padermių poilsio gauti. mokymo atmainos.
  • Apskaičiuokite funkcijų entropiją už tiriamajam kamienui remiantis mokymo padermių ir išsaugokite jį kaip bandymų duomenis.
  • Apskaičiuokite funkcijų entropiją kiekvieno kamieno į mokymo padermės nustatyta remiantis " mokymo kamienų ir išsaugokite juos kaip mokymo duomenis.
  • Generate klasifikavimo modelį, naudojant mokymo duomenis.
  • klasifikuoti bandymų duomenis remiantis klasifikavimo modelį.
  • Pakartokite šią procedūrą penkis kartus, ir tada apskaičiuoti vidurkį kaip galutinis rezultatas.

    Bootstrap.

    pagrindinė problema kuriant klasifikavimo modelį, šiuo atveju yra didelis skirtumas dydžių pavyzdžių tarp vėžio ir ne vėžio grupės, kurios gali sukelti šališkumo klasifikavimo rezultatus. Bootstrapping procedūra buvo taikoma sprendžiant šią problemą. Kiekvienoje potipio grupės, kiekvienai mokymo /bandymų duomenų rinkinių, visi ne-vėžio mėginiai buvo įtrauktas, ir tada kamienai buvo nuolat sudarytas iš vėžio grupės atsitiktine tvarka, kol pasiekiama tokio pat dydžio ne vėžio grupės. Šiuo atveju, visi galimi duomenys buvo naudojami nors vėžio mėginiai buvo naudojami kelis kartus atsižvelgiant į jų mažesnio dydžio, palyginti su ne-vėžio grupės. Ši procedūra buvo taikoma penkis kartus generuoti penkis nepriklausomus mokymo rinkinius kiekvienam bandymo seką. Klasifikavimas /prognozavimo rezultatas yra tų penkių nepriklausomų rezultatų vidurkis.

    Kryžminis įteisinimą.

    Kadangi duomenų dydis yra mažas, atostogos-vienas iš (LOO) kryžminio tikrinimo tvarka buvo atliekama. Tai yra ne tik, kad klasifikatorius našumą mokymo /testavimo duomenų vertinimas, bet taip pat prognozavimo galia sąmatą naujų atvejų.

    SVM.

    Mes pasirinkome SVM kaip dvejetainis klasifikatorių ir naudojamas funkcija entropija vektoriai mokyti ir testuoti klasifikatorių. Per dviejų klasės minkštas maržos klasifikavimo atveju sprendimas funkcija yra svertinis tiesinė kombinacija apibrėžiamas taip: (4) kur atstovauja vartotojo nustatytą branduolio funkciją, kuri matuoja tarp įvesties funkcija vektorių ir yra: vektorių mokymo panašumus duomenų rinkinys. yra masė priskirtas mokymo funkcija vektorius, nurodantis, ar CagA padermės buvo paženklinti teigiamo klasės (+1) ar neigiamo klasės (-1). Pirminis optimizavimas problema trunka formą: sumažinti (5) Atsižvelgiant į (6) kur. m yra bendras skaičius padermių. yra laisvumo kintamasis kuris matuoja klaidingo klasifikavimo pagal atskaitos laipsnį. yra ekonomiškai parametras kuri leidžia prekybos išjungti mokymo klaidą su modelio sudėtingumo. w yra normalus vektorius ir B yra kompensuoti.

    Po lyginant daugianario, TANH ir Gauso radialinis bazinių grūdų rezultatus, gaunamas su RBF branduolio rezultatas dirbo geriausiai, kur Gauso radialinis pagrindas branduoliai (spindulio tipo bazės :) yra už bendrosios paskirties mokymosi, kai nėra išankstinių žinių apie duomenų. SVM Šviesos paketas (http://svmlight.joachims.org/) [32] dirbo statyti mūsų prašymą. Parametrai ir buvo sureguliuota, kad gauti geriausią modelį mokymo duomenų, kaip parodyta toliau. Visi kiti SVM parametrai buvo nustatyti numatytąsias jų reikšmes

    Atestacija

    Norint įvertinti klasifikatoriaus našumą, iš veiklos priemonių įvairovė yra taikomas:.. Tikslumas, jautrumas ir specifiškumas. Tikras teigiamas (TP) yra vėžys, susijusių seka klasifikuojami kaip, pavyzdžiui, o klaidingai teigiamas (FP) yra ne-vėžys susijęs seka klasifikuojami kaip vėžys susijusių, klaidingas neigiamas (FN) yra vėžys, susijusių seka klasifikuojami kaip ne -cancer susiję ir tiesa neigiamas (TN) yra ne vėžys susijęs seka laikoma ne tik vėžio susiję. Tikslumas, jautrumas (SN), specifiškumas (SP) ir Matthews koreliacijos koeficientas (MKC) klasifikavimo apibrėžiamas taip: (7) (8) (9) (10) Kadangi yra tik du parametrai RBF branduolio ir jie yra nepriklausomi, mes pritaikėme Grid paiešką, siekiant nustatyti optimalius parametrus klasifikatorių. Mes naudojamas harmoninis vidurkis jautrumo ir specifiškumo, kaip tikslo funkcijos optimizuoti už mokymo rinkinys, kuri apibrėžiama kaip modelio efektyvumą taip:
    (11)

    Rezultatai

    Likučių nustatymo ir Žanras skaičiavimo

    1 lentelėje išvardytos visų aptiktų pagrindiniai likučiai pagal apskaičiuoti entropijos skirtumą kiekvieną tarpiniu regione tiek Vakarų ir Rytų Azijos potipių. Nors yra keletas geografinės variacijos CagA sekų tarp Vakarų ir Rytų Azijos potipių, keletas bendrų liekanos vis dar gali būti nustatyta, kad atskirti vėžines ir ne tik vėžio grupes. Tai rodo, kad tie likučiai gali būti labai svarbus nustatant CagA kenksmingumą ir tarp CagA ir kai kurių konkrečių ligų santykį.

    likučių pozicijos parodyta 5 paveiksle Ankstesnis tyrimas [27] parodė, kad skirtingi EPIYA segmentai gali prisijungti prie įvairių kinazių, pvz, EPIYA-R2 ir EPIYA-R3, /R3 'jungiasi prie C-galinių src kinazės (Csk), o EPIYA-R4 ir EPIYA-R4' jungiasi prie SHP-2 kinazės sukelti kolibris fenotipas. CagA-CSK sąveika žemyn reguliuoja CagA-SHP-2 signalizacijos, kad perturbs ląstelių funkcijas kontroliuoti CagA kenksmingumą. Ji yra nustatyta, kad dauguma rasta likučių priklauso R2 ir R3 /R3 'regionuose ir keletą likučių R4 /R4' regionuose nebuvo aptikta. Tai gali būti dėl to, R4 /R4 'yra daugiau konservatyvius seką nei R2 ir R4 /R4' yra trumpesnis nei R3 /R3 '. Siūlome, kad skirtingi likučių modeliai R2 arba R3 /R3 'regionuose gali pakeisti žemyn reguliavimo CagA-SHP-2 signalizacijos galimybes, todėl keičiant CagA kenksmingumą.

    Ren et al., nustatė, kad CagA multimerizes žinduolių ląstelėse [33]. Tai multimerizaciją yra nepriklausomi, kad tirozino fosforilinimo, bet ji yra susijusi su "FPLxRxxxVxDLSKVG" motyvas kuris pavadintas CM motyvas R3 'tarpiniu regione. Kadangi multimerizaciją yra būtina sąlyga, kad CagA-SHP-2 signalizacijos sudėtingą ir vėliau, nustojus reguliuoti SHP-2, CM motyvas vaidina svarbų vaidmenį CagA teigiamas H. pylori
    sąlygojamą skrandžio patogenezė. Su keliais CM motyvai h. pylori
    atmainos yra kiek tikėtina, susijęs su sunkių skrandžio ligų [33], [34], tačiau šis pastebėjimas negali paaiškinti, kodėl skirtingi gastroduodeninės ligos gali būti sukurta su tą patį skaičių CM motyvais. Mūsų tyrimas aptiko dvi likučių CM motyvas R3 'tarpiniu regione, kuris gali baigtis multimerizaciją kaita, todėl keičiant CagA kenksmingumą. Tai dera su ankstesniais atradimas [35], kad seka skirtumas tarp Rytų Azijos cm ir Vakarų CM lemia jungimosi afinitetą tarp CagA ir SHP-2.

    Nors identifikuotos pagrindinės liekanos gali atskleisti tam tikrą skirtumą tarp vėžio ir ne-vėžio grupės, nė vienas liekana gali būti žymeklis vėžio, kaip parodyta 5 paveiksle Šis tyrimas prognozuoja, kad vienas specialus derinys visų arba dalinių aptiktų likučių gali turėti didelį ryšį su vienu konkrečios ligos. Norėdami patikrinti, keli linijiniai statistiniai modeliai, pvz tiesinė regresija ir logistinė regresija, buvo taikomi nustatytų funkcijų įvertinti kiekvieno likučių svarbą ir tarp pasirinktų likučių ir vėžio ryšį. Tačiau, nė vienas iš minėtų modelių galėjo pagaminti statistiškai reikšmingą rezultatą. Kadangi funkcijų negali būti įrengta paprastų linijinių modelių prognozuoti vėžį, taikant mašina mokymosi metodą šiuos duomenis analizuoja ir klasifikuoja tampa būtina.

    Parametras mokymai Klasifikacija

    Naudojant Vakarų potipio grupę kaip pavyzdys, laisvas tinklelį paieška pirmą kartą buvo atliktas ir (6a pav) ir nustatė, kad geriausia yra aplink gauti aukščiausią F vertė su Loo kryžminio patvirtinimo norma 76%. Tada prabangiau tinklelis paieška buvo atlikta kaimynystėje ir geriau F vertė buvo gautas su 79,7% Loo kryžminio patvirtinimo metu. Ta pati procedūra buvo naudojama Rytų Azijos potipio grupės ir geriausio LOO kryžminio patvirtinimo normos buvo pasiektas 72,6%.

    Kadangi nėra jokių ankstesnių tyrimų ar skaičiavimų metodai, ta pačia tema, įvertinamas šios veiklos Research naujas metodas yra sunku. Įvertinti informacijos turinio sekas pagal jų atidesni galios prognozuoti vėžį, atsitiktinis Maišoma procedūra buvo pasamdytas sukurti valdymo grupę. Pirma, visos sekos iš Vakarų potipio buvo pateikti kartu kurti sekos baseinas. Antra, mes atsitiktinai surinkti tą patį skaičių sekas, kaip vėžio grupės iš sekos baseinas ir apdorojimo priemonės, kuriomis sekas, kaip ne-vėžio grupės poilsio. Tada, visas mokymo procedūra buvo taikoma naujai išmaišytos duomenų kad rasti geriausią. Aukščiau nurodytus veiksmus buvo pakartotas penkis kartus generuoti penkis nepriklausomus išmaišytos duomenų rinkinius. Vienas su didžiausia F
    verte, kuri lygi 46,6% buvo pasirinktas ir jo kontūras Sklypas yra parodyta 6B pav. Tai atsitiktinai maišymo vertinimas taip pat buvo taikoma Rytų Azijos potipio duomenų ir geriausias F
    vertė buvo 54,3%. Lyginant du sklypus rodo didelį skirtumą, F
    vertės tarp duomenų teisingą grupės vėžiu ir ne vėžio atvejų mokymo ir geriausių atsitiktinai išmaišytos duomenis. Rezultatas rodo, kad įstojusios į bylą regionai informatyvus atskirti nuo vėžio ir ne vėžio grupių ir mūsų metodas gali efektyviai panaudoti informaciją.

    Klasifikavimas spektaklio

    Yra daugiausia trijų kategorijų seka klasifikacija metodai: funkcija pagrįsta, seka atstumas pagrįstas ir modelis pagrįstas. Metodas, kad mes aprašyta šiame dokumente yra siejamas su funkcija pagrindu kategorijas. Mes pasirinkome du iš populiariausių seka klasifikavimo įrankiai kaip reprezentacinių metodų kitų dviejų kategorijų palyginimas. BLAST [36] buvo pasirinktas seka atstumu pagrįsti kategorijos, nes ji yra labiausiai plačiai naudojamas seka palyginimas įrankis. Dėl modelio pagrindu kategorijos, paslėptas Markovo modelis yra tipiškas metodas sekos analizę ir jos plačiai naudojama priemonė, hmmer [37], buvo pasirinktas. Klasifikavimo tvarka tiek sprogimo ir hmmer, mes naudojamas numatytasis parametrus įrankiai, naudojami tie patys Loo kryžminio įteisinimą, kaip mūsų metodu ir buvo naudojami tie patys vertinimo formules išvardytus skyriuje metodas.

    2 lentelė išvardija klasifikavimo rezultatus visų trijų metodų. SVM metodas atlieka žymiai geriau nei kitų dviejų požiūrių. BLAST pasiekti glaudų tikslumą entropija-SVM metodas, tačiau jis prognozavo daug klaidingų neigiamų su mažo jautrumo. Hammer pasiekti aukštą jautrumą tačiau su šiek tiek specifikos. Atsižvelgiant į F
    vertybes ir MCC
    vertybes, prognozavimo rezultatai BLAST ir plaktuku beveik atsitiktinai.

    klasifikacija rezultatas ir kontūras sklypas (6 paveikslas) tvirtai remiame mūsų hipotezė, ty atrinktų likučių įsikišimo regionus informacija gali būti naudojama klasifikuoti tarp CagA sekų ir skrandžio vėžio ryšį, nors tarp vėžio ir ne vėžio grupių profilius skirtumas nėra labai stiprus.

    palyginimas tarp įvairių ligų

    h. pylori
    infekcija yra susijusi su daugeliu skrandžio ligų, tarp kurių skrandžio vėžys yra skaudžiausias vienas sukelia daugiau nei 700.000 mirčių kasmet pasaulyje [38]. Nuo h. pylori
    yra pagrindinis rizikos veiksnys skrandžio vėžio (GC), atradimas iš H mechanizmą. pylori
    tarpininkauti GC tampa prioritetu uždavinys šioje srityje. Lyginant su kitomis ligomis, diagnozė informacija GC iš viešojo duomenys yra gana tikslūs, ir tai yra dar viena svarbi priežastis atkreipti dėmesį į GC šiame dokumente. Mūsų tyrimai yra ne tik GC, nors. Mes taip pat bandė įvertinti tarp CagA sekų ir įvairių ligų dispersija santykius.

    Kadangi dauguma duomenys buvo renkami iš viešųjų duomenų bazių be tikslios informacijos diagnostika, prieš taikant mūsų metodą CagA duomenimis, mes rankomis kuravo ligos komentarus visų padermių mokslinėje literatūroje peržiūrėti. S1 lentelėje pateikiami pagrindinių ligų tiek Vakarų ir Rytų Asain potipio grupių skirstiniai. Dėl to, kad deformacijų numerių kai kurių ligų, tokių kaip atrofinio gastrito (AG) ir skrandžio opa (GU) apribojimo, mes galiausiai pakėlė lėtinis gastritas (CG) ir dvylikapirštės žarnos opa (DU) kaip kontrolinių grupių vertinimo. DU grupė Rytų Azijos potipio yra 79 kamienų, ir Bootstrap procedūra buvo taikoma visoms kitoms grupėms padaryti tą patį skaičių padermių kaip Rytų Azijos DU grupei. Šis žingsnis garantuoja visais atžvilgiais lyginant tame pačiame apimčiai, nes kombinatorinės entropijos vertė priklauso nuo sekų skaičius. Mes naudojamas, kurio formulė (3) apskaičiuoti entropijos skirtumą kiekvieno tarp GC ir CG /DU grupių padėtį, ir po to pridedama visus entropija skirtumus, kaip bendra skirtumo tarp GC ir CG /DU grupių, kaip parodyta S2 lentelėje. Lyginant rezultatus tarp dviejų grupių toje pačioje geografinėje potipio (Rytų Azijos ar Vakarų potipis), tai atitinka klinikinį mano, kad gastritas turi stipresnius ryšius su vėžiu nei DU [39] (paprastai, gastritas atvejai gali būti kai nedeklaruojama arba nediagnozuota lėtinis atrofinė gastritas ir žarnyno Metaplasia atvejų, su kuriais pacientai turi didelę riziką vystytis GC). Iki atsižvelgiant į pačios ligos porą tarp dviejų geografinių potipių, ji taip pat paaiškino virulentinės skirtumą tarp Rytų Azijos ir Vakarų potipių. Be to, dėl didelio panašumo įvairių ligų grupių Rytų Azijos potipio, net daugiau duomenų, mes vis dar negali pasiekti tą pačią klasifikaciją tiksliai, kaip Vakarų potipio grupei.

    Remiantis pirmiau minėtus rezultatus, CagA sekas rodo potencialą atskirti kelis viršutinės virškinamojo trakto ligomis. Siekiant įvertinti klasifikavimo rezultatus, mes naudojome DU grupę pakeisti ne tik vėžio grupę, tada vėl taikoma visą klasifikavimo procedūrą be saviranka, nes šios dvi ligos grupės turi panašias dydžių. S3 lentelė rodo klasifikavimo rezultatus. Nors iš klinikinio požiūriu, DU turi negtive koreliaciją su GC tarp visų skrandžio ligų [40], buvo tik šiek tiek pagerėjo klasifikacija spektaklis iš dviejų potipio grupes. Taigi vėžio susijusių CagA kamienai gali turėti keletą unikalių sekos modelius lyginant su visais kitais skrandžio ligas. Taigi, tuningas iš kontrolinės grupės pogrupis gali nepavykti pagerinti klasifikavimo tikslumą.

    Diskusijos

    Nors tyrimai rodo, kad yra seka žymekliai atskirti vėžio grupei ir ne vėžio grupės , pagrindiniai profiliai šių dviejų grupių yra pernelyg panašus į išskirti naudojant tradicinius metodus, nes CagA sekos yra bendras aukšto konservatyvumo. Todėl, mes siekiama nustatyti informacinius liekanas, kiekybiškai informaciją iš šių pasirinktų likučių, ir tada naudojant jį sukurti klasifikatorių, kad gali prognozuoti, ar nauja seka yra siejamas su vėžio grupės arba ne-vėžio grupės. Šis metodas ne tik nušviečia tarp CagA sekų ir skrandžio vėžio santykių, bet taip pat gali būti naudinga priemonė skrandžio vėžio diagnozę ar prognozę.

    yra H mechanizmai. pylori
    sukelia skirtingi gastroduodeninės ligos vis dar neaišku, tačiau tikėtina, kad įvairių gastroduodeninės sukeliamos ligos H. Helicobacter pylori infekcijos
    pasidalinti kai sekos modelius per praėjusius regionuose. Maži pokyčiai amino rūgščių tų svarbių likučių gali sukelti virulentiškumo dispersija CagA padermių atsirandančių įvairiose skrandžio ligas. Nors CagA gali būti žymeklis aptikti galimą vėžio riziką, naudojant CagA vien atskirti visas viršutinės virškinamojo trakto ligomis yra nerealu. Kaip ateities studijų, mes kurti naujus modelius, kad diferencijuoti įvairias viršutinės virškinamojo trakto ligas iš CagA ir kitų genų.

    Pagalbinė informacija
    S1 lentelėje. .
    Skaičius padermių kiekvienos ligos
    Doi: 10,1371 /journal.pone.0036844.s001
    (DOC)
    S2 lentelėje. .
    Viso entropija skirtumas tarp skrandžio vėžio ir kitų dviejų ligų grupes
    Doi: 10,1371 /journal.pone.0036844.s002
    (DOC)
    S3 lentelėje.
    klasifikacija charakteristikos tarp skrandžio vėžio ir dvylikapirštės žarnos opa grupių tiek Vakarų ir Rytų Azijos potipių
    Doi:. 10,1371 /journal.pone.0036844.s003
    (DOC)

  • Other Languages