Stomach Health > gyomor egészség >  > Gastric Cancer > gyomorrák

PLoS One: Kockázatértékelés Gyomorrák helicobacter pylori által okozott használata CagA Sequence Markers

absztrakt katalógusa

Háttér katalógusa

Mivel a marker a Helicobacter pylori katalógusa, cytotoxin-asszociált gén a (cagA) már kiderült, hogy a fő virulencia faktor okozó gyomor- betegségek. Azonban a molekuláris mechanizmusok, amelyek hátterében a fejlesztés különböző gasztroduodenális betegségek által okozott cagA-pozitív H. pylori fertőzés katalógusa ismeretlen marad. Jelenlegi tanulmányok korlátozódnak az értékelés közötti korreláció betegségek száma és a Glu-Pro-Ile-Tyr-Ala (EPIYA) motívumokat az CagA törzs. Ahhoz, hogy jobban megértsük a kapcsolatát CagA szekvencia és virulencia gyomorrák javasoltuk szisztematikus entrópia-alapú megközelítés, hogy azonosítsa a rákkal kapcsolatos maradványok a közbeeső régióiban CagA és alkalmazott felügyelt gépi tanulási módszer a rák és a nem rákos megbetegedések besorolás.

Módszertan katalógusa

Egy entrópia-alapú számítást kimutatására használt kulcsfontosságú maradványainak CagA közbeeső szekvencia a gyomorrák biomarker. Minden maradék, mind kombinatorikus entrópia és a háttér entrópia számoltuk, és az entrópia különbséget használták a kritérium jellemző maradék kiválasztása. A jellemző értékeket ezután betápláljuk Support Vector Machines (SVM) a radiális bázisfüggvény (RBF) kernel, és két paramétereket hangoljuk össze, hogy az optimális F érték felhasználásával rács keresést. Két másik népszerű sorozat osztályozási módszerek, a BLAST és HMMER, szintén alkalmazzák ugyanazokat az adatokat az összehasonlítás. Katalógusa

Következtetés

A módszer elért 76%, illetve 71% besorolási pontosság nyugat és kelet-ázsiai altípusok, illetve, amely szignifikánsan jobb teljesítményt, mint a BLAST és HMMER. Ez a kutatás azt mutatja, hogy kis eltérések az aminosavak azok fontos maradékok vezethet a virulencia varianciája CagA törzsek így különböző gasztroduodenális betegségek. Ez a tanulmány nem csak hasznos eszköz megjósolni az összefüggés a regény CagA törzs és a betegségek, hanem egy új, általános keret kimutatására biológiai szekvencia biomarkerek populációs. Katalógusa

Citation: Zhang C, Xu S, Xu D (2012) kockázatértékelési gyomorrák okozta Helicobacter pylori
használata CagA Sequence Markers. PLoS ONE 7 (5): e36844. doi: 10,1371 /journal.pone.0036844 katalógusa

Szerkesztő: Niyaz Ahmed, University of Hyderabad, India katalógusa

Beérkezett: november 13, 2011; Elfogadva: 11. április 2012; Megjelent: 2012. május 15. katalógusa

Copyright: © 2012 Zhang et al. Ez egy nyílt hozzáférésű cikk feltételei szerint terjeszthető a Creative Commons Nevezd meg! Licenc, amely engedélyezi a korlátlan használatát, a forgalmazás és a reprodukció bármilyen adathordozón, feltéve, hogy az eredeti szerző és a forrás jóváírásra. Katalógusa

Forrás: Ez a munka részben támogatta az amerikai Nemzeti egészségügyi Intézet [támogatási szám R21 /R33 GM078601] és nemzetközi tapasztalatcsere és együttműködés Hivatal Nanjing Orvosi Egyetem, Kína. A finanszírozók nem volt szerepe a tanulmány tervezés, adatgyűjtés és elemzés, döntés, hogy közzéteszi, vagy a készítmény a kézirat. Katalógusa

Érdekütközés: A szerzők kijelentették, hogy nem ellentétes érdekek léteznek. Katalógusa

Bevezető

Helicobacter pylori (H. pylori)
egy Gram-negatív spirális alakú baktérium lakó az emberi gyomor, és megfertőzni több mint a fele a világ népességének [1], [2], [ ,,,0],3]. A legújabb vizsgálatok kimutatták, hogy ez együtt jár a gasztroduodenális betegségek, beleértve a nyombélfekély [4], gyomorfekély [5] és a krónikus gasztritisz. Ennél is fontosabb, hogy ez egy jelentős kockázati tényező a fejlődő gyomorrák [6], [7], [8]. Ez lett besorolva 1. osztályú emberi rákkeltő Egészségügyi Világszervezet 1994 óta [1]. Katalógusa

Mivel a marker a H. pylori
, a citotoxin-asszociált gén A (cagA) már feltárt további elemzés, hogy a fő virulencia faktor. H. pylori katalógusa hordozó törzsek a cagA gén növeli a kockázati tényező a gyomor- betegségek három többszöröseként cagA-negatív törzsek [6], [9], [10]. CagA, amely által kódolt cagA gén, egy 125-140 kDa fehérje. Ez tartalmazza 1142-1320 aminosavakat, és van egy variábilis régió a C-terminális régió, amelyben a különféle rövid szekvenciák (mint például a EPIYA motívum) ismételjük meg 1-7 alkalommal. Miután H. pylori
kolonizáló felületén a gyomornyálkahártya, CagA lehet transzlokálódik a gyomornyálkahártya sejt keresztül IV típusú szekréciós rendszer. Miután fecskendeznek a gazdasejtbe, CagA lokalizálja a plazmamembrán és lehet foszforilezzük Src-család tirozin-kinázok a specifikus tirozin-maradékok egy öt-amino-sav (EPIYA) motívum [11], [12], [13] , [14]. A tirozin-foszforilált CagA majd specifikusan kötődik az SHP-2 tirozin foszfatáz 11,15 aktiválni egy foszforiláz, ami a kaszkád értelemben, hogy zavarja a jelátviteli útvonal a gazdasejtbe, ami egy átalakítása a gazdasejt citoszkeleton és kialakulása kolibri fenotípus [11], [16]. Ugyanakkor keresztül aktiváló mitogén-aktivált protein kináz (MAPK), extracelluláris szignál-szabályozott kináz (ERK) [17] és fokális adhéziós kináz (FAK), CagA is okozhat sejt disszociációs és infiltratív tumor növekedését [18], [19 ], [20], [21]. Egy ilyen eljárás teszi CagA a legfontosabb virulencia faktor H. pylori
[22].

a variábilis régió CagA, van néhány különböző köztes szekvenciák közötti EPIYA motívumok. Az egyik példányát EPIYA, plusz a közbeékelődő szekvenciát azonosítottak, mint egy EPIYA szegmensben. Négy egyedülálló típusú EPIYA szegmensek találtak CagA, definíció szerint EPIYA-A, -B, -C és -d [11]. A CagA izolált kelet-ázsiai országban, kijelölt kelet-ázsiai CagA tartalmaz EPIYA-A, B és EPIYA-EPIYA-D motívumok. A CagA a nyugati országok EPIYA-D, helyébe EPIYA-C. Erősebb foszforiláció motívum kötődési aktivitását a EPIYA-D motívum vezet a nagyobb morfológiai változások, mint amit a EPIYA-C motívum okozhat a fertőzött sejtekben [11]. Ez az EPIYA-D motívum megnövekedett kötési aktivitás és az ebből eredő morfológiai változások, azonosítja azt a potenciális tényező magyarázza a magasabb előfordulási gyomorrák a kelet-ázsiai országban [23], [24]. Katalógusa

Korábbi vizsgálatok kimutatták, variációja száma EPIYA motívum ismétlődik mind a kelet-ázsiai és a nyugati CagA, ami hatással lehet a biológiai aktivitása. Yamaoka et al. [25] megállapította, hogy a Columbia és az USA azon képessége, cagA-pozitív H. pylori
okoz gyomor nyálkahártya sorvadás és intestinalis metaplasia összefüggésben lehet a több EPIYA motívumok CagA törzs. Argent et al. [16] jött ugyanerre a következtetésre jutott később. Azonban, ellentétben vélemények közzé Lai et al. [26] alapuló megállapításai nincs összefüggés száma EPIYA motívumok CagA törzs és a betegség klinikai belül 58 elszigeteli tajvani. Figyelembe véve a méret és a földrajzi korlátozás Ezeknek a tanulmányoknak, ez az érvényesség következtetés megkérdőjelezhető. Eltekintve attól a számát EPIYA motívum ismétlődik, a sorrend különbség törzsek variábilis régiók is okozhat jelentős különbség a virulencia, amelyek kapcsolódnak a különböző kórokozó képességeit H. pylori katalógusa [27]. katalógusa

Mivel a komplex és variáns szekvenciák CagA közötti kapcsolatokat a polimorfizmus CagA és a klinikai betegségek vált egy nagyon érdekes kutatási problémát. Azonban a molekuláris mechanizmusok, amelyek hátterében különböző gastroduodenális által okozott betegségek cagA-pozitív H. pylori fertőzés katalógusa ismeretlen marad. Mostanáig a tanulmányok többsége még csak a felfedezés vagy értékelése közötti összefüggést számos CagA EPIYA motívumok és betegségek [28]. Katalógusa

Ebben a cikkben, azt javasoljuk, szisztematikus módszer, hogy elemezze nem csak a száma EPIYA motívumok CagA szekvenciák, hanem a specifikus szekvencia minták beavatkozó régiókban. Először bemutatjuk entrópia számítás, hogy észleli a maradékok belül a variábilis régiója CagA, mint a gyomorrák biomarkerek. Akkor mi foglalkoztat egy felügyelt tanulási folyamat minősítette rákos és nem rákos használatával információkat az észlelt maradványok CagA a funkciókat. Úgy döntünk, support vector machines (SVM) bináris osztályozó, és hasonlítsa össze a módszer másokkal. A mi megközelítésünk nem csak azt bizonyítja, a hipotézisünket, hogy a sorozatot a variábilis régiójának CagA információkat tartalmaz megkülönböztetni a különböző betegségek, hanem egy hasznos eszközt biztosít megjósolni az összefüggés a regény CagA törzsek és betegségek kimutatására a biomarker is. Katalógusa

módszerek katalógusa

adatok előfeldolgozás katalógusa

Ennek alapján az előző leírást Ref. [15], azt elemzi a EPIYA motívum, és a következő közbenső régiók R1, R2, R3, R3 ', R4 és R4' (1. ábra). A 2. ábra a pozíció közötti viszonyt EPIYA motívum (R1) és a többi beavatkozó régiók segítségével a CagA típusok A-B-D (kelet-ázsiai altípus) és az A-B-C (Western altípus) példaként. R2 viszonylag konzerválódott egész mind altípus, de vannak között jelentős különbségek a közbeeső régiók R3 és R3 ', valamint a között, R4 és R4'. A kelet-ázsiai altípus és a nyugat-altípus kezelték két független. Az adatok ezután feldolgozásra, és az eredményeket elemeztük az egyes csoportokon belül külön-külön. Katalógusa

Minden közbeeső régiók nyerték a CagA szekvenciák, és tegye be a megfelelő altípus csoportok, majd a többszörös szekvencia illesztés alkalmaztak külön csoportonkénti használatával Clustal X verzió 2.0.3 [29]. A szekvenciák profilok (1. ábra) építette a Weblogo 3 [30]. Katalógusa

Maradék Detection katalógusa

Mivel CagA kapcsolódik szinte minden gasztroduodenális betegségek és egyszerű elemzése EPIYA motívum ismétlődik nem így statisztikailag szignifikáns különbséget az említett betegségek, arra vonatkozó információ, egy adott betegség lehet elrejtve a közbeeső területeken. Ez a kutatás azt feltételezi, hogy van egy sor maradékok vagy maradék kombinációkra, amelyek hasznosak lehetnek, mint a marker egy adott betegség. Ez a tanulmány középpontjában a gyomorrák és használja a rák /nem-daganatos csoportok, mint a példa.

alapján összeillesztett szekvenciákban az egyes közbeeső régió specifikus maradékokat azonosították összehasonlításával különbség kombinatorikus entrópia [31] között a rák és a nem rákos csoportban. Ez az eljárás a következő lépéseket tartalmazza: katalógusa

Először is, elosztjuk az adott többszörös illesztések minden közbeeső régiók két csoportra oszthatók: a gyomorrák csoport és a nem rákos csoport. Minden oszlop több nyomvonalakat, kiszámítjuk a háttérben entrópia (Eq. 1), és a kombinatorikus entrópia (Eq. 2), a következőképpen írja le: (1) ahol számát jelenti szekvenciák csoportos k katalógusa. számát mutatja maradványainak típusú oszlop i
csoport k katalógusa. a maradékok száma típusú oszlopban i
. jelenti a teljes szekvencia számát összehangolás. (2) ahol.

Ezután az entrópia közötti különbség kombinatorikus entrópia és a háttér entrópia számítjuk ki: (3)

A 3. ábra a entrópia koncepció felhasználásával három szélsőséges esetekben. Abban az esetben, P1, az aminosavak "véletlenszerűen, és egyenletesen elosztott" felett az összes csoport, és nincs szignifikáns konzervált minta ebben a helyzetben. Case P2 jelentése egy 'globálisan konzervált "mintát, és az összes aminosav egyformák mindkét csoportban. Abban az esetben P3, néhány specifikus aminosavakat csak konzerváltak bizonyos csoportok, és a különböző csoportok különböző aminosavak. Hívjuk az esetben a "helyben megőrzött." Katalógusa

A számítási eredmények az entrópia különbség a fenti három esetben a kombinatorikus entrópia engedély "globálisan konzervált" és a "helyben megőrzött" esetek. Mert "véletlenszerűen, és egyenletesen elosztva" esetben kapja a maximális értéket. Mi lehet megkülönböztetni a "konzervált" és "véletlenszerűen, és egyenletesen elosztva" esetek alapján kombinatorikus entrópia, de ez nem segít felvenni a "helyi konzervált" esetében minden "konzervált" esetek. Ha figyelembe vesszük a háttérben entrópia egyidejűleg, kapja a maximális érték, a 0 és közepes érték a "véletlenszerűen, és egyenletesen elosztott" esetben a "globálisan konzervált 'esetben a" helyileg konzervált "esetében, ill. Végül a különbség a fenti három eset :,, és megkapja a minimális értéket. Ennélfogva az entrópia különbség megfelelő mérési kimutatására "helyben megőrzött" szekvencia motívum. Katalógusa

A szolgáltatás-entrópia kiszámítása katalógusa

A fentiek alapján számítást, akkor lehet meghatározni, hogy a megfelelő kategóriákon minimalizálni az entrópia különbség ezek a maradványok tartozó "helyben megőrzött" ügyben. Végrehajtásához egy teszt, az egyik szekvencia van kiválasztva, míg a többi a szekvenciák vannak osztva egy gyomorrák-csoport és egy nem-rákos csoport. Minden kiválasztott maradék, a kiválasztott szekvencia kerül a gyomorrák csoport kiszámításához entrópia különbség, és akkor kerül a nem rákos csoport, hogy a megfelelő entrópia különbség. Végül kapunk minden kiválasztott maradványok, amelyek a szokásos a funkció entrópia. Katalógusa

Osztályozási CagA szekvenciák katalógusa

adatcsomag. Katalógusa

kerestük a National Center for Biotechnology Information (NCBI ), a Swiss-Prot /Indulj és DDBJ fehérje adatbázis és kapott 535 törzset H. pylori
CagA fehérje. Köztük van 287 kelet-ázsiai altípusú törzsek és 248 Western altípusú törzsek. A kelet-ázsiai altípus csoport, közül 47 287 törzsek származó gyomorrákos betegek és a többi más betegségek. A nyugati altípus csoport, van 37 törzsek a gyomorrákos betegek, és a maradványok vannak más betegségek vagy a normál kontroll, köztük 24 törzsek önkéntesek, akiknek egészségi (betegség) állapotát ismeretlen volt. Katalógusa

munkafolyamat.

a 4. ábra a munkafolyamat az osztályozás /előrejelzés eljárás katalógusa

  • Válassza ki az egyik törzs a vizsgált törzzsel. katalógusa
  • egy bootstrap eljárást a többi törzsek kap a képzés törzsek. katalógusa
  • Számoljuk ki a funkciót entrópia a vizsgált törzs alapuló képzési törzsek, és mentse el a vizsgálati adatokat. katalógusa
  • Számoljuk ki a funkciót entrópia minden törzs a képzési törzs készlet alapján képzése törzsek és mentse őket az edzés adatait. katalógusa
  • generálása osztályozási modell segítségével edzésadatait. katalógusa
  • Osztályozza a vizsgálati adatok szerint a besorolási modellt. katalógusa
  • Ismételje meg az eljárást ötször, majd kiszámítja az átlagot a végeredményt. Matton

    Bootstrapping. katalógusa

    a fő kérdés az épület egy osztályozási modell ebben az esetben a nagy különbség a minta mérete között rákos és nem rákos csoportban, ami azt eredményezheti, torzítás az osztályozási eredményeket. A bootstrap eljárást alkalmazták ezt a kérdést. Minden altípus csoport, mindegyik képzés /teszt adathalmazok, mind a nem daganatos mintát vettek, majd törzsek folyamatosan levonni a rákos csoport szúrópróbaszerűen eléréséig azonos méretű a nem rákos csoport. Ebben az esetben az összes rendelkezésre álló adatokat használtuk bár rák mintákat alkalmazunk többször tekintettel azok a kisebb méretű, mint a nem-rákos csoport. Ezt az eljárást alkalmazták ötször generálni öt független képzés készlet minden tesztet. Az osztályozás /előrejelzés eredmény átlaga öt független eredményeket. Katalógusa

    Kereszt-érvényesítés. Katalógusa

    Mivel az adatok mérete kicsi, a szabadság-one-out (LOO) cross-hitelesítési eljárás elő lett adva. Ez nem csak egy értékelést az osztályozó teljesítményét a képzés /vizsgálati adatok, hanem a becsült előrejelzést teljesítmény új esetek. Katalógusa

    SVM. Katalógusa

    Azért választottuk SVM bináris osztályozó és használta a feature-entrópia vektorok képzése és tesztelni az osztályozót. Abban az esetben, két-osztályú puha árrés osztályozás, a döntési függvény súlyozott lineáris kombinációja meghatározása a következő: (4) ahol jelentése egy felhasználó által definiált magfüggvényes, amely méri a hasonlóság a bemeneti jellemző vektort és a funkció vektorok a képzési adatbázisba. a súlya rendelt képzési funkció vektort és jelzi, hogy egy CagA törzs már jelzett a pozitív osztály (1) vagy negatív osztály (-1). Az eredeti optimalizálási feladat formájában: minimalizálása (5) a (6), ahol. m jelentése az összes törzsek. egy laza változó, amely méri a mértékét téves besorolás az adatot. költséghatékony paraméter, amely lehetővé teszi a kereskedelmi off képzési hiba ellen modell komplexitását. w a normál vektor és b az eltolás. katalógusa

    Miután eredményeit összehasonlítva polinom, tanh és Gauss radiális alapján magok, a kapott eredmény az RBF kernel működött a legjobban, ahol a Gauss radiális alapján kernelek (RBF :) között az általános célú tanulás, ha nincs előzetes ismereteket az adatokat. Az SVM Könnyű csomag (http://svmlight.joachims.org/) [32] dolgozott építeni az alkalmazás. A paraméterek és úgy hangoljuk, hogy a legjobb modell a képzési adatokat, amint az a következő. Minden más SVM paraméterek beállítása az alapértelmezett értékekre. Katalógusa

    A teljesítmény értékelése. Katalógusa

    Annak érdekében, hogy értékelni kell az osztályozó, a különböző teljesítmény intézkedéseket alkalmaznak: pontosság, érzékenység és specificitás. Egy valódi pozitív (TP) egy rákkal kapcsolatos szekvencia sorolható, míg a hamis pozitív (FP) egy nem-rákos megbetegedésekkel kapcsolatos szekvencia besorolt ​​rákkal kapcsolatos, a téves negatív (FN) egy rákos megbetegedésekkel kapcsolatos szekvencia nem minősülő -cancer kapcsolódó és a valódi negatív (Tn) egy nem-rákos megbetegedésekkel kapcsolatos szekvencia besorolt ​​nem rákos kapcsolatos. A pontosság, érzékenység (Sn), specificitás (Sp) és Matthews korrelációs együttható (MCC) a besorolás meghatározása a következő: (7) (8) (9) (10) Mivel csak két paraméter az RBF kernel és függetlenek, alkalmaztuk a grid-keresést, hogy meghatározza az optimális paramétereket a osztályozó. Mi egy harmonikus eszköz érzékenysége és specificitása a célfüggvény optimalizálásához a modell a tanító, amelyek meghatározása a következő: katalógusa (11)

    Eredmények katalógusa

    Maradék észlelése és Feature kiszámítása katalógusa

    az 1. táblázat felsorolja az összes észlelt kulcsfontosságú aminosavakat számításával entrópia különbség az egyes közbeeső régió nyugati és kelet-ázsiai altípusok. Bár van néhány földrajzi variációk CagA szekvenciák között a nyugat és a kelet-ázsiai altípusok, néhány közös maradékok még mindig megtalálható megkülönböztetni a rákos és nem rákos csoportban. Ez azt sugallja, hogy ezek a maradékok lehetnek nagyon fontos meghatározásában virulenciájának CagA és viszonyának CagA és néhány specifikus betegségek.

    A maradékot pozíciók az 5. ábrán látható Egy korábbi tanulmány [27] azt mutatja, hogy a különböző EPIYA szegmensek kötődnek a különböző kinázok, például EPIYA-R2 és EPIYA-R3 /R3 'kötődnek a C-terminális Src kináz (Csk), míg EPIYA-R4 és EPIYA-R4' kötődnek az SHP-2 kináz okoz a kolibri fenotípus. A CagA-Csk kölcsönhatás leszabályozza CagA-SHP-2 jelzés, hogy megzavarja a sejtek funkcióit, hogy ellenőrizzék a virulencia CagA. Azt találtuk, hogy a legtöbb észlelt maradékok tartoznak az R2 és R3 /R3 'régiók és kevés maradékok R4 /R4' régiók észlelt. Ez azért lehet, mert R4 /R4 'több konzervált szekvencia, mint R2, és R4 /R4' rövidebb, mint R3 /R3 '. Azt javasoljuk, hogy a különböző maradékot mintákat R2 vagy R3 /R3 'régiók megváltoztathatja a képességét, down-szabályozó CagA-SHP-2 jelzés, ezért változó virulenciájának CagA.

    Ren et al. találta, hogy CagA multimerizes emlőssejtekben [33]. Ez multimerizációról független a tirozin foszforiláció, de ez kapcsolódik a "FPLxRxxxVxDLSKVG" motívum, amely elemzi CM motívum az R3 'közbeeső régió. Mivel a multimerizációról előfeltétele a CagA-SHP-2 jelátviteli komplex és az azt követő deregulációja SHP-2, a CM motívum játszik fontos szerepet cagA-pozitív H. pylori katalógusa közvetített gyomor patogenezisében. A több CM motívumok H. pylori katalógusa törzsek sokkal valószínűbb járó súlyos gyomor-betegségek [33], [34], de ez a megfigyelés nem tudja megmagyarázni, hogy miért különböző gyomor-betegség lehet kidolgozni pontosan ugyanazt a számot a CM motívumok. A tanulmány kimutatott két aminosavat a CM motívuma R3 'közbeeső régió, ami ahhoz vezethet, hogy a változás a multimerizálódást, megváltoztatva így a virulencia CagA. Ez összhangban áll a korábbi felfedezés [35], hogy a szekvencia közötti különbség a kelet-ázsiai CM és a Nyugat-CM határozza meg a kötési affinitás között CagA és az SHP-2. Katalógusa

    Bár a kulcsfontosságú aminosavakat észlelt kiderülhet némi különbség a rák és a nem rákos csoportban, egyetlen maradék lehet egy marker a rák, mint az 5. ábrán látható Ez a kutatás azt jósolja, hogy az egyik speciális kombinációja minden vagy részleges észlelt maradékok volna egy magas korrelációt egy adott betegség. Annak ellenőrzésére, több lineáris statisztikai modellek, például lineáris regresszió és a logisztikus regresszió, alkalmaztak az érzékelt jellemzői, hogy értékelje a fontosságára, hogy minden maradék és a korreláció kiválasztott maradékok és a rák. Azonban egyik fenti modellek képesek voltak előállítani statisztikailag szignifikáns eredményt. Mivel ezek a funkciók nem illeszthető egyszerű lineáris modellek előrejelző rák alkalmazásával gépi tanulási módszert elemzi és osztályozza ezeket az adatokat válik szükségessé. Katalógusa

    paraméter képzése Besorolás katalógusa

    A nyugati altípus csoport a példában egy laza rácsos keresés mutatták be először, és (6A), és úgy találta, hogy a legjobb körül, hogy a legmagasabb F értéket a LOO kereszt-érvényesítés aránya 76%. Aztán egy finomabb grid keresés zajlott a környéken, és a jobb F értéket kaptunk 79,7% LOO kereszt-érvényesítés címen. Ugyanezt az eljárást alkalmaztuk a kelet-ázsiai altípus-csoport és a legjobb LOO kereszt-érvényesítés ráta 72,6% jutottak. Katalógusa

    Mivel nincsenek a korábbi tanulmányok és számítási módszerek ugyanebben a témában, teljesítményének értékelése ennek kutatás új módszer nehézkes. Annak megállapítására, az információ tartalma a szekvenciák tekintve a kifinomult teljesítmény megjósolni a rák, egy véletlen csoszogó eljárást alkalmaztak építeni a kontroll csoportban. Először is, minden szekvenciák a nyugat-altípus kerültek együtt építeni sorozata medence. Másodszor, véletlenszerűen kiválasztott azonos szekvenciák száma, mint a rák csoportot a szekvencia medence és a kezelt a többi szekvenciák, mint a nem-rákos csoport. Ezután a teljes képzési eljárást alkalmaztuk újonnan megkeverjük adatokat, hogy megtalálják a legjobb. A fenti lépéseket megismételjük ötször, hogy létrehoz öt független megkeverjük adathalmazokat. Az egyik a legmagasabb F
    érték, ami egyenlő 46,6% lett kiválasztva, és a kontúr telek ábrán látható a 6B. Ez véletlenszerűen csoszogott értékelést is alkalmazták a kelet-ázsiai altípus adatok és a legjobb F katalógusa érték volt 54,3%. Összehasonlítva a két telek mutat szignifikáns különbséget a F katalógusa értékek között az adatok helyes csoportosítását rákos és nem rákos esetek képzés és a legjobb véletlenszerűen csoszogott adatokat. Az eredmény arra utal, hogy a közbeeső régiók tájékoztató megkülönböztetni a rákos és nem rákos csoportok és a módszer az adatok eredményes. Katalógusa

    Osztályozási Performance katalógusa

    Itt elsősorban három kategóriája sorozat osztályozása módszerek: jellemző alapján, sorrendben távolság alapú és a modell alapú. A módszer, amelyet a jelen tanulmány tartozik a funkció alapú kategóriában. Azért választottuk a két legnépszerűbb sorozat osztályozási eszközök, mint a képviselője módszerek másik két kategória az összehasonlítás. BLAST [36] választották a szekvencia távolság alapú létesítmény, mivel ez a legszélesebb körben használt szekvencia-összehasonlító eszközt. A modell alapú létesítmény, a rejtett Markov-modell egy tipikus módszer szekvencia analízis és a széles körben elterjedt eszköze, HMMER [37], nem lett kiválasztva. A besorolási eljárás mindkét BLAST és HMMER használtuk az alapértelmezett paramétereket a szerszámok, ugyanezt a LOO kereszt-érvényesítés, mint a mi módszerünk, és használt azonos értékelési képleteket felsorolt ​​módszer fejezetben. Katalógusa

    2. táblázat felsorolja a besorolás eredménye mindhárom módszer. Az SVM módszer teljesít lényegesen jobb, mint a két másik szempont. BLAST elért közel pontosság a entrópia-SVM módszer, de megjósolta sok hamis negatívok alacsony érzékenység. HAMMER elért magas érzékenység de kevés jellegét. Figyelembe véve, F katalógusa értékek és MCC katalógusa értékek, az előrejelzési eredmények BLAST és HAMMER szinte véletlenszerűen. Katalógusa

    Az osztályozás eredménye és a kontúr telek (6. ábra) erősen támogatja a hipotézissel, azaz az információ a kiválasztott maradékanyagok közbeeső régiókban lehet használni, hogy osztályozzák a viszonyát CagA szekvenciák és gyomorrák, bár a különbség a profilok között a rák és a nem rákos csoportok nem túl erős.

    összehasonlítás között különféle betegségek

    H. pylori fertőzés katalógusa társul a legtöbb gyomor-betegségek, amelyek közül a gyomorrák a legsúlyosabb okoz több mint 700.000 halnak meg világszerte, [38]. Mivel H. pylori katalógusa egyik fő kockázati tényezője a gyomorrák (GC), felfedezés a mechanizmus H. pylori
    közvetítő GC válik kiemelt feladat ezen a téren. Összehasonlítva más betegségekkel, a diagnosztikai információkat a GC állami adatok viszonylag pontosak, és ez egy másik fontos oka, hogy összpontosítson GC ebben a tanulmányban. Vizsgálataink nem korlátozódnak a GC, mégis. Azt is próbáltam, hogy értékelje a kapcsolatok a varianciája CagA szekvenciák és a különböző betegségek. Katalógusa

    Mivel a legtöbb adatot gyűjtöttünk nyilvános adatbázisokban nélkül pontos diagnózis információt, mielőtt a módszert CagA adatok, akkor manuálisan kurátora a betegség kommentárok minden törzs által szakirodalom áttekintése. Táblázat S1 felsorolja a disztribúció a súlyos betegségek, mind a nyugati és a keleti Asain altípus csoportok. Mivel a korlátozás törzs számok Egyes betegségek, mint például a atrófiás gasztritisz (AG) és gyomorfekély (GU), akkor végül felvette krónikus gasztritisz (CG), és nyombélfekély (DU), mint a kontroll csoportokban értékelésre. A DU-csoport a kelet-ázsiai altípus tartalmaz 79 törzsek, és egy bootstrap eljárást alkalmazták az összes többi csoport, hogy az azonos számú törzsek, mint a kelet-ázsiai DU-csoport. Ezzel a lépéssel biztosítható minden összehasonlítást azonos skálán, mivel az értéke kombinatorikus entrópia függ a szekvenciák száma. Mi használt (3) képlet kiszámításához az entrópia különbség az egyes pozíciók között GC és CG /DU csoportok, és majd össze minden entrópia különbségek, mint a teljes különbség a GC és CG /DU csoportok, amint azt a táblázat S2. Összehasonlításával eredmények a két csoport az azonos földrajzi altípus (kelet-ázsiai vagy nyugati altípus), ez összhangban van a klinikai véli, hogy a gyomorhurut erősebb kapcsolatok a rák, mint a DU [39] (általában gastritis esetekben tartalmazhat valamennyi bejelentett vagy diagnosztizálatlan krónikus sorvadásos gyomorhurut és a bél metaplasia esetében, amellyel a betegek nagy a kockázata, hogy dolgozzon GC). Figyelembe véve az ugyanazon betegségtől pár két földrajzi altípusa, azt is kifejtette, a virulens különbség a kelet-ázsiai és a nyugat-altípusok. Ezen kívül, mivel a magas hasonlóság a különböző betegségcsoportok a kelet-ázsiai altípus, még több adatot, még mindig nem éri el ugyanazt a besorolási pontosság, mint a nyugat-altípus csoport. Katalógusa

    A fentiek alapján eredményeket, CagA szekvenciák lenniük arra, hogy megkülönböztesse több gyomor- betegségek. Annak érdekében, hogy értékelje a besorolás teljesítmény, szoktuk DU csoport helyére nem Rák-csoport, és utána az egész besorolási eljárás nélkül ismét rendszertöltőről, mivel e két betegség csoportok hasonló méretben. Táblázat S3 besorolását mutatja a eredményeket. Bár a klinikai szempontból, DU van a negtive korrelációt GC között a gasztroduodenális betegségek [40], a besorolás teljesítményét két altípus csoportok csak kissé javult. Így a rákkal kapcsolatos CagA törzsek lehet néhány egyedi szekvenciát mintákat összehasonlítva az összes többi gyomor- betegségek. Ezért tuning egy részét a kontroll csoport nem lehet tudni, hogy javítsa a besorolási pontosság. Katalógusa

    Vita katalógusa

    Bár a kutatások azt mutatják, hogy vannak olyan szekvencia markerek megkülönböztetni rákos csoport és a nem rákos csoport a fő profil az említett két csoport is hasonlít megkülönböztetni a hagyományos módszerekkel, mivel a CagA szekvenciák teljes erősen konzervált. Ezért összpontosított azonosítására informatív maradékok számszerűsítése információ ezeknek a kiválasztott maradékok, majd használja, hogy tervezzen egy osztályozót, amely képes előre jelezni, hogy egy új szekvencia tartozik a rákos csoport vagy a nem-rákos csoport. Ez a módszer nem csak fényt derít a kapcsolatok CagA szekvenciák és a gyomorrák, hanem nyújthat hasznos eszköze gyomorrák diagnózis vagy prognózis. Katalógusa

    A mechanizmusokat a H. pylori
    okozza a különböző gasztroduodenális betegségek még mindig nem tisztázott, azonban valószínű, hogy a különböző gastroduodenális által okozott betegségek H. pylori fertőzés
    részesedése sorszámozott minták a közbeeső területeken. Kis eltérések aminosavak azok fontos maradékok vezethet a virulencia varianciája CagA törzsek így különböző gasztroduodenális betegségek. Míg CagA lehet marker kimutatására potenciális rák kockázata alapján CagA egyedül megkülönböztetni összes gyomor-betegség nem reális. Mint a jövő tanulmány, akkor dolgozzon ki új modelleket, amelyek megkülönböztetik a különböző gyomor-betegséggel, cagA és más géneket. Katalógusa

    alátámasztó információk katalógusa táblázat S1.
    száma törzsek minden betegség. katalógusa doi: 10,1371 /journal.pone.0036844.s001 katalógusa (DOC) hotelben táblázat S2.
    Az összes entrópia közötti különbség a gyomorrák és két másik betegség csoportban. katalógusa doi: 10,1371 /journal.pone.0036844.s002 katalógusa (DOC) hotelben táblázat S3.
    Besorolás teljesítmény között gyomorrák és nyombélfekély csoportok mind a nyugati és a kelet-ázsiai altípusok. katalógusa doi: 10,1371 /journal.pone.0036844.s003 katalógusa (DOC) hotelben

  • Other Languages