Žmogaus skrandžio vėžio (DBGC) duomenų bazė yra išsami duomenų bazė, kuri integruoja įvairias žmogaus skrandžio vėžiu susijusių duomenų išteklius. Žmogaus skrandžio vėžiu susijusių transkriptomika projektai, proteomiką projektai, mutacijos, biologiniai žymenys ir narkotikų jautrus genai iš skirtingų šaltinių buvo renkama ir vieningą šio duomenų bazę. Be to, epidemiologiniai statistika skrandžio vėžiu sergančių pacientų Kinijoje ir klinikos informacijos komentuotų skrandžio vėžio atvejų taip pat buvo integruoti į DBGC. Mes tikime, kad ši duomenų bazė bus gerokai palengvinti tyrimus dėl žmogaus skrandžio vėžiu daugelyje sričių. DBGC yra laisvai prieinami http://bminfor.tongji.edu.cn/dbgc/index.do
nurodomoji dalis: Wang, C, Zhang J Cai, M, Zhu Z Gu W, J. Y ir kt , (2015) DBGC: iš žmogaus skrandžio vėžio duomenų bazė. PLoS ONE 10 (11): e0142591. Doi: 10,1371 /journal.pone.0142591
redaktorius: Arunas Sreekumar, Baylor medicinos koledžo, JAV
Įstojo: Vasario 18, 2015; Priėmė: Balandis 24, 2015 m Paskelbta: Lapkričio 13, 2015
Visos teisės saugomos: © 2015 Wang et al., Tai atviros prieigos straipsnis platinama pagal Creative Commons Attribution licencija, kuri leidžia nevaržomai naudotis, paskirstymo ir dauginimąsi bet kokioje laikmenoje sąlygomis, su sąlyga, kad pirmasis autorius ir šaltinis įskaitomos
Duomenų Prieinamumas: Duomenys turimo per Datadryad (https://datadryad.org). Unikalus prisijungimas skaičius: doi:. 10,5061 /dryad.271dk
Finansavimas: Šis darbas buvo iš dalies remiama dotacijas iš nacionalinio Gamtos mokslo fondo Kinijos (81172329, 31571363, 81372644, 81372645 ir 8157111077), kinų Nacionalinė High Tech programa (2012AA02A504 ir 2012AA02A203), Tarptautinis bendradarbiavimo projektas iš Šanchajaus mokslo ir technologijų komisija (12410706400), inovacijų fondo Pritaikymo medicinos Šanchajaus Jiao Tong universiteto medicinos mokyklos (15ZH1002 ir 15ZH3001) Fong Šu Fook Tong fondo ir virškinimo karcinomos biobanków projektas Šanchajaus Jiao Tong universiteto medicinos mokyklos. Į finansuotojai neturėjo vaidmenį studijų dizainas, duomenų rinkimo ir analizės, sprendimų skelbti, ar ruošiant rankraštį
konkuruojančių interesų.. Autoriai pareiškė, kad nėra konkuruojantys interesai egzistuoja
Įvadas
Kaip vienas iš labiausiai paplitusių vėžio, skrandžio vėžys yra trečioji didžiausia žuvimą bei ketvirtas didžiausias sergamumas visų vėžio visame pasaulyje [1]. Pagal GloboCan statistikos 2012, naujas skrandžio vėžio atvejų suskaičiuoti beveik vienas milijonas (952,000), o daugiau nei 700.000 mirčių sukėlė skrandžio vėžio; beveik pusė šių pacientų atvyko iš Kinijos (405,000 naujų atvejų ir 325,000 mirčių) [1, 2]. Nors tiek mirtingumas ir sergamumas skrandžio vėžiu sumažėjo pastaraisiais metais, 5 metų išgyvenamumas išlieka gana žemas [3]. Todėl, skrandžio vėžys ir toliau bus vienas iš sunkiausių uždavinių, mokslininkų ir gydytojų ilgą laiką [4].
Mokslininkai visame pasaulyje baigę daug genomika, transkriptomika proteomikoje ir epidemiologinius tyrimus ir klinikinius tyrimus, susijusius su patogenezėje ir gydymo skrandžio vėžio [5-10]. Šie tyrimai sukėlė didžiulius kiekius informacijos, susijusios su skrandžio vėžiu, duomenimis, ir šių tyrimų greitis greitėja su spartaus augimo vėžio žiniomis, išlaidas aptikimo ir skaičiavimo ir plitimo internete [11] sumažėjo. Šie duomenys yra svarbus informacijos, reikalingos tiriant ir gydant skrandžio vėžiu. Tačiau, atsižvelgiant į ribotą fono žinių gydytojams ir pagrindinių tyrėjų, šių duomenų potencialas negali būti visiškai sukurta. Naujos technologijos ir tyrimo metodai vis dar reikia plėtrą; Tačiau, mažas efektyvumas į duomenų tvarkymo yra pagrindinis apribojimas šios raidos [12]. Dėl ilgalaikio kaupimo decentralizuoto mokslinių tyrimų, šie duomenys ir jų formatai tik patenkinti individualius poreikius, trūksta integraciją ir standartizavimą ir todėl paįvairinimo, izomerizacijos ir skrodimo vėžio duomenimis [13, 14].
Šiuo metu gausiai klinikiniai ir pagrindinės studijos, susijusios su skrandžio vėžiu planuojama arba pažangą. Įvairios duomenų yra saugomi skirtingose duomenų bazių sistemų [13], be pasidalijimo ar perdavimo. Taigi, stipriai koreliuoja informacija lieka izoliuotas, į tai, kas vadinama "informacija salos". Viena vertus, duomenų skrodimo padidina duomenų gavybos sunku, o, kita vertus, jis neleidžia gydytojams iš visapusiškai pasinaudojant fundamentinių tyrimų rezultatų plėtoti klinikinius tyrimus ir programas ir išlaiko pagrindines mokslininkai atlieka veiksmingus tiriamąsias studijas, kad orientuojasi į kliniškai svarbi informacija [15].
Esant tokiai situacijai, ieškančiai išsamią informaciją apie skrandžio vėžiu nėra lengva užduotis, ir porcijos šių duomenų gali dingti iš interneto vandenyno, kuris būtų labai gaila.
Šis tyrimas pasinaudojo išteklių iš interneto ir publikacijų nuo Kinijos centro ligų kontrolės ir prevencijos (CDC) ir skrandžio vėžio centro diagnostika ir gydymas, Key laboratorija skrandžio navikų Šanchajuje. Šis tyrimas sistemingai surinkti įvairių tipų skrandžio vėžiu susijusių duomenų, integruota šiuos duomenų šaltinius po filtravimo ir standartizacijos, ir galiausiai suformavo pirmąjį išsamų žinių bazę, reikalingą analizuojant skrandžio vėžiu.
duomenų šaltiniai
žmogiškųjų skrandžio vėžys (DBGC) duomenų bazė integruota į šiuos skrandžio vėžys išteklių, susijusių su: Rīga
duomenų rinkimas
1) Epidemiologiniai statistika skrandžio vėžiu sergančių pacientų Kinijoje.
CDC turėjo nustatytą vėžio sistema, pranešanti apie daugelį metų ir sukaupė gausius epidemiologinę informaciją apie vėžiu sergančių pacientų Kinijoje. Epidemiologiniai statistika skrandžio vėžio, įskaitant bylos numerį, mirties skaičius, sergamumas (žalia norma, amžius pakoreguotas dažnis ir kumuliacinis dažnis), mirtingumas (žalios normos, amžius pakoreguotas normos ir sukauptas normos) ir dažnis (arba mirtingumo) pasiskirstymas pagal amžiaus grupes buvo paimti rankomis iš CDC leidiniuose. DBGC 1,0 apima visus epidemiologinius statistiką visų tipinių Kinijos regionuose nuo 2004 iki 2009 metų, ir papildomi statistiniai duomenys bus įtraukti į patobulinta versija.
klinikos informacija buvo pateikta Šanchajus Ruijin ligoninėje. Klasifikacija ir sustojimo metodai paprastai naudojami skrandžio vėžio diagnozę buvo komentuojami naudojant diagnozuojama Ruijin ligoninėje skrandžio vėžio atvejų. Tipinės skrandžio vėžio audinių skirtingais etapais ir tipų buvo atrinkti iš skrandžio vėžio biobanków kad mes laikėmės už metus. Visi pacientas informacija buvo anonimiški ir de-identifikuotas iki mūsų analizei.
Molekuliniai biologiniai duomenys buvo paimti ir kuravo iš interneto išteklių. Transkriptomika duomenys buvo renkami iš GEO duomenų bazės (http://www.ncbi.nlm.nih.gov/geo/) ir EBI duomenų bazė (http://www.ebi.ac.uk/). Proteomiką duomenys buvo paimti iš paskelbtos literatūros per rankinis matavimas ir standartizacijos [16, 17]. Mutacijų duomenys buvo renkami iš dbVar duomenų bazę (http://www.ncbi.nlm.nih.gov/dbvar/), OMIM duomenų bazė (http://www.ncbi.nlm.nih.gov/omim/), HGMD duomenų bazėje (http://www.hgmd.org/), ir paskelbė literatūros [18, 19]. Visi biologinius žymeklius duomenys buvo paimti iš paskelbtos literatūros [20, 21]. Su narkotikais susijusios genai buvo paimti iš PharmGKB duomenų bazės (http://www.pharmgkb.org/) CancerDR duomenų bazė (http://crdd.osdd.net/raghava/cancerdr/) ir mokslinės literatūros [22, 23]. Mes sukūrėme išsamias gavybos standartus kiekvienam molekulinės biologijos duomenų išteklių rūšies, ir kiekvienas duomenų rinkimo procedūra turėjo laikytis šių standartų siekiant užtikrinti duomenų suderinamumą. Išsamus surinkimo tvarka pateiktas žemiau:
transkriptomika duomenys:
Proteomika duomenys:
mutacija duomenys:.
žymenų duomenys:.
"narkotikų jautrus duomenys:.
komentuojami visi genai ir vaistai klausimų apie duomenis, siekiant padėti Vartotojų geriau suprasti ir naudoti šiuos duomenų šaltinius. Genai yra komentuojami pagal NCBI (http://www.ncbi.nlm.nih.gov), HGNC (http://www.genenames.org/~~HEAD=pobj), Ensembl (http://feb2014.archive.ensembl.org /) ir Genų kortelės (http://www.genecards.org/). Vaistai yra komentuojami pagal Vaistų banką (http://www.drugbank.ca/).
Be to, pastebėtus TCGA projekto mutacijos taip pat buvo įtrauktas komentuoti genus į DBGC. Vartotojai gali rasti visus tam tikro geno išaiškinamas TCGA projekto mutacijas. Šios mutacijos buvo apdorojami ICGC (https://dcc.icgc.org), remiantis TCGA duomenis ir nurodyti pagal kiekvieno mutacija DBGC.
Be to, buvo atlikta keletas skrandžio vėžiu susijusių pagrindinių mokslinių tyrimų projektai mūsų tyrimų komanda. Projekto aprašymas ir neapdoroti duomenys yra pateikta DBGC atsisiųsti ir tolesnei analizei.
DBGC yra reliacinės duomenų bazės su MySQL duomenų sluoksnį. Patogi sąsaja buvo sukurta siekiant organizuoti ir rodyti duomenų išteklius naudojant HTML ir "JavaScript". Tarp duomenų sluoksnį ir web sąsają sąveika buvo baigtas naudojant Java EE platformą.
Duomenų bazės aprašymas
Ši duomenų bazė visų pirma sudaro trijų išilginių duomenų sistemų epidemiologinius, klinikos ir molekulinės biologijos duomenys (1 pav). Molekuliniai biologiniai duomenys susideda iš skrandžio vėžiu susijusių transkriptomika, proteomikos mutacijos, biologinis žymuo ir narkotikų jautrus genų duomenis. Bendrieji statistiniai šių duomenų yra išvardyti 1 lentelėje Kartu su epidemiologinių statistikos skrandžio vėžiu sergančių pacientų Kinijoje ir klinikos informacijos komentuotų skrandžio vėžio atvejų, visi šie duomenys buvo paimti iš viešųjų duomenų bazių, leidinių ir mokslinės literatūros.
Duomenų bazės sąsajos
1) Greita Paieška (2 pav). Greitai paieškos funkcija modulis leidžia identifikuoti geno ar baltymų skrandžio vėžio galimą vaidmenį per įvedusi raktinius žodžius į paieškos laukelį, esančių navigacijos juostoje. Paieškos rezultatas pasakys, ar genas arba proteinas skirtingai išreikštos bet kuria transkriptomika projektų ar proteomikai projektus ir ar jis buvo nustatytas kaip skrandžio vėžio ar narkotikų jautrus genas biologinis žymuo. Be to, jei genas neturi jokios mutacijos, kuri yra susijusi su skrandžio vėžiu, išsamus sąrašas bus rodomas rezultatų puslapyje. Pavyzdžiui, naudojant "EGFR" kaip raktinį žodį, galime daryti išvadą, kad jis buvo identifikuotas kaip iki reguliuojama geno GSE51936 ir GSE27342 ir kaip žemyn reguliuojama geno GSE29630. Atitinkamą baltymas genų EGFR buvo įvardytas kaip up-reguliuojama baltymų 3 proteomikai projektų (PubMed ID: 23.161.554, 24263233 ir 24722433). EGFR buvo pranešė, kaip prognozavimo faktoriaus skrandžio vėžio ir yra susijęs su atsparumo vaistams irinotekano, kuri yra dažniausiai naudojamas vaisto, skirto skrandžio vėžio gydymui. Keturi mutacijos EGFR, susijusių su skrandžio vėžio atvejų (c.2361G > A, c.2402A > G, c.2573T > G, c.2588G > A) dalį.
2) naršyti ir ieškoti (pav 3). Naudojant navigaciją, vartotojai gali spustelėti atitinkamus elementus naršyti duomenų ištekliams, gaunamiems iš DBGC. Detali informacija bus išvardintos žemiau. Mes taip pat sukūrėme keletą paieškos kriterijus kiekvienai duomenų išteklius, per kurį bus rodomi visi duomenų elementai, kurie tenkina sąlygas tipo.
3) Mūsų duomenų bazė skiriasi nuo kitų išteklių internete, nes epidemiologinių statistikos skrandžio įtraukimo vėžiu sergantiems pacientams Kinijoje. Vartotojai gali lyginti statistinius duomenis pagal lytį (vyrų ir moterų), ploto (miesto ir kaimo), ir amžius ne diagnozė ar mirties. Bylos numeris, mirtis skaičius, dažnis ir mirtingumas pasirinktu metų intervalas gali būti rodomas tiek grafike ir lentelės formatu (4 pav).
Skrandžio vėžys yra viena iš pirmaujančių vėžio pasaulyje tiek mirtingumo ir sergamumo. Dažnesnių ir mirtingumas skrandžio vėžio pastebėtas Azijos regionuose, ypač Kinijoje. Epidemiologiniai statistiniai duomenys skrandžio vėžio šioje duomenų bazėje buvo gautos daugiausia iš leidinių CDC, kuri vykdė piktybinių navikų tyrimų kelis dešimtmečius ir sukūrė išsamią archyvus piktybiniais navikais sergantiems pacientams Kinijoje. Šie duomenys suvaidino svarbų vaidmenį skatinant vėžio prevencijos ir sveikatos politikos formavimo Kinijoje [24-26]. Per gaunant skrandžio vėžio epidemiologijos duomenimis šioje duomenų bazėje, tyrėjai ir gydytojai gali greitai nustatyti epidemiologines tendencijas skrandžio vėžiu Kinijoje.
skrandžio vėžiu susijusių mutacijų, biologinių žymenų, narkotikų jautrus genų, transkriptomika Projektai ir atitinkami diferencijuotai išreikšti genai, ir proteomiką eksperimentai ir atitinkami skirtingai išreikšti baltymai buvo rankiniu būdu surinkti iš internetinių duomenų bazių ir mokslinės literatūros. Greitai paieškos funkcija teikia DBGC leidžia mokslininkams nustatyti geno ar baltymų skrandžio vėžio vaidmenį. Šie skirtingai išreikšti genai ir baltymų sudėtyje gausu svarbios informacijos apie skrandžio vėžį, ir daug analizės tyrimai gali būti atliekami naudojant juos.
Mūsų tyrimų komanda vykdė skrandžio vėžio tyrimų daugelį metų ir yra sukaupusi didelę patirtį naviko epidemiologiniai tyrimai, skrandžio vėžys clinicopathology ir biologinis tyrimas, biobanków pastatas, molekulinės biologijos mechanizmas tyrimai, bioinformatika analizė ir didelio masto duomenų statyba [27-30]. Teikti paklausimus ir analizės įrankius, kurie yra labiau patogu ir praktiška nuo skrandžio vėžio mokslininkų, mes pastatyti šią duomenų bazę. Dabartinė versija yra 1.0. Kadangi dideli kiekiai duomenų, generuojamų įvairių eksperimentinių platformų įvairiose srityse yra labai padrika ir nevienalytė, kai naudinga informacija gali būti praleista mūsų proceso duomenų rinkimą. Mes ir toliau išgauti šiuos duomenis ir atnaujinti naujausius duomenis ilgą laiką užtikrinti laiku ir išsamumą duomenis. Į kitą versiją, mes ketiname padengti naujausias žmogaus skrandžio vėžiu susijusių mutacijų biologinius žymenis ir narkotikų jautrus genus. Transkriptomika duomenys bus kitą versiją, kurioje visi transkriptomika projektai bus iš naujo išnagrinėta išgauti skirtingai išreikštas genus skirtingais kartų kaitos vertybių dėmesio. Taigi, vartotojai gali užklausti, ar tam tikras genas yra skirtingai išreikštas per konfigūruoti TIRIAMOJI MEDŽIAGA ir kartų kaitos vertę.
aprašyta šiame straipsnyje, yra DBGC, duomenų bazė yra išsami ir interneto -accessible duomenų žmogaus skrandžio vėžio. Ši duomenų bazė yra integruota į duomenų išteklių, susijusių su skrandžio vėžio įvairovė ir pateikė keletą lengva naudoti interneto pagrindu funkcinius modulius. Mes tikime, kad DBGC bus svarbi priemonė skrandžio vėžio gydytojams, naviko pagrindinių mokslininkų, vėžio genomo mokslininkų, vyriausybės sveikatos politikos formuotojams ir skrandžio vėžiu sergantiems pacientams.