Die Datenbank der menschlichen Magenkrebs (DBGC) ist eine umfassende Datenbank, die verschiedene menschliche Magen-Krebs im Zusammenhang mit Datenressourcen integriert. Menschliche Magenkrebs im Zusammenhang mit Transkriptomik Projekte, Proteomik-Projekte, Mutationen, Biomarker und Drug-sensitiven Genen aus verschiedenen Quellen wurden in dieser Datenbank gesammelt und vereinigt. Außerdem epidemiologische Statistiken von Magenkrebs-Patienten in China und klinisch-pathologischen Informationen kommentierten mit Magenkrebsfälle wurden auch in die DBGC integriert. Wir glauben, dass diese Datenbank Forschung in Bezug auf die menschliche Magenkrebs in vielen Bereichen erheblich erleichtern wird. DBGC ist frei verfügbar bei http://bminfor.tongji.edu.cn/dbgc/index.do
Citation: Wang C, Zhang J, Cai M, Zhu Z, Gu W, Yu Y, et al . (2015) DBGC: Eine Datenbank der menschlichen Magenkrebs. PLoS ONE 10 (11): e0142591. doi: 10.1371 /journal.pone.0142591
Editor: Arun Sreekumar, Baylor College of Medicine, UNITED STATES
Empfangen: 18. Februar 2015; Akzeptiert: 24. Oktober 2015; Veröffentlicht: 13. November 2015
Copyright: © 2015 Wang et al. Dies ist ein offener Zugang Artikel unter den Bedingungen der Creative Commons Attribution License, die uneingeschränkte Nutzung erlaubt, die Verteilung und Vervielfältigung in jedem Medium, vorgesehen sind der ursprüngliche Autor und Quelle genannt
Datenverfügbarkeit: Die Daten sind availabe über Datadryad (https://datadryad.org). Die einzigartige Eingangsnummer: doi:. 10,5061 /dryad.271dk
Finanzierung: Diese Arbeit wurde zum Teil durch Zuschüsse aus dem National Natural Science Foundation of China unterstützt (81172329, 31571363, 81372644, 81372645 und 8157111077), Chinesisch national High Tech Program (2012AA02A504 und 2012AA02A203), Internationales Kooperationsprojekt von Shanghai Science and Technology Kommission (12410706400), Innovationsstiftung Translational Medicine der Shanghai Jiao Tong University School of Medicine (15ZH1002 und 15ZH3001), Fong Shu Fook Tong Foundation und Magen-Darm-Karzinom Biobank-Projekt der Shanghai Jiao Tong University School of Medicine. Die Geldgeber hatten keine Rolle in Studiendesign, Datenerfassung und Analyse, Entscheidung oder Vorbereitung des Manuskripts zur Veröffentlichung
Konkurrierende Interessen:.. Die Autoren haben erklärt, dass keine Interessenkonflikte bestehen
Einführung
Als eine der häufigsten Krebsarten, hat Magenkrebs die dritthöchste Letalität und vierthöchste Morbidität aller Krebserkrankungen weltweit [1]. Nach den Globocan Statistik im Jahr 2012, neue Fälle von Magenkrebs nummeriert fast eine Million (952.000) und mehr als 700.000 Todesfälle wurden durch Magenkrebs verursacht werden; fast die Hälfte dieser Patienten kamen aus China (405.000 neue Fälle und 325.000 Todesfälle) [1, 2]. Obwohl sowohl die Letalität und Morbidität von Magenkrebs in den letzten Jahren verringert haben, die 5-Jahres-Überlebensrate bleibt ziemlich niedrig [3]. Daher wird Magenkrebs für eine lange Zeit eine der schwierigsten Herausforderungen für Forscher und Ärzte bleiben [4].
Die Forscher weltweit viele Genomik abgeschlossen haben, Transkriptom, Proteomik und epidemiologische Untersuchungen und klinischen Studien über die Pathogenese und Therapien von Magenkrebs [5-10]. Diese Untersuchungen generiert haben große Mengen an Daten in Bezug auf Magenkrebs, und die Geschwindigkeit dieser Untersuchungen wird mit dem schnellen Wachstum von Krebs Wissen zu beschleunigen, verringerte Kosten der Erfassung und Berechnung und Verbreitung des Internets [11]. Diese Daten enthalten wichtige Informationen für die Untersuchung und Magenkrebs zu heilen. Jedoch aufgrund der begrenzten Hintergrundwissen der Kliniker und Grundlagenforscher, das Potential dieser Daten nicht vollständig entwickelt werden können. Neue Technologien und Forschungsmethoden erfordern noch in der Entwicklung; jedoch geringe Effizienz Daten in der Verwaltung ist eine primäre Einschränkung dieser Entwicklung [12]. Durch die langfristige Akkumulation von dezentralen Forschung, diese Daten und deren Formate nur individuellen Bedürfnissen gerecht zu werden, fehlt die Integration und Standardisierung ist und zur Diversifizierung, Isomerisierung und Zergliederung von Krebsdaten [13, 14].
Derzeit reichlich vorhandenen klinischen und grundlegenden Studien Magenkrebs in Bezug auf oder im Gange geplant. Verschiedene Arten von Daten in verschiedenen Datenbanksystemen [13], ohne gemeinsame Nutzung oder Kommunikation gespeichert. So stark korrelierte Information bleibt isoliert, in was "Informationsinseln" genannt. Auf der einen Seite, erhöht die Daten Dissektion die Schwierigkeit des Data Mining, während auf der anderen Seite verhindert es Kliniker aus der vollen Nutzung der Ergebnisse der Grundlagenforschung klinischen Studien und Anwendungen zu entwickeln und hält grundlegende Forscher von der Durchführung effizienter Sondierungsstudien, die Referenz klinisch relevante Informationen [15].
in dieser Situation auf Magenkrebs umfassend das Abrufen von Informationen ist keine leichte Aufgabe, und Teile dieser Daten in den Ozean des Internets verschwinden kann, was sehr bedauerlich wäre.
Diese Forschung nutzte Ressourcen aus dem Internet und Publikationen aus dem chinesischen Center for Disease Control and Prevention (CDC) und Magenkrebs-Zentrum für Diagnose und Behandlung, Key Laboratory von Magentumoren in Shanghai. Diese Studie systematisch verschiedene Arten von Magenkrebs-bezogenen Daten, integriert diese Daten Ressourcen nach der Filtration und Standardisierung gesammelt und bildeten schließlich die erste umfassende Wissensbasis für Magenkrebs zu analysieren.
Data Resources
Die Datenbank der menschlichen Magenkrebs (DBGC) die folgenden Magenkrebs-bezogenen Ressourcen integriert hat:
Datenerfassung entsprechenden
1) epidemiologische Statistiken von Magenkrebs-Patienten in China.
Die CDC ein etabliertes Krebs-Reporting-System seit vielen Jahren gehabt hat und hat reichlich epidemiologischen Informationen über die Krebspatienten in China gesammelt. Die epidemiologischen Statistiken von Magenkrebs, einschließlich Fallnummer, Tod Nummer, Inzidenzrate (Roh-Rate, altersbereinigte Rate und kumulative Rate), Sterblichkeit (Roh-Rate, altersbereinigte Rate und kumulative Rate) und das Auftreten (oder Mortalität) Verteilung nach Altersgruppe wurden manuell von CDC Publikationen extrahiert. DBGC 1.0 deckt alle epidemiologischen Statistiken für alle typischen Regionen Chinas aus den Jahren 2004 bis 2009 und zusätzlichen Statistiken werden in der aktualisierten Version enthalten sein.
Clinicopathological Informationen wurden von Shanghai Ruijin Krankenhaus zur Verfügung gestellt. Die Klassifikation und Staging-Methoden im Allgemeinen für Magenkrebs Diagnose verwendet wurden Fälle mit Magenkrebs in Ruijin Krankenhaus diagnostiziert kommentiert. Typische Magenkrebsgewebe verschiedener Stadien und Arten wurden aus einem Magenkrebs Biobank ausgewählt, die wir seit Jahren gepflegt. Alle Patienteninformationen wurden anonymisiert und deidentifiziert vor unserer Analyse.
Molekularbiologische Daten wurden von Online-Ressourcen extrahiert und kuratiert. Transcriptomics Daten wurden aus der GEO-Datenbank (http://www.ncbi.nlm.nih.gov/geo/) und EBI-Datenbank (http://www.ebi.ac.uk/) gesammelt. Proteomik-Daten wurden aus der veröffentlichten Literatur durch manuelles Ablesen und Standardisierung extrahiert [16, 17]. Mutationsdaten wurden aus der dbVar Datenbank gesammelt (http://www.ncbi.nlm.nih.gov/dbvar/), OMIM-Datenbank (http://www.ncbi.nlm.nih.gov/omim/), HGMD Datenbank (http://www.hgmd.org/) und der veröffentlichten Literatur [18, 19]. Alle biomarker Daten wurden aus der veröffentlichten Literatur entnommen [20, 21]. Drogenbedingte Gene wurden aus der PharmGKB Datenbank extrahiert (http://www.pharmgkb.org/), CancerDR Datenbank (http://crdd.osdd.net/raghava/cancerdr/) und der veröffentlichten Literatur [22, 23]. Wir haben detaillierte Extraktionsstandards für jede Art von molekularbiologischen Daten Ressource, und jedes Datensammelverfahren musste diese Standards folgen, um die Datenkohärenz zu gewährleisten. Die detaillierte Auflistung Verfahren ist unten angegeben:
Transcriptomics Daten:
Proteomics Daten:
Mutationsdaten:.
Biomarkerdaten.
Drug-sensible Daten.
Wir annotiert in dieser Datenbank alle Gene und Medikamente helfen Benutzer besser zu verstehen und diese Daten-Ressourcen. Die Gene werden nach NCBI kommentierten (http://www.ncbi.nlm.nih.gov), HGNC (http://www.genenames.org/), Ensembl (http://feb2014.archive.ensembl.org /) und Gene Cards (http://www.genecards.org/). Die Arzneimittel werden nach Drugbank annotiert (http://www.drugbank.ca/).
Darüber hinaus wird im TCGA Projekt detektiert Mutationen wurden ebenfalls enthalten Gene im DBGC zu annotieren. Benutzer können alle Mutationen eines bestimmten Gens im TCGA Projekt erfasst finden. Diese Mutationen wurden durch ICGC verarbeitet (https://dcc.icgc.org), basierend auf TCGA Daten und durch jede Mutation im DBGC verwiesen.
Darüber hinaus wurden mehrere Magenkrebs im Zusammenhang mit der Grundlagenforschung Projekte wurden durchgeführt, von unserem Forschungsteam. Projektbeschreibungen und Rohdaten werden in der DBGC zum Download und zur weiteren Analyse zur Verfügung gestellt.
Die DBGC ist eine relationale Datenbank mit einer MySQL-Datenschicht. Eine benutzerfreundliche Schnittstelle wurde entwickelt, HTML und JavaScript zu organisieren und Anzeigedaten-Ressourcen. Die Wechselwirkung zwischen der Datenschicht und der Web-Oberfläche wurde mit der Java EE-Plattform abgeschlossen.
Datenbank Beschreibung
Diese Datenbank in erster Linie aus drei Längsdatensystemen besteht , epidemiologische, klinisch-pathologischen und molekularbiologische Daten (Bild 1). Die molekularbiologischen Daten bestehen aus Magenkrebs im Zusammenhang mit Transkriptomik, Proteomik, Mutation, Biomarker und arzneimittelempfindlichen Gendaten. Die Gesamtstatistik dieser Daten in der Tabelle aufgeführt sind 1. Neben den epidemiologischen Statistiken von Magenkrebs-Patienten in China und der klinisch-pathologischen Informationen kommentierte mit Magenkrebsfälle, die alle diese Daten wurden aus öffentlichen Datenbanken extrahiert, Veröffentlichungen und der veröffentlichten Literatur.
Datenbank-Schnittstellen
1) Schnellsuche (Bild 2). Die schnelle Suchfunktion Modul macht die Rolle eines Gens oder Proteins bei Magenkrebs Identifizierung möglich über an der Navigationsleiste Schlüsselwörter in das Suchfeld eingeben. Das Suchergebnis wird Ihnen sagen, ob das Gen oder Protein differentiell in beliebigen Transkriptomik Projekten oder Proteomik Projekte exprimiert wird und ob es als Biomarker für Magenkrebs oder ein Medikament empfindlichen Gen identifiziert wurde. Außerdem, wenn das Gen jede Mutation, die zu Magenkrebs verbunden ist, wird eine detaillierte Liste auf der Ergebnisseite angezeigt werden. Zum Beispiel: "EGFR" als Schlüsselwort verwenden, können wir schließen, dass es als hochreguliert Gen in GSE51936 und GSE27342 und als herunterreguliert Gen in GSE29630 identifiziert wurde. Das entsprechende Protein des Gens EGFR wurde als hochreguliert Protein in 3 Proteomik-Projekte (: 23161554, 24263233 und 24722433 PubMed Ids) identifiziert. EGFR wurde als Prognosefaktor von Magenkrebs berichtet und sind eine Arzneimittelresistenz im Zusammenhang mit Irinotecan, die eine häufig verwendete Arzneimittel für die Behandlung von Magenkrebs. Vier Mutationen von EGFR zu Magenkrebs im Zusammenhang berichtet worden (c.2361G > A, c.2402A > G, c.2573T > G, c.2588G > A).
2) blättern und suchen (Abb 3). Mit Hilfe der Navigation können Benutzer entsprechenden Artikel finden Sie in den Datenressourcen im DBGC bereitgestellt zu durchsuchen. Detaillierte Informationen finden Sie unten aufgelistet. Wir haben auch mehrere Suchkriterien für jede Art von Datenquelle, über die alle Datenelemente, die die Bedingungen erfüllen etabliert werden angezeigt.
3) Unsere Datenbank unterscheidet sich von anderen Online-Ressourcen aufgrund der Einbeziehung von epidemiologischen Statistiken von Magen Krebspatienten in China. Benutzer können Statistiken nach Geschlecht (männlich und weiblich), Bereich (Stadt und Land) und Alter bei der Diagnose oder Tod vergleichen. Fallnummer, Tod Nummer, Inzidenzrate und Sterblichkeit in einem ausgewählten Jahresbereich kann sowohl in der Grafik und Tabelle Format (Bild 4) angezeigt werden.
Magenkrebs ist ein führender Krebs weltweit sowohl in der Mortalität und Morbidität. Höhere Inzidenz und Mortalität von Magenkrebs sind in den asiatischen Regionen, vor allem in China beobachtet. Die epidemiologischen statistischen Daten von Magenkrebs in dieser Datenbank wurden in erster Linie aus den Veröffentlichungen der CDC erhalten, die seit mehreren Jahrzehnten in malignen Tumorstudien engagiert wurde und umfassende Archive von bösartigen Tumorpatienten in China etabliert. Diese Daten haben eine wichtige Rolle bei der Förderung der Krebsprävention und Gesundheit Politik in China gespielt [24-26]. die Magenkrebsepidemiologie Daten in dieser Datenbank Durch das Abrufen, Forscher und Kliniker können schnell die epidemiologischen Trends von Magenkrebs in China bestimmen.
Magenkrebs im Zusammenhang mit Mutationen, Biomarker, arzneimittelempfindliche Gene, Transkriptomik Projekte und entsprechende differentiell exprimierten Gene und Proteomik Experimente und entsprechende differentiell exprimierten Proteine wurden manuell aus Online-Datenbanken und der veröffentlichten Literatur gesammelt. Die schnelle Suchfunktion durch die DBGC bereitgestellt ermöglicht es Forschern, die Rolle eines Gens oder Proteins in Magenkrebs zu identifizieren. Diese differentiell exprimierten Gene und Proteine enthalten reichlich wichtige Informationen über Magenkrebs, und viele analytische Studien konnte mit ihnen durchgeführt werden.
Unser Forschungsteam hat sich seit vielen Jahren bei Magenkrebs Forschung und hat erhebliche Erfahrung im Tumor akkumuliert epidemiologische Forschung, Magenkrebs clinicopathology und Biomarker-Forschung, Biobank Gebäude, molekularbiologischen Mechanismus Forschung, Bioinformatik Analyse und groß angelegte Datenbank Bau [27-30]. Um Anfrage und Analyse-Tools, die bequemer und praktischer für Magenkrebs Forscher konstruierten wir diese Datenbank. Die aktuelle Version ist 1.0. Da die große Mengen von verschiedenen experimentellen Plattformen in verschiedenen Gebieten erzeugten Daten stark verteilten und heterogenen sind, können haben einige nützliche Informationen sind in unserem Prozess der Datenerhebung verpasst. Wir werden diese Daten abrufen und die neuesten Daten für eine lange Zeit zu aktualisieren, die Aktualität und Vollständigkeit der Daten zu gewährleisten. In der nächsten Version werden wir die neuesten menschlichen Magenkrebs im Zusammenhang mit Mutationen, Biomarker und Drug-sensitiven Genen zu decken. Transcriptomics Daten wird der Schwerpunkt der nächsten Version sein, in dem alle Transkriptomik Projekte werden erneut analysiert werden differentiell exprimierte Gene bei verschiedenen fold Änderungswerte zu extrahieren. Somit könnten Benutzer abfragen, ob ein bestimmtes Gen differentiell durch die Konfiguration der Probentyp exprimiert wird und Änderungswert falten.
Die Datenbank in diesem Artikel beschrieben, der DBGC, ist eine umfassende und Web -accessible Datenbank des menschlichen Magenkrebs. Diese Datenbank hat eine Vielzahl von Datenquellen integriert Magenkrebs und leistete mehrere leicht zu bedienende Web-basierte Funktionsmodule. Wir glauben, dass die DBGC wird ein wichtiges Instrument für Magenkrebs Ärzte, Tumorgrundlagenforschung Wissenschaftler, Krebsgenomforscher, staatliche Gesundheitspolitiker und Magenkrebs-Patienten sein.