Stomach Health > Желудок Здоровье >  > Gastric Cancer > Рак желудка

PLoS ONE: Вычислительная Метод прогнозирования выделительной белков и приложением к идентификации маркеров рака желудка в Urine

Абстрактный
<р> Роман вычислительный метод для прогнозирования белков организма в моче представлена. Метод основан на определении перечня отличительных признаков между белков, обнаруженных в моче здоровых людей и белков не считаются мочи выделительной. Эти функции используются для обучения классификатор, чтобы различать два класса белков. При использовании в сочетании с информацией о которых белки дифференциально экспрессируются в пораженных тканей определенного типа в сравнении
тканей управления, этот метод может быть использован для прогнозирования потенциальных маркеров мочи на присутствие заболевания. Здесь мы сообщаем подробный алгоритм этого метода и применение к идентификации маркеров мочи для рака желудка. Производительность обученного классификатора на 163 белков было экспериментально подтверждено с использованием массивов антител, достигая > 80% истинная положительная норма. Применяя классификатор на дифференциально экспрессированных генов при раке желудка <ЕМ> против
нормальных тканей желудка, было установлено, что эндотелиальные липазы (EL), был в значительной степени подавлено в образцах мочи 21 больных раком желудка <ЕМ> в сравнении
21 здоровых людей. В целом, мы показали, что наш предсказатель для мочи выделительной белков является весьма эффективным и потенциально может служить мощным инструментом в поисках биомаркеров заболеваний в моче в целом
<р> Цитирование:. Hong CS, Цуй J, Ni Z, Су Y, Puett D, Li F, и др. (2011) Вычислительная Метод прогнозирования выделительной белков и приложением к идентификации рака желудка маркеров в моче. PLoS ONE 6 (2): e16875. DOI: 10.1371 /journal.pone.0016875
<р> Редактор: Владимир Brusic, Дана-Фарбер институт рака, Соединенные Штаты Америки
<р> Поступило: 22 сентября 2010 года; Принято: 31 декабря 2010 года; Опубликовано: 18 февраля, 2011
<р> Это статья с открытым доступом распределяются в соответствии с положениями декларации Creative Commons Public Domain, который предусматривает, что после того, как размещены в свободном доступе, эта работа может свободно воспроизводиться, распространяться, передана, изменена, построена на, или иным образом использоваться кем-либо для любых законных целей
<р> Финансирование:. Это исследование было поддержано частично Национальным научным фондом (CCF-0621700, DBI0542119004, 1R01GM075331), Цзилинь университета, университет штата Джорджия, Джорджия Рак коалиция, исследовательский альянс Грузии и Национальные институты здоровья (1R01GM075331, DK69711). Доноры не играет никакой роли в дизайн исследования, сбора и анализа данных, решение о публикации или подготовки рукописи
<р> Конкурирующие интересы:.. Авторы заявили, что не существует никаких конкурирующих интересов

Введение
<р> быстрое развитие OMIC
техники в последние годы сделало возможным поиск биомаркеров для конкретных заболеваний человека на систематической и комплексной основе, что существенно улучшая нашу способность выявлять заболевания на ранние стадии. Большинство предыдущих исследований биомаркеров были сосредоточены на сывороточных маркеров [1], в основном из-за известного насыщенностью сыворотки в содержащий сигналы для различных физиологических и патофизиологических условиях.
<Р> По сравнению с сывороточных маркеров, существующие мочевые маркеры в основном связанных с мочевыводящих путей или тесно связанных с ними заболеваний. Только за последние несколько лет улучшилось протеомические анализы проб мочи показал, что, как и сывороток, моча также является богатым источником информации для выявления заболеваний человека, таких как трансплантат против
-host заболевания и ишемической болезни сердца [2], [3], [4]. Обратите внимание, что моча образуется путем фильтрации крови через почки; следовательно, некоторые белки в крови могут проходить через фильтры и быть выделены в мочу. В результате, мочевые белки не только отражают состояние почек и урогенитального тракта, но и те из других органов, которые могут быть дистальный из почки, как по меньшей мере 30% из мочевых белков не являются первоначально из урогенитального тракта [5], [6]. Изобилие информации, содержащейся в моче делает его привлекательным источником для скрининга биомаркеров, так как, по сравнению с сывороткой, состав мочи является относительно простым, и сбор мочи проще и неинвазивный [7], [8].
<Р> Маркерные выявление в моче потенциально может быть сделано с помощью сравнительных протеомическим анализов проб мочи пациентов с конкретным заболеванием и контрольной групп. Задача в таких поисках мочевых маркеров в слепом имеет два аспекта. (А) Моча может иметь большое количество белков /пептидов (в отличие от предыдущего понимания [8]) с относительно низкой численности. (Б) Динамический диапазон в обилии этих белков может охватывать несколько порядков, шире, чем диапазон, как правило, охватываемой масс-спектрометра [9]. По этим причинам, сравнительный анализ, в частности, (полу) количественный анализ, протеомных данных образцов мочи может быть очень сложным. Это может быть одной из основных причин, что нет никаких надежных маркеров мочи для диагностики рака.
<Р> Наше исследование фокусируется на разработке вычислительного метода для точного прогнозирования белков, мочи выделительной (см рисунок 1 для контура подхода ). Эти белки должны иметь определенные свойства, которые позволяют им быть секретируемый из клеток, а затем быть отфильтрованы через клубочки мембрану в почках. Недавнее исследование выявило Протеомные более 1500 белков /пептидов, которые выводятся из организма с мочой в здоровых через мембраны клубочков [8]. Используя этот набор белков и белков не считаются мочи выделительной, мы определили список отличительных признаков между этими двумя классами белков и воспитал опорных векторов (SVM) на основе классификатор спрогнозировать, если данный белок может быть из организма в моче , Способ предсказания экспериментально подтверждено с использованием массивов антител в сочетании с Вестерн-блоттинга, и результаты являются весьма обнадеживающими
. <Р> Этот классификатор был применен для прогнозирования белков, которые могут быть выделены в моче, на основе выявленных дифференциально выраженных генов в рак желудка по сравнению с
ссылки желудка тканей; а также ряд потенциальных маркеров мочи для рака желудка были идентифицированы. Основной вклад, внесенный в этой работе является то, что она обеспечивает новый и эффективный способ для руководства протеомические исследования мочи, предложив кандидатом белков-маркеров, таким образом позволяя целенаправленный поиск маркеров с использованием антител-опосредованной методы, как Вестерн-блоттинга и Elisa, которые существенно посильнее крупномасштабные сравнительные протеомические анализы образцов мочи без каких-либо целей, с которыми работать. Хотя эта программа прогнозирования была применена к желудочным данным рака в данном исследовании, не желудочный информация канцер-специфическая была использована в этой программе; следовательно, он может быть использован для поиска мочи маркеров для других заболеваний

методы
<р> Это исследование состоит из трех основных компонентов:. (I) строительство классификатора для прогнозирования мочи выделительные белков; (II) оценка работы классификатора, применяя его к набору белков, для которых выделительной статус белков, как известно; и (III) применение проверенного классификатор для экспрессии генов данных рака желудка, чтобы продемонстрировать свою эффективность в решении проблемы мочи идентификации маркера.
<р> Это исследование было одобрено Советом по рассмотрению Institutional в Университете Джорджии, Афины, штат Джорджия, США (Канцелярия вице-президент по исследованиям DHHS Assurance ID NO. FWA00003901, номер проекта 2009-10705-1) и Институциональным наблюдательным советом китайского надзора за человека предметов в Цзилинь университета медицинский колледж, г. Чанчунь, Китай. Форма согласия, одобренный IRB в Университете Джорджии и китайского IRB, была собрана из каждого предмета. Все субъекты осознают, что любые данные исследования могут быть использованы для документов или публикаций, как указано в форме согласия.

а. Алгоритм для прогнозирования выделительные белков
<р> Общее понимание выделения белка из тканей в моче, что некоторые белки секретируются или утечка из клеток в кровь, а затем часть этих белков, наряду с некоторыми нативных белков в кровь, может быть из организма в моче. Наши цели в первую очередь для выявления отличительных особенностей для таких белков мочи выделительной, а затем построить классификатор на основе этих признаков, чтобы предсказать, какие белки в клетках могут быть выделены в мочу. Насколько нам известно, не было никаких опубликованных работ направлена ​​на решение этой проблемы. Важность в том, чтобы такую ​​возможность является то, что она обеспечивает эффективную связь в соединении OMIC
анализ тканей, чтобы произвести поиск маркеров в моче, предоставляя маркеры кандидатов в моче, которые могут быть изучены с использованием подходов на основе антител.
<р> Первый шаг в разработке такой возможности прогнозирования, т.е. классификатор, должен иметь обучающий набор данных, содержащий белки, которые могут и которые не могут быть выделены в моче, на основании которых, возможно, может быть определен набор отличительных признаков. К счастью, мы нашли один большой Протеомические набор данных образцов мочи у здоровых людей, в недавно опубликованном исследовании [8], который содержит более 1500 уникальных белков из которых 1313 имеют идентификаторы SwissProt о присоединении. Мы использовали эти белки 1313 в качестве положительных обучающих данных для чтобы быть обученным классификатором. Следующая процедура была затем использована для создания отрицательного набора обучения: произвольно выбрать по крайней мере один белок из каждого семейства Pfam, который не содержит каких-либо положительных данных обучения, а также количество выбранных белков из каждой семьи пропорционально размеру семьи [ ,,,0],10], [11]. В результате 2627 белки были выбраны и использованы в качестве отрицательного обучающего набора.
<Р> Мы исследовали 18 физико-химические особенности, вычисленных из белковых последовательностей, которые являются потенциально полезными для задачи классификации, основанной на общем понимании экскреции белков , Детали 18 функций и компьютерных программ, используемых для расчета их приведены в таблице S1. Некоторые из этих функций представлены множеством значений признаков, например, состав аминокислоты в белковой последовательности, представлено 20 художественных ценностей; в целом на 18 функции представлены с использованием 243 значений признаков. Затем мы определили подмножество функций значений из 243, которые могут различать между положительными и отрицательными данными обучения с использованием SVM классификатор на основе. РФБ ядро ​​было использовано в нашем обучении SVM, учитывая его способность обрабатывать нелинейные свойства [12], [13].
<Р> Для того, чтобы выяснить, какие из первоначально рассматриваемых функций действительно полезны, инструмент отбора признаков при условии, в LIBSVM [12] был использован для выбора наиболее проницательных функций среди 243. Другие инструменты выбора функции могли бы быть использованы, но мы имеем значительный опыт в использовании этого инструмента, и нашел, что это будет адекватным. Коды, используемые в этом публично доступны на веб-сайте LIBSVM (http://www.csie.ntu.edu.tw/~cjlin/libsvm/); мы также сделали соответствующую программу, доступную на http://seulgi.myweb.uga.edu/files. F-оценка [12], определяется следующим образом, используется для измерения требовательного мощности каждого значения признака к нашей задаче классификации,
<р>, где относится к значений признаков обучения (к = 1, ..., т); п
<суб> + и п
<суб> - это количество белков в положительном (+) и отрицательные (-) подготовка набора данных, соответственно; , Являются средние значения я
-е значение функции во всем наборе данных, подготовки кадров положительного набора данных и отрицательного набора данных, соответственно; и и являются я
й особенностью к
го белка в положительных и отрицательных обучающих данных, соответственно. Как правило, чем больше Ф-счет, тем более дискриминационный соответствующая функция. В нашем выборе, все функции с F-баллов выше предварительно выбранного порогового значения были сохранены и использованы в подготовке окончательного классификатор. Для того, чтобы найти оптимальный порог F-оценка, мы рассмотрели список возможных пороговых значений, а затем выбрала лучших на основе результатов обучения
. <Р> Тренировка нашей SVM на основе классификатора производится с использованием стандартной процедуры, представленную в LIBSVM [12], чтобы найти значения двух параметров C
и γ, которые дают оптимальную классификацию на обучающих данных, где C
контролирует компромисс между ошибками обучения и классификации маржи, а также γ определяет ширину используемого ядра [12]. Наша методика обучения резюмировать следующим образом [12]:
  • Получите F-балл для каждого значения признака;
  • Для каждого из предварительно выбранных пороговых значений, выполните следующие действия
  • Удалите значения функций с функциями F-баллов ниже порога;
    <литий> Произвольно разделить обучающие данные в суб-профессиональной подготовки и наборов суб-проверки с одинакового размера;
  • обучить SVM с РФБ ядром на вспомогательном обучающего набора для поиска оптимальных значений C
    и у, а затем применить его к данным суб-проверки и вычисления ошибки классификации;
  • Повторите шаги (I) - (III) в пять раз и вычислить среднюю ошибку проверки;


  • Выберите порог, который дает самую низкую среднюю ошибку проверки, и сохранить функции с F-баллов выше выбранного порогового значения; и
  • Переподготовка в SVM на основе выбранных функций в качестве окончательного классификатора.

    б. Наборов данных, используемых для оценки производительности классификатора
    <р> Независимый набор данных был использован для оценки эффективности тренированного классификатора, для которых выделительной статус каждого белка известна. Положительное подмножество этого набора данных состоит из 460 человеческих белков, обнаруженных в моче здоровых людей тремя мочеполовых исследований протеомики [14], [15], [16], а отрицательное подмножество содержит 2,148 белки, выбранные с использованием тех же процедурой, описанной выше, но делает не перекрываются с отрицательным набором используемых для обучения
    <р> следующие меры были использованы для оценки классификации точностей:. Чувствительность, специфичность, точность, коэффициент корреляции Матфея, и АУК [17]. В таблице 1 приведены классификации точностей тренированного классификатора по обе тренировки и тестовые наборы данных [17]. Из классификации точностей на двух наборах данных, мы считаем, что наш обученный классификатор захватили ключевые отличительные особенности выделительной белков в моче.
    <Р> Кроме того, наш классификатор был протестирован на отдельном наборе данных, подмножество 274 белки, закрепленные на предварительно сделанной массив белка антитела (массив G-серии RayBio Human 4000 (RayBiotech, Inc., Norcross, GA)). Из 274 белков, 111, как известно, выделительной и были включены в наше обучение или независимого испытательного набора данных. Мы применили классификатор на остальных 163 белков, для которых выделительной статус был неизвестен (см Результаты и таблица S2). Этот массив белка обеспечивает относительный уровень экспрессии для каждого белка на матрице при испытании на (моча) образца, который измеряется с точки зрения интенсивности сигнала, измерить с помощью денситометрии. Фон массива был использован в качестве контроля для определения фактического присутствия белка в моче () образца. Интенсивность сигнала для белка рассматривался как истинный сигнал, если он был, по крайней мере в 5 раз выше, чем у контрольной группы, как это было предложено в соответствии с рекомендацией завода-изготовителя. Мы сосредоточили нашу экспериментальную проверку на подтверждении положительные прогнозы только так как практически невозможно доказать, белок не присутствует в образце мочи из-за ограничений в области чувствительности обнаружения текущей технологии, когда белок является очень низкой концентрации в образце.

    с. Моча коллекция /подготовка
    <р> образцы мочи у больных раком желудка и здоровых контрольных образцов были собраны в Медицинской школе университета Цзилинь, Чанчунь, Китай. Больных раком желудка, с кем образцы были собраны из, все пациенты на поздней стадии (таблица S3 для информации о пациентах). Эти образцы были немедленно лиофилизируют и хранят при -80 ° С до дальнейшего использования после их хирургического удаления от пациентов. Затем они восстанавливали и центрифугировали (3000 XG
    в течение 25 мин при 4 ° С), чтобы удалить клеточные компоненты. Супернатанты собирали и подвергали диализу при 4 ° C против Millipore ультра чистой воды (три смены буфера с последующим диализом в течение ночи) с использованием Slide-A-лизатора диализ (кассетах Thermo Fisher Scientific, Rockford, IL). Концентрации белка определяли с помощью Bio-Rad Protein Assay (Bio-Rad, Hercules, CA) с бычьим сывороточным альбумином в качестве стандарта.

    d. Идентификация генов, которые дифференциально экспрессируются в рака желудка и контроля тканей
    <р> В общей сложности 80 желудочных раковых тканей и прилегающих к ним нераковых тканей из 80 пациентов были собраны в Медицинской школе университета Цзилинь. микрочипов экспериментов были проведены на этих тканей с использованием Affymetrix GeneChip Human Экзон 1.0 ST Array, которая охватывает 17800 генов человека. Алгоритм PLIER [18] был использован для суммирования сигналов о срабатывании датчика к экспрессии генов на уровне. Для каждого гена, мы исследовали распределение экспрессии сгиба изменения между парными рака и контроля тканей во всех 80 пар тканей. Пусть К <югу> ехр,
    быть число пар тканей, чьи складными изменение по меньшей мере, 2. Ген рассматривается как дифференцированно выражены
    если р <бр> -value наблюдаемого к <подразделам> ехр
    меньше 0,05. Используя этот критерий, были найдены в общей сложности 715 генов, дифференциально экспрессируется в раке желудка во всех человеческих генов, а также имена 715 генов, вместе с соответствующим K <подразделам> ехр
    и р
    -значения, приведены в таблице S4. Детальное изучение данных микрочипов было сообщено в другом месте [19].

    е. Функция и обогащение пути анализа
    <р> Давидом Биоинформатика Ресурсы и веб-сервер KOBAS [20], [21] были использованы, чтобы сделать функциональное и обогащения пути анализа, соответственно, для всех предсказанных мочи-выводных белков, используя весь набор человеческих белков в качестве фона. Мы отсылаем читателя к [20], [21] для получения подробной информации о методах анализа функциональной и пути обогащения. Используя DAVID биоинформатики ресурсов, обогащение оценка для определенной группы белков определяли с помощью EASE балла [20], [22]. KOBAS является дополнительным инструментом для DAVID, поскольку оно расширяет аннотацию гена с использованием KEGG Ортология (KO) термины. Веб-сервер KOBAS, наряду с КО на основе системы аннотаций [21], [23], был использован, чтобы найти статистически обогащается и недопредставленными пути между предсказанными мочой из организма белков. KOBAS занимает в наборе последовательностей белка и помечает их, используя термины КО. Аннотированные термины KO были сопоставлены против всех человеческих белков в качестве фона набор для оценки, если они обогащены или недопредставлены.

    е. Вестерн-блоты

    мочевые белки из каждого образца (в общей сложности 2 мкг) смешивали с 3-кратным образца красителя. Каждую пробирку кипятят в течение 5 мин и наносили на SDS-PAGE, гели, вместе с 10 мкл стандартов и работать в течение 1 часа при 200 вольт. Мембрана активировали 100% метанола, после переноса из геля на мембрану (100 вольтах в течение 1 ч). После того, как передача была завершена, мембрана давали высохнуть, повторно увлажняются в 100% метаноле и промывали 2Х в течение 5 мин каждый с Трис-солевом буфере (TBS). Затем мембрану инкубировали в 3% блокирующего раствора молока в течение 2 ч при комнатной температуре. Затем мембрану инкубировали в первом растворе антител (1:200 разведений в 1,5% блокирующем молоко) в течение 1 ч при комнатной температуре, и несвязанного антитела удаляли путем промывки мембраны 3Х с-20 Tween раствором TBS (TBST) в течение 10 мин каждый. Затем мембрану инкубировали в 1:10,000 разбавлением вторичного антитела в 1,5% блокирующего раствора молока в течение 1 ч при комнатной температуре. Мембрану промывали 3 раза с TBST и 2Х с TBS (10 мин каждый). И, наконец, мембрана была покрыта полностью с равным количеством энхансер и пероксидного раствора из комплекта Пирса Вестерн-блоттинга в течение 5 мин и экспонировали с пленкой. Каждый эксперимент повторяли несколько раз, чтобы обеспечить воспроизводимость [24]. Интенсивности сигналов определяли с помощью программного обеспечения ImageJ [25]. Для каждой мембраны, заготовка полоса была использована для нормализации интенсивности сигнала через мембраны. Спектакль исследовали с помощью ROC и усов коробками участок.

    Результаты и обсуждение

    а. Сигнальный пептид и вторичные структуры являются ключевыми особенностями мочой из организма белков
    <р> Первоначальный список функций был тщательно отобраны, чтобы включить то, что мы считали, что белковые характеристики, имеющие отношение к экскреции на основе поиска литературы и наше нынешнее понимание мочевыводящих путей белки. Например, отрицательно заряженные клубочковой стенки в почках позволит фильтрацию только положительно или нейтрально заряженных белков. Таким образом, заряд белка является одной из функций, которые мы выбрали. Принимая имеющуюся информацию к сведению, общее число значений признаков, собранных первоначально был 243, представляющий основные свойства последовательностей, мотивы, физико-химические свойства и структурные свойства (табл S1). При определении возможностей, которые эффективны при выделении мочи выделительные белков из не-выделительной из них, простой и эффективный метод для устранения особенностей, которые показывают, мало или вообще не выходя из мощности для нашей задачи классификации была используемой; 74 значений признаков были выбраны с помощью процедуры, описанной в разделе А методы (Таблица S5). Эти значения функция были использованы для подготовки окончательного классификатор.
    <Р> Среди выбранных функций, наиболее дискриминационным одним было наличие сигнальных пептидов. Понятно, что белки, которые секретируются через ER имеют сигнальные пептиды, и продают в место назначения в соответствии с конкретными сигнальных пептидов; Таким образом, не удивительно, что большинство из организма белки имеют эту функцию. Другой отличительной чертой была вторичной структуры типа; В частности, процентное содержание альфа-спиралей в белковой последовательности оценивался как особенность значения номер 2 среди выбранных 74 (таблица S5). Как и следовало ожидать, заряд белка был среди топовых функций для экскретируемых белков. Это согласуется с общим пониманием, что плата является фактором в определении того, какие белки могут быть отфильтрованы через клубочковой мембраны [26], как белки внутри клубочков мембран и подоцитов щелей заряжены отрицательно, и, следовательно, отрицательно заряженные белки имеют низкие шансы через фильтр почек. Действительно, значения особенность положительных аминокислот и заряда были одними из лучших оцениваемых значений признаков.
    <Р> Интересно, однако, молекулярный вес, который занимает на 232 из 243, не была включена в заключительные 74 художественных ценностей. Это можно объяснить следующим образом. Белки, присутствующие в сыворотке крови, возможно, уже подверглись расщеплению или частично деградировали, и, таким образом, не может быть в их нетронутыми или полной форме, когда они попадают в почки. Он, в самом деле, было установлено, что большинство белков, обнаруженных в моче широко деградировали [27]. В то время как интактный белок может быть не в состоянии отфильтровать через клубочки из-за его размера или формы, белок, полученный пептид может легко проходить через подоцита щели. В результате, молекулярная масса интактного белка не является фактором в прогнозировании, если белок мочи экскреторную.
    <Р> Следует отметить, что моча выделительные белки и секретируемые белки имеют некоторые общие характеристики, как некоторые из особенности, используемые для идентификации крови секретируемых белков в нашем предыдущем исследовании [10] были выбраны в предсказании белка в моче в этом исследовании. Например, такие функции, как доступность растворителя, полярности, и сигнальных пептидов были включены в обоих классификаторов. Однако существует четкое различие между особенностями используемых в двух классификаторов. В то время как функции, такие как бета-цепь-контента, особенности, связанные с бета-бочка трансмембранного белка и соотношение белков, TATP мотив, трансмембранный домен, размер белка, и самый длинный неупорядоченной области были одними из лучших возможностей для прогнозирования крови секреторная белков [10 ], они не были включены в заключительные функции для прогнозирования белка в моче. Кроме того, характеристики, связанные с положительным зарядом, такие, как состав положительно заряженных аминокислот, были видными в предсказании белка в моче, но не выбран в предсказании секреции крови. Кроме того, альфа-спираль-контента и катушки содержание белков были одними из главных признаков для прогнозирования белка в моче, но они не были выбраны для прогнозирования белка крови секреторная. Интересно отметить, что в отличие от открытия, что бета-нити являются общей вторичной структуры типа среди секреторных белков крови, мочевые белки, как правило, имеют более высокий альфа-спирали и содержание катушки, которая указывает, что мочевые белки обладают свойствами, не разделяемые секреторными белками крови в целом.

    б. Выполнение классификатор

    Для того, чтобы определить точность конечного классификатора, мы тестировали его на независимом тестовом наборе, который состоит из 460 экспериментально подтверждено мочи выделительной белков и 2148 без мочи выделительной белков. Наш классификатор имеет чувствительность и специфичность предсказания на этом независимом множестве тест на 0,78 и 0,92, соответственно (таблица 1).
    <Р> Затем мы запустили классификатор на 163 из 274 белков, закрепленных на предварительно сделанной антитела массив (см методы), для которых выделительной статус был неизвестен. Из 163 белков, 112 белки были предсказаны быть мочи выделительной наш классификатор. Для того, чтобы оценить эффективность этого предсказания, антител эксперименты на основе массивов были проведены на 14 образцах мочи, семь из здоровых людей и семь от больных раком желудка. Из 112 предсказанных мочи-выводных белков, 92 были обнаружены по меньшей мере, одного из образцов мочи (табл S6), что дает положительную скорость предсказания 0,81, что согласуется с уровнем производительности на первом наборе тестов.
    <р> следует отметить, что одно из ограничений данного классификатора является то, что некоторые белки могут быть частично разлагаться до того, из организма в моче или в моче, что затрудняет наш классификатор, чтобы обнаружить полученные таким образом пептиды, как она была обучена на целых интактных белков. Этот вопрос будет решаться в будущем с помощью получения значений признаков на основе фактических белков /пептидов, определенных в предыдущих исследованиях мочевых протеомическим, а не соответствующие им белки полной длины, как это сделано в данном исследовании. В то время как там явно возможности для дальнейшего совершенствования, результаты прогнозирования текущего классификатора являются весьма обнадеживающими.

    с. Применение классификатор для рака желудка
    данных <р> Наше предыдущее исследование на 160 наборов микрочипов экспрессии генов данных рака желудка идентифицировал 715 дифференцированно выраженных генов, по меньшей мере, в 2 раза изменений в рак желудка по сравнению с <бр> образцы контрольной ткани [19]. Хотя было бы предпочтительнее иметь протеомических данных образцов тканей, у нас есть только данные экспрессии генов, имеющихся в данном исследовании. Следовательно, данные экспрессии генов используются в качестве приближения к экспрессии белка в данной методике ориентированной на исследования. Наш классификатор был применен к этим 715 белков, и он предсказал, что 201 из 715 белков мочи экскреторную. Таблица S7 предоставляет подробную информацию о 201 белков. Так как это нереально проверить все 201 белков в этом исследовании, чтобы определить, есть ли они в моче выделительной или нет, мы сделали анализ, чтобы сузить этот список. В частности, мы провели следующие анализы: (I) функциональный и пути обогащения анализа, чтобы получить лучшее представление о типах белков, присутствующих в моче, (II) поиск литературы по мочевых белков для сбора информации о опубликованных недержание маркерных белков, ( III) изучения данных экспрессии генов, чтобы удалить гены, которые по существу не дифференцированно выраженных между раком и контроль образцов тканей; и (IV) Вестерн-блоты на белках, выбранных из суженного списка из 201 белков. Эта процедура показала высокий уровень успеха и привело к интересным открытием потенциального биомаркера для рака желудка
    . <Р> Для (я), мы провели функциональный анализ и обогащение путь на всех 201 белков с использованием DAVID [20 ] и KOBAS [21] серверы соответственно. Мы обнаружили, что обогащенные функциональные группы включали внеклеточного матрикса (ECM), клеточную адгезию, и развитие, подвижность клеток, защитную реакцию, ангиогенез, которые все как известно, участвует в развитии или в защиту рака (рис S1A). Наиболее обогащенные пути были взаимодействие ECM-рецептора и неорганического переноса ионов и метаболизм путей (рис s1b)
    <р> Следующий критерий был использован для сокращения списка 201 белков для стадий (II) - (III):. белки не были сообщены, что связано с любого рака на основе нашей обширной поисковой литературы
    , что приводит к 71 белков. Перечень был сокращен на основе предварительно выбранного среза на дифференциальных выражений и функциональных аннотациями (потенциально имеющих отношение к раку желудка, а не иммунных реакций).

    d. Эндотелиальная липаза существенно снижается в образцах мочи рака желудка у пациентов

    Мы выбрали шесть белков (MUC13, COL10A1, AZGP1, LiPF, MMP3 и ЭЛ) для экспериментальной проверки по указанному выше сужен списка. Для этого мы собрали образцы мочи из 21 больных раком желудка и 21 здоровых людей. Из шести выбранных белков, пять белков, MUC13, COL10A1, LIPG, AZGP1 и EL выявляли Вестерн-блоттинга, по меньшей мере одной пробы мочи. Из пяти, MUC13, COL10A1, и Е.Л. были обнаружены даже при очень низком количестве от общего количества мочевых белков (1-2 мкг). MMP3 не был найден в образцах, протестированных нами, что может быть связано с низкой концентрацией MMP3 в моче или ложного предсказания нашим классификатором.
    <Р> Особенно интересно отметить, что нам удалось обнаружить последовательные различия в изобилии ЭЛ (кодируемый LIPG
    ) между двумя наборами 21 образцов мочи. Западные помарки для EL показали существенное сокращение его численности в образцах мочи 21 больных раком желудка по сравнению с контрольными образцами. Как показано на фигуре 2А, ​​большинство из контрольных образцов показал наличие EL, в то время как большинство образцов желудочного рака имели относительно низкие количества EL. Эта картина наблюдалась неоднократно
    <р> Молекулярная масса этого белка было определено, что 68 кДа [28]. Таким образом, гомодимер, как ожидается, будет 134 кД. В Вестерн-блоттинга, тем не менее, полосы были обнаружены в около 100 кДа. Это, вероятно, соответствует частично расщепленного гомодимер, активная форма которого была подтверждена предыдущем исследовании [29], хотя возможность мономерной формы EL, связанный с другим белком, не может быть исключена. http://csbl.bmb.uga.edu/~juancui/Publications/GC2009/Additional_material.pdf.
    doi:10.1371/journal.pone.0016875.s005
    (XLS)
    Table

  • Other Languages