Исследователи из МФТИ, Института биомедицинской химии, Института энергетических проблем химической физики и Научно-исследовательского института физико-химической медицины представили алгоритм обнаружения мутантных белков на основе данных масс-спектрометрии и результатов секвенирования экзома. Используя этот новый подход, ученые обнаружили уникальные варианты генома, некоторые из которых связаны с развитием рака. Изучение мутантных пептидов поможет обнаружить слабые места в опухолевых клетках, которые могут привести к более эффективному лекарственному лечению. Результаты опубликованы в журнале Proteomics.
Протеомика и большие данные
Кажется, что термин "большое количество данных" относительно новый. Однако невозможно представить себе науку, которая не использовала бы большие объемы данных. С одной стороны, большие данные позволяют ученым проводить крупномасштабные эксперименты и извлекать больше полезных данных из биологического материала. С другой стороны, становится все труднее выявить важные высокоспецифичные закономерности в большом объеме информации. Чтобы справиться с этой проблемой, ученые все больше сосредотачиваются на разработке сложных алгоритмов и / или рабочих процессов для фильтрации и анализа данных.
Протеомика – крупномасштабное исследование белков клеток и целых организмов – не исключение. Как правило, белки, пептиды и их фрагменты можно анализировать с помощью масс-спектрометрии. Масс-спектрометрия предоставляет информацию о фрагментации пептидов, специфичную для аминокислотной последовательности, что позволяет ученым идентифицировать белки, присутствующие в исходном образце. В настоящее время доступна поисковая система, использующая ряд алгоритмов для идентификации белков. Эти алгоритмы берут образцы фрагментации пептидов, полученные с помощью масс-спектрометрии, сопоставляют их с базой данных белков и возвращают список белков, соответствующих экспериментальным данным.
Однако этот подход не совсем подходит для белков, которые не кодируются в эталонном геноме. Если мутантный белок из раковой клетки не присутствует в базе данных поиска, то так называемый вариантный пептид, соответствующий мутированной части белка, не будет идентифицирован. Именно здесь на помощь приходит протеогеномика – быстро развивающаяся область биологических исследований на стыке геномики и протеомики. Варианты пептидов, идентифицированные с использованием протеогеномного подхода, предоставляют бесценную информацию для аннотации генов – информацию, которую сложно или невозможно получить с помощью стандартных методов аннотации.
Расширение белковой базы данных
В своей статье российские ученые описывают рабочий процесс поиска вариантных пептидов из мутантных белков с целью сравнения результатов масс-спектрометрии различных групп и лабораторий для однозначной маркировки мутаций рака. Эффективность их подхода проверена на клетках HEK-293. Клетки HEK-293 (Human Embryonic Kidney 293) представляют собой специфическую клеточную линию, первоначально полученную из клеток эмбриональной почки человека, выращенных в культуре ткани. Клетки HEK-293 уже много лет широко используются в исследованиях клеточной биологии из-за их надежного роста и склонности к трансфекции.
В дополнение к своим собственным экспериментальным данным, исследователи использовали результаты масс-спектрометрии из двух недавних исследований, анализирующих протеомы клеток HEK-293. Они создали так называемую настраиваемую базу данных для протеогеномного анализа на основе секвенирования экзома клеток HEK-293. Экзом образован экзонами (часть гена, кодирующая аминокислотную последовательность). В результате настраиваемая база данных белков теперь содержит 1336 последовательностей мутантных белков в дополнение к справочной базе данных белков человека. Это просто означает, что белок "толковый словарь" вырос. Без этого улучшения было бы невозможно найти "неправильный" мутантные белки. Раковая клетка мутирует чаще, чем обычная клетка, поэтому известны различия между белками при раке и "ссылка" клетки помогут ученым узнать больше об опухолевых клетках.
Используя данные масс-спектрометрии двух предыдущих исследований и результаты собственных экспериментов, российские ученые идентифицировали пептиды и соответствующие белки, содержащиеся в клетке. Используя протеогеномный анализ с расширенной базой данных пептидов, авторы обнаружили 113 уникальных вариантных пептидных последовательностей в клетках HEK-293, относящихся к экзонам 103 генов.
Ранее было доказано, что некоторые из обнаруженных мутаций связаны с различными типами рака. Эти мутантные белки могут способствовать выживанию и размножению клеток. В частности, один из идентифицированных вариантов связан с белком p53, который, как известно, подавляет злокачественные трансформации.
"Наш подход может быть использован для поиска мутаций, связанных с раком, на основе протеомного анализа. Это поможет в изучении экспрессии белков в опухолях и обеспечит дополнительную основу для разработки лекарств, направленных на мутантные белки, продуцируемые в опухолевых клетках," говорит доктор. Михаил Горшков, один из соавторов проекта, заведующий лабораторией физико-химических методов структурного анализа Института энергетических проблем химической физики, сотрудник кафедры химической физики МФТИ.