Предсказание биологической активности

Всем доброго дня, меня зовут Александр и расскажу немного о научном направлении нашей кафедры биоинженерии и биоинформатики Волгоградского государственного университета (ВолГУ), курированием которого занимаюсь.

Двадцать первый век диктует свои условия в научном мире, поэтому происходит переход экспериментальной площадки научных опытов в область моделирования и виртуализации. Только после выполнения многочисленных вычислений исследователь начинает подтверждать их экспериментальным путем. Причина такого подхода - материальная составляющая исследования. Поэтому для совершенствования точности прогнозов задействован целый научный пласт. Мы немного прикасаемся к великому под названием BigData и формируем свое видение проблемы, создавая свои расчетные кирпичики.

Сегодня представлю работу, которая заняла первое место в региональном конкурсе молодых исследователей в 2016 году. Мы уже продвинулись дальше и планируем часть работ перенести на блокчейн голос, но хочется закрепить свой успех и показать себя с лучшей стороны.

Докинг (в переводе "стыковка"). Синонима лучше не придумали, поэтому и произносим заморское docking на наш лад. Это процесс моделирования, в ходе которого лиганд (оно же будущее лекарство) находит свое пространственное место в потенциальной мишени (то, на что лекарство будет действовать и давать фармакологический эффект). Опираясь на результаты такого виртуального эксперимента делаем вывод о прогнозируемой активности.

Процесс подготовки докинг-машины не так прост и требует определенной квалификации, но никто работе с докингом не обучает. По этой причине можно условно считать данный способ определенно передовой технологией. По крайней мере в РФ. Основная задача докинга - очертить область в большой белковой молекуле, где будет происходить анализ и стыковка. Всю молекулу охватывать бесполезно и вредно. Возможно, может не хватить вычислительных мощностей, но ограничение пространства влечет за собой возможную ошибку "промах". В таком случае докинг-машина будет рассчитывать ситуацию, которая невозможна в реальном мире, поэтому процесс подготовки весьма важен в этом деле.

Основная база данных из которых мы черпаем структуры белков - Protein Data Bank. С 1976 года она ведется и бесплатна для всех. При желании может быть быстро скачена по ftp. Помимо баз данных по белкам используем еще базы данных по самим лигандам. Чтобы предсказывать на неизвестном, надо натренироваться на знакомом. На данный момент отдаю предпочтения только трем базам: Chembl, Zn15 и GtP. Последняя имеет полное описание API на python, что позволяет обращаться к ней напрямую минуя вебморду.

Нажимая разные кнопочки и галочки можно адекватно визуализировать ситуацию. Например, мне нравится выделять белковую молекулу ленточкой (альфа-спирали и бета-листы), а лиганд представлять в виде шариков. Но это дело вкуса, некоторые используют 3D-очки для того, чтобы полностью погрузиться в ту область с помощью монитора. На картинке готовим к докингу сигма нон-опиоидный рецептор первого типа (SOR1). Его структура недавно появилась в сети, поэтому работать с новым всегда актуально.

Далее идет непереводимая игра слов с использованием местного диалекта. Помимо подготовки мишени необходимо подготовить лиганды. Предпочитаю химические формулы в виде "смайликов". Берешь смайлик, копируешь в химический редактор и вжухх... формула перед глазами. Сами понимаете 2586 значений обрабатываются аппаратными методами, а не ручками. Так что пишем собственные скрипты исходя из текущей научной задачи.

При анализе всегда есть проблема. Язык компьютерных программ существенно отличается от человеческого (что понятно алгоритму человек понять не может). Наши криптовалюты и блокчейн были созданы как некий машинный язык. В нашем случае любая попытка визуализации накладывает отпечаток погрешности. Но стараемся обходить этот острый угол.

Обязательно при получении собственных данных (даже если они уникальны) необходимо сравнивать их с предыдущими. У одних ученых в статьях картинки непонятны.

А у других все замечательно. Можете даже сами проверить. Авторы опубликовали данные и определили своим способом фармакофорные точки для этой мишени. Точки соприкосновения лиганда с рецептором. Это как игра на пианино: берем аккорд и пошла музыка. Так и в мире молекул: соприкоснулись в нужных местах и активность пошла. Если приглядеться, то наш алгоритм определил самостоятельно практичеки аналогичную картину фармакофоров. Это нас порадовало. Возможно, научим ее самостоятельно определять подобные точки для остальных рецепторов в автоматическом режиме, пока будем гулять по пляжу Тайланда за счет средств гранта.

После всех процессов настройки и отладки запускается прогноз на "неизвестном". Только так можно обеспечить контроль работы прогнозируемых систем. Нам помогла молекула галоперидола, одна из известных молекул. Более того она исторически так же была впервые получена на компьютере. Точнее на доисторических компьютерах в исследовательской лаборатории.

В заключении переносим свой алгоритм на практику. РУ-1205 - это одна из сильнейших разработок Волгоградского государственного медицинского университета (ВолГМУ). Мощнейшее обезболивающее без наркологичекого эффекта. Это достигается за счет воздействия на каппа-опиоидный рецептор (KOR). Наблюдаем за ним через виртуальный эксперимент. А будут ли побочные эффекты за счет влияния на сигму? И по числовым данным, и по визуальным становится понятно, что SOR1 для этой молекулы закрыт, фармакофорные точки далеки пространственно от атомов этой молекулы. На предыдущей картинке видно совпадение у галоперидола.

Вот такие мы ученые-биоинформатики. Надеюсь, было познавательно. С вам был @ksantoprotein, вычитка @sergesfnv, команда @sci-populi.

vp-cosmosнаукабиоинформатикаsci-populipsk
355
2.529 GOLOS
0
В избранное
vp-cosmos
Космос - от атома до Вселенной
355
0

Зарегистрируйтесь, чтобы проголосовать за пост или написать комментарий

Авторы получают вознаграждение, когда пользователи голосуют за их посты. Голосующие читатели также получают вознаграждение за свои голоса.

Зарегистрироваться
Комментарии (3)
Сортировать по:
Сначала старые