Прорыв в науке в 2021 году
Научный журнал |
Белковые структуры для всех - прогнозы на основе ИИ показывают, что белки находят свои формы.
В своей речи о принятии Нобелевской премии 1972 года американский биохимик Кристиан Анфинсен изложил видение: однажды, по его словам, можно будет предсказать 3D-структуру любого белка просто по его последовательности аминокислотных строительных блоков. С сотнями тысяч белков только в организме человека такой прогресс будет иметь обширные приложения, предлагая понимание базовой биологии и раскрывая многообещающие новые лекарственные мишени. Теперь, спустя почти 50 лет, исследователи показали, что программное обеспечение, управляемое искусственным интеллектом (ИИ), может производить точные белковые структуры тысячами, прогресс, который реализует мечту Анфинсена и является прорывом науки 2021 года.
Структуры белка когда-то можно было определить только с помощью кропотливых лабораторных анализов. Но теперь их можно быстро
вычислить для десятков тысяч белков и для комплексов взаимодействующих белков. “Это изменение моря для структурной биологии”, - говорит Гаэтано Монтелионе, структурный биолог из Политехнического института Ренсселера. Дэвид Бейкер, Университет Вашингтона, Сиэтл, вычислительный биохимик, возглавлявший один из проектов прогнозирования, добавляет, что с щедростью легкодоступных структур “Все области вычислительной и молекулярной биологии будут преобразованы”.Белки-это рабочие лошадки биологии. Они сокращают наши мышцы, превращают пищу в клеточную энергию, переносят кислород в нашу кровь и борются с микробными захватчиками. Тем не менее, несмотря на их разнообразные таланты, все белки начинаются с одной и той же основной формы: линейной цепи до 20 различных видов аминокислот, нанизанных вместе в последовательности, закодированной в нашей ДНК. После сборки на клеточных фабриках, называемых рибосомами, каждая цепь складывается в уникальную, изысканно сложную 3D - форму. Эти формы, которые определяют, как белки взаимодействуют с другими молекулами, определяют их роль в клетке.
Работа Анфинсена и других предполагала, что взаимодействия между аминокислотами приводят белки к их окончательным формам. Но, учитывая огромное количество возможных взаимодействий между каждым отдельным звеном цепи и всеми остальными, даже белки скромного размера могут принимать астрономическое количество возможных форм. В 1969 году американский молекулярный биолог Сайрус Левинтал подсчитал, что белковой цепи потребуется больше времени, чем возраст вселенной, чтобы пройти через них один за другим—даже в бешеном темпе. Но в природе каждый белок надежно складывается только в одну отличительную форму, обычно в мгновение ока.
В 1950-х годах исследователи начали отображать 3D-структуры белков, анализируя, как рентгеновские лучи рикошетили от атомов молекул. Этот метод, известный как рентгеновская кристаллография, вскоре стал ведущим подходом; сегодня центральное хранилище поля, Банк данных о белках, содержит около 185 000 экспериментально решенных структур. Но картирование структур может занять годы—и стоить сотни тысяч долларов за белок. Чтобы ускорить процесс, ученые начали создавать компьютерные модели в 1970-х годах, чтобы предсказать, как данный белок будет складываться.
Сначала это было возможно только для небольших белков или коротких сегментов более крупных. Однако к 1994 году компьютерные модели стали достаточно сложными, чтобы запустить конкурс "Критическая оценка предсказания структуры белка" (CASP). Организаторы дали моделистам аминокислотные последовательности десятков белков. В конце мероприятия результаты моделистов были сопоставлены с последними экспериментальными данными рентгеновской кристаллографии и новыми методами, такими как спектроскопия ядерного магнитного резонанса и криоэлектронная микроскопия (cryo-EM). Оценки выше 90 рассматривались наравне с экспериментально решенными структурами.
Ранние результаты были скромными, со средними баллами ниже 60. Но со временем моделисты научились трюкам, чтобы улучшить свои расчеты. Например, участки аминокислот, разделяемые двумя белками, часто складываются одинаково. Если белок с неизвестной структурой разделяет, скажем, 50% своей аминокислотной последовательности с белком, который имеет известную структуру, последний может служить “шаблоном” для руководства компьютерными моделями.
Еще одно важное понимание пришло из эволюции. Исследователи поняли, что если одна аминокислота изменится в белке, разделяемом близкородственными организмами, такими как шимпанзе и люди, аминокислоты, расположенные рядом в сложенной молекуле, тоже должны будут измениться, чтобы сохранить форму и функцию белка. Это означает, что исследователи могут сузить форму белка, ища аминокислоты, которые коэволюционируют: даже если они находятся далеко друг от друга в развернутой цепи, они, вероятно, являются соседями в окончательной 3D-структуре.
Я никогда не думал, что увижу это в своей жизни.
ДЖОН МОУЛТ
К 2018 году моделисты часто забивали в середине 70-х. Затем на сцену вышла AlphaFold, программа, управляемая ИИ. Программа, разработанная дочерней компанией Google DeepMind, обучается на базах данных экспериментально решаемых структур. В своем первом конкурсе его средний балл был близок к 80, и он выиграл 43 из 90 матчей против других алгоритмов. В 2020 году его преемник AlphaFold2 сиял еще ярче. AlphaFold2, работающий на сети из 182 процессоров, оптимизированных для машинного обучения, набрал средний балл 92,4—наравне с экспериментальными методами.
“Я никогда не думал, что увижу это в своей жизни”,- сказал в то время Джон Моулт, структурный биолог из Университета Мэриленда, Shady Grove и соучредитель CASP.
В этом году прогнозы ИИ перешли в овердрайв. В середине июля Бейкер и его коллеги сообщили, что их программа ИИ RoseTTAFold решила структуры сотен белков, все из класса общих лекарственных мишеней. Неделю спустя ученые DeepMind сообщили, что они сделали то же самое для 350 000 белков, обнаруженных в организмечеловека—44% всех известных человеческих белков. В ближайшие месяцы они ожидают, что их база данных вырастет до 100 миллионов белков во всех видах, что составляет почти половину от общего числа, которое, как считается, существует.
Следующий шаг-предсказать, какие из этих белков работают вместе и как они взаимодействуют. DeepMind уже делает это. В октябрьском препринте его ученые представили 4433 белково-белковых комплекса, раскрывая, какие белки связываются друг с другом—и как. В ноябре RoseTTAFold добавила еще 912 комплексов в подсчет.
Код для AlphaFold2 и RoseTTAFold теперь общедоступен, помогая другим ученым прыгать в игру. В ноябре исследователи в Германии и США использовали AlphaFold2 и cryo-EM для отображения структуры комплекса ядерных пор, сборки из 30 различных белков, которая контролирует доступ к ядру клетки. В августе китайские исследователи использовали AlphaFold2 для отображения структур почти 200 белков, которые связываются с ДНК и могущие быть вовлечены во все, от репарации ДНК до экспрессии генов. В прошлом месяце материнская компания Google Alphabet запустила новое предприятие, которое будет использовать предсказанные белковые структуры для разработки новых кандидатов на лекарства. И команда Бейкера использует свое программное обеспечение для создания новых белковых последовательностей, которые будут складываться в стабильные структуры, что может привести к появлению новых противовирусных препаратов и катализаторов.
Даже сейчас ученые, изучающие SARS-CoV-2, используют AlphaFold2 для моделирования эффекта мутаций в спайковом белке омикронного варианта. Вставляя более крупные аминокислоты в белок, мутации изменили его форму, возможно, достаточно, чтобы антитела не связывались с ним и не нейтрализовали вирус.
Остается много работы. Белковые структуры не статичны; они изгибаются и скручиваются, выполняя свою работу, и моделирование этих изменений остается проблемой. И все еще остается сложной задачей визуализировать большинство больших мультипротеиновых комплексов, которые выполняют множество задач в клетках. Но взрыв достижений, основанных на ИИ, в этом году предлагает взгляд на танец жизни, как никогда раньше, панораму, которая навсегда изменит биологию и медицину.
Комментарии
Отправить комментарий