ISSN: 2153-0637
Арунима Сингх
Недавние разработки в области криоэлектронной микроскопии (крио-ЭМ) теперь обычно позволяют получать разрешение на уровне, близком к атомному, и на атомном уровне для биомолекул. Однако определение структур комплексов белок-лиганд остается сложной задачей, поскольку разрешение связанного лиганда значительно ниже, чем у белка. Таким образом, понимание положения связывания лиганда требует креативных решений, таких как использование методов вычислительной химии в сочетании с экспериментальными данными. Робертсон и др. разработали GemSpot, автоматизированный вычислительный конвейер стыковки для моделирования и оценки поз связывания лиганда на картах крио-ЭМ. Он использует инструмент GlideEM для стыковки, принимая во внимание потенциалы карты ЭМ в качестве ограничений. Уточнение модели выполняется с использованием силового поля OPLS3e и расчетов квантовой механики, а сайты молекул воды предсказываются с помощью JAWS. Авторы демонстрируют конвейер на нескольких белках на разных уровнях сложности моделирования и разрешения карты ЭМ. Электронная крио-микроскопия (криоЭМ) стала основной методологией для определения структуры макромолекул и их комплексов с высоким разрешением. Количество структур криоЭМ, депонированных в PDB 1 с разрешением лучше 4 Å, возросло с 48 в 2015 году до почти 1500 на сегодняшний день. Эти структуры включают множество макромолекулярных комплексов и мембранных белков, которые, как правило, оказались очень сложными или неразрешимыми для традиционных структурных методов, в частности рентгеновской кристаллографии. Например, GPCR и ионные каналы являются очень важными классами лекарственных мишеней, представляющими 33% и 18% фармацевтических препаратов, одобренных FDA соответственно, где структурные исследования исторически ограничивались трудностями, связанными с их кристаллизацией, хотя в последнее время были достигнуты определенные успехи. С другой стороны, криоЭМ предлагает все более надежные рабочие процессы для определения структуры этих типов макромолекул 4 . В результате криоЭМ открывает беспрецедентные возможности для открытия лекарственных средств на основе структуры для большого количества мишеней, которые до недавнего времени были неразрешимыми. Открытие лекарственных препаратов на основе структуры — это рациональный подход к разработке лекарственных препаратов, который учитывает трехмерную структуру биомолекулярной мишени 5. Нелигандная структура может использоваться для широкомасштабного виртуального скрининга с целью получения исходных соединений с желаемой биохимической активностью .При наличии лидирующего соединения(ий) экспериментальная структура лигандного комплекса необходима для проверки точного режима связывания и часто помогает в идентификации модификаций для повышения эффективности. Правильная поза особенно важна для таких методов, как расчеты возмущения свободной энергии, где соединение алхимически мутирует в аналог в ходе молекулярного моделирования, и рассчитывается относительная свободная энергия связывания, как было недавно успешно показано на полученной с помощью криоЭМ структуре для человеческой АТФ-цитратлиазы. Кроме того, структура с достаточно высоким разрешением (обычно <2,5 Å) позволит идентифицировать связанные молекулы воды, которые могут играть решающую роль в разработке лекарств . Например, разработка успешных ингибиторов протеазы ВИЧ часто включает замену ключевой структурной воды . Учитывая недавний замечательный прогресс криоЭМ, методология станет бесценным инструментом для усилий по открытию лекарств, особенно для сложных макромолекулярных комплексов. Подчеркнутая постоянными достижениями в подготовке образцов , автоматизированном сборе данных и улучшенной доступности микроскопов, способных достигать высокого разрешения, криоЭМ неизбежно будет использоваться на этапе оптимизации свинца для получения структур промежуточных соединений, связанных с их мишенями. Десятилетия кристаллографии привели к созданию надежных методов моделирования и проверки структур кристаллов белок-лиганд . Хотя и рентгеновская кристаллография, и одночастичная криоЭМ в принципе являются методами рассеяния, основанными на взаимодействии излучения с биологическим образцом, существуют ключевые различия, которые усложняют моделирование в картах криоЭМ и не позволяют использовать метрики, разработанные для кристаллических структур. В кристаллографии фазовая информация об измеренном рассеянном излучении теряется и должна быть восстановлена либо с помощью дополнительной экспериментальной информации ( например, многоволновая аномальная дисперсия (MAD), изоморфное смещение), либо с помощью сравнения с известными структурами (молекулярное замещение ). Начальные значения фаз затем улучшаются во время построения модели путем сравнения вычисленного рассеяния из текущей модели с экспериментальным рассеянием. Таким образом, определение структуры рентгеновской кристаллографии включает в себя непрерывный перекрестный обмен данными между моделью и экспериментальными данными с одновременной обратной связью по качеству модели. Напротив, в криоЭМ фазы легко доступны, поскольку они встроены в изображения образцов, которые напрямую используются для расчета трехмерных карт. После того, как окончательная трехмерная карта определена из тысяч экспериментальных проекций, модель встраивается в карту без дальнейшей обратной связи от необработанных данных ЭМ. Кроме того, карты, полученные в кристаллографии, соответствуют электронной плотности, тогда как в криоЭМ они представляют кулоновский потенциал исследуемой молекулы. Таким образом, использование инструментов, разработанных для кристаллографии, непосредственно для моделирования структуры криоЭМ может быть по своей сути проблематичным. Хотя количество криоЭМ-карт макромолекулярных комплексов, определенных на сегодняшний день, относительно невелико, существующие структуры предполагают, что существуют некоторые фундаментальные проблемы, связанные с моделированием комплексов белок-лиганд. Даже при наличии данных с очень высоким разрешением для биомолекулы разрешение карты для связанного лиганда часто значительно ниже, чем у его окружающей среды 14 . Учитывая, что криоЭМ-структуры происходят из быстрозамороженных макромолекул в водном растворе, возможно, неудивительно наблюдать дополнительную подвижность некоторых лигандов в активных участках белка. Кроме того, криоЭМ-реконструкции уязвимы для ложных особенностей карты, что в настоящее время очевидно при использовании различного программного обеспечения, дающего заметно разные карты из одного и того же набора данных. Эта характеристика может возникать из-за неточностей в оценке расфокусировки изображения и коррекции функции передачи контраста при высоком разрешении, а также изменчивости схем маскирования и взвешивания, используемых в различных программных платформах для обработки данных криоЭМ. Примечательно, что в некоторых случаях даже различные настройки с одним и тем же программным обеспечением приведут к отклонениям карты, которые могут иметь значительные последствия при моделировании лигандов. Эта проблема усугубляется тем фактом, что лиганды не имеют структурных ограничений, принятых белками, например , ограничений вторичной структуры, которые способствуют более надежному моделированию. Такие предостережения ставят перед моделером задачу идентификации связанной позы лиганда в пределах карты криоЭМ с относительно высоким разрешением, что часто приводит к неверным позициям лиганда и интерпретациям со значительными последствиями для молекулярного механизма и усилий по открытию лекарств. Параллельно с разработками в области криоЭМ методы вычислительной химии для моделирования комплексов белок-лиганд со временем значительно улучшились. Вычислительные силовые поля успешно использовались в течение десятилетий для описания энергии и сил различных конформаций белков 15. Эти силовые поля были расширены для точного описания энергии и силы большого разнообразия лигандов и могут быть легко расширены пользователями для охвата интересующих лигандов или даже автоматически расширены для охвата лигандов за пределами тех, которые использовались в начальной параметризации . Такие параметры силовых полей использовались для различных приложений, включая динамику и для перечисления конформаций белков и лигандов, которые будут доступны в биологически значимых условиях . Молекулярная стыковка - это подход, который использует силовые поля в сочетании с высокооптимизированными алгоритмами выборки и уточнения для прогнозирования режимов связывания белок-лиганд, учитывая только конформацию белка и идентичность лиганда . Эта методология широко применялась как для идентификации лигандов, которые связываются с определенными белками с высоким сродством, так и для прогнозирования их конформаций связывания белок-лиганд . Однако следует отметить, что при отсутствии экспериментальных данных эти чисто вычислительные методы часто затрудняются значительными ложноположительными и ложноотрицательными показателями. Для разработки лекарственных препаратов на основе структуры, значительный акцент также был сделан на прогнозировании расположения молекул воды, которые часто координируют связывание лигандов в карманах и оказывают глубокое воздействие на фармакологическую активность. Несколько подходов для прогнозирования участков гидратации, включая подходы на основе сетки, такие как JAWS , и динамические подходы, такие как WATERMAP теперь способны предсказывать местоположение связанных молекул воды. Эти вычислительные предсказания дают впечатляющее согласие с экспериментально полученными структурами и дополнительно подчеркивают роль гидратации в оптимизации свинца. Таким образом, становится очевидным, что ряд хорошо зарекомендовавших себя вычислительных инструментов может быть использован в сочетании с криоЭМ для решения проблемы моделирования лигандов в криоЭМ-картах. С этой целью мы разработали и проверили «GemSpot», конвейер методов вычислительной химии, который помогает получить наиболее вероятную связанную позу, используя комбинацию стыковки лигандов в сочетании с уточнением, квантово-механическими (КМ) расчетами, автоматическим размещением воды и дополнительной внешней информацией, принимая во внимание экспериментальные данные криоЭМ. Конвейер GemSpot был проверен на основе разнообразного набора из 19 структур, полученных из данных криоЭМ с разрешением от 1,9 до 4,3 Å, состоящих как из белка, так и из РНК, а также разнообразного набора лигандов, включая малые молекулы и пептиды (Схема всех лигандов в Приложении. На первом этапе с помощью GemSpot лиганд стыкуется с популярным программным обеспечением GLIDE, используя новую комбинацию традиционной функции оценки стыковки GLIDE и оценки кросс-корреляции реального пространства с картой. Это программное обеспечение, называемое GlideEM, генерирует несколько поз-кандидатов для лиганда, которые затем подвергаются уточнению в реальном пространстве с помощью PHENIX, включая современное силовое поле OPLS3e / VSGB2.1. Комбинация коэффициента корреляции реального пространства и оценок стыковки до уточнения используется для устранения любых поз, которые не имеют химического смысла или плохо вписываются в экспериментальную карту. После того, как будут идентифицированы основные позиции, При необходимости можно использовать дополнительные вычислительные методы для повышения уверенности в позе ведущего кандидата. Для ЭМ-карт высокого разрешения можно использовать подход свободной энергии для гидратации активного центра с использованием JAWS, чтобы помочь отличить потенциальные молекулы воды от шума на карте и получить представление о взаимодействиях лигандов. Если все еще есть сомнения относительно конформации молекулы, можно использовать квантовую химию для изучения конформационной деформации, связанной с любыми связанными позами, например, с GAUSSIAN или Jaguar. В ситуациях, когда эти вычислительные методы сами по себе не могут определить одну позу, которая однозначно соответствует всем данным, может потребоваться определить, какие из верхних поз также согласуются с данными других экспериментов. Особенно ценным является сравнение с данными о соотношении структура-активность (SAR), т. е. может ли предполагаемая поза эффективно объяснить изменения в сродстве связывания для аналогов этой молекулы. Объединяя полученные данные, часто можно получить высокую степень уверенности даже при низком разрешении или проблемной плотности для лиганда.