Макромолекулярная стыковка - Macromolecular docking

Макромолекулярная стыковка вычислительное моделирование четвертичная структура из комплексы образованный двумя или более взаимодействующими биологические макромолекулы. Протеин -Белковые комплексы являются наиболее частыми мишенями такого моделирования, за которыми следуют белковые-нуклеиновая кислота комплексы.

Конечная цель стыковки - это предсказание трехмерной структуры интересующего макромолекулярного комплекса, как это было бы в живом организме. Сама стыковка создает только вероятные структуры-кандидаты. Эти кандидаты должны быть ранжированы с использованием таких методов, как скоринговые функции для выявления структур, которые наиболее часто встречаются в природе.

Термин «стыковка» возник в конце 1970-х годов в более узком смысле; тогда «стыковка» означала уточнение модели сложной структуры путем оптимизации разделения между взаимодействующие но сохраняя их относительную ориентацию фиксированной. Позже относительная ориентация взаимодействующих партнеров при моделировании могла изменяться, но внутренняя геометрия каждого из партнеров оставалась неизменной. Этот тип моделирования иногда называют «жесткой стыковкой». С дальнейшим увеличением вычислительной мощности стало возможным моделировать изменения внутренней геометрии взаимодействующих партнеров, которые могут происходить при образовании комплекса. Этот тип моделирования называется «гибкой стыковкой».

Фон

В биологический роли большинства белков, характеризуемых другими макромолекулы, с которыми они взаимодействуют, известны в лучшем случае не полностью. Даже те белки, которые участвуют в хорошо изученном биологический процесс (например, Цикл Кребса ) могут иметь неожиданных партнеров по взаимодействию или функции которые не имеют отношения к этому процессу.

В случаях известных белок-белковых взаимодействий возникают другие вопросы. Генетические заболевания (например., кистозный фиброз ), как известно, вызваны неправильным свертыванием или мутировавший белков, и есть желание понять, какие аномальные межбелковые взаимодействия может вызвать данная мутация. В отдаленном будущем белки могут быть разработаны для выполнения биологических функций, и определение потенциальных взаимодействий таких белков будет иметь важное значение.

Для любого данного набора белков могут быть интересны следующие вопросы с точки зрения технологии или естествознания:

  • Связываются ли эти белки in vivo ?

Если они связывают,

  • Какую пространственную конфигурацию они принимают в своих связанное состояние ?
  • Насколько сильно или слабо их взаимодействие?

Если они не связывают,

  • Можно ли заставить их связываться, вызвав мутацию?

В конечном итоге предполагается, что стыковка белок-белок решит все эти проблемы. Кроме того, поскольку методы стыковки могут основываться исключительно на физический принципы, даже белки неизвестной функции (или которые были изучены относительно мало) могут быть состыкованы. Единственное условие - чтобы их молекулярная структура либо определено экспериментально, либо может быть оценено предсказание структуры белка техника.

Взаимодействия белок-нуклеиновая кислота играют важную роль в живой клетке. Факторы транскрипции, которые регулируют экспрессия гена, и полимеразы, который катализировать репликация, состоят из белков, а генетический материал они взаимодействуют с нуклеиновыми кислотами. Моделирование комплексов белок-нуклеиновая кислота представляет некоторые уникальные проблемы, как описано ниже.

История

В 1970-х годах сложное моделирование вращалось вокруг ручного определения характеристик на поверхности взаимодействующих элементов и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования, чтобы различать относительно небольшое количество конфигураций, оставшихся после наложения всех эвристических ограничений. Первое использование компьютеров было в исследовании гемоглобин взаимодействие в серповидная клетка волокна.[1] Затем в 1978 г. началась работа над трипсин -БПТИ сложный.[2] Компьютеры различали хорошие и плохие модели, используя функцию оценки, которая вознаграждала за большую площадь интерфейса и пары молекул, контактирующих, но не занимающих одно и то же пространство. Компьютер использовал упрощенное представление взаимодействующих белков с одним центром взаимодействия для каждого остатка. Благоприятный электростатический взаимодействия, в том числе водородные связи, были идентифицированы вручную.[3]

В начале 1990-х годов было определено больше структур комплексов, и доступная вычислительная мощность существенно возросла. С появлением биоинформатика, основное внимание было уделено разработке обобщенных методов, которые можно было бы применять к произвольному набору комплексов при приемлемых вычислительных затратах. Предполагалось, что новые методы будут применяться даже при отсутствии филогенетических или экспериментальных ключей; любые конкретные априорные знания все же можно было ввести на этапе выбора между моделями выходных данных с наивысшим рейтингом или оформить в качестве входных данных, если алгоритм учитывал это. В 1992 г. была опубликована методика корреляции,[4] алгоритм, который использовал быстрое преобразование Фурье чтобы дать значительно улучшенную масштабируемость для оценки грубой комплементарности форм на моделях твердого тела. В 1997 году он был расширен на грубую электростатику.[5]

В 1996 году были опубликованы результаты первого слепого исследования.[6] в котором шесть исследовательских групп пытались предсказать сложную структуру ТЕМ-1 Бета-лактамаза с бета-лактамазой белок-ингибитор (BLIP). Это упражнение привлекло внимание к необходимости приспособления к конформационным изменениям и трудности различения конформеров. Он также послужил прототипом для серии оценок CAPRI, которая дебютировала в 2001 году.[нужна цитата ]

Стыковка с жестким корпусом против. гибкая стыковка

Если валентные углы, связующие длины и торсионные углы компонентов не модифицируются ни на одном этапе генерации комплекса, это известно как стыковка твердого тела. Существует предположение, что стыковка с твердым телом достаточно хороша для большинства стыковок. Когда существенные конформационные изменения происходят в компонентах во время формирования комплекса, стыковка твердого тела неадекватна. Однако подсчет всех возможных конформационных изменений непомерно дорог в компьютерном времени. Процедуры стыковки, допускающие изменение конформации, или гибкая стыковка процедуры, должны разумно выбирать небольшое подмножество возможных конформационных изменений для рассмотрения.

Методы

Для успешной стыковки необходимы два критерия:

  • Создание набора конфигураций, который надежно включает хотя бы одну почти правильную.
  • Надежно отличая почти правильные конфигурации от остальных.

Для многих взаимодействий сайт связывания известен на одном или нескольких белках, которые нужно стыковать. Это случай для антитела и для конкурентные ингибиторы. В других случаях сайт связывания может быть настоятельно рекомендован мутагенный или же филогенетический свидетельство. Конфигурации, в которых белки сильно взаимопроникают, также могут быть исключены. априори.

После исключения на основании предварительных знаний или стереохимический столкновение, оставшееся пространство возможных сложных структур должно быть исчерпывающе, равномерно и с достаточным охватом, чтобы гарантировать близкое попадание. Каждая конфигурация должна быть оценена с помощью меры, которая способна ранжировать почти правильную структуру выше как минимум 100 000 альтернатив. Это вычислительно-ресурсоемкая задача, и было разработано множество стратегий.

Методы взаимного пространства

Каждый из белков можно представить в виде простой кубической решетки. Тогда для класса дискретных оценок извилины, конфигурации, связанные друг с другом путем трансляции одного белка точным вектором решетки, могут быть оценены почти одновременно, применяя теорема свертки.[4] Можно построить разумные, хотя и приблизительные, оценочные функции типа свертки, представляющие как стереохимическую, так и электростатическую пригодность.

Методы взаимного пространства широко используются из-за их способности оценивать огромное количество конфигураций. Они теряют преимущество в скорости, если вносятся крутильные изменения. Другой недостаток состоит в том, что невозможно эффективно использовать предыдущие знания. Также остается вопрос, не являются ли свертки слишком ограниченным классом оценочной функции, чтобы надежно идентифицировать лучший комплекс.

Методы Монте-Карло

В Монте-Карло, начальная конфигурация уточняется путем выполнения случайных шагов, которые принимаются или отклоняются на основании вызванного ими улучшения оценки (см. Критерий мегаполиса ), пока не будет испробовано определенное количество шагов. Предполагается, что сходимость к наилучшей структуре должна происходить из большого класса начальных конфигураций, только одну из которых необходимо рассматривать. Исходные конфигурации могут быть выбраны грубо, и можно сэкономить много времени на вычисления. Из-за трудности нахождения оценочной функции, которая одновременно в значительной степени распознает правильную конфигурацию, а также сходится к правильной конфигурации на расстоянии, было предложено использование двух уровней уточнения с различными оценочными функциями.[7] Кручение можно естественным образом ввести в Монте-Карло как дополнительное свойство каждого случайного движения.

Методы Монте-Карло не гарантируют исчерпывающий поиск, поэтому лучшая конфигурация может быть упущена даже при использовании функции оценки, которая теоретически идентифицировала бы ее. Насколько серьезна эта проблема для стыковки, точно не установлено.

Оценка

Функции подсчета очков

Чтобы найти оценку, которая формирует последовательную основу для выбора наилучшей конфигурации, проводятся исследования на стандартных тестах (см. Ниже) случаев взаимодействия белок-белок. Скоринговые функции оцениваются по рангу, который они присваивают лучшей структуре (в идеале, лучшая структура должна быть оценена как 1), и по их охвату (доля контрольных случаев, для которых они достигают приемлемого результата). Типы изучаемых оценок включают:

Обычно гибридные оценки создаются путем объединения одной или нескольких вышеуказанных категорий во взвешенную сумму, веса которой оптимизированы для случаев из эталонного теста. Во избежание предвзятости контрольные примеры, используемые для оптимизации весов, не должны пересекаться со случаями, используемыми для окончательной проверки оценки.

Конечная цель стыковки белок-белок - выбрать идеальное решение для ранжирования в соответствии со схемой подсчета баллов, которая также дала бы представление о сродстве комплекса. Такое развитие событий привело бы in silico белковая инженерия, компьютерный дизайн лекарств и / или высокопроизводительная аннотация того, какие белки связываются или нет (аннотация интерактом ). Было предложено несколько оценочных функций для предсказания сродства связывания / свободной энергии.[7][8][9][10][11] Однако было обнаружено, что корреляция между экспериментально определенной аффинностью связывания и предсказаниями девяти часто используемых оценочных функций почти равна ортогональный2 ~ 0).[12] Также было замечено, что некоторые компоненты алгоритмов оценки могут отображать лучшую корреляцию с экспериментальными энергиями связывания, чем полная оценка, что позволяет предположить, что значительно лучшая производительность может быть получена путем объединения соответствующих вкладов от различных алгоритмов оценки. Экспериментальные методы определения аффинности связывания: поверхностный плазмонный резонанс (SPR), Фёрстеровский резонансный перенос энергии, радиолиганд -основанные техники, калориметрия изотермического титрования (ITC), микромасштабный термофорез (MST) или спектроскопические измерения и другие методы флуоресценции. Текстовая информация из научных статей может дать полезные подсказки для выставления оценок.[13]

Контрольные точки

Для тестирования методов стыковки был разработан эталон 84 белок-белковых взаимодействий с известными комплексными структурами.[14] Набор выбирается таким образом, чтобы охватить широкий спектр типов взаимодействия и избежать повторяющихся функций, таких как профиль структурных семейств взаимодействующих элементов в соответствии с SCOP база данных. Элементы эталона подразделяются на три уровня сложности (самый сложный, содержащий самое большое изменение в строении позвоночника). Тест стыковки белок-белок содержит примеры комплексов фермент-ингибитор, антиген-антитело и гомомультимерных комплексов.

Последняя версия тестового приложения белок-белок состоит из 230 комплексов.[15] Тест стыковки белок-ДНК состоит из 47 тестов.[16] Тест стыковки белок-РНК был подготовлен как набор данных из 45 неизбыточных тестовых случаев.[17] с комплексами, решаемыми Рентгеновская кристаллография только а также расширенный набор данных из 71 тестового примера со структурами, полученными из моделирование гомологии также.[18] Тест «белок-РНК» был обновлен и теперь включает больше структур, решаемых с помощью Рентгеновская кристаллография и теперь он состоит из 126 тестовых случаев.[19] Тесты имеют объединенный набор данных из 209 комплексов.[20]

Тест сродства связывания основан на тесте стыковки белок-белок.[12] Включен 81 белок-белковый комплекс с известным экспериментальным сродством; эти комплексы охватывают более 11 порядков с точки зрения аффинности. Каждая запись эталона включает несколько биохимических параметров, связанных с экспериментальными данными, а также метод, используемый для определения аффинности. Этот тест был использован для оценки степени, в которой функции оценки могут также предсказывать сродство макромолекулярных комплексов.

Этот эталонный тест был проанализирован и значительно расширен.[21] Новый набор разнообразен с точки зрения биологических функций, которые он представляет, с комплексами, которые включают G-белки и внеклеточные домены рецептора, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Он также разнообразен с точки зрения близости партнеров друг к другу, причем Kd от 10−5 и 10−14 М. Девять пар статей представляют собой близкородственные комплексы, которые имеют аналогичную структуру, но очень разную аффинность, каждая пара состоит из родственной и непознанной сборки. При наличии несвязанных структур составляющих белков можно оценить изменения конформации. Они значительны в большинстве комплексов, и часто наблюдаются большие движения или переходы от беспорядка к порядку. Набор может быть использован для эталонного тестирования биофизических моделей, стремящихся связать сродство со структурой во взаимодействиях белок-белок, принимая во внимание реагенты и изменения конформации, которые сопровождают реакцию ассоциации, а не только конечный продукт.[21]

Оценка CAPRI

Критическая оценка предсказания взаимодействий[22] представляет собой непрерывную серию мероприятий, в которых исследователи всего сообщества пытаются стыковать одни и те же белки, как было предоставлено экспертами. Раунды проводятся примерно каждые 6 месяцев. Каждый раунд содержит от одного до шести целевых белок-белковых комплексов, структура которых недавно была определена экспериментально. Координаты и находятся в частной собственности оценщиков в сотрудничестве с структурные биологи кто их определил. Оценка представленных материалов двойной слепой.

CAPRI привлекает высокий уровень участия (37 групп по всему миру участвовали в седьмом раунде) и высокий уровень интереса со стороны биологического сообщества в целом. Хотя результаты CAPRI имеют небольшую статистическую значимость из-за небольшого количества целей в каждом раунде, роль CAPRI в стимулировании дискурса значительна. (The CASP оценка - аналогичное упражнение в области предсказания структуры белка).

Смотрите также

Рекомендации

  1. ^ Левинталь К., Водак С.Дж., Кан П., Дадиванян А.К. (1975). «Взаимодействия гемоглобина в клетках серповидной клетки: I. Теоретические подходы к молекулярным контактам». Труды Национальной академии наук. 72 (4): 1330–1334. Bibcode:1975PNAS ... 72.1330L. Дои:10.1073 / пнас.72.4.1330. ЧВК  432527. PMID  1055409.
  2. ^ Водак С.Дж., Джанин Дж. (1978). «Компьютерный анализ белок-белковых взаимодействий». Журнал молекулярной биологии. 124 (2): 323–342. Дои:10.1016/0022-2836(78)90302-9. PMID  712840.
  3. ^ Водак С.Дж., Де Кромбругге М., Джанин Дж. (1987). «Компьютерные исследования взаимодействия макромолекул». Прогресс в биофизике и молекулярной биологии. 49 (1): 29–63. Дои:10.1016/0079-6107(87)90008-3. PMID  3310103.
  4. ^ а б Качальски-Кацир Э., Шарив И., Эйзенштейн М., Фризем А.А., Афлало С., Ваксер И.А. (1992). «Распознавание молекулярной поверхности: определение геометрического соответствия между белками и их лигандами с помощью методов корреляции». Proc. Natl. Акад. Sci. СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ. 89 (6): 2195–2199. Bibcode:1992PNAS ... 89.2195K. Дои:10.1073 / pnas.89.6.2195. ЧВК  48623. PMID  1549581.
  5. ^ Габб Х.А., Джексон Р.М., Штернберг М.Дж. (сентябрь 1997 г.). «Моделирование стыковки белков с использованием комплементарности форм, электростатики и биохимической информации». J. Mol. Биол. 272 (1): 106–120. Дои:10.1006 / jmbi.1997.1203. PMID  9299341.
  6. ^ Стринадка NC, Эйзенштейн М., Качальски-Кацир Э., Шойхет Б.К., Кунц И.Д., Абагян Р., Тотров М., Джанин Дж., Черфилс Дж., Циммерман Ф., Олсон А., Дункан Б., Рао М., Джексон Р., Стернберг М., Джеймс М.Н. ( 1996). «Программы молекулярного докинга успешно предсказывают связывание ингибирующего бета-лактамазу белка с бета-лактамазой ТЕМ-1». Структурная и молекулярная биология природы. 3 (3): 233–239. Дои:10.1038 / nsb0396-233. PMID  8605624. S2CID  40212654.
  7. ^ а б Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). «Белок-белковая стыковка с одновременной оптимизацией смещения твердого тела и конформации боковой цепи». J. Mol. Биол. 331 (1): 281–299. Дои:10.1016 / S0022-2836 (03) 00670-3. PMID  12875852.
  8. ^ Камачо CJ, Вайда S (2008). «Стыковка белков по гладким путям ассоциации». Труды Национальной академии наук. 98 (19): 10636–10641. Дои:10.1073 / pnas.181147798. ЧВК  58518. PMID  11517309.
  9. ^ Камачо CJ, Вайда S (2007). «Скрининг in silico мутационных эффектов на сродство фермент-белкового ингибитора: подход, основанный на стыковке». BMC Структурная биология. 7: 37. Дои:10.1186/1472-6807-7-37. ЧВК  1913526. PMID  17559675.
  10. ^ Чжан Ц., Лю С., Чжу Ц., Чжоу Ю. (2005). «Энергетическая функция, основанная на знаниях, для комплексов белок-лиганд, белок-белок и белок-ДНК». Журнал медицинской химии. 48 (7): 2325–2335. Дои:10.1021 / jm049314d. PMID  15801826.
  11. ^ Esmaielbeiki R, Nebel JC (2014). «Оценка стыковочных конформаций с использованием предсказанных интерфейсов белков». BMC Bioinformatics. 15: 171. Дои:10.1186/1471-2105-15-171. ЧВК  4057934. PMID  24906633.
  12. ^ а б Кастритис П.Л., Бонвин А.М. (май 2010 г.). «Готовы ли скоринговые функции в стыковке белок-белок для прогнозирования взаимодействия? Ключи из нового теста сродства связывания». J. Proteome Res. 9 (5): 2216–2225. Дои:10.1021 / pr9009854. HDL:1874/202590. PMID  20329755.
  13. ^ Бадал, В.Д., Кундротас, П.Дж., Ваксер, И.А. (2018). «Обработка естественного языка в интеллектуальном анализе текста для структурного моделирования белковых комплексов». BMC Bioinformatics. 19 (1): 84. Дои:10.1186 / s12859-018-2079-4. ЧВК  5838950. PMID  29506465.
  14. ^ Минцерис Дж., Вие К, Пирс Б., Андерсон Р., Чен Р., Джанин Дж., Вен З (2005). «Докинг-тест« белок-белок 2.0 »: обновление». Белки. 60 (2): 214–216. Дои:10.1002 / prot.20560. PMID  15981264. S2CID  24049376.
  15. ^ Вревен Т., Моал И.Х., Вангоне А., Пирс Б.Г., Кастритис П.Л., Торчала М., Чалейл Р., Хименес-Гарсия Б., Бейтс П.А., Фернандес-Ресио Дж., Бонвин А.М., Вен Зи (сентябрь 2015 г.). «Обновления для интегрированных тестов взаимодействия белков: стыковочные тесты версии 5 и Affinity Benchmark версии 2». Журнал молекулярной биологии. 427 (19): 3031–41. Дои:10.1016 / j.jmb.2015.07.016. ЧВК  4677049. PMID  26231283.
  16. ^ ван Дейк М., Бонвин А.М. (август 2008 г.). «Тест стыковки белка и ДНК». Исследования нуклеиновых кислот. 36 (14): e88. Дои:10.1093 / nar / gkn386. ЧВК  2504314. PMID  18583363.
  17. ^ Барик А., С. Н., П. М., Бахадур Р. П. (июль 2012 г.). «Тест стыковки белок-РНК (I): неизбыточные случаи». Белки. 80 (7): 1866–71. Дои:10.1002 / prot.24083. PMID  22488669. S2CID  437472.
  18. ^ Перес-Кано Л., Хименес-Гарсия Б., Фернандес-Ресио Дж. (Июль 2012 г.). «Тест стыковки белок-РНК (II): расширенный набор экспериментальных данных и данных моделирования гомологии». Белки. 80 (7): 1872–82. Дои:10.1002 / prot.24075. PMID  22488990. S2CID  20322388.
  19. ^ Нитин С., Мукерджи С., Бахадур Р.П. (ноябрь 2016 г.). «Тест стыковки неизбыточных белков и РНК версии 2.0». Белки. 85 (2): 256–267. Дои:10.1002 / prot.25211. PMID  27862282. S2CID  26814049.
  20. ^ Нитин, Чандран; Гош, Прита; Буйницкий, Януш; Нитин, Чандран; Гош, Прита; Буйницки, Януш М. (2018-08-25). «Биоинформатические инструменты и тесты для вычислительной стыковки и предсказания трехмерной структуры комплексов РНК-белок». Гены. 9 (9): 432. Дои:10.3390 / genes9090432. ЧВК  6162694. PMID  30149645.
  21. ^ а б Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J (март 2011 г.). «Тест на основе структуры для сродства связывания белок-белок». Белковая наука. 20 (3): 482–491. Дои:10.1002 / pro.580. ЧВК  3064828. PMID  21213247.
  22. ^ Джанин Дж, Хенрик К., Моулт Дж., Эйк Л.Т., Штернберг М.Дж., Вайда С., Ваксер И., Водак С.Дж. (2003). «CAPRI: критическая оценка предполагаемых взаимодействий». Белки. 52 (1): 2–9. CiteSeerX  10.1.1.461.3355. Дои:10.1002 / prot.10381. PMID  12784359. S2CID  31489448.