Молекулярный докинг при исследовании белок-лигандных комплексов
Другой подход к описанию места связывания в молекуле белка был предложен группой Рут Нусинов. Набор критических узлов, сформированный из впадин, выпуклостей и седловин на молекулярной поверхности белка и его потенциального лиганда, используется для определения вероятных соответствий между молекулами. Этот метод использует технику геометрического перемешивания (рандомизации), применяемую… Читать ещё >
Содержание
- Список сокращений
- Цель работы
- Основные задачи работы
- Положения, выносимые на защиту
- Литературный обзор
- Локирование целой молекулы: виртуальный скрининг
- Фрагментарные методы: создание лигандов de novo
- Методы оптимизации счета
- Материалы и методы
- Аппаратная база работы
- Программная база работы
- Оптимизация комплекса двух молекул
- Оптимизация конформации лиганда при поиске в базах данных
- Моделирование полного цитохрома
- QSAR модели и их параметры
- Параметры работы программы DockSearch
- Информационные ресурсы, использованные в работе
- Результаты и обсуждение
- Программа DockSearch
- Оценка эффективности программы DockSearch
- Уточнение результатов докинга
- Полностью автоматизированная процедура локирования
- Моделирование комплекса цитохром Р4 50саш — цитохром bs
- Моделирования полного цитохрома
- Моделирование комплексов цитохромов Р450саш и
- Применение программы ОоскБеагсИ при поиске низкомолекулярных лигандов для ферментов
- 1. Поиск лигандов к ферментам с известной трехмерной структурой
- 2. Поиск лигандов к моноаминоксидазе, А — ферменту с неизвестной трехмерной структурой
Молекулярный докинг при исследовании белок-лигандных комплексов (реферат, курсовая, диплом, контрольная)
Лекарственные соединения воздействуют на биохимическиу процессы, как правило, взаимодействуя с макромолекулами-мишенями: белками и нуклеиновыми кислотами. Образование комплексов лекарство-мишень характерно для действия биологически активных соединений разного типа, в том числе активаторов и ингибиторов различных ферментов. В таких комплексах молекулы-лиганды пространственно (геометрически) комплементарны участку связывания на поверхности белка и удерживаются на нем благодаря кулоновским и вандерваальсовым взаимодействиям, водородным связям и т. п.
Создание новых лекарственных препаратов с необходимостью включает поиск соединений, которые комплементарны функционально важным участкам белков. Современные компьютеры позволяют осуществить такой поиск посредством вычислительного эксперимента, суть которого — в своего рода «прилаживании» пространственных образов лиганда и белка. Эта процедура называется геометрическим докингом. Наиболее адекватный подход основан на использовании данных о структуре белка, полученных рентгеноструктурным методомв случае их отсутствия сведения о пространственном строении участка связывания (часто называемого рецепторным) могут быть получены путем анализа структуры уже известных эффективных лигандов.
Компьютерные программы, осуществляющие геометрический докинг, позволяют выявлять комплементарные молекулы в обширных базах химических структур, в том числе и в каталогах коммерчески доступных соединений. Однако известные программы этого типа далеки от идеала в отношении как скорости, так и точности.
Далее, пространственная комплементарность лиганда к рецепторному участку является необходимым, но далеко не всегда достаточным условием эффективного связывания. Поэтому геометрический докинг как средство поиска потенциальных лигандов среди десятков и сотен тысяч органических соединений должен сочетаться с оценкой энергии взаимодействия лиганда с белком, равно как и с процедурами, позволяющими в определенных пределах максимизировать эту энергию. Настоящая работа посвящена разработке оптимального алгоритма геометрического докинга, созданию на его основе программного обеспечения поиска потенциальных лигандов в базах данных химических структур, а также выработке методологии использования результатов докинга для оценки устойчивости соответствующих комплексов.
Поиск потенциальных низкомолекулярных лигандов — далеко не единственная область применения геометрического докинга. В частности, эта процедура может быть также использована для нахождения контактирующих участков при моделировании взаимодействия белковых молекул.
ЦЕЛЬ РАБОТЫ.
Разработка нового алгоритма геометрического докинга и его применение для моделирования межбелковых комплексов и поиска потенциальных низкомолекулярных белковых эффекторов.
ОСНОВНЫЕ ЗАДАЧИ РАБОТЫ.
1. Разработка нового алгоритма геометрического докинга и создание на его основе соответствующего программного обеспечения.
2. Оптимизация процедуры максимизации энергии взаимодействия в системе лиганд-белок посредством конформационной адаптации лиганда и уточнению его положения на рецепторном участке белка.
3. Выработка совокупности критериев для оценки эффективности лиганд-белкового взаимодействия в комплексах, найденных в вычислительном эксперименте.
4. Создание программного комплекса, позволяющего быстро выявлять потенциальные лиганды белков в обширных базах данных, содержащих десятки тысяч структур органических соединений.
5. Применение геометрического докинга для моделирования белок-белковых комплексов.
5.1. Моделирование комплекса цитохрома Р450саш с водорастворимым фрагментом цитохрома ?>5 (белок с известной трехмерной структурой).
5.2. Создание трехмерной модели полной структуры цитохрома Ь5 и его комплекса с цитохромом Р450саш.
6. Применение геометрического докинга для поиска потенциальных лигандов для белков с известной трехмерной структурой (цитохром Р450саш, субтилизин, нейраминидаза), а также для белков, о строении рецепторного участка которых можно судить по структуре их ингибиторов и субстратов (моноаминоксидаза А).
ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ.
1. Разработан алгоритм геометрического докинга, обладающий существенными преимуществами по сравнению с описанными в литературе.
2. Создано программное обеспечение, позволяющее удовлетворительно моделировать строение белок-белковых комплексов и быстро выявлять потенциальные эффекторы белков среди большого числа органических соединений.
ЛИТЕРАТУРНЫЙ ОБЗОР.
Алгоритмы, позволяющие выявлять особенности связывания небольшой молекулы в полости макромолекулярной мишени, становятся все более разнообразными и полезными для исследователей. Автоматический докинг, как процесс, на который в настоящее время обычно ссылаются, включает использование различных методических подходов и приближений. В данной главе будут описаны некоторые разработки в области процедуры локирования, которые должны предсказывать, будет ли предпочтительно взаимодействовать данная небольшая молекула с белком, и если будет, то каким именно образом. Если с помощью подобного подхода тестируется библиотека молекулярных структур, этот процесс соответствует виртуальному скринингу. Потенциальным преимуществом такого метода являются ясные указания для разработки новых лекарств, так как, основываясь на способности небольших молекул укладываться в место связывания макромолекулярной мишени, предварительно может быть отобран целый набор химических соединений для последующего биологического скрининга. Альтернативным подходом может быть построение молекул de novo на поверхности места связывания, использующим фрагменты, дополняющие место связывания и оптимизирующие межмолекулярное взаимодействие. Этот класс методов может также быть назван фрагментарным докингом (или докингом фрагментов), поскольку он включает оптимизацию взаимодействия между макромолекулярной мишенью и небольшими молекулярными фрагментами. В данном обзоре основное внимание уделяется этим двум классам методических подходов. Дополнительно рассматриваются алгоритмы, специально разработанные для геометрической оптимизации взаимодействий в процессе связывания. Такие шаги оптимизации часто выполняются перед фильтрацией данных, сформированных алгоритмами локирования. Отсутствие подобной оптимизации во многих случаях может сделать локирование бессмысленной процедурой. В обзоре также описаны методы, позволяющие предсказывать энергии связывания молекул в комплексе.
Локирование целой молекулы: виртуальный скрининг.
Во всех описанных в мировой литературе методиках докинга молекулой мишенью, как правило, являются высокомолекулярные соединения, такие как нуклеиновые кислоты и белки. В качестве лигандов же могут быть использованы любые молекулы, однако, для докинга небольших молекул и молекул белков обычно применяются различные подходы, что связано с особенностями вычислений.
Программа DOCK [Kuntz, 1982] является одной из самых ранних и наиболее широко применяемых для стыковки лиганда и мишени. Метод заключается в заполнении полости места связывания локально комплементарными макромолекулярной поверхности сферами, как это определено Конолли [Conolly, 1983]. Сферы создают пространственно заполненный слепок, который дополняет геометрические характеристики места связывания и эти сферы применяются для поиска соответствий с потенциальными лигандами. Далее в базе данных, содержащей трехмерные структуры потенциальных лигандов, проводится поиск молекул, в которых межатомные расстояния соответствуют расстояниям между сферами слепка места связывания. Программа может также принять во внимание физико-химические характеристики, приписанные сферам, например, чтобы определенный тип атома соответствовал конкретной сфере. Обычно каждое соединение в базе данных хранится в виде единственной конформации и его многочисленные ориентации в пределах места связывания оцениваются с использованием некоторой функции. Предварительно рассчитанные решетки, подобные тем, которые используются при вычислениях энергии взаимодействия в молекулярной механике, описывают макромолекулярную статическую мишень и применяются для увеличения эффективности оценки. В итоге каждое соединение имеет наилучшую ориентацию и вычисленную оценку взаимодействия, связанную с данной ориентацией. Соединения из базы данных получившие наилучшую оценку, наиболее комплементарны месту связывания в белке-мишени, и таким образом считаются потенциальными лигандами.
Основной протокол поиска по базам данных является общим для большинства методов виртуального скрининга. Согласно нему определяют лучшую комплементарность поверхностей лиганда и белка по оценивающей функции и затем проводят отсев результатов посредством различных критериев оценки. DOCK-метод достаточно широко используется [Gschwend 1996; Kuntz 1994]. В своем исходном варианте этот алгоритм проверен только для стерической комплиментарности [Kuntz, 1982; Schoichet, 1992]. Недавние разработки были ориентированны на усложнение различных функций оценки. В наиболее широко используемой версии рассмотрены молекулярные поля сил [Meng, 1992], возможна химическая идентификация сфер [Schoichet, 1993], а также может быть учтена гидратация [Meng, 1994].
Тогда как в пакете DOCK для небольших молекул предполагается только жесткая конформация, в ряде работ до некоторой степени принимается во внимание конформационная гибкость лиганда [Leach, 1992]. В данной процедуре сначала некая выбранная жесткая часть (якорный фрагмент) молекулы лиганда располагается в месте связывания, а затем генерируются и кластеризуются возможные ориентации гибких частей. В конечном счете, отбираются представители из каждого кластера. Подобный анализ исспользуется в качестве исходной точки для оценки того, как конформационная изменчивость лиганда может влиять на процесс связывания.
Другой подход к описанию места связывания в молекуле белка был предложен группой Рут Нусинов [Fischer, 1995; Sandak 1995]. Набор критических узлов, сформированный из впадин, выпуклостей и седловин на молекулярной поверхности белка и его потенциального лиганда, используется для определения вероятных соответствий между молекулами. Этот метод использует технику геометрического перемешивания (рандомизации), применяемую в технологиях компьютерной визуализации, и большей частью приспособлен для стыковки поверхностей в крупных системах. Также существует подход, который локирует молекулярные поверхности, основываясь на совмещении решеточных моделей методом наименьших квадратов [Bacon, 1992]. Точечная решеточная модель, именуемая паутиной, принимает во внимание сольватацию с учетом электростатических взаимодействий и скрытых областей поверхности. Тестовые вычисления демонстрируют эффективность методики. Для вычисления максимального числа соответствий между точками поверхности рецептора и лиганда также использовалась теория графов [Kasinos, 1992]. Идея использования исключительно стерических критериев путем формирования матриц представления молекулярных поверхностей в виде двухмерных решеток позволяет проводить исчерпывающий анализ возможной ориентации белка, выявляя подматрицы согласования [Helmer-Citterich, 1994; Walls, 1992].
В вопросах решения проблем межмолекулярного соответствия весьма перспективна программа GRAMM, предлагающая некоторые интересные альтернативы. В ее основу положено сглаживание функции энергии межмолекулярного взаимодействия путем варьирования атом-атомных потенциалов, что позволяет учитывать масштаб стерических препятствий в самом начале процесса. Этот способ не требует дополнительного описания места связывания, необходимы только координаты лиганда и мишени [Katchalski-Katzir, 1992; Vakser, 1994; Vakser, 1995; Vakser, 1996aVakser, 1996b].
В последние годы все более многочисленны попытки учета гибкости лигандов. Программа FLOG [Miller, 1994], развившаяся из DOCK, учитывает гибкость лигандов путем использования серии конформеров, которые для каждой молекулы хранятся в базе данных. Описывается только один, получивший наилучшую оценку, конформер лиганда. FLOG использует концепцию критических точек, где используются определенные центры строго соответствующие атомам лиганда. FLOG имеет также несколько других особенностей, изначально отличающих его от DOCK. Однако по многим особенностям функционирования самые новые реализации DOCK эквивалентны FLOG.
Существует целый ряд других подходов, рассматривающих конформационную вариабельность лиганда. Например, предложен метод, где вероятные способы связывания находятся и оцениваются с точки зрения образования водородных связей [Mizutani, 1994]. Рассчитываются и рассматриваются все модели взаимодействия для всех конформаций лиганда, после оценки строения моделей выбирается лиганд в конформации с наилучшими параметрами. Другая программа, GREEN, опирается на метод построения решеточных моделей и разработана той же группой. GREEN имеет многочисленные встроенные функции для минимизации и покомпонентного анализа энергии, существенно облегчающие процесс локирования [Tomioka, 1994].
Разрабатываются подходы и с использованием более сложных систем, включая методы основанные на технологии виртуальной реальности. Пользовательский интерфейс STALK программы CAVEAT [Lauri, 1994] является системой виртуальной реальности, позволяет визуализировать процесс оптимизации и разрешает пользователю напрямую взаимодействовать с алгоритмом путем изменения параметров. Autodock использует протокол оценки решеточных моделей в сочетании с моделированием отжига для конформационного поиска. Основное его преимущество — использование метода Монте-Карло при моделировании отжига, что позволяет исследовать возможные варианты взаимодействии лигандов с молекулой мишенью [Morris, 1996]. Docking-d представляет собой инструмент, разработанный как часть большого программного пакета для вычисления и предсказания взаимодействия рецептора с лигандом. Эта программа использует технологии визуализации, сходные с теми, которые применяет Nussinov и оценочные функции, использующие параметры LUDI [Rarey, 1996].
Были сделаны попытки свести описание места связывания к отдельным фармакофорным точкам, и использовать расположение этих точек для поиска потенциальных лигандов. Первоначально данная идея была внедрена компанией Chemical Design в программе ChemProtein, а недавно она была использована другой группой как часть пакета для проектирования лекарств Prometheus [Clark, 1996].
В рамках всех вышеописанных методов, используется жесткая конформация рецептора, и осуществляются некоторые попытки учесть гибкость малых молекул либо путем их оптимизации в пределах места связывания, либо путем использования многочисленных заранее рассчитанных конформеров. Несмотря на то, что разработано большое число методов предсказания взаимодействия между макромолекулой и небольшим лигандом, было предпринято очень мало попыток учесть конформационную подвижность элементов места связывания макромолекулы. Одна из подобных попыток предполагает создание набора различных конформационных состояний белка-мишени в процессе проведения молекулярной динамики и реализована в программе SYSDOC [Pang, 1994]. Также представляется весьма многообещающим подход, где возможные конформации боковых цепей аминокислот варьируются на основании закономерностей, установленных для них по кристаллографическим данным. Этот способ также предполагает гибкость рассматриваемого лиганда, опираясь при этом на теоретический конформационный анализ [Leach, 1994].
Фрагментарные методы: создание лигандов de novo.
Фрагментарные методы строят новые небольшие молекулы внутри определенного места связывания, пытаясь при этом увеличить число благоприятных контактов. В то время как все описанные выше методы оперируют уже существующими молекулами, которые содержатся в базах данных, методы de novo конструируют новые молекулярные структуры. Фрагментарные алгоритмы могут быть разделены на две основные подгруппы, которые можно определить как восходящие (нарастающие, build-up) методы и методы перемыкания (построения мостов, bridging). В рамках первой группы методов единственный фрагмент, или затравка, размещается в полости связывания, и далее пошаговым способом к растущей структуре добавляются другие группировки. В рамках второй группы методов в месте связывания размещают ключевые функциональные группы, а затем предпринимают попытки увязать все это вместе в одну структуру.
Восходящие процедуры. Программа GROW была разработана для проектирования пептидов, дополняющих место связывания в белковой молекуле [Moon, 1991]. Это типичный метод «разрастания», где аминокислотная затравка и следующие остатки добавляются итеративно. Конформации выбираются из предварительно созданной библиотеки низкоэнергетических форм.
Существует и другой метод пептидного дизайна [Singh, 1991] GroupBuild, использующий библиотеку общих органических масок и полное описание взаимодействия между лигандом и ферментом без химической связи. Таким образом он строит лиганд, который стерически и электростатически соответствует месту связывания [Rotstein, 1993а]. GroupBuild представляет собой улучшенный вариант метода Genstr, который основан на использовании углеродов в эрЗ-гибридизации в качестве основных строительных блоков [Rotstein, 1993b]. Родственный метод использует атомы либо небольшие химические группировки, случайно размещенные в месте связывания [Pearlman, 1993], которые могут быть затем связаны вместе.
LEGEND [Nishibata, 1991] представляет собой также поатомный алгоритм, который поэтапно строит структуру из атомов случайного типа со случайными торсионными углами. MCDNLG начинает с заполнения активного центра атомами углерода. Далее выполняется серия мутаций атомов и мутаций типов связей с пошаговой элиминацией методом Монте-Карло, в процессе которого может быть сохранен или удален любой предыдущий шаг. Результат представляет собой структуру, которая заполняет место связывания [Gehlhaar, 1995а]. SMoG использует несложную модель белок-лигандного взаимодействия, а также оценивающую полуэмпирическую функцию, которая прямо пропорциональна свободной энергии. Присоединение функциональных групп непосредственно в области связывания проводится по алгоритму Монте-Карло [De Witte, 1996].
Методы конструирования промежуточных элементов (в англоязычной литературе — bridging method). Одной из первых реализацией данного метода была программа LUDI [Bohm, 1992а, b]. Программа увязывает в пространстве фрагменты, которые предварительно локируются в специфические области рецептора, например, доноры или акцепторы водородной связи, либо гидрофобные элементы. Место связывания может быть представлено, исходя из результатов работы программы GRID [Goodford, 1985а, b]. Фрагменты выбираются из заранее заданных библиотек, которые без труда могут быть настроены пользователем. Размещенные фрагменты могут быть связаны вместе посредством линейных групп. С другой стороны, если фрагмент затравки размещен в месте связывания, программа может использоваться и для внедрения специфических функциональных группировок в конструируемый лиганд. Метод продолжает совершенствоваться. В самое последнее время сообщалось о попытках принять во внимание синтетическую доступность молекул, что является одной из основных проблем проектирования лекарств de novo [Bohm, 1996]. BUILDER представляет собой алгоритм, также присоединяющий фрагменты [Lewis, 1992], и использующий DOCK для определения нерегулярных решеток локируемых молекул, что может быть использовано для поисков путей связывания молекулярных фрагментов. Программа интерактивна, так что оператор может вручную контролировать вероятность синтеза конструируемой молекулы. Метод MCSS [Miranker, 1991; Caflish, 1993] определяет энергетически благоприятные положения и ориентацию малых органических молекул (метанол, вода, ацетонитрил и так далее) на поверхности белка. Фрагменты первоначально размещаются в минимумах, затем соединяются, например, с помощью поиска по базам данных общей молекулы, в которой одновременно увязаны несколько фрагментов, для чего используют алгоритм HOOK [Eisen, 1994]. Не так давно в процедуре динамического дизайна лигандов (DLD) был сделан новый шаг в развитии подходов, реализованных в MCSS методе [Miranker, 1995]. В DLD методе место связывания насыщается атомами, которые образуют связи друг с другом под контролем выбранной полуэмпирической функции потенциальной энергии. Результирующие молекулы строятся из заранее вычисленных функциональных групп, которые располагаются в энергетических минимумах места связывания. SPROUT [Gillet, 1994] представляет собой набор инструментов для дизайна лигандов, базирующегося на структуре (structure based ligand design). Согласно этому методу, фрагменты соединяют в единую структуру, исходя из поиска многокомпонентного графа, связывающего набор масок с препозиционированными функциональными группами в месте связывания мишени. Место связывания мишени может быть определено посредством правила приближений. Вследствие развития комбинаторной химии, идея проектирования единичных химических соединений замещается проектированием сплошных химических библиотек. Методы структурного дизайна лигандов (structure based ligand design) соответствуют данной тенденции. Недавно предложен новый метод, основанный на алгоритмах MCSS и позволяющий автоматически генерировать широкий набор разнообразных химических соединений [Caflisch, 1996].
Методы оптимизации счета.
В настоящее время предпочтительным направлением для оптимизации взаимодействия молекул является использование эволюционных алгоритмов. Об использовании эволюционных алгоритмов в молекулярном дизайне написан превосходный обзор [Clark, 1996b]. Одна из глав этого обзора посвящена использованию эволюционных алгоритмов для молекулярного докинга и молекулярного дизайна de novo. Ранние попытки использовать генетические алгоритмы осуществлялись на основе использования процедур DOCK [Oshiro, 1995]. Также были попытки прямого использования генетических алгоритмов для расчетов оценочной функции в молекулярной механике [Xiao, 1994]. Judson и соавторы адаптировали генетический алгоритм для конформационного поиска в рамках метода гибкого докинга [Judson, 1995], и обосновали большую важность учета влияния растворителя. DIVALI [Clark, 1995] использует потенциальную функцию AMBER и предлагает вариант ее совместного использования с генетическими алгоритмами для увеличения скорости процесса поиска. Более того, та же группа провела весьма интересный анализ оценочных функций, которые представляют собой критическую проблему в этой области [Jain, 1996]. Была описана простая модель молекулярного узнавания, основанная на описании стерических взаимодействий и возможности образования водородных связей, а также возможность эффективного поиска на основе генетических алгоритмов [Gehlhaar, 1995b]. Также рассматривались методы, которые учитывают полную гибкость лиганда и частичную гибкость макромолекулярной мишени [Jones, 1995]. Этот метод использует модель для определения величины энергии образования водородных связей, как донорного, так и акцепторного типа, а также учитывает влияние растворителя на процесс связывания.
МАТЕРИАЛЫ И МЕТОДЫ.
Аппаратная база работы.
Вычислительная часть работы выполнялась на базе компьютеров Silicon Graphics Indigo2 R4400−150, 0rigin200 2xRl0000−180 под управлением операционных систем IRIX 5.2 и 6.4 соответственно. Анализ полученных результатов и разработка программного обеспечения (кроме макросов SPL) проводились на базе персональных компьютеров Pentium под управлением операционной системы Windows 95.
Программная база работы.
В ходе работы использовалось следующее программное обеспечение :
Пакет молекулярного моделирования Sybyl фирмы Tripos (модули Sybyl Base, Advanced Computation, Biopolymer, QSAR and Advanced CoMFA, DISCO, COMPOSER, Concord.
Pearlman, 1987], UNITY и встроеный язык программирования SPL) [Syby 6.4, 1997].
Оригинальная программа геометрического локирования DockSearch, разработанная автором и описанная в разделе «Результаты и обсуждение» .
Программа Fiesta для вычислений электростатических взаимодействий с использованием быстрого разложения Фурье [Sklenar, 1990].
Программа расчета полярных и гидрофобных эффектов HINT [Kellogg, 1991, 1992].
Компилятор Microsoft Visual С++.
Оптимизация комплекса двух молекул.
Для оптимизации комплекса двух молекул использовалась процедура минимизации энергии молекул методом Пауэла (Powell, ускоренный метод сопряженного градиента) [Powell, 1977], имеющаяся в составе модуля Advanced Computation программного пакета Sybyl. В каждом случае использовалось не более 200 шагов минимизации. Процедура останавливалась раньше, если градиент энергии был меньше 0.05 ккал/(моль•А). При моделировании большого числа комплексов в ходе проверки эффективности работы программы DockSearch конформация молекулы-мишени фиксировалась. В случае моделирования комплекса цитохромов Р45 0сат и Ь5 обе молекулы имели незакрепленную конформацию. Вычисление внутренней энергии молекул при оптимизации осуществлялось с использованием полуэмпирического поля сил фирмы Tripos, разработчика Sybyl, в которое входили следующие компоненты:
Е = Estr + Ebend + Еоор + Etors + Evdw + Eele котрые рассчитывались следующим образом: Величина энергии деформации связей.
Nbonds.
Estr= Ik^-d о 2.
1=1 2, где di — длина л.-той связи (А), d0i — идеальная длина 1-той связи (А), к1<3 — константа силы напряжения связи (ккал*моль-1* А-2). Величина энергии угловых деформаций.
ЕЬеп4 = Ек1(01−61)2 где.
1=1 '.
01 — угол между двумя смежными связями (радиан), 9°1 — идеальная величина 1-того угла (радиан), кх9 — константа силы угловой деформации (ккал*моль~1*радиан~2). Величина энергии деформации плоскости.
Ысюр -1.
Е = V — koopd 2 °°р ^ 2 1 1, где di — расстояние между центром 1-того атома и плоскостью его заместителей (А), клоор — константа силы деформации плоскости (ккал*моль-1* А ~2). Величина торсионной энергии.
Еьм = Е-У1-[1 + 31соз (К|.О)1)]г рде.
У0! — торсионный барьер (ккал*моль-1) ,.
Эх — принимает значение +1 при скрещенной конформации, принимает значение -1 при заслоненной конформации, П1 — периодичность, СО! — торсионный угол.
Величина энергии вандерваальсовых взаимодействий (потенциала Ленарда-Джонса).
Natoms vdw ^ii i=l j>l поп bonded.
1.0 2.0 я12 я6 где.
Eij — вандерваальсова константа для i-j пары атомов (ккал*моль-1), aij — принимает значение rij/(Ri+Rj), rij — расстояние между i-тым и j-тым атомом (А),.
Ri — вандерваальсов радиус i-того атома (А).
Величина энергии электростатических взаимодействий.
Natoms Г) Г).
Е, =332.17 X У У к к Duru' где поп bonded.
Dij — величина диэлектрической проницаемости для i-j пары атомов (приравнивалась к расстоянию между атомами), Qi — остаточный заряд на i-том атоме (рассчитывался по комбинированной схеме Gasteiger-Marsili и Huckel), rij — расстояние между i-тым и j-тым атомом (А), 332.17 — универсальный фактор преобразования.
Собственно энергия комплекса вычислялась как:
Ecompl = A^vdw +Ее1е ^.
AEvdw — изменение энергии вандерваальсовых взаимодействий, а AEeie ~ соответственно изменение энергии электростатического взаимодействия.
Оптимизация конформации лиганда ори поиске в базах данных.
Оптимизация конформации лиганда при поиске в базах данных проводилась путем минимизации энергии молекулы лиганда и энергии его взаимодействия с мишенью, имеющей фиксированную конформацию. Использовался алгоритм быстрого вычисления энергии по предварительно рассчитанной решетке значений с шагом 0,25А. Из известных программ подобный подход используется программой DOCK, описанной в литературном обзоре. В настоящей работе использовался модуль оптимизации программы моделирования de novo LEAPFROG пакета.
SYBYL. Метод LEAPFROG базируется на поле сил Tripos и определяет виртуальную энергию связывания следующим образом:
Ecompl = Els + Ecds + Elds + Eh.
Соответствующие компоненты вычислялись следующим образом: Els =? {Qg ¦ Я, ~ Ag ¦ а, + BG ¦ bi) ^ где q± - остаточный заряд на i-том атоме лигандал/2к ¦ (2Rf ai — принимает значение 4 ,.
— Jk ¦ (2R)6 bi — принимает значение v ' ;
Qg ~ электростатическая компонента узла решетки ближайшего к i-тому атому лиганда, вычисляется как.
Яа.
3 гва.
А6 -притягательная компонента узла решетки ближайшего к 1-тому атому лиганда, вычисляется как.
V а, г ¦1-ве.
Всотталкивающая компонента узла решетки ближайшего к 1-тому атому лиганда, вычисляется как г12 bg = Е qs — остаточный заряд на s-том атоме мишениг — расстояние между узлом решетки и s-тым атомом мишени.
ECds — энергия десольватации мишени.
Eids ~ энергия десольватации лиганда.
Eh — энергия водородного связывания (-5 ккал/моль за каждую водородную связь).
К и R — табличные характеристики, связанные с химическим типом атома.
Моделирование полного цитохрома. Ъ5.
Минимизация энергии при моделировании полной молекулы цитохрома ?5 также проводилась методом Пауэла с использованием полуэмпирического поля сил Tripos. Молекулярная динамика выполнялись с использованием того же поля сил методом Верле [Verlet, 1967]. В случаях молекулярной динамики и минимизации при наличии растворителя использовались периодические граничные условия: постоянное число частиц, постоянное давление (одна атмосфера) и постоянная температура (300К).
QSAR модели и их параметры.
Для построения QSAR моделей (регрессионных уравнений) в настоящей работе использовался модуль «QSAR with Advanced CoMFA» пакета SYBYL, использующий метод частичных наименьших квадратов. В случае использования в качестве зависимой переменной константы диссоциации, измеряемой в мкМ, она вводилась в виде следующей величины:
1000pKd = 103 • log (l0~6 • Kd).
При проверке эффективности работы программы DockSearch при построении регрессионных уравнений для предсказания константы диссоциации комплекса в качестве независимых переменных использовались энергия электростатического взаимодействия молекул, изменение энергии взаимодействия с водным окружением при образовании комплекса, изменение площади гидрофобной и гидрофильной поверхности при образовании комплекса, изменение интегрального параметра степени гидрофобности и гидрофильности поверхности при образовании комплекса. Энергия электростатического взаимодействия молекул и изменение энергии взаимодействия с водным окружением рассчитывались с использованием программы FIESTA, любезно предоставленной доктором Скленаром. Для расчета остальных параметров исспользовалась оригинальная программа, базирующаяся на молекулярном потенциале липофильности [Heiden, 1993]:
IV.
X fi ¦ fa).
LPm = — gfo) =.
— CA где уу ^ е~Ф,~с2) + !
1=1 di — расстояние от точки пространства до 1-того атома;
С] и Сг — константы Ферми, эмпирически определенные как 1 и 4 соответственно;
2 — криппеновские частичные липофильности атомов [Viswanadhan, 1989]. Интегральные параметры гидрофильности {Ь) и липофильности (У) рассчитывались по формулам:
L = ZlpL • ds.
U = S ЪРш ¦ ds,.
T D1 -5.П где.
Ы^нм ~ значение ЬРт на з.-том элементе площади, с1 В! — величина элемента площади. Площади гидрофобной (Б^ и гидрофильной {Би) поверхности вычислялись соответственно как:
Е ds±.
Рш< о О.
При построении регрессионных уравнений для предсказания константы диссоциации комплекса двух белков в качестве независимых переменных использовались параметры, характеризующие гидрофобновзаимодействия (hinthp) расчитанные с помощью программы расчета полярных и гидрофобных эффектов HINT. Эти параметры представляют собой специфический счет характеризующий взаимодействие между собой соответственно гидрофобных участков поверхности лиганда и мишени и гидрофобных и полярных гидрофобных участков поверхности лиганда и мишени.
При построении QSAR-модели с использованием CoMFA при поиске лигандов для моноаминоксидазы, А в качестве независимых переменных использовались распределения стерического и электростатического полей на решетке с шагом 2 А, где атом углерода в эрз-гибридизации с зарядом +1 использовался в качестве пробы.
Параметры работы программы DockSearch.
Основные принципы работы программы DockSearch описаны в главе «Результаты и обсуждение» [DockSearch, 1998]. Параметры программы DockSearch, использовавшиеся на различных этапах работы представлены в таблице 1. гидрофобные взаимодействия (hinthh) и гидрофобно-полярные.
Таблица 1. Параметры программы DockSearch в различных экспериментах.
Варианты использования программы DockSearch.
Параметры программы ОоскЭеагсЬ 1 2 3 4 5 6 7.
Число точек на поверхности 42 42 42 42 42 42 42.
Угол вращения молекулы вокруг каждой из осей (градусов) — 10 15 20 20 20 20 15.
Разрешение трехмерной решетки аппроксимации (А) — 0,2 0,2 0,2 0,2 0,2 0,2 0,2.
Допустимая величина пенетрации (А) 0 0,1 0 0 0,1 0 0.
Радиус сферы зонда (А) 1,4 1,4 1,4 1,4 1,4 1,4 1,4.
Радиус сферы атома (А) 1,6 1,6 1,6 1,6 1,5 1,5 1,5.
Уровень отбора гипотетических комплексов по величине скрытой поверхности лиганда (% от максимально полученного значения) 80 85 65 70 70 70 50.
Уровень отбора гипотетических комплексов по величине скрытой поверхности комплекса (% от максимально полученного значения) 80 85 80 78 80 80 50.
Допустимое среднеквадратичное отклонение расстояний между атомами лигандов в гипотетических комплексах в пределах одного кластера (А) 2,0 2,0 2,0 2,0 2,0 2,0 0,25.
1. Оценка эффективности программы DockSearch.
2. Полностью автоматизированная процедура локирования.
3. Моделирование комплексов цитохромов Р4 50сат и Ь5.
4. Поиск низкомолекулярных лигандов для субтилизина NOVO.
5. Поиск низкомолекулярных лигандов для нейраминидазы вируса гриппа.
6. Поиск низкомолекулярных лигандов для цитохрома Р4 50саш.
7. Поиск низкомолекулярных лигандов для моноаминоксидазы, А с использованием специально модифицированной программы DockSearch.
Информационные ресурсы, использованные в работе.
Данные о трехмерной структуре молекул-мишеней и их комплексов с молекулами с известными константами диссоциации были взяты из Protein Data Bank [Bernstein, 1977] (табл. 2).
Таблица 2. Молекулы, использованные в работе, структуры которых были получены из РБВ.
Мишень (код PDB) Лиганд (код PDB) Комплексы молекул код PDB).
Оценка эффективности программы DockSearch latp lbmm lbtx lcpi ldwc leib lhpx lmmb lmmp lmnc.
Автоматизированная процедура локирования lcil leim leat leau leib lfkg lhbv lhfs lhsg lhsh ljan ljap lmmq Inlo lnlp lppc lsbg 4est 6tmn 7gch.
Моделировании комплексов цитохромов Р450сат и Ь5 2ср4 ЗЬ5с.
Поиск лигандов для субтилизин NOVO lsib lsib lsua 2sni 2sic 3sic 5sic.
Поиск лигандов для нейраминидазы вируса гриппа 2 ВАТ linf ling linh linw linx live livd live livf 2bat.
Поиск лигандов для цитохром Р4 50сат 2срр 2cpp 4cpp 5cpp 6cpp 8cpp lnoo.
Список 54 комплексов с известными Kd, использованных для построения регрессионных уравнений представлен в таблице 3. Константы диссоциации были выбраны из базы данных KeyLock [KeyLock, 1998], поддерживаемой в лаборатории молекулярно-графического конструирования лекарств ИБМХ РАМН.
Данные о аминокислотной последовательности цитохрома Ь5 были получены из базы данных SWISS-PROT [Bairoch, 1997], код записи Р171.
Данные о моделях трехмерных структур [Pearlman, 1987] низкомолекулярных молекул для поиска новых лигандов брались из базы данных коммерчески доступных соединений фирмы Maybridge [Maybridge, 1996]. и базы данных Comprehensive Medical Chemistry компании MDL Information Systems [CMC, 1997].
Данные о структуре и активности ингибиторов моноаминоксидазы были предоставлены лабораторией биохимии аминов и других азотистых оснований ИБМХ РАМН [Мес^ес1еу, 1995, 1998].
Таблица 3. Некоторые характеристики 54-х отобранных для эксперимента белковых комплексов.
Рецептор Лиганд Код в PDB Kd (nM).
Актин Профилин 2BTF 5000.
Альфа-литическая протеиназа Boc-Ala-Pro-Valine метоборат 1Р01 0,35.
Альфа-литическая протеиназа Метоксисукцинил-А1а-А1а-Рго-Val метоборат 1Р03 6,4.
Альфа-литическая протеиназа Метоксисукцинил-А1а-А1а-Рго-Phe метоборат 1Р06 540.
Ацетилхолинэстераза Фасцикулин 1FSS 0, 04.
Карбоксипептидаза, А Cbz-Phe-ValP-(0)-Phe 7СРА 0, 01.
Карбоксипептидаза, А Cbz-Ala-GlyP-(0)-Phe 8СРА 0,71.
Карбонатдегидрогеназа II Ингибитор ETS 1CIL 0, 37.
Карбонатдегидрогеназа II Ингибитор PTS 1CIM 1, 52.
Карбонатдегидрогеназа II Ингибитор MTS 1CIN 1,88.
Катепсин Э Пепстатин 1LYB 38.
Коллагеназа нейтрофилов человека Pro-Leu-Gly-гидроксиламин 1 JAN 19 000.
Коллагеназа нейтрофилов человека З-меркапто-2-бензилпропаноил-Ala-Gly-NH2 1JA0 1200.
Коллагеназа нейтрофилов человека Pro-Leu-Gly-гидроксиламин 1 JAP 19 000.
Коллагеназа нейтрофилов человека Bb94 1ММВ 0,6.
Коллагеназа нейтрофилов человека (N-(2-гидроксаматеметилен-4-метил-пентоил) фенилаланин) метил амин 1MNC 2.
Коллагеназа фибробластов человека (N-(2-гидроксаматеметилен-4-метил-пентоил) фенилаланин) метил амин 1HFC 7.
Коллагеназа фибробластов человека Аналог муравьиной кислоты 1843и89 1TLC 9.
Матрилизин Карбоксилат-ингибитор 1MMP 570.
Матрилизин Гидроксамат-ингибитор 1MMQ 1.
Нейраминидаза вируса гриппа Сульфодииминингибитор 1MMR 1800.
Пенициллопепсин DANA 1NSD 1000.
Пенициллопепсин Iva-Val-Val-гидрат дифторстатон-Ы-метиламд 1APV 10.
Пенициллопепсин Iva-Val-Val-гидрат дифторстатин-Ы-метиламд 1APW 1.
Рецептор Лиганд Код в PDB Kd (nM).
Пенициллопепсин Iva-Val-Val-Leu (Р)-(0)Phe-0-метил 1PPL 2,8.
Пенициллопепсин Iva-Val-Val-Sta-OEt 1APU 47.
Протеиназа-1 ВИЧ Iva-Val-Val-[LySta]-OEt 1ATP 2,1.
Протеиназа-1 ВИЧ Циклический пептидомиметик 1CPI 39.
Протеиназа-1 ВИЧ SB203238 1HBV 430.
Протеиназа-1 ВИЧ SB206343 1HPS 0, 6.
Протеиназа-1 ВИЧ KNI-272 1HPX 0, 005.
Протеиназа-1 ВИЧ L-735,524 1HSG 0,56.
Протеиназа-1 ВИЧ L-735,524 1HSH 0,56.
Протеиназа-1 ВИЧ A-77 003 1HVI 0, 084.
Протеиназа-1 ВИЧ A-78 791 1HVJ 0, 035.
Протеиназа-1 ВИЧ A-76 928 1HVK 0,077.
Протеиназа-1 ВИЧ A-76 889 1HVL 1.
Протеиназа-1 ВИЧ A-27b 1HVR 0,31.
Протеиназа-1 ВИЧ SB20338 6 1SBG 18.
Протеиназа-1 ВИЧ JG-365 7HVP 0,24.
Протеиназа-1 ВИЧ U-85548e 8HVP 1.
Ретинолсвязывающий белок A-74 704 9HVP 4/5.
Термолизин Трангиретин (TTR) 1RLB 70.
Термолизин PC-2 5TMN 9,1.
Тимидилатсинтаза PC-3 6TMN 9000.
Тирозинкиназный сигналпередающий белок (БНЗ-домен) CB3717 2TSC 4,8.
Тирозинкиназный сигналпередающий белок (БНЗ-домен) N11 1NL0 3400.
Тирозинкиназный сигналпередающий белок (ЭНЗ-домен) N12 1NLP 11 000.
Тирозинкиназный сигналпередающий белок (БНЗ-домен) AFAPPLPRR (PLR1) 1PRM 59 000.
Тирозинкиназный сигналпередающий белок (БНЗ-домен) RALPPLPPY (RLP2) 1RLQ 8000.
Трипсин T-ByTOKcn-Ala-Val-6opo-Lys этилэфир 1BTX 7.
Трипсин T-ByTOKcn-Ala-Val-6opo-Lys этилэфир 1BTZ 7.
Трипсин NAPAP 1PPC 690.
Трипсин Ингибитор Боумана-Бирка 1SMF 0, 001.
Трипсин Циклотеонамид A 1TYM 0,2.
Трипсин BPTI 2TGP 0, 46.
Рецептор Лиганд Код в PDB Kd (nM).
Трипсин Бензамидин 1BIT 100 000.
Трипсин T-ByTOKCH-Ala-Val-6opo-Lys этилэфир 1BTW 7.
Тромбин Бензамидин 1DWB 300.
Тромбин Агротробан (MD-805) 1DWC 19.
Тромбин NAPAP 1DWD 6, 6.
Тромбин BMS-183 507 1HDT 17, 2.
Тромбин Гирудин 1HGT 0, 022.
Тромбин Аргинин-ОиР714 1LHC 0,04.
Тромбин Амидин-ОиР714 1LHD 0,29.
Тромбин Лизин-РиР714 1LHE 0,24.
Тромбин Орнитин-ОиР714 1LHF 8,1.
Тромбин Гомолизин-0иР714 1LHG 79.
Тромбин Циклотеонамид, А 1ТМВ 1.
Тромбин Гирудин 4НТС 0,022.
Тромбин р-амидинофенилпируват 1ANT 620.
Тромбин BMS-186 282 1ВММ 78, 9.
Тромбин BMS-189 090 1BMN 3, 64.
Химотрипсин N-aueraui-Leu-Phe трифторметилкетон 7GCH 0, 53.
Цис-транс изомераза (1R)-1,З-дифенил-1-пропил (2S)-1-(3,З-диметил-1,2- диоксипентил)-2-пиперидинкарбоксилат 1FKG 7.
Эластаза нейтрофилов человека 3-[[(Метиламино) сульфонил]амино]-2-оксо-б-фенил-Ы-[3,3,З-трифтор-1-(1-метилэтил)-2-оксопропил]-1(2h)-пиридинацетамид 1EAS 18.
Эластаза нейтрофилов человека 2- [5-метансульфониламино-2-(4-аминофенил)-б-оксо-1,6- дегидро-1-пиримидинил]-N-(3,3,З-трифтор-1-изопропил-2-оксопропил)ацетамид IE AT 15.
Эластаза нейтрофилов человека 2-[5-амино-6-оксо-2-(2-тиенил)-1,б-дигидропиримидин-1-ил) — N-[3,3-дифтор-1-изопропил-2-оксо-3-(N-(2-морфолиноэтил) карбомоил]пропил]ацетамид IE AU 0, 95.
Эластаза поджелудочной железы свиньи Трифторацетил-лизил-пролил-Р-изопропиланилид 1ELA 220.
Эластаза поджелудочной железы свиньи Трифторацетил-лизил-лейцил-Р-изопропиланилид 1ELB 70.
Эластаза поджелудочной железы свиньи Трифторацетил-фенилаланил-Р-изопропиланилид 1ELC 440.
Эластаза поджелудочной железы свиньи Асе-А1а-Рго-Уа1-дифтор-Ы-фенилэтилацетамид 4EST 100.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Программа БоскЗеагсЬ.
Разработанный алгоритм геометрического докинга реализован в виде программы ОоскБеагс]!, которая написана на языке С и может быть использована на разных платформах. Этот алгоритм базируется на следующих исходных положениях:
1. Из двух молекул, участвующих в докинге, одна (неподвижная) объявляется мишенью, а другая (подвижная) — лигандом.
2. Мишень и лиганд описаны в собственных декартовых системах координат, центры которых не совпадают (рис. 1).
3. Лиганд имеет три вращательные и три поступательные степени свободы, отнесенные к его системе координат.
4. Мишень и лиганд рассматриваются как набор неводородных атомових пространственное расположение отвечает выбранной конформации молекул, которая не изменяется в ходе докинга.
5. Атомы описываются сферами равного радиуса (рекомендуется 1.6 А), центры которых совпадают с центрами атомов.
6. На поверхности каждой атомной сферы равномерно размещается заданное число точек, одинаковое для каждой сферы. Точка считается расположенной на поверхности молекулы, если пробная сфера (обычно с радиусом 1.4 А, что соответствует эффективному радиусу молекулы воды), касающаяся в ней данной атомной сферы, не пересекается с другими атомными сферами (рис. 2).
Неподвижная молекула мишень.
Сфера с радиусом 1.4 ангстрем (молекула воды). Доступная точка. Недоступная точка.
Подвижная молекула лиганд.
Сфер атомы молекулы).
Рисунок 1 Лиганд и мишень имеют Рисунок 2 Поверхностные независимые системы координат- (доступные) точки.
Процедура докинга заключается в последовательном выполнении следующих операций:
1. Ориентация лиганда фиксируется в пространстве заданием углов его поворота относительно осей подвижной системы координат.
2. Рассматривается набор векторов смещения центра координат лиганда относительно центра координат мишени. Каждый такой вектор получается совмещением двух поверхностных точек лиганда и мишени, для которых нормали к атомным сферам антиколлинеарны (рис. 3) .
3. Исключаются из рассмотрения вектора смещения, при которых пересекаются атомные сферы лиганда и мишени. Оставшиеся расположения лиганда и мишени рассматриваются как потенциальные комплексы этих молекул. Для них вычисляется число поверхностных точек лиганда и мишени, которые в комплексе перестали быть поверхностными (рис. 4). Доля таких точек коррелирует со скрытой поверхностью комплекса (то есть с поверхностью, недоступной для молекул воды).
Точка соприкосновения.
Центр координат мишени х^Х.
Центр коорлииит лнганда.
Рисунок 3 Формирование вектора смещения .
Доступная поверхность Г.
Молекула лиганд. 4.
Молекула мишень.
Область шю1 ною контакта.
Скрытая поверхность.
Рисунок 4 Скрытая поверхность комплекса.
4. Углы поворота лиганда относительно осей подвижной системы координат изменяются, после чего осуществляется возврат к п. 2.
Таким образом, генерируется очень большой набор комплексов, каждый из которых характеризуется величиной скрытой поверхности. Их число сокращается путем кластеризации по среднеквадратичному отклонению расстояний между атомами, так чтобы центру кластера отвечал комплекс с максимальной скрытой поверхностью (рис. 5).
Варианты положения молекулы лнганда. Кластер I.
Рисунок 5. Кластеризация положения лиганда.
Видно, что все вычисления простые и не требуют сложного математического аппарата, но объем вычислений огромен, а в большинстве случаев «хороших» гипотез значительно меньше, чем «плохих». Для сокращения времени счета в схему вычислений были введены некоторые изменения. Во-первых, величина скрытой поверхности оценивалась не для всего комплекса, а только для «закрытого» участка лиганда, так как, как правило, эта молекула меньше мишени. Оценка же полной скрытой поверхности производилась только для тех гипотетических комплексов, у которых величина поверхности «закрытого» участка лиганда была достаточно велика (как правило, 80% от максимально полученной) (рис. б). Во-вторых, для быстрой оценки величины скрытой поверхности и элиминации стерических пересечений использовалась решеточная модель представления молекулы мишени (рис. 7).
60% 70% 90%.
Рисунок 6. Результат фильтрации выборки по величине скрытой поверхности комплекса на примере локирования камфоры к цитохрому Р450сат и при различном уровне (60, 70, 90% от максимально полученного значения соответственно). Красный — цитохром Р4 5 0сат, черный — гем, малиновый — камфора в реальном комплексе, фиолетовый — положение молекулы камфоры после процедуры локирования.
Рисунок 7 Принципы решеточной аппроксимации мишени.
Эффективность работы программы ОоскБеагсЬ контролируется путем установки ряда параметров. Эти параметры включают в себя: число точек на поверхности атома (может принимать фиксированные значения 42, 162, 642) — угол вращения молекулы лиганда вокруг каждой из осей (по умолчанию 20 градусов) — шаг трехмерной решетки аппроксимации (по умолчанию 0.2 А) — допустимая величина пенетрации (по умолчанию 0 А, не более величины разрешения трехмерной решетки аппроксимации) — радиус сферы зонда (по умолчанию 1.4 А) — радиус сферы атома (по умолчанию 1.6 А) — уровень отбора гипотетических комплексов по величине скрытой поверхности лиганда (по умолчанию 80% от максимально полученного значения, но не менее 65%) — уровень отбора гипотетических комплексов по величине скрытой поверхности комплекса (по умолчанию 90% от максимально полученного значения, но не менее 50%) — допустимое среднеквадратичное отклонение расстояний между атомами лигандов в гипотетических комплексах в пределах одного кластера (по умолчанию 2 А).
Оценка, эффективности программы ВоскЗеахгсЬ.
Для проверки эффективности программы БоскБеагсЬ в базе данных РОВ были отобраны 10 белок-лигандных комплексов с известной трехмерной структурой. Лиганды и белки при докинге сохраняли ту же конформацию, что и в комплексах, а начальная ориентация лигандов в подвижной системе координат была случайной.
Для оценки результатов докинга гипотетические комплексы ранжировались по доле скрытой поверхности, после чего определялось положение (ранг) комплекса, который по среднеквадратичной разности расстояний между тождественными атомами (ИМЗО) наиболее близок к реальному. Оказалось, что в большинстве случаев такой комплекс обладает наивысшим рангом (табл. 4), причем соответствующее ему значение РМББ, безусловно, можно считать удовлетворительным для предсказания. Таким образом, докинг позволил, как выявить участки связывания лигандов на белковой поверхности, так и определить расположение на них соответствующих лигандов.
Таблица 4. Сравнение гипотез о строении комплексов с реальными кристаллическими структурами.
Код в PDB Число неводородных атомов лиганда Число комплексов Минимальное значение RMSD (А) Ранг комплекса с наименьшим значением RMSD по величине скрытой поверхности latp 157 36 11,681 9 lbmm 35 3 0, 304 1 lbtx 32 38 1, 355 1 lcpi 49 1 0, 832 1 ldwc 35 98 0, 226 1 lelb 33 181 0, 202 1 lhpx 46 1 0, 600 1 lmmb 32 25 0, 299 1 lmmp 32 49 0, 693 1 lmnc 25 27 1, 025 1.
Уточнение результатов докнига.
Геометрическому докингу как методу определения структуры лиганд-белковых комплексов присущи некоторые недостатки. Во-первых, он предполагает неизменность конформаций лиганда и мишени, которые, в действительности, адаптируются друг к другу. Во-вторых, площадь скрытой поверхности отражает пространственную комплементарность взаимодействующих молекул, но не позволяет оценить энергию их взаимодействия и предсказать устойчивость комплексов. В принципе, может оказаться, что в реальном комплексе скрытая поверхность меньше максимально возможной, т.к. при этом более эффективно, скажем, кулоновское взаимодействие или образуются дополнительные водородные связи.
Перечисленные принципиальные недостатки удалось преодолеть, сочетая докинг с последующей оптимизацией структуры гипотетических комплексов при использовании в качестве критерия вычисленные значения энергии связывания. Выбор соответствующих процедур зависит от особенностей задачи. Так в данной работе, при моделировании комплекса двух белков при оптимизации учитывалась конформационная подвижность обоих белков (лиганда и мишени). Если лигандами служили низкомолекулярные соединения, то учитывалась только их конформационная подвижность.
Результаты оптимизация структуры гипотетических комплексов, описанных выше, приведены в таблице 5, где представлен ранг комплекса, наиболее близкого к реальному. Из таблицы видно, что гипотетические комплексы с наибольшей вычисленной энергией белок-лигандного взаимодействия чаще всего по структуре наиболее близки к реальным. На примере комплекса latp видно, что оптимизация позволяет увеличить вероятность предсказания «правильной» структуры гипотетического комплекса.
Объем вычислений, связанных с оптимизацией может быть сокращен, если предварительно отбросить гипотетические комплексы, заведомо неудачные по легко оцениваемому критерию, например, по энергии электростатического взаимодействия между лигандом и мишенью. Данные о такого рода фильтрации представлены в таблице 5.
Таблица 5. Сравнение гипотез о строении минимизированных комплексов с реальными кристаллическими структурами.
Код в PDB. Минимальное значение RMSD (A), полученное после минимизации Число комплексов Число. комплексов, для которых AEq < 0 отрицательна Ранг по AEq для комплекса с наименьшим значением RMSD Ранг по АЕ комплекса с наименьшим значением RMSD latp 11,603 36 28 2 2 lbmm 1,135 3 3 3 2 lbtx 1,401 38 17 1 1 lcpi 0, 605 1 1 1 1 ldwc 0,181 98 59 9 1 lelb 0,148 181 100 10 1 lhpx 0,280 1 1 1 1 lmmb 0,289 25 14 1 1 lmmp 0, 688 49 29 17 1 lmnc 0, 882 27 22 1 2.
АЕ0 — величина энергии электростатического взаимодействия в комплексе;
ЛЕ — сумма величин энергии электростатического и вандерваальсового взаимодействий в комплексе.
Об эффективности сочетания докинга с последующей оптимизацией можно судить по результатам QSAR-предсказаний констант диссоциации гипотетических комплексов. Такие предсказания были произведены с помощью двух регрессионных уравнений, построенных по данным о 54 белок-лигандных комплексах с известной структурой и свойствами.
Для построения регрессионных уравнений в качестве набора независимых переменных использовались параметры комплексов, которые могли быть достаточно быстро вычислены для всех молекул, в том числе и тех которые использовались при локировании. В их состав вошли: энергия электростатического взаимодействия между молекулами, рассчитанная программой Fiestaизменение энергии электростатического взаимодеиствия между молекулами и водным окружением при образовании комплекса, рассчитанная программой Fiestaизменения площади липофильной поверхности молекул при образовании комплекса, рассчитанная при использовании MLPизменения площади гидрофильной поверхности молекул при образовании комплекса, рассчитанная при использовании MLPизменение интегральных параметров липофильности и гидрофильности.
Первоначально не было известно, какие из перечисленных выше параметров существенны для построения регрессионного уравнения. Кроме того, не было уверенности в степени достоверности литературных данных и отсутствии ошибок в файлах, содержащих трехмерные структуры. Для преодоления этой проблемы, с использованием метода частичных наименьших квадратов, было построено большое количество регрессионных уравнений, в которых варьировались независимых переменные, размеры и состав выборки. Зависимость квадрата коэффициента множественной корреляции (R2) для данного набора независимых переменных от размера выборки представлена на рисунке 8. Из рисунка видно, что хорошую корреляцию можно получить уже для зависимости константы диссоциации от изменения площадей липофильной и гидрофильной поверхности, однако при использовании большего числа переменных средняя ошибка несколько меньше.
— eq, er, l, u, sl, su eq, er l, u, sl.su.
— ed, l, u, sl, su.
— eq, er, sl, su.
— ed, sl, su eq, er, L, u.
— er, sl, su i.
— er.l.u eq, l, u, sl, su f ed? er sl. su l.u sl.
Рисунок 8. Зависимости R2CV от количества комплексов не используемых в анализе, для статистических моделей, использующих различные наборы независимых переменных.
Обозначение переменных:
EQИзменение электростатического взаимодействия между молекулами при образовании комплекса, вычисленное программой Fiesta. ERИзменение электростатического взаимодействия молекул с водой при образовании комплекса, вычисленное программой Fiesta.
EDEQ+ER.
LИнтегральная величина степени гидрофильности поверхности только для гидрофильной части поверхности). UИнтегральная величина степени гидрофобности поверхности (только для гидрофобной части поверхности). SLПлощадь гидрофильной поверхности. SUПлощадь гидрофобной поверхности.
В таблице б приведены параметры двух регрессионных уравнений, отобранных для дальнейшей работы. Эти уравнения различаются наличием в первом из них энергии электростатического взаимодействия. С их использованием были предсказаны константы диссоциации для всех гипотетических комплексов (табл. 7). Из таблицы 7 следует, что чаще всего наибольшая устойчивость предсказывается для комплексов, максимально сходных по структуре с реальными, а нарушения этой закономерности могут быть обусловлены неудачным выбором регрессионных параметров.
Количество комплексов (из 54) не вошедших в анализ (шт.).
Таблица б. Статистические показатели двух моделей, предсказывающих значений 1000рК<3, и соответствующие регрессионные уравнения.
Модель 1 Модель 2.
Размер выборки 35 35.
Коэффициент множественной корреляции для анализа со скользящим контролем (Р2^) 0, 649 0, 630.
Стандартная ошибка для анализа со скользящим контролем (в^) 1059 1003.
Оптимальное число компонентов (п) 4 4.
Коэффициент множественной корреляции без скользящего контроля (Р2) 0, 742 0, 713.
Стандартная ошибка для анализа без скользящего контроля (э) 860 932.
Критерий значимости (Г) 21, 6 18, 6.
Регрессионное уравнение 1. lOOOpKd = 5784 — 6,59-EQ — 5.84-ER + 15.27-SL + 29.31-SU.
Регрессионное уравнение 2. lOOOpKd = 5357 + 2 93•L + 10.02-U + 29.90-SL + 28.06-SU.
Наименования входящих в уравнение независимых переменных:
EQ — Изменение величины энергии электростатического взаимодействия между молекулами при образовании комплекса, вычисленное программой Fiesta;
ER — Изменение величины энергии электростатического взаимодействия молекул с водой при образовании комплекса, вычисленное программой Fiesta;
L — Интегральная величина степени гидрофильности поверхности (только для гидрофильной части поверхности) — и — Интегральная величина степени гидрофобности (только для гидрофобной части поверхности);
ЭЪ — Площадь гидрофильной поверхности;
Би — Площадь гидрофобной поверхности. поверхности.
Таблица 7. Оценка гипотетических комплексов по предсказанию константы диссоциации (Кс1) .
Код в РБВ Известная величина К<1 (нм) Минимальное значение ИМБО (А), полученное после минимизации Ранг по КсЗ для комплекса с наименьшим значением ИМБО Предсказанная величина И (нМ) для комплекса с наименьшим значением ИМБО.
Регрессионное уравнение 1* latp 2,10 11,603 2 12, 96.
1Ьшш 78, 90 1,135 1 6, 73.
1ЪЬх 7, 00 1, 401 1 630,09.
1ср1 39, 00 0, 605 1 10, 40.
1сЫс 19, 00 0, 181 1 62, 93.
1е1Ь 70, 00 0,148 5 605,20.
1Ьрх 0,01 0,280 1 9, 10.
1шшЬ 0, 60 0,289 1 310,56.
1тшр 570,00 0, 688 1 620,84.
1шпс 2,00 0,882 1 593,20.
Регрессионное уравнение 2* latp 2,10 11,603 2 9, 94.
1Ьгпш 7 8, 90 1,135 1 5,49 lbtx 7,00 1,401 10 541,83.
1ср1 39, 00 0, 605 1 2, 80 ldwc 19, 00 0,181 1 27, 51.
1е1Ь 70, 00 0,148 32 86, 10.
1Ьрх 0, 01 0,280 1 0, 66.
1штЬ 0, 60 0,289 1 75, 44.
1ттр 570,00 0, 688 26 901,04.
1шпс 2, 00 0, 882 1 256,64.
Описание регрессионных уравнений 1 и 2 — см. в таблице 6.
Полностью автоматизированная процедура локирования.
Вычислительные эксперименты, связанные с оценкой эффективности докинга, совмещенного с оптимизацией структуры гипотетических комплексов, привели к созданию программного обеспечения, которое позволяет осуществить все процедуры в автоматическом режиме без вмешательства оператора. Этот программный комплекс был испытан на 20 выбранных наугад белковых комплексах, структура которых представлена в РОВ. Во всех случаях первым этапом был геометрический докинг случайным образом ориентированного лиганда к свободному белку (конформации обоих партнеров те же, что в комплексе). Из таблицы 8 видно, что в 14 случаях положение лигандов было «угадано» с точностью < 2.0 А, что может считаться вполне удовлетворительным результатом. Участок связывания лиганда на поверхности белка всегда отыскивался безошибочно, в то время как в ориентации лиганда наблюдались некоторые отклонения.
Таблица 8. Результаты работы полностью автоматизированного докинга.
Код в PDB Число комплексов Минимальное значение RMSD (A) после минимизации Ранги по различным параметрам для комплекса с минимальным значением RMSD.
DS ED FED Kd lcil 17 0,308 11 12 13 6 leim б 0, 353 4 1 2 5 leat 82 9, 569 63 2 8 71 leau 53 6, 275 39 4 11 42 leib 5 3, 178 3 1 1 3 lf kg 5 0,221 2 2 1 1 lhbv 1 0, 637 1 1 1 1 lhfs 1 3, 035 1 1 1 1 lhsg 1 0, 316 1 1 1 1 lhsh 2 0, 515 1 1 2 2.
1 j an 126 0, 782 102 37 119 34 ljap 181 1, 035 147 77 160 95 lmmq 13 1, 177 8 1 2 11 lnlo 1 3, 960 1 1 1 1 lnlp 6 0, 752 3 1 2 1 lppc 7 1,257 5 2 3 2 lsbg 5 0,172 5 1 1 5.
4est 132 9, 970 114 32 84 91.
6tmn 7 1, 667 3 2 3 5.
7gch 4 0, 435 1 1 1 4.
DS — скрытая поверхность комплекса;
ED — энергия взаимодействия в комплексе с учетом действия электростатических и вандерваальсовых сил;
FED — энергия электростатического взаимодействия в комплексе с учетом сольватации, вычисленная программой Fiesta;
Kd — константа диссоциации, предсказанная по регрессионному уравнению 2. Описание регрессионного уравнения 2 — см. в таблице б.
Моделирование комплекса цитохром P450cam — цитохром bs.
В исследованиях монооксигеназных систем животных большое внимание уделяется механизму переноса электронов между темами цитохромов Р450 и цитохрома b5 [Archakov, 1990, Ozols, 1989]. Оба цитохрома — мембранные белки, что создает значительные методические трудности при изучении этого явления. Поэтому в качестве эквивалентного объекта часто используют бактериальные водорастворимые белки — цитохром P450cam (Pseudomonas putida) и его естественный партнер путидаредоксин. Известно, что цитохром Ъ$ конкурирует с путидаредоксином за место связывания на цитохроме P4 50cam [Stayton 1989], причем свойства образующихся комплексов зависят от того, использовался ли сам цитохром b? или его водорастворимый фрагмент, получаемый обработкой нативного белка трипсином [Ivanov, 1997]. Строение этих комплексов не установлено, и потому представляло интерес получить сведения о нем посредством вычислительного эксперимента с использованием геометрического докинга. Исходно были известны трехмерные структуры цитохрома Р4 50саш и водорастворимого фрагмента цитохрома Ь5, определенные рентгеноструктурным методом.
Моделирования полного цитохрома Ъ5.
На первом этапе было необходимо построить модель трехмерной структуры нативного цитохрома ?>5. Эта часть исследования включала следующие стадии:
1. Моделирование трехмерной структуры мембрано-связанного фрагмента цитохрома Ь5 (остатки 89−133) с помощью программного модуля COMPOSER [Topham, 1990]. Для построения структуры использовались данные об упаковке гомологичных фрагментов белков, найденных в PDB.
2. Оптимизация полученной структуры в среде, моделирующей мембранное окружение (неполярный растворитель).
3. Создание модели полной структуры цитохрома Ьз путем объединения структур мембранно-связанного и водорастворимого фрагментов по общей части аминокислотной последовательности (остатки 8 9−91).
4. Оптимизация структуры цитохрома jb5 в двухфазной среде из полярного и неполярного растворителя с использованием молекулярной динамики.
С помощью программы composer были найдены два белка в РОВ (2CTS — цитрат синтаза и 2ААТ аспартат аминотрансфераза), содержащие фрагменты с гомологией больше 80% к мембрано-связанному фра гменту Ь. ь (остатки 8 9−133). Линейное выравнивание аминокислотной последовательности было выполнено с использованием матрицы замен «p-mutation» [Needleman, 19 701. Найденные белки содержали три структурно-консервативных региона (scr), координаты атомов которых использовались в дальнейшей работе. Пропущенные фрагменты между SCR были подобраны в pdb по расстоянию между Са атомами и по гомологии фрагментов последовательности Г Fine, 1986]. Таким образом, были подобраны четыре фрагмента из следующих белков: 3MCG, 4X1А, 5СРА и 1РНН. Полученная предварительная структура фрагмента Ь5 была оптимизированы в присутствии неполярного растворителя — бензола. Модель мембрано-связанного фрагмента представлена на рисунке 9.
N-t-ermiiinJ.
Loop I rum 3MSG.
J Й.
C-termiual.
ЙЕЕЗЖЙЖГ YiLEEIt) KH.4 HSKSTIII3L" «IKTIBLIKFL.
Loop fr-ош 41 51 61 71 8(.
1 РНН.
EEHPGQEEVL EEQSGGDI1TE NEEDUGHSTD REELS]®EU.
Loop from LX1A fx: O i < H л у-Y О. < g (-p. j Loop from 5CPA szml ывьши a V.
Рисунок 9. Результат моделирования по гомологии мембрано-связанного фрагмента цитохрома bf, (89−133 остатка), после минимизации в неполярном растворителе. SCR показаны голубым цветом.
Используя для пространственного совмещения частей молекулы Ьн остатки 8 9−91, представленные в обоих фрагментах, была получена модель полного цитохрома Ь5. Мембранный участок белка (остатки 10 412 6) был помещен в неполярный растворитель. Для этой цели были использованы молекулы бензола, предварительно приведенные в состояние равновесия молекулярной динамикой. Полученный комплекс был в свою очередь помещен в водное окружение, также уравновешенное молекулярной динамикой. Таким образом, была получена система, имитирующая положение молекулы цитохрома Ь5 в мембране (рис. 10). Для нее было проведено моделирование молекулярной динамики на протяжении 600 пс с временным шагом 1 фс. Фактическое равновесие системы было достигнуто после 500 пс (рис. 11) .
Сравнение значений среднеквадратичного отклонения положения атомов в пространстве для 1-Ь5/ t-b5 и модели мембрансвязанного фрагмента показывает, что максимальные изменения имели место для последнего. Строение изменилось в небольшой степени.
КМЗО — 2А) и стабилизировалось уже после 50 пс. Процедура минимизации энергии текущей конформации была выполнена после каждых 5 пс без остановки молекулярной динамики. Таким образом, были получены более 100 вероятных конформаций fl-b5. Потенциальная энергия системы белок/бензол/вода была от -2,7 * 104 до -4,2¦104 ккал/моль. Конформация в системе с минимальным значением потенциальной энергии представлена на рисунках 12 и 13. Эта же конформация? IЬц использовалась в докинге.
Рисунок 10. Начальная конформация полного цитохрома Ь*> {?1 Ьд) в двухфазной системе растворителей (вода/бензол). Белковая цепь представлена желтым цветом, молекулы бензола — голубым, гёмкрасным, молекулы воды {кислородные атомы) — белым.
Время (пс).
РМЭО (А-Ь5) -КМЗЭ (остатки 1−88) — - - РМЭО {остатки 89−133).
Рисунок 11. Результаты моделирования молекулярной динамики Ш Ь5 в двухфазной системе растворителей (вода/бензол).
Рисунок 12 — Сравнение трехмерных структур с (желтый цвет) и flЬъ (зеленый).
Рисунок 13. Поверхность модели £~1-Ь5 раскрашенная по значению липофильнох’о потенциала (ЬР). Максимальные значения ЪРкоричневый цвет, минимальные — синий.
Моделирование комплексов цитохромов Р450сат и Ь5.
Общая схема вычислительного эксперимента представлена на рисунке 14.
Рисунок 14. Последовательность моделирования взаимодействия цитохромов Р450сат и Ьз.
Результаты геометрического докинга цитохрома Ь5 и его водорастворимого фрагмента с цитохромом Р4 50саш приведены в таблице 9. Число гипотетических комплексов, найденных с помощью программы ОоскБеагсЬ, было значительно уменьшено с помощью описанных выше процедур кластеризации и фильтрации по энергии электростатического взаимодействия. Оставшиеся комплексы были подвергнуты оптимизации по энергии межбелкового взаимодействия (с помощью программного комплекса ЗуЬу1) с изменением конформации как лиганда, так и мишени.
Таблица 9, Число гипотетических комплексов цитохрома Р450сагп с водорастворимым фрагментом цитохрома ?>5 (и моделью полного цитохрома {£1-Ь5) .
Процедура Количество комплексов Р4 50саш/ ?-?>5 Количество комплексов Р4 50сат/?1-Ь.ч.
Геометрический докинг 3667 2798.
Кластеризация 70 65.
Отбор по значению энергии электростатического взаимодействия (ДЕЧ < 0 ккал/моль) 37 27.
Отбор по значению полной энергии межбелкового взаимодействия (ДЕ > -80 ккал/моль) 3 2.
Для двух полученных выборок гипотетических комплексов был рассчитан ряд дополнительных параметров. Зависимости этих параметров друг от друга были проанализированы и представлены на рисунках 16, 17, 18, 19, 20 и 21. Зависимость для ДЕ {в ккал/моль) от скрытой поверхности (5, число поверхностных точек) показана на рисунке 15. Очевидно, отсутствие корреляции между этими параметрами, так как значения Э мало различаются и изменяются в пределах от 350 до 450. Это определяется основными принципами геометрического локирования и способом отбора результатов. В то же время ДЕ колеблется в широком диапазоне значений от -20 до -130 ккал/моль. Энергия взаимодействия ДЕ складывается из двух компонентов: вандерваальсовых взаимодействий (ДЕуои) и электростатических взаимодействий (¿-Ш^) — Их значения для комплексов Р450сат/?:-?>5 (А) и Р450сат I Е1-Ьь (В) показаны на рисунке 16. Так как ДЕуоа строго коррелирует со скрытой поверхностью комплекса, для обеих выборок это значение мало вариабельно, а все вариации ДЕ связаны с изменением электростатической энергии. Также были вычислены расстояния между атомами железа в гем группах Р450сат и ?>5, расстояния между самыми пространственно близкими атомами в гем группах Р450сагп и Ь$, а также число и энергия возможных водородных связей. Результаты для ДЕ и Ре-Ге расстояний, ДЕ и гем-гем расстояния, ЛЕ+ЛЕНВ и Ее-Ре расстояний и ДЕ+ДЕНв и гем-гем расстояний представлены на рисунках 17, 18, 19 и 20 соответственно. Принимая во внимание нелинейную зависимость туннелирования электрона от расстояния, может быть предсказана вероятность электронного транспорта между молекулами. Десять лучших положений цитохрома Ь5 с минимальными гем-гем расстояниями представлены на рисунке 21. На рисунке представлены только положения гем групп Ь5, раскрашенные согласно значениям ДЕ+ДЕНВ.
После отбрасывания гипотетических комплексов, у которых полная энергия межбелкового взаимодействия (ДЕ) меньше -80 ккал/моль, оказалось, что оставшиеся комплексы могут быть объединены по сходству в строении в небольшое число групп: три — для водорастворимого фрагмента и всего две — для полного цитохрома Ь$ (рис. 22 и 23). Выбор между этими вариантами связывания не может быть пока осуществлен чисто вычислительными приемами, однако он вполне реален с помощью экспериментальных методов (ковалентные сшивки, флуоресцентные и/или ЭПР-метки), поскольку каждому предполагаемому типу связывания соответствуют различные наборы аминокислотных остатков в цитохроме Р450саш, находящихся в контакте со связанными белковыми лигандами (табл. 10).
Тем не менее, полученные результаты позволяют предполагать, что комплексообразование возможно как в случае Р4 50сат/1-Ь5 так и Р450сат2-Ъ<. Однако возникающие комплексы могут отличаться позицией цитохрома Ьз в пространстве, ориентацией гем группы и энергией комплексообразования. Эти результаты в определенной мере совпадают с результатами, полученными в экспериментах на биосенсоре (табл. 11). Если рассматривать энергетические параметры гипотетических комплексов, то формирование комплекса в случае Р4 50сат/*:-£>.5 более вероятно. Из данных же эксперимента на биосенсоре видно, что только в случае Р450сат/t-b5 образуются реальные комплексы с Кс1 ~ 108 М [Зкуо^эоу, 1997]. о.
I '50 Е i.
ЗЁ ш -100.
— 150.
200 250 300 350 400 450 500 скрытая поверхность (число точек).
• А-Ь5 Ot-Ьб.
Рисунок 15. Зависимость ДЕ (ккал/моль) от скрытой поверхности (число точек) для комплексов Р450сат/Ь~-Ь5 (белый цвет) и Р4Ь0сат/Г1-Ь5 (черный цвет). оУГ.
О6 °о.
— 150 -100 -50 0.
ДЕ (ккап/моль).
• вклад вандерваальсовых сил о вклад электростатики.
Рисунок 16. Два компонента ДЕ (ДЕуои ~ черный цвет и ДЕ0 — белый) для комплексов Р450сат/*:-Ь5. о.
— 40 I.
1 -80.
111 о.
— 120 -160.
0 15 30 45 60.
Ре-Ре растояние (Л).
01-Ь5 • А-Ь5 9.
Ч Л в" .
— и ^ о * ° °. О о.
О.
Рисунок 17. Зависимость ДЕ (ккал/моль) от расстояния между атомами железа (А) для комплексов Р450сат/?-Ь5 (белый цвет) и Р450сат/^1-Ь5 (черный цвет). 0 -40 ф X X я 0.
8 -80 га О,? ?
1 '120 -160.
0 10 20 30 40 50.
ДЕ (ккал/моль).
•г!-Ь5 Оь-Ь5.
•—о о о сР о.
ОтОО.
То с°*. о о от.
Рисунок 18. Зависимость ДЕ (ккал/моль) от расстояния между темами (А) для комплексов ?450cam/t~b5 (белый цвет) и Р450сага/Г2~Ь5 (черный цвет). и -40 § 2 1 -80 ш.
I шт.
— 160.
• *< * 1 1 си о 0°0 о о ° «% ° % о • о СЕ V %?<
О °.
15 30.
Ре-Ре расстояние (А).
ОЬЬ5.
И!-Ь5.
Рисунок 19. Зависимость ДЕ+ДЕНв (ккал/моль) от расстояния между атомами железа (А) для комплексов Р450сат/Ь~Ь5 (белый цвет) и Р450сат//1-Ьл (черный цвет).
— 40.
I -80 ш о -120.
— 160.
О Л" о о ° о.-«.* О/о О ° о*.
6* 1. о с.
10 20 30 гем-гем расстояние {А).
О !-Ь5.
Н!-Ь6.
Рисунок 20. Зависимость ДЕ+ДЕНВ (ккал/моль) от расстояния между гемами (А) для комплексов Р4 50сагп/Ь ~Ь5 (белый цвет) и Р450сат/?'1-:Ь5 (черный цвет).
Рисунок 21. 10 лучших позиций I-Ьь (А) и (В) с минимальным расстоянием гем-гем. Значения) ДЕ+АЕцв! (ккал/моль) — <8 0 (синий цвет), 80−100 (фиолетовый), 100−120 (малиноый), >120 (красный).
Рисунок 22. Участки связывания для (А) и П-аЦ (В) на поверхности цитохрома Р4 50саш. Смотри список аминокислотных остатков в таблице 10 — А. Участок #1 — зеленыйУчасток #2 синийУчасток #3 — красный. В, Участок # 1 синийУчасток #2 -красный.
Рисунок 23. Кластеры комплексов Р4 50cam/1 jb.5 (А) и Р4 50cam/ f l Ьь (В) для которых [АЕ|>80 ккал/моль.
Таблица 10. Аминокислотные остатки, образующие на поверхности цитохрома Р4 50сат место связывания для водорастворимого фрагмента цитохрома Ь5 (t-b5) и для модели полного цитохрома Ь5 (£1-Ь5) .
Номер участка Цвет на рис. 22 Аминокислоты.
Участки связывания для t-b5.
1 Зеленый Е152 Е156 D182 D188 S190 К266 Р268 ?269 Е273 Е276 D339 S382 А384 G386 А387 Q388 Q4 00 Р403 D407 Т410.
2 Синий Q69 R72 Е7 3 Е7 6 R79 H8Q Р106 Q108 R109 R112 А113 N116 Q117 М121 Р122 D125 А283 Y305 R330 Q343 К344 Н347 Н352 G353 S354 L356 Q360 Н361 R364.
3 Красный Е94 Е198 D202 1205 Е209 S235 D236 Е237 R240.
Участки связывания для fl-bs.
1 Синий Е7 6 Y78 R79 Р106 R109 ШЛ2 А113 М121 Р122 Р282 А283 Q343 К344 Н352 S354 Н361 R364.
2 Красный Р13 Р16 Е20 R57 Е8 4 R90 Е91 Е94 Е195 К197 Е198 D236 К239 D304 К313 К314.
Таблица 11. Результаты по связыванию цитохрома Р450сат с t-b5 и fibs, полученные на оптическом биосенсоре [Skvortsov, 1997].
Бинарный белковый комплекс коп, (mkM'V1) k0? f, (s1) Kd, (мкМ).
Р450саш + t-b5 0,77 ± 0,20 0,010 ± 0,002 1,3 ± 0,4.
Р450саш + fl-b5 0,09 ± 0,05 0,40 ± 0,10 440,0 ± 260,0.
Применение программы DockSearch при поиске низкомолекулярных лигандов для ферментов.
Число коммерчески доступных органических соединений столь велико, что есть шанс обнаружить среди них либо готовые эффекторы для данного фермента, либо соединения, которые могут послужить их прототипами, нуждающимися в некоторой оптимизации структуры. Речь идет о молекулах, которые комплементарны участку связывания субстрата и/или конкурентного ингибитора, либо аллостерического регулятора. Поиск таких соединений с помощью вычислительных методов может значительно упростить и удешевить разработку новых ферментных субстратов, ингибиторов и активаторов. В настоящей работе показано, что программа DockSearch с успехом может быть использована при таком поиске и предложена методология ее применения в различных ситуациях. В качестве источника структур потенциальных лигандов использовались базы данных МауВridge (>45 000 соединений) и CMC (6300 биологически активных соединений).
выводы.
1. Предложен новый алгоритм геометрического докинга и на его основе разработана программа DockSearch, которая может быть с успехом использована для адекватного компьютерного моделирования комплексов типа белок-белок и белок-низкомолеклярный лиганд.
2. Разработана методология использования геометрического докинга при поиске участков связывания лигандов на поверхности белка, для моделирования межбелковых комплексов, а также для поиска низкомолекулярных эффекторов ферментов.
3. Разработанный метод успешно апробирован на ряде комплексов белок-белок (цитохромов Р450саш и bs) и белок-лиганд (цитохрома Р4 50саш, субтилизина NOVO, нейраминидазы вируса и моноаминоксидазы А).
ЗАКЛЮЧЕНИЕ
.
Опыт, полученный при тестировании программы ОоскБеагсЬ и при ее применении для моделирования комплексов белков с другими белками и с низкомолекулярными лигандами позволяет предложить некоторые общие правила и рекомендации.
Геометрический докинг, как правило, применяется не сам по себе, а как один из инструментов при исследовании межмолекулярных взаимодействий (рис. 42).
Непосредственной целью докинга может быть:
1. отыскание участка связывания на поверхности мишени, когда известны структуры мишени и специфического лиганда;
2. моделирование строения исследуемого комплекса;
3. поиск новых лигандов когда известна структура участка связывания.
Сущность докинга состоит в генерации набора стерически допустимых размещений лиганда относительно мишени (гипотетических комплексов). Выбор из них более предпочтительных зависит от применяемого критерия. В программе ОоскЭеагсЬ таким критерием служит пространственная комплементарность, оцениваемая по доле скрытой поверхности комплекса, лиганда и мишени. Это означает, что для селекции гипотетических комплексов по иным критериям (например, по энергии взаимодействия лиганд-мишень) необходимо привлекать другие программные модули.
Вместе с тем, ранжирование гипотетических комплексов по доле скрытой поверхности является инструментом, позволяющим успешно решать многие фильтрационные задачи:
1. отбор по наибольшей скрытой поверхности комплекса выявляет наилучшее по комплементарности расположение лиганда относительно мишени;
2. отбор по наибольшей скрытой поверхности лиганда при сниженных требованиях к скрытой поверхности участка связывания позволяет разыскать небольшие молекулы, которые могут служить блоками при конструировании более крупных специфичных лигандов;
3. отбор по наибольшей скрытой поверхности участка связывания при сниженных требованиях к скрытой поверхности лиганда позволяет разыскать крупные молекулы, у которых лишь отдельные фрагменты взаимодействуют с мишенью (характерный пример — белковые ингибиторы субтилизинасм. выше).
Эффективность отбора гипотетических комплексов по критерию максимальной скрытой поверхности тем ниже, чем больше вклад в их устойчивости составляют не неспецифические — вандерваальсовы, — а специфические — водородные связи и электростатические взаимодействия (ср. выше поиск лигандов для субтилизина и нейраминидазы).
Затраты времени на поиск потенциальных лигандов среди множества молекул в базах данных, существенно сокращаются, если докингу предшествует селекция молекул по структурным критериям: числу и типу атомов, наличию или отсутствию определенных циклов и функциональных групп и т. п., в основе которой лежит информация об индивидуальных особенностях молекулы мишени. Такой препроцессинг при необходимости должен включать «диссоциацию» ионогенных групп, а если в гибкой молекуле их несколько, то и оптимизацию ее конформации (в базах данных обычно представлены неионизованные формы).
1. Структурное моделирование молекулярных комплексов. 2. Поиск лигандов к мишени с известной трехмерной структурой. 3. Поиск лигандов к мишени с неизвестной трехмерной структурой.
1 г 1 г 1 г.
Область докинга — вся поверхность молекулы-мишени. Область докингаизвестный участок связывания на поверхности молекулы-мишени. Область докингаслепок с поверхности одного или нескольких известных лигандов.
1 г 1 г 1 г.
Генерация набора гипотетических комплексов (БоскЗеагсЬ).
1 г 1 г.
Оптимизация структуры полученных комплексов и оценка их энергетических параметров. Оптимизация структуры найденных лигандов и оценка энергетических параметров их связывания с мишенью.
1 г 1 Г 1 г.
Сравнительный анализ полученных гипотез с экспериментальными данными. — Оценка экспертом в данной области исследования. — Предсказание целевой биологической активности методами СоМРА, С^АЯиЗО-дЗАК.
Рисунок 42. Место программы ОоскБеагсЬ в общей структуре исследований.
Список литературы
- Archakov A.I., Bachmanova G.I. Cytochrome P450 and Active Oxygen. // London: Taylor & Francis. 1990.
- Bacon D.J., Moult J. Docking by least-squares fitting of molecular surface patterns. // J. Mol. Biol.-1992-v.225(3)-p.849−858.
- Bairoch A., Apweiler R. The SWISS-PROT protein sequence database: its relevance to human molecular medical research. // J. Mol. Med. -1997-v.75-p.312−316.
- Bernstein C., Koetzle T.F., Williams G.J.В., Meyer E.F.Jr., Brice M.D., Rodgers J.R., Kennard 0., Shimanouchi Т., Tasumi M. The Protein Data Bank: A Computer-based Archival File for Macromolecular Structures. // J. Mol. Biol.-1977-v.H2-p. 535−542.
- Bohm H.J. LUDI: rule-based automatic design of new substituents for enzyme inhibitor leads. // J. Comput. Aided Mol. Design -1992b-v.б-р.593−606.
- Bohm H.J. The computer program LUDI: a new method for the de novo design of enzyme inhibitors. // J. Comput. Aided Mol. Design -1992a-v.6-p.61−78.
- Bohm H.J. Towards the automatic design of synthetically accessible protein ligands: peptides, amides and peptidomimetics. // J. Comput. Aided Mol. Design. -1996-v.lO-p.265−272.
- Caflisch A. Computational combinatorial ligand design: application to human alpha-thrombin. //J. Comput.-Aided Mol. Design -1996-v.10-p.372−396.
- Caflish A., Miranker A., Karplus M. Multiple copy simultaneous search and construction of ligands in bindingsites: application to inhibitors of HIV-1 aspartic proteinase. // J. Med. Chem.-1993-v.36-p.2142−2167.
- Clark D.E., Westhead D.R., Sykes R.A., Murray C.W. Active-site-directed 3D database searching: pharmacophore extraction and validation of hits. // J. Comput.-Aided Mol. Design -1996-v.10-p.397−416.
- Clark K.P., Ajay // J. Comp. Chem. -1995-v.16(10)-p.1210−1226
- CMC ISIS™/Base -1997- Molecular Design Limited Information Systems, Inc., 14 600 Catalina Street, San Leandro, California, 94 577, USA.
- Connolly M.L. Analytical Molecular Surface Calculation. // J.Appl. Cryst.-1983-v.16-p.54 8−558.
- De Witte R.S., Shakhnovich E.L. // J. Am. Chem. Soc. -1996-v.118-p.11 733−11 744.
- DockSearch -1998-http://Imgdd.ibmh.msk.su/DockSearch.
- Eisen M.B., Wiley D.C., Karplus M., Hubbard R.E. HOOK: a program for finding novel molecular architectures that satisfy the chemical and steric requirements of a macromolecule binding site. // Proteins -1994-v.19-p.199−221.
- Fischer D., Lin S.L., Wolfson H.L., Nussinov R. A geometry-based suite of molecular docking processes. // J. Mol. Biol. -1995-v.24 8(2)-p.459−477.
- Gehlhaar DK, Moerder KE, Zichi D., Sherman C.J., Ogden R.C., Freer S.T. De novo design of enzyme inhibitors by Monte Carlo ligand generation. // J. Med. Chem -1995-v.38(3)-p.466−472.
- Gillet V.J., Newell W., Mata P., Myatt G., Sike S., Zsoldos Z., Johnson A.P. SPROUT: recent developments in the de novo design of molecules. // J. Chem. Inf. Comput. Sci. -1994-V.34(1)-p.2 07−217.
- Goodford P.J. A computational procedure for determining energetically favorable binding s ites on biologically important macromolecules. // J. Med. Chem. -1985-v.28(7)-p.849−857.
- Gschwend D.A., Good A.C., Kuntz I.D. Molecular docking towards drug discovery. // J. Mol. Recognition -1996-v.9(2)-p.175−186.
- Helmer-Citterich M., Tramontano A. PUZZLE: a new method for automated protein docking based on surface shape complementarity. // J. Mol. Biol. -1994-v.235(3)-p.1021−1031.
- Jain A.N. Scoring noncovalent protein-ligand interactions: a continuous differentiable function tuned to compute binding affinities. // J. Comput.-Aided Mol. Design -1996-v.10-p.427−440.
- Jones G., Willett P., Glen R.C. Molecular recognition of receptor sites using a genetic algorithm with a description of desolvation. // J. Mol. Biol. -1995-v.245(1)-p.43−53.
- Judson R.S., Tan Y.T., Mori E., Melius C., Jaeger E.P., Treasurywala A.M., Mathiowetz A. Docking Flexible Molecules: A Case Study of Three Proteins. // J. Comp, Chem. -1995-v.11-p.1405−1419.
- Kasinos N., Lilley N., Subbarao, Haneef I. A robust and efficient automated docking algorithm for molecular recognition. // Prot. Engineering v.5(1)-p.69−75.
- Kellogg G.E., Joshi G.S., Abraham D.J. New Tools for Modeling and Understanding Hydrophobicity and Hydrophobic Interactions. // Med. Chem. Res. -1992-v.1-p.444−471.
- Kellogg G.E., Semus S.F., Abraham D.J. A New Method of Empirical Hydrophobic Field Calculation for CoMFA. // J. Computer Aided Mol. Design -1991-v.5-p.545−569.
- KeyLock -1998-http: //Imgdd. ibmh.irisk. su/KeyLock.
- Koymans L., Donne-op Den Kelder G.M., Koppele Te J.M., Vermeulen N.P.E. Cytochrome P450: their Active-Site Structure and Mechanism of Oxidation. // Drug Metab. Rev,-1993-v.25-p.325.
- Kuntz I.D., Blaney J.M., Oatley S.J. Landridge, Ferrin, T. E A geometric approach to macromolecule-ligand interactions. // J. Mol. Biol. -1982-v.161(2)-p.269−288.
- Kuntz I.D., Meng E.C., Shoichst B.K. Structure-based molecular design. // Acc. Chem. Res. -1994-v.27(5)-p.117−123.
- Lauri G., Barlett P.A. CAVEAT: a Program to Facilitate the Design of Organic Molecule. // J. Comput. Aided Mol. Design.-1994-v.8-p.51−67.
- Leach A. R. // J. Mol. Biol. -1994-v.235-p.345−356.
- Leach A.R., Kuntz I.D. Conformational Analysis of Flexible Ligands in Macromolecular Receptor Sites. // J. Comp. Chem. -1992-v.13(6)-p.730−748.
- Lewis R.A., Roe D.C., Huang С., Ferrin Т.Е., Langridge R., Kuntz I.D. Automated site-directed drug design using molecular lattices. // J. Mol. Graphics. -1992-v.10(2)-p.66−78.
- Maybridge catalog database. -1996- Ryan Scientific, Columbia, USA.
- Meng Е.С., Kuntz I.D., Abraham D.J., Kellog G.E. Evaluating docked complexes with the HINT exponential function and empirical atomic hydrophobicities. // J. Comput. Aided Mol. Design -1994-v.8(3)-p.299−306.
- Meng E.C., Shoichet B.K., Kuntz I.D. Automated Docking with Grid-Based Energy Evaluation. // J. Comp. Chem. -1992-v.13(4)-p.505−524.
- Miller M.D., Kearsley S.K., Underwood D.J., Sheridan R.P. // J. Comput.-Aided Mol. Design -1994-v.8-p.153−174.
- Miranker A., Karplus M. An automated method for dynamic ligand design. // Proteins -1995-v.23-p.472−490.
- Miranker A., Karplus M. Functionality maps of binding sites: a multiple copy simultaneous search method. // Proteins-1991-v.ll (l)-p.29−34.
- Mizutani M.Y., Tomioka N., Itai A. Rational automatic search method for stable docking models of protein and ligand. // J. Mol. Biol.-1994-v.24 3(2)-p.310−326.
- Moon J.B., Howe J.W. Computer design of bioactive molecules: a method for receptor-based de novo ligand design. // Proteins 11: 314−328, 1991. (1991 11:4 314−28)
- Morris G.M., Goodsell D.S., Huey R., Olson A.J. Distributed automated docking of flexible ligands to proteins: parallel applications of AutoDock 2.4. // J. Comput.-Aided Mol. Design -1996-v.10-p.293−304.
- Needleman S.B., Wunsch C.D. A general method applicable to the search for similarities in the amino acid seguence of two proteins. // J. Mol. Biol. -1970-v.48(3)-p.443−453.
- Nishibata Y., Itai A. // Tetrahedron -1991-v.47-p.8985.
- Ortiz de Motellano P.R. Substrate Docking Algorithms and the Prediction of Substrate Specificity. «Cytochrome P450 part II» // Methods in Enzymology (Johnson E.F. ed.) Academic Press, San Diego -1996-p.336−347.
- Oshiro C. M, Kuntz I.D., Dixon J.S. Flexible ligand docking using a genetic algorithm. // J. Comput-Aided Mol. Design -1995-v.9(2)-p.113−130.
- Ozols Structure of cytochrome b5 and its topology in the microsomal membrane. // J. Bioch. Bioph. Acta -1989-v.997(1−2)-p.121−30.
- Pang Y.P., Kozikowski A.P. Prediction of the binding sites of huperzine A in acetylcholinesterase by docking studies. // J. Comput. Aided Mol. Design -1994-v.8(6)-p.669−681.
- Pearlman R.S. CONCORD: from Connectivity to 3D-Coordinates of Organic Compounds. // Chem. Design Auto News -1987-v.8-p.3.
- Pearlman D.A., Murcko M.A. CONCEPTS: New Dynamic Algorithm for De Novo Drug Suggestion. // J. Comput. Chem. -1993-v. 14 (10)-p.1184−1193.
- Powell M.J.D. Restart Procedures for the Conjugate Gradient Method. // Mathematical Programming -1977-v.12-p.241−254.
- Rarey M., Wefing S., Lengauer T. Placement of medium-sized molecular fragments into active sites of proteins. // J. Comput.-Aided Mol. Design -1996-v.10(1)-p.41−54.
- Rotstein S.H., Murcko M.A. GenStar: a method for de novo drug design. // J. Coput. Aided Mol. Design -1993-v.7(1)-p.23−43.
- Rotstein S.H., Murcko M.A. GroupBuild: a fragment-based method for de novo drug design. // J. Med. Chem. -1993-v.36(12)-p.1700−1710.
- Sandak B., Nussinov R. Wolfson H.J. An automated computer vision and robotics-based technique for 3-D flexible biomolecular docking and matching. // Comput. Appl. Biosci. -1995-v.11(1)-p.87−99.
- Shoichet B.K., Bodian D.L., Kuntz I.D. // J. Comp. Chem. -1992-v.13-p.380−397.
- Shoichet B.K., Kuntz I.D. Matching chemistry and shape in molecular docking. // Prot. Eng. -1993-v.6(7)-p.723−732.
- Singh J., Saldanha J., Thronton A novel method for the modelling of peptide ligands to their receptors. // J.M. Protein Eng. -1991-v.4(3)-p.251−261.
- Sklenar H., Eisenhaber F., Poncin M., Lavery R. Theoretical Biochemistry and Molecular Biophysics. // Eds.: D.L.Beveridge & R. Lavery, Adenine Press. -1990-p.317−335.
- Stayton P. S., Poulos T.L., Sliger S.G. Putidaredoxin competitively inhibits cytochrome b5-cytochrome P-450cam association: a proposed molecular model for a cytochrome P-450cam electron-transfer complex. // Biochemistry -1989-v. 28 (20)-p.8201−8205.
- Sybyl 6.4 -1997- Tripos Inc., 1699 South Hanley Road, St. Louis, Missouri, 63 144. USA.
- Tajima S., Enomoto K., Sato R. Nature of tryptic attack on cytochrome b5 and further evidence for the two-domain structure of the cytochrome molecule. // J. Biochem. (Tokyo) -1978-v.84(6)-p.1573−158 6.
- Tomioka N., Itai A. GREEN: a program package for docking studies in rational drug design. // J. Comput. Aided Mol. Design -1994-v.8(4)-p.347−366.
- Topham C.M., Thomas P., Overington J.P., Johnson M.S., Eisenmenger F., Blundell T.L. An assessment of COMPOSER: a rule-based approach to modelling protein structure. // Biochem. Soc.Symp. -1990-v.57-p.1−9.
- Vakser I.A. Long-distance potentials: an approach to the multiple-minima problem in ligand-receptor interaction. // Protein Eng. -1996-v.9(1)-p.37−41.
- Vakser I.A. Low-resolution docking: prediction of complexes for underdetermined structures. // Biopolymers -1996-v.39(3)-p.455−464.
- Vakser I.A. Protein docking for low-resolution structures. // Protein Eng. -1995-v.8(4)-p.371−377.
- Vakser I.A., Aflalo C. Hydrophobic docking: a proposed enhancement to molecular recognition techniques. // Proteins -1994-V.20(4)-p.320−329.
- Verlet J. Computer «experiments» on classical fluids: I. Thermodynamical properties of Lennard-Jones molecules.// Phys. Rev. -1967-v.159-p.98−103.
- Walls P.H., Sternberg M.J.E. New algorithm to model proteinprotein recognition based on surface complementarity. Applications to antibody-antigen docking. // J. Mol. Biol. -1992-v.228(1)-p.277−297.
- Xiao Y.L., Williams D.E. GAME: Genetic Algorithm for Minimisation of Energy: An Interactive Program for 3-Dimensional Intermolecular Interactions. // Computers and Chemistry -1994-v.18-p.199−201.
- Машковский М.Д. Лекарственные средства. // M.¡-Медицина -1 993 736 с.