ShadTask4
Version 2 (Arthur Zalevsky, 27.07.2013 13:47) → Version 3/16 (Andrey Golovin, 09.10.2013 02:05)
h1. Гомологичное моделирование комплекса белка с лигандом
* Отчёт должен содержать все файлы необходимы для моделирования и описание их получения.
* Необходимо представить в отчёте результаты моделирования и результаты проверки качества структур.
* Необходимо представить обсуждение результата.
h3. Традиционные ссылки на полезные ресурсы:
* "Уроки по работе с Modeller":http://salilab.org/modeller/tutorial
* "Напоминание о Python":https://kodomo.fbb.msu.ru/wiki/Main/Modelling/PyPymol от Александра Гришина.
* [[tip4|Подсказки]]
* "команды баш, коротко":http://kodomo.fbb.msu.ru/wiki/2011/1/bash-hints
* "Bash cheatsheet":http://kodomo.fbb.msu.ru/FBB/year_11/term1/latexsheet.pdf
Вся работа по расчётам будет проходить на хосте vsb.fbb.msu.ru порт 22025 через терминал putty. Для копирования файлов используйте "WinSCP":http://winscp.net/eng/download.php . Создайте свою рабочую папку и в ней работайте.
Цель данного занятия ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом. В этом занятии мы будем пользоваться пакетом Modeller. Это программное обеспечение распространяется бесплатно для академических пользователей.
Вы будете работать с белком лизоцимом из [[table|указанного организма]]. Используя известную структуру лизоцима форели как образец, Вам необходимо построить модель комплекса Вашего белка с лигандом.
Программе MODELLER для моделирования структуры белков, в качестве входных данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл выравнивания с дополнительной информацией.
# Постройте выравнивание последовательности из структуры ID: 1lmp и предложенного Вам белка. Рекомендуемые ресурсы и программы: "Clustal":http://www.genebee.msu.su/clustal/ Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR.
# Модификация файла выравнивания:
Переименуйте последовательность в файле выравнивания как в примере:
|Было|Стало|
|>P1;uniprot P37712 LYSC_CAMDR|>P1;seq| |>P1;uniprot|P37712|LYSC_CAMDR|>P1;seq|
|>P1;1LMP PDBID CHAIN SEQUENCE|>P1;1lmp| |>P1;1LMP|PDBID|CHAIN|SEQUENCE|>P1;1lmp|
После имени последовательности моделируемого белка добавьте строчку:
>sequence:ХХХХХ:::: 0.00: 0.00
эта строчка описывает входные параметры последовательности для modeller.
После имени последовательности белка-образца добавьте:
>structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00
эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д. В конце каждой последовательности добавьте символ
<pre>
.
</pre>
Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).
# Модификация файла со структурой: удалите всю воду из структуры (в текстовом редакторе) всем атомам лиганда присвойте один и тот же номер "остатка" (MODELLER считает, что один лиганд = один остаток) и модифицируйте имена атомов каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д. . После модификации имен атомов измените номера остатков на 130.
Пример:
|Было|Стало| |Было|Стало||
|HETATM 1014 O7 NAG 130|HETATM 1014 O7A NAG 130|
|HETATM 1015 C1 NAG 131|HETATM 1015 C1B NAG 130|
сохраните в файле 1lmp_now.ent
4.Создание управляющего скрипта my_seq.py (my_seq - имя Вашей последовательности, например, lysc_chram)
Вам представляется следующая заготовка:
<pre><code <pre> <code class="python">
from modeller.automodel import *
class mymodel(automodel):
def special_restraints(self, aln):
rsr = self.restraints
for ids in (('OD1:98:A', 'O6A:131:A'),
('N:65:A', 'O7B:132:A'),
('OD2:73:A', 'O1C:133:A')):
atoms = [self.atoms[i] for i in ids]
rsr.add(forms.upper_bound(group=physical.upper_distance,
feature=features.distance(*atoms), mean=3.5, stdev=0.1))
env = environ()
env.io.hetatm = True
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
a.starting_model = 1
a.ending_model = 5
a.make()
</code></pre>
В скрипте указано:
* что нужно использовать стандартные валентные углы в полипептидной цепи (строчка 4)
* что дополнительно нужно сохранять взаимное расположение определенных пар атомов (3.5 ангстрема);
* В данном случае трех атомов белка, образующих водородные связи с тремя атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного расположения атомов пары описаны в строчке 9-10. 3 точки могут однозначно расположить сложную структуру в пространстве, поэтому мы выбираем водородные связи как источник данных точек.
* что ковалентные связи в гетероатомах нужно вычислять по расстояниям между атомами (так же, как это делает Rasmol), строчка 12
* что имя файла с выравниванием и имена последовательностей образца и моделируемого белка, строчка 13 (а имя файла со структурой содержится в выравнивании)
* что число и номера моделей, которые нужно построить (в данном примере 5 моделей), строки 14-15
* что пора строить модель, строчка 16
< В скрипте Вам необходимо отредактировать строчки, в которых указаны какие водородные связи белка с лигандом должны быть '''В БУДУЩЕЙ МОДЕЛИ.''' Номера остатков и имена нужных атомов определите по выравниванию и тому, какие водородные связи имеются в образце. Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.
Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.
'''ВНИМАНИЕ.''' В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Соблюдайте предложенный в заготовке синтаксис.
5.Запустите исполнение скрипта командой
>mod9.11 myscript &
6. Просмотрите полученные Вами моделибВизуальные различия занесите в отчёт.
7. Проверьте качество моделей и выберите лучшую. Инструменты для оценки качества структуры можно найти в веб интерфейсе WHATIF (google://whatif). Достаточно 2-3 инструментов. Выберете лучшую модель.
* Отчёт должен содержать все файлы необходимы для моделирования и описание их получения.
* Необходимо представить в отчёте результаты моделирования и результаты проверки качества структур.
* Необходимо представить обсуждение результата.
h3. Традиционные ссылки на полезные ресурсы:
* "Уроки по работе с Modeller":http://salilab.org/modeller/tutorial
* "Напоминание о Python":https://kodomo.fbb.msu.ru/wiki/Main/Modelling/PyPymol от Александра Гришина.
* [[tip4|Подсказки]]
* "команды баш, коротко":http://kodomo.fbb.msu.ru/wiki/2011/1/bash-hints
* "Bash cheatsheet":http://kodomo.fbb.msu.ru/FBB/year_11/term1/latexsheet.pdf
Вся работа по расчётам будет проходить на хосте vsb.fbb.msu.ru порт 22025 через терминал putty. Для копирования файлов используйте "WinSCP":http://winscp.net/eng/download.php . Создайте свою рабочую папку и в ней работайте.
Цель данного занятия ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом. В этом занятии мы будем пользоваться пакетом Modeller. Это программное обеспечение распространяется бесплатно для академических пользователей.
Вы будете работать с белком лизоцимом из [[table|указанного организма]]. Используя известную структуру лизоцима форели как образец, Вам необходимо построить модель комплекса Вашего белка с лигандом.
Программе MODELLER для моделирования структуры белков, в качестве входных данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл выравнивания с дополнительной информацией.
# Постройте выравнивание последовательности из структуры ID: 1lmp и предложенного Вам белка. Рекомендуемые ресурсы и программы: "Clustal":http://www.genebee.msu.su/clustal/ Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR.
# Модификация файла выравнивания:
Переименуйте последовательность в файле выравнивания как в примере:
|Было|Стало|
|>P1;uniprot P37712 LYSC_CAMDR|>P1;seq| |>P1;uniprot|P37712|LYSC_CAMDR|>P1;seq|
|>P1;1LMP PDBID CHAIN SEQUENCE|>P1;1lmp| |>P1;1LMP|PDBID|CHAIN|SEQUENCE|>P1;1lmp|
После имени последовательности моделируемого белка добавьте строчку:
>sequence:ХХХХХ:::: 0.00: 0.00
эта строчка описывает входные параметры последовательности для modeller.
После имени последовательности белка-образца добавьте:
>structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00
эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д. В конце каждой последовательности добавьте символ
<pre>
.
</pre>
Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).
# Модификация файла со структурой: удалите всю воду из структуры (в текстовом редакторе) всем атомам лиганда присвойте один и тот же номер "остатка" (MODELLER считает, что один лиганд = один остаток) и модифицируйте имена атомов каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д. . После модификации имен атомов измените номера остатков на 130.
Пример:
|Было|Стало| |Было|Стало||
|HETATM 1014 O7 NAG 130|HETATM 1014 O7A NAG 130|
|HETATM 1015 C1 NAG 131|HETATM 1015 C1B NAG 130|
сохраните в файле 1lmp_now.ent
4.Создание управляющего скрипта my_seq.py (my_seq - имя Вашей последовательности, например, lysc_chram)
Вам представляется следующая заготовка:
<pre><code <pre> <code class="python">
from modeller.automodel import *
class mymodel(automodel):
def special_restraints(self, aln):
rsr = self.restraints
for ids in (('OD1:98:A', 'O6A:131:A'),
('N:65:A', 'O7B:132:A'),
('OD2:73:A', 'O1C:133:A')):
atoms = [self.atoms[i] for i in ids]
rsr.add(forms.upper_bound(group=physical.upper_distance,
feature=features.distance(*atoms), mean=3.5, stdev=0.1))
env = environ()
env.io.hetatm = True
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
a.starting_model = 1
a.ending_model = 5
a.make()
</code></pre>
В скрипте указано:
* что нужно использовать стандартные валентные углы в полипептидной цепи (строчка 4)
* что дополнительно нужно сохранять взаимное расположение определенных пар атомов (3.5 ангстрема);
* В данном случае трех атомов белка, образующих водородные связи с тремя атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного расположения атомов пары описаны в строчке 9-10. 3 точки могут однозначно расположить сложную структуру в пространстве, поэтому мы выбираем водородные связи как источник данных точек.
* что ковалентные связи в гетероатомах нужно вычислять по расстояниям между атомами (так же, как это делает Rasmol), строчка 12
* что имя файла с выравниванием и имена последовательностей образца и моделируемого белка, строчка 13 (а имя файла со структурой содержится в выравнивании)
* что число и номера моделей, которые нужно построить (в данном примере 5 моделей), строки 14-15
* что пора строить модель, строчка 16
< В скрипте Вам необходимо отредактировать строчки, в которых указаны какие водородные связи белка с лигандом должны быть '''В БУДУЩЕЙ МОДЕЛИ.''' Номера остатков и имена нужных атомов определите по выравниванию и тому, какие водородные связи имеются в образце. Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.
Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.
'''ВНИМАНИЕ.''' В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Соблюдайте предложенный в заготовке синтаксис.
5.Запустите исполнение скрипта командой
>mod9.11 myscript &
6. Просмотрите полученные Вами моделибВизуальные различия занесите в отчёт.
7. Проверьте качество моделей и выберите лучшую. Инструменты для оценки качества структуры можно найти в веб интерфейсе WHATIF (google://whatif). Достаточно 2-3 инструментов. Выберете лучшую модель.