ShadTask4

Version 11 (Andrey Golovin, 29.11.2016 19:10)

1 1 Andrey Golovin
h1. Гомологичное моделирование комплекса белка с лигандом 
2 1 Andrey Golovin
3 1 Andrey Golovin
    * Отчёт должен содержать все файлы необходимы для моделирования и описание их получения. 
4 1 Andrey Golovin
    * Необходимо представить в отчёте результаты моделирования и результаты проверки качества структур. 
5 1 Andrey Golovin
    * Необходимо представить обсуждение результата.
6 1 Andrey Golovin
7 1 Andrey Golovin
h3. Традиционные ссылки на полезные ресурсы: 
8 1 Andrey Golovin
9 1 Andrey Golovin
  * "Уроки по работе с Modeller":http://salilab.org/modeller/tutorial 
10 1 Andrey Golovin
  * "Напоминание о Python":https://kodomo.fbb.msu.ru/wiki/Main/Modelling/PyPymol  от Александра Гришина.
11 1 Andrey Golovin
  * [[tip4|Подсказки]]
12 1 Andrey Golovin
  * "команды баш, коротко":http://kodomo.fbb.msu.ru/wiki/2011/1/bash-hints
13 1 Andrey Golovin
  * "Bash cheatsheet":http://kodomo.fbb.msu.ru/FBB/year_11/term1/latexsheet.pdf
14 1 Andrey Golovin
15 9 Andrey Golovin
16 9 Andrey Golovin
h3. Набросок выполнения работы в Jupyter
17 9 Andrey Golovin
18 11 Andrey Golovin
attachment:modeller_teach_ligand.html или http://vsb.fbb.msu.ru/attachments/download/517/modeller_teach_ligand.html
19 11 Andrey Golovin
20 9 Andrey Golovin
21 7 Andrey Golovin
Вся работа по расчётам будет проходить на хосте vsb.fbb.msu.ru порт 22025 через терминал "putty":http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html (shad/shad123). Для копирования файлов используйте "WinSCP":http://winscp.net/eng/download.php . Создайте свою рабочую папку и в ней работайте.
22 1 Andrey Golovin
23 1 Andrey Golovin
24 1 Andrey Golovin
Цель данного занятия ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом. В этом занятии мы будем пользоваться пакетом Modeller. Это программное обеспечение распространяется бесплатно для академических пользователей.
25 1 Andrey Golovin
26 1 Andrey Golovin
27 1 Andrey Golovin
Вы будете работать с белком лизоцимом из [[table|указанного организма]]. Используя известную структуру лизоцима форели как образец, Вам необходимо построить модель комплекса Вашего белка с лигандом.
28 1 Andrey Golovin
29 1 Andrey Golovin
Программе MODELLER для моделирования структуры белков, в качестве входных данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл выравнивания с дополнительной информацией.
30 1 Andrey Golovin
 
31 8 Andrey Golovin
# Постройте выравнивание последовательности из структуры ID: 1lmp и предложенного Вам белка. Рекомендуемые ресурсы и программы: "Clustal": http://www.genome.jp/tools/clustalw/ Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR.
32 1 Andrey Golovin
# Модификация файла выравнивания:
33 1 Andrey Golovin
34 1 Andrey Golovin
Переименуйте последовательность в файле выравнивания как в примере:
35 1 Andrey Golovin
36 1 Andrey Golovin
|Было|Стало|
37 3 Andrey Golovin
|>P1;uniprot P37712 LYSC_CAMDR|>P1;seq|
38 3 Andrey Golovin
|>P1;1LMP PDBID CHAIN SEQUENCE|>P1;1lmp|
39 1 Andrey Golovin
40 1 Andrey Golovin
После имени последовательности моделируемого белка добавьте строчку: 
41 1 Andrey Golovin
>sequence:ХХХХХ:::: 0.00: 0.00 
42 1 Andrey Golovin
43 1 Andrey Golovin
эта строчка описывает входные параметры последовательности для modeller.
44 1 Andrey Golovin
После имени последовательности белка-образца добавьте: 
45 1 Andrey Golovin
>structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00 
46 1 Andrey Golovin
эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д. В конце каждой последовательности добавьте символ
47 1 Andrey Golovin
<pre>
48 1 Andrey Golovin
. 
49 1 Andrey Golovin
</pre>
50 1 Andrey Golovin
Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки). 
51 1 Andrey Golovin
52 5 Andrey Golovin
3. Модификация файла со структурой: удалите всю воду из структуры (в текстовом редакторе) всем атомам лиганда присвойте один и тот же номер "остатка" (MODELLER считает, что один лиганд = один остаток) и модифицируйте имена атомов каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д. . После модификации имен атомов измените номера остатков на 130.
53 1 Andrey Golovin
Пример: 
54 1 Andrey Golovin
55 3 Andrey Golovin
|Было|Стало|
56 1 Andrey Golovin
|HETATM 1014 O7 NAG 130|HETATM 1014 O7A NAG 130|
57 1 Andrey Golovin
|HETATM 1015 C1 NAG 131|HETATM 1015 C1B NAG 130|
58 1 Andrey Golovin
59 1 Andrey Golovin
сохраните в файле 1lmp_now.ent 
60 5 Andrey Golovin
61 5 Andrey Golovin
4.Создание управляющего скрипта my_seq.py (my_seq - имя Вашей последовательности, например, lysc_chram)
62 5 Andrey Golovin
63 1 Andrey Golovin
Вам представляется следующая заготовка: 
64 3 Andrey Golovin
<pre><code class="python">
65 1 Andrey Golovin
from modeller.automodel import *
66 1 Andrey Golovin
class mymodel(automodel):
67 1 Andrey Golovin
    def special_restraints(self, aln):
68 1 Andrey Golovin
        rsr = self.restraints
69 1 Andrey Golovin
        for ids in (('OD1:98:A', 'O6A:131:A'),
70 1 Andrey Golovin
                    ('N:65:A', 'O7B:132:A'),
71 1 Andrey Golovin
                    ('OD2:73:A', 'O1C:133:A')):
72 1 Andrey Golovin
                    atoms = [self.atoms[i] for i in ids]
73 1 Andrey Golovin
                    rsr.add(forms.upper_bound(group=physical.upper_distance,
74 1 Andrey Golovin
                    feature=features.distance(*atoms), mean=3.5, stdev=0.1)) 
75 1 Andrey Golovin
env = environ()
76 1 Andrey Golovin
env.io.hetatm = True
77 1 Andrey Golovin
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
78 1 Andrey Golovin
a.starting_model = 1
79 1 Andrey Golovin
a.ending_model = 5
80 1 Andrey Golovin
a.make()
81 1 Andrey Golovin
</code></pre>
82 1 Andrey Golovin
83 1 Andrey Golovin
В скрипте указано:
84 1 Andrey Golovin
85 1 Andrey Golovin
 * что нужно использовать стандартные валентные углы в полипептидной цепи (строчка 4)
86 1 Andrey Golovin
 * что дополнительно нужно сохранять взаимное расположение определенных пар атомов (3.5 ангстрема);
87 1 Andrey Golovin
 * В данном случае трех атомов белка, образующих водородные связи с тремя атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного расположения атомов пары описаны в строчке 9-10. 3 точки могут однозначно расположить сложную структуру в пространстве, поэтому мы выбираем водородные связи как источник данных точек.
88 1 Andrey Golovin
 * что ковалентные связи в гетероатомах нужно вычислять по расстояниям между атомами (так же, как это делает Rasmol), строчка 12
89 1 Andrey Golovin
 * что имя файла с выравниванием и имена последовательностей образца и моделируемого белка, строчка 13 (а имя файла со структурой содержится в выравнивании)
90 1 Andrey Golovin
 * что число и номера моделей, которые нужно построить (в данном примере 5 моделей), строки 14-15
91 1 Andrey Golovin
 * что пора строить модель, строчка 16
92 1 Andrey Golovin
93 5 Andrey Golovin
> В скрипте Вам необходимо отредактировать строчки, в которых указаны какие водородные связи белка с лигандом должны быть '''В БУДУЩЕЙ МОДЕЛИ.''' Номера остатков и имена нужных атомов определите по выравниванию и тому, какие водородные связи имеются в образце. Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда. 
94 1 Andrey Golovin
95 1 Andrey Golovin
Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.
96 1 Andrey Golovin
97 1 Andrey Golovin
'''ВНИМАНИЕ.''' В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Соблюдайте предложенный в заготовке синтаксис.
98 1 Andrey Golovin
99 6 Andrey Golovin
5.Запустите исполнение скрипта командой
100 5 Andrey Golovin
101 1 Andrey Golovin
>mod9.11 myscript & 
102 1 Andrey Golovin
 6. Просмотрите полученные Вами моделибВизуальные различия занесите в отчёт. 
103 1 Andrey Golovin
 7. Проверьте качество моделей и выберите лучшую. Инструменты для оценки качества структуры можно найти в веб интерфейсе WHATIF (google://whatif). Достаточно 2-3 инструментов. Выберете лучшую модель.