Task3
Version 19 (Andrey Golovin, 27.09.2019 13:17) → Version 20/22 (Andrey Golovin, 04.10.2021 17:06)
h1. Хемоинформатика
lecture: http://kodomo.fbb.msu.ru/~golovin/l2.pdf
Цель занятия — используя пакет модулей RDkit предложить аналог ибупрофена:
* на сайте PubChem найти все радикалы c азидом для Click Chemistry и скачать их SMILES нотации
* Найти формулу ибупрофена и предложить способ изменения его SMILES для эмуляции реагента "Click Chemistry":https://en.wikipedia.org/wiki/Click_chemistry#Copper.28I.29-catalyzed_azide-alkyne_cycloaddition_.28CuAAC.29 (заменить изопропил на этин он же ацителен)
* Заменить в найденых радикалах азидную группу на модифцированный ибупрофен.
* Превратить новые SMILES в объекты-молекулы
* Отобрать те молекулы, которые удовлетворяют "правилу пяти Lipinski":https://en.wikipedia.org/wiki/Lipinski%27s_rule_of_five
h2. Подсказки:
* shadbox — это виртуальная машина, на которой вы можете выполнять занятия. Модули из практикума также можно установить локально: см. файл conda.install
* shadbox также известен как shadbox.vsb.fbb.msu.ru .
* Всю работу выполняем в Jupiter Notebook, можно запускать как локально, так и на "Colab":https://colab.research.google.com/drive/1gBkrpxFAH-Fmn8QtThRUYKlCU52DiUXn?usp=sharing
shadbox
* Добавим путь к conda и активируем профиль с помощью терминала Jupyter :
<pre><code class="bash">
export PATH="/home/shad/miniconda2/bin:$PATH"
source activate hse
python -m ipykernel install --user --display-name "Python 2.7 HSE"
или
export PATH="/home/shad/miniconda3/bin:$PATH"
source activate py37-hse
python -m ipykernel install --user --display-name "Python 3.7 HSE"
</code></pre>
* Создадим новый notebook Python 2.7 HSE и загрузим модули RDkit (мануал: http://www.rdkit.org/docs/GettingStartedInPython.html )
<pre><code class="python">
from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit import RDConfig
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import Draw
import numpy as np
from IPython.display import display,Image
</code></pre>
* Нарисуем ибупрофен
<pre><code class="python">
ibu=Chem.MolFromSmiles('CC(C)CC1=CC=C(C=C1)C(C)C(=O)O')
AllChem.Compute2DCoords(ibu)
display(ibu)
</code></pre>
* Посчитаем параметры для правила Липински
<pre><code class="python">
import rdkit.Chem.Lipinski as Lipinksy
print Lipinksy.NumHDonors(ibu)
print Lipinksy.NumHAcceptors(ibu)
print Lipinksy.rdMolDescriptors.CalcExactMolWt(ibu)
print Lipinksy.rdMolDescriptors.CalcCrippenDescriptors(ibu)[0]
</code></pre>
* Загрузим скачанные данные и отфильтруем
<pre><code class="python">
strings=np.genfromtxt('2515324818764782706.txt',dtype=np.str)
for line in strings:
if len(line[1]) < 30 and not '.' in line[1]:
smiles.append(line[1])
</code></pre>
* Построим новые молекулы и отфильтруем
<pre><code class="python">
for smi in smiles[:1500]:
if азид in smi:
newsmi=smi.replace('N=[N+]=[N-]',template)
else:
continue
</code></pre>
* Новую молекулу лучше создавать в try из-за битых smiles
<pre><code class="python">
try:
newmol=Chem.MolFromSmiles
if новая молекулу удолтворяет правилу 5
сохраним в массив
и покажем
except:
pass
</code></pre>
* Наводим красоту за бонусные баллы, постройте 3D структуру и покрутите её
* можно сделать большую картинку с Draw.MolsToGridImage
* как сделать конформацию лиганда:
<pre><code class="python">
m3d=Chem.AddHs(m2d)
Chem.AllChem.EmbedMolecule(m3d)
AllChem.MMFFOptimizeMolecule(m3d,maxIters=500,nonBondedThresh=200 )
</code></pre>
* загрузим NGL viewer
<pre><code class="python">
import nglview as nv
</code></pre>
* и покажем первую конформацию
<pre><code class="python">
nv.show_rdkit(m3d)
</code></pre>
lecture: http://kodomo.fbb.msu.ru/~golovin/l2.pdf
Цель занятия — используя пакет модулей RDkit предложить аналог ибупрофена:
* на сайте PubChem найти все радикалы c азидом для Click Chemistry и скачать их SMILES нотации
* Найти формулу ибупрофена и предложить способ изменения его SMILES для эмуляции реагента "Click Chemistry":https://en.wikipedia.org/wiki/Click_chemistry#Copper.28I.29-catalyzed_azide-alkyne_cycloaddition_.28CuAAC.29 (заменить изопропил на этин он же ацителен)
* Заменить в найденых радикалах азидную группу на модифцированный ибупрофен.
* Превратить новые SMILES в объекты-молекулы
* Отобрать те молекулы, которые удовлетворяют "правилу пяти Lipinski":https://en.wikipedia.org/wiki/Lipinski%27s_rule_of_five
h2. Подсказки:
* shadbox — это виртуальная машина, на которой вы можете выполнять занятия. Модули из практикума также можно установить локально: см. файл conda.install
* shadbox также известен как shadbox.vsb.fbb.msu.ru .
* Всю работу выполняем в Jupiter Notebook, можно запускать как локально, так и на "Colab":https://colab.research.google.com/drive/1gBkrpxFAH-Fmn8QtThRUYKlCU52DiUXn?usp=sharing
shadbox
* Добавим путь к conda и активируем профиль с помощью терминала Jupyter :
<pre><code class="bash">
export PATH="/home/shad/miniconda2/bin:$PATH"
source activate hse
python -m ipykernel install --user --display-name "Python 2.7 HSE"
или
export PATH="/home/shad/miniconda3/bin:$PATH"
source activate py37-hse
python -m ipykernel install --user --display-name "Python 3.7 HSE"
</code></pre>
* Создадим новый notebook Python 2.7 HSE и загрузим модули RDkit (мануал: http://www.rdkit.org/docs/GettingStartedInPython.html )
<pre><code class="python">
from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit import RDConfig
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import Draw
import numpy as np
from IPython.display import display,Image
</code></pre>
* Нарисуем ибупрофен
<pre><code class="python">
ibu=Chem.MolFromSmiles('CC(C)CC1=CC=C(C=C1)C(C)C(=O)O')
AllChem.Compute2DCoords(ibu)
display(ibu)
</code></pre>
* Посчитаем параметры для правила Липински
<pre><code class="python">
import rdkit.Chem.Lipinski as Lipinksy
print Lipinksy.NumHDonors(ibu)
print Lipinksy.NumHAcceptors(ibu)
print Lipinksy.rdMolDescriptors.CalcExactMolWt(ibu)
print Lipinksy.rdMolDescriptors.CalcCrippenDescriptors(ibu)[0]
</code></pre>
* Загрузим скачанные данные и отфильтруем
<pre><code class="python">
strings=np.genfromtxt('2515324818764782706.txt',dtype=np.str)
for line in strings:
if len(line[1]) < 30 and not '.' in line[1]:
smiles.append(line[1])
</code></pre>
* Построим новые молекулы и отфильтруем
<pre><code class="python">
for smi in smiles[:1500]:
if азид in smi:
newsmi=smi.replace('N=[N+]=[N-]',template)
else:
continue
</code></pre>
* Новую молекулу лучше создавать в try из-за битых smiles
<pre><code class="python">
try:
newmol=Chem.MolFromSmiles
if новая молекулу удолтворяет правилу 5
сохраним в массив
и покажем
except:
pass
</code></pre>
* Наводим красоту за бонусные баллы, постройте 3D структуру и покрутите её
* можно сделать большую картинку с Draw.MolsToGridImage
* как сделать конформацию лиганда:
<pre><code class="python">
m3d=Chem.AddHs(m2d)
Chem.AllChem.EmbedMolecule(m3d)
AllChem.MMFFOptimizeMolecule(m3d,maxIters=500,nonBondedThresh=200 )
</code></pre>
* загрузим NGL viewer
<pre><code class="python">
import nglview as nv
</code></pre>
* и покажем первую конформацию
<pre><code class="python">
nv.show_rdkit(m3d)
</code></pre>