Adbm2017 pr3

Version 1 (Arthur Zalevsky, 23.03.2017 17:59)

1 1 Arthur Zalevsky
h2. Домашнее задание
2 1 Arthur Zalevsky
3 1 Arthur Zalevsky
Вы должны уверенно освоить следующий список приемов:
4 1 Arthur Zalevsky
5 1 Arthur Zalevsky
# Умение открывать и анализировать хроматограммы, полученные методом секвенирования по Сэнгеру
6 1 Arthur Zalevsky
# Первичная обработка прочтений: тримминг, выравнивание парных ридов (сборка контигов)
7 1 Arthur Zalevsky
# Обработка прочтений: анализ сложных ситуаций, выбор корректного нуклеотида
8 1 Arthur Zalevsky
# Экспорт консенсусной последовательной в формате fasta
9 1 Arthur Zalevsky
10 1 Arthur Zalevsky
h3. Задания
11 1 Arthur Zalevsky
12 1 Arthur Zalevsky
h4.  Установите и запустите один из инструментов для работы с хроматограммами
13 1 Arthur Zalevsky
14 1 Arthur Zalevsky
Я рекомендую использовать "SeqTrace":https://github.com/racaljk/seqtrace или "CodonCodeAligner":http://www.codoncode.com/aligner/
15 1 Arthur Zalevsky
16 1 Arthur Zalevsky
Для работы SeqTrace потребуется PyGTK. 
17 1 Arthur Zalevsky
18 1 Arthur Zalevsky
h4. Выберите объект 
19 1 Arthur Zalevsky
20 1 Arthur Zalevsky
Для дальнейше работы выберите себе пару прочтений от одного из организмов http://vsb.fbb.msu.ru/share/aozalevsky/hse/adbm2017/sanger/raw/
21 1 Arthur Zalevsky
22 1 Arthur Zalevsky
* 16S - 16S РНК
23 1 Arthur Zalevsky
* 18S - фрагменты (I, II, III) 18S РНК
24 1 Arthur Zalevsky
* H3 - гистон H3
25 1 Arthur Zalevsky
* NN - негативный контроль
26 1 Arthur Zalevsky
* <empty> -  1 субъединица цитохром c оксидазы
27 1 Arthur Zalevsky
* F и R - прямой и обратный праймеры
28 1 Arthur Zalevsky
29 1 Arthur Zalevsky
h4. Просмотрите выбранные хроматограммы
30 1 Arthur Zalevsky
31 1 Arthur Zalevsky
Просмотрите хроматограммы, чтобы убедиться, что они разумного качества и вы сможете выцепить из них данные приемлимого качества.
32 1 Arthur Zalevsky
33 1 Arthur Zalevsky
h4. Подберите параметры тримминга
34 1 Arthur Zalevsky
35 1 Arthur Zalevsky
В параметрах (File -> Project settings) поиграйтесь с параметрами тримминга (количество успешно распознанных нуклеотидов, минимальное качество нуклеотида и т.д.). Подберите качество так, чтобы при просмотре последовательности (Trace - View selected trace), увиденное не вызывало у вас внутреннего протеста. Попробуйте сравнить подобранные вами значения со значениями из других программ (CodonCode Aligner, например) или литературы. 
36 1 Arthur Zalevsky
37 1 Arthur Zalevsky
h4. Объедините последовательности
38 1 Arthur Zalevsky
39 1 Arthur Zalevsky
Т.к. представленные хроматограммы соответствуют одной и той же последовательности, попробуйте их сгруппировать в контиги (Traces - Group selected traces). Посмотрите на консенсусную последовательность (нижняя строчка) и оцените количество артефактов в последовательности. 
40 1 Arthur Zalevsky
41 1 Arthur Zalevsky
h4. Исправьте ошибки
42 1 Arthur Zalevsky
43 1 Arthur Zalevsky
Перемещаясь по консенсусной последовательности, найдите все артефакты и постарайтесь их исправить, оперируя выделениями в консенсусной последовательности и кнопками Modify... или Delete... . В процессе редактирования соберите коллекцию из нескольких (минимум 3х) примеров артефактов секвенирования. Например:
44 1 Arthur Zalevsky
* Пик сигнала неотличим от шума
45 1 Arthur Zalevsky
* Пики от нескольких идентичных нуклеотидов сливаются/размываются
46 1 Arthur Zalevsky
* На пик наложилась "грязь" существенно превышающая его по интенсивности
47 1 Arthur Zalevsky
* Нарушена частота пиков. Пик "съехал" относительно ожидаемого положения или вклинился шум
48 1 Arthur Zalevsky
* etc
49 1 Arthur Zalevsky
50 1 Arthur Zalevsky
Для каждой такой ситуации сделайте скриншот и кратко поясните, почему вы решили исправить ситуацию тем или иным способом. 
51 1 Arthur Zalevsky
52 1 Arthur Zalevsky
h4. Экспортируйте последовательность 
53 1 Arthur Zalevsky
54 1 Arthur Zalevsky
Для экспорта в формате fasta спользуSequence - Export Sequence...