Домашнее задание¶
Вы должны уверенно освоить следующий список приемов:
- Умение открывать и анализировать хроматограммы, полученные методом секвенирования по Сэнгеру
- Первичная обработка прочтений: тримминг, выравнивание парных ридов (сборка контигов)
- Обработка прочтений: анализ сложных ситуаций, выбор корректного нуклеотида
- Экспорт консенсусной последовательной в формате fasta
Задания¶
Установите и запустите один из инструментов для работы с хроматограммами¶
Я рекомендую использовать SeqTrace или CodonCodeAligner
Для работы SeqTrace потребуется PyGTK.
Выберите объект¶
Для дальнейше работы выберите себе пару прочтений от одного из организмов http://vsb.fbb.msu.ru/share/aozalevsky/hse/adbm2017/sanger/raw/
- 16S - 16S РНК
- 18S - фрагменты (I, II, III) 18S РНК
- H3 - гистон H3
- NN - негативный контроль
- <empty> - 1 субъединица цитохром c оксидазы
- F и R - прямой и обратный праймеры
Просмотрите выбранные хроматограммы¶
Просмотрите хроматограммы, чтобы убедиться, что они разумного качества и вы сможете выцепить из них данные приемлимого качества.
Подберите параметры тримминга¶
В параметрах (File -> Project settings) поиграйтесь с параметрами тримминга (количество успешно распознанных нуклеотидов, минимальное качество нуклеотида и т.д.). Подберите качество так, чтобы при просмотре последовательности (Trace - View selected trace), увиденное не вызывало у вас внутреннего протеста. Попробуйте сравнить подобранные вами значения со значениями из других программ (CodonCode Aligner, например) или литературы.
Объедините последовательности¶
Т.к. представленные хроматограммы соответствуют одной и той же последовательности, попробуйте их сгруппировать в контиги (Traces - Group selected traces). Посмотрите на консенсусную последовательность (нижняя строчка) и оцените количество артефактов в последовательности.
Исправьте ошибки¶
Перемещаясь по консенсусной последовательности, найдите все артефакты и постарайтесь их исправить, оперируя выделениями в консенсусной последовательности и кнопками Modify... или Delete... . В процессе редактирования соберите коллекцию из нескольких (минимум 3х) примеров артефактов секвенирования. Например:- Пик сигнала неотличим от шума
- Пики от нескольких идентичных нуклеотидов сливаются/размываются
- На пик наложилась "грязь" существенно превышающая его по интенсивности
- Нарушена частота пиков. Пик "съехал" относительно ожидаемого положения или вклинился шум
- etc
Для каждой такой ситуации сделайте скриншот и кратко поясните, почему вы решили исправить ситуацию тем или иным способом.
Экспортируйте последовательность¶
Для экспорта в формате fasta спользуSequence - Export Sequence...