Домашнее задание

Вы должны уверенно освоить следующий список приемов:

  1. Умение открывать и анализировать хроматограммы, полученные методом секвенирования по Сэнгеру
  2. Первичная обработка прочтений: тримминг, выравнивание парных ридов (сборка контигов)
  3. Обработка прочтений: анализ сложных ситуаций, выбор корректного нуклеотида
  4. Экспорт консенсусной последовательной в формате fasta

Задания

Установите и запустите один из инструментов для работы с хроматограммами

Я рекомендую использовать SeqTrace или CodonCodeAligner

Для работы SeqTrace потребуется PyGTK.

Выберите объект

Для дальнейше работы выберите себе пару прочтений от одного из организмов http://vsb.fbb.msu.ru/share/aozalevsky/hse/adbm2017/sanger/raw/

  • 16S - 16S РНК
  • 18S - фрагменты (I, II, III) 18S РНК
  • H3 - гистон H3
  • NN - негативный контроль
  • <empty> - 1 субъединица цитохром c оксидазы
  • F и R - прямой и обратный праймеры

Просмотрите выбранные хроматограммы

Просмотрите хроматограммы, чтобы убедиться, что они разумного качества и вы сможете выцепить из них данные приемлимого качества.

Подберите параметры тримминга

В параметрах (File -> Project settings) поиграйтесь с параметрами тримминга (количество успешно распознанных нуклеотидов, минимальное качество нуклеотида и т.д.). Подберите качество так, чтобы при просмотре последовательности (Trace - View selected trace), увиденное не вызывало у вас внутреннего протеста. Попробуйте сравнить подобранные вами значения со значениями из других программ (CodonCode Aligner, например) или литературы.

Объедините последовательности

Т.к. представленные хроматограммы соответствуют одной и той же последовательности, попробуйте их сгруппировать в контиги (Traces - Group selected traces). Посмотрите на консенсусную последовательность (нижняя строчка) и оцените количество артефактов в последовательности.

Исправьте ошибки

Перемещаясь по консенсусной последовательности, найдите все артефакты и постарайтесь их исправить, оперируя выделениями в консенсусной последовательности и кнопками Modify... или Delete... . В процессе редактирования соберите коллекцию из нескольких (минимум 3х) примеров артефактов секвенирования. Например:
  • Пик сигнала неотличим от шума
  • Пики от нескольких идентичных нуклеотидов сливаются/размываются
  • На пик наложилась "грязь" существенно превышающая его по интенсивности
  • Нарушена частота пиков. Пик "съехал" относительно ожидаемого положения или вклинился шум
  • etc

Для каждой такой ситуации сделайте скриншот и кратко поясните, почему вы решили исправить ситуацию тем или иным способом.

Экспортируйте последовательность

Для экспорта в формате fasta спользуSequence - Export Sequence...