Поисковые системы и базы данных

1. С помощью SRS найдите ваш белок в банке SwissProt и опишите не менее трех "особенностей" (features) в его аминокислотной последовательности

  • SRS http://srs.ebi.ac.uk/
  • На странице Library page отметьте UniPRotKB/Swiss-Prot
  • Выберите Standard Query Form
  • В одном из полей запроса выберите ID и внесите в окошко идентификатор вашего белка (или выберите Accession Number и внесите в окошко код доступа белка).
  • Нажмите Search. Проследуйте по гиперссылке в левом столбце таблицы.
  • Выберите очередную особенность. Рекомендую выбрать такую, которая относится к целому участку, а не к одному остатку. Пройдите по гиперссылке. Сохраните информацию об особенности в протоколе для последующего оформления на сайте(в данном случае проще скопировать с экрана). Опишите своими словами в чем состоит особенность. Последовательность особенности должна быть приведена обязательно.

2. Получите и сохраните описание всех записей банка трехмерных структур PDB, относящихся к вашему белку

  • Вернитесь на страницу находок
  • Обратите внимание на окошко Apply options to слева. В нем указано к каким находкам буду применяться последующие действия. Отметьте галочкой находку, если сочтете необходимым.
  • Перейдите по ссылке Link to related information
  • Выберите банк PDB
  • Получив список, сохраните информацию по ссылке Save. Перед сохранением следует следить за тем, что в окошке указано: * сохранение в текстовом формате - File(text) * число Number of entries to download больше числа сохраняемых записей * результат сохраняется в нужном вам виде; в данном случае, Save with view установить на PDBShortView (а можно было бы выбрать Complete entries, или fasta sequences, или др.) * имя и расширение сохраняемого файла были подходящими

3. Найдите полноразмерные белки из Firmicutes, выполняющие функцию, сходную с функцией вашего белка

  • Пользуясь SRS, составьте несколько (не менее двух) запросов к банку Swissprot и заполните Таблицу
  • Строка запроса содержится в верхней части страницы с результатами, в окошке Query.
  • При составлении запроса имейте в виду, что слова, входящие в описание вашего белка, ''приндексированы'' независимо друг от друга, поэтому имеет смысл вводить их по одному, соединяя знаком &.
  • Чтобы исключить записи, содержащие лишь фрагмент последовательности, используйте оператор НО НЕ и тот факт, что слово fragment указывается в поле DE. Составьте запрос и на все последовательности, и на полноразмерные (не фрагменты) только.
  • Если описание содержит несколько синонимов (в таблице синонимы названы "формулировками функции"), то имеет смысл сделать несколько запросов - по одному на каждый синоним. Если синонимов нет, ограничьтесь одним запросом.
  • Для проверки почему запрос не дает ожидаемого результата используйте ссылку i слева от строки запроса, в которой выбрано поле для поиска. Если в открывшееся окошко List values that match введёте искомое слово, и, при необходимости, "*" на конце, то получите полную информацию о его встречаемости в данном поле в данном банке.

4. Сохраните полноразмерные последовательности найденных белков в fasta формате

  • Вернитесь к наиболее подходящему запросу из задания 3. Для этого перейдите по ссылке Results из верхнего меню, отметьте галочкой нужный запрос из списка всех ваших запросов и Return query. Если находок много (больше 10), то отметьте галочками 10 из них, желательно, действительно гомологичных (т.е. родственных) вашему белку. Если находок мало (меньше 10), то ищите по БД Uniprot.
  • См. инструкции по сохранению к заданию 2.

5. Сохраните список последовательностей из задания 4, в котором указаны ID, AC последовательностей, организм (Species), название белка (Description) и длина последовательности

  • Вернитесь к стандартной форме запроса, введите тот же запрос (в вашей Таблице 3-1 он указан)
  • Ниже запроса в разделе Create view выберите нужные поля, Search
  • Если необходимо, отметьте те последовательность, которые были сохранены в fasta формате
  • Сохраните результат: Save. Заказанный вами вид (view) таблицы будет называться SWISSPROT1 или как-то похоже. Сохраните этот вид в файле с подходящим названием и расширением .xls, он представляет из себя плоскую таблицу, которая открывается Excel.

На вашей html странице поставьте ссылку на полученный файл.

Дополнительные задания

6.Найдите и изучите страницу с описанием поля "Taxonomy" банка Swissprot

  • В SRS на Library Page щелкните по названию банка. Откроется страница с описанием банка. В нижней части этой страницы имеется список полей; названия полей оформлены как гиперссылки на их описания.
  • Пользуясь возможностями, предоставляемыми этой страницей, ответьте на вопросы (ответы внесите в протокол):
    • Названия каких таксонов начинаются на "bacil"?
    • Сколько в банке Swissprot записей, описывающих белки из рода Bacillus?
    • Сколько в банке Swissprot записей, описывающих белки из отдела Firmicutes?

7. Найдите записи SwissProt , связанные с научными интересами известного российского (советского)биолога А.А.Нейфаха

  • Для тех записей, в которых Нейфах - автор первой публикации, сохраните табличку Excel, включающую описание белка; авторов, название и год публикации.
  • Опишите научный интерес Нейфаха.
  • Используйте следующие возможности SRS:
    • включение символов '*' и '?' в слова запроса.
    • на странице запроса задание полей, выводимы в таблицу с результатом, см. задание 5
    • выбор находок для сохранения (checkbox): публикации, среди авторов которых нет Нейфаха, следует убрать из таблицы.
    • возможности сохранения (save)