Поиск схожих последовательностей в базах данных. Локальное выравнивание. Семейство программ серии BLAST
Содержание
- 2. Выравнивание последовательностей —размещение двух или более последовательностей ДНК, РНК или белков друг под другом таким образом,
- 3. Цель выравнивания – добиться максимального количества совпадений. Что лучше? Просто написать последовательности друг под другом Двигать
- 4. Алгоритм локального выравнивания был предложен Т. Ф. Смитом и М. Уотерменом в 1981 г. В обоих
- 5. – Стоимость замены, вcтавки, делеции Значительно чаще 1 длинная делеция, чем много коротких => штраф за
- 6. AACGTTTCCAGTCCAAATAGCTAGGC ===--=== =-===-==-====== AACCGTTC TACAATTACCTAGGC Hits(+1): 18 Misses (-2): 5 Gaps (existence -2, extension -1): 1
- 7. http://blast.ncbi.nlm.nih.gov/Blast.cgi BLAST (Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков
- 8. Используя BLAST, можно сравнить имеющуюся последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов.
- 9. Принципы работы BLAST 1. Для каждого слова длины W в искомой последовательности составляется список схожих слов,
- 10. 2. Для каждого слова обрабатываем составленный для него список схожих слов - ищем, по заранее построенной
- 11. 3. Расширяем выравнивание вправо и влево от найденных “затравок” используя алгоритм динамического программирования сначала без гэпов
- 13. После максимального продления размеров всех возможных «слов» изучаемой последовательности, определяются выравнивания с максимальным количеством совпадений для
- 18. ДНК: megaBLAST – другой алгоритм для сравнения ДНК. Оптимизирован для длинных похожих последовательностей. Оптимален для поиска
- 20. Пример последовательности в формате FASTA : >OVAX_CHICK GENE X PROTEIN QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAEKMKILELPFASGDLSMLVLLPDEVSDLERIEKTINFEKLTEWTNPNTMEKRRVKVY Пустые строки в середине не
- 21. Вырожденные нуклеотидные коды (красный цвет), рассматриваются как «mismatches» нуклеотидного выравнивания. Для тех программ, которые используют аминокислотные
- 22. Nucleotide Sequence Databases Nr All GenBank + RefSeq Nucleotides + EMBL + DDBJ + PDB sequences
- 23. Peptide Sequence Databases Nr All non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt
- 25. Белок: PSI-BLAST (Position-Specific Iterated -BLAST) поиск удаленных белковых гомологов с использованием PSSM (position-specific scoring matrix) PHI-BLAST
- 27. При определении сходства ключевым элементом является матрица замен, так как она определяет показатели сходства для любой
- 28. Выбор параметров Меняйте параметры только, если по умолчанию не работает (параметры по умолчанию подобраны хорошо для
- 29. Выбор параметров Матрица:BLOSUM для локального выравнивания обычно лучше, чем PAM Чем выше номер BLOSUM – тем
- 33. E-value (the expectation value) – представляет число различных элайментов с баллами эквивалентными или лучшими, чем S,
- 39. PSI – BLAST Алгоритм: Несколько раундов поиска Первый раунд – просто blastp (BLOSUM62) Построение PSSM на
- 41. DELTA – BLAST (Domain Enhanced Lookup Time Accelerated BLAST)
- 48. MEGAN V5.11.3 http://ab.inf.uni-tuebingen.de/software/megan/ Основное применение программы для разбора и анализа результата BLAST сравнения набора ридов против
- 49. MEGAN V5.11.3 http://ab.inf.uni-tuebingen.de/software/megan/ The aim of MEGAN is to provide a tool for studying the taxonomic
- 50. MEGAN V5.11.3 http://ab.inf.uni-tuebingen.de/software/megan/ However, the main application of the program is to parse and analyze the
- 51. MEGAN V5.11.3 http://ab.inf.uni-tuebingen.de/software/megan/ New input to the program is usually provided as a BLAST file obtained
- 54. DNA Master http://cobamide2.bio.pitt.edu/ DNA Master это Multiple Document Interface (MDI) программа для создания, модификации и анализа
- 55. domain A discrete portion of a protein assumed to fold independently of the rest of the
- 56. RAST (Rapid Annotation using Subsystem Technology) is a fully-automated service for annotating bacterial and archaeal genomes.
- 58. LOCUS FJ795028 701 bp mRNA linear PRI 06-APR-2009 DEFINITION Homo sapiens tumor necrosis factor alpha (TNF)
- 59. CDS /gene="TNF" /note="APC1 protein" /codon_start=3 /product="tumor necrosis factor alpha" /protein_id="ACO37640.1" /db_xref="GI:226201421" /translation="STESMIRDVELAEEALPKKTGGPQGSRRCLFLSLFSFLIVAGAT TLFCLLHFGVIGPQREEFPRDLSLISPLAQAVRSSSRTPSDKPVAHVVANPQAEGQLQ WLNRRANALLANGVELRDNQLVVPSEGLYLIYSQVLFKGQGCPSTHVLLTHTISRIAV SYQTKVNLLSAIKSPCQRETPEGAEAKPWYEPIYLGGVFQLEKGDRLSAEINRPDYLD FAESGQVYFGIIAL«
- 61. Скачать презентацию