Методы секвенирования ДНК

Содержание

Слайд 2

Немного истории 1977 г. - Первый полный геном бактериофага Φ-X174 (5386

Немного истории

1977 г. - Первый полный геном бактериофага Φ-X174 (5386

нуклеотидов) секвенирован методом Shotgun
1995 г. – секвенирование генома первого свободноживущего организма – бактерии Haemophilus influenzae.
Проект «Геном человека» - 1990 – 2003 - 2006 гг., стоимость -15 млрд.$.
Секвенировано 92,3% генома.
2010 г. – завершён проект «тысяча геномов», для каждого персонального генома человека секвенировано около 85% последовательности.

1995 2000 2005 2010

Слайд 3

«Расшифровка» генома Розеттский камень Характерные размеры геномов вирус папиллом человека -

«Расшифровка» генома

Розеттский камень

Характерные размеры геномов
вирус папиллом человека - 8 т.п.о
Escherichia coli

- 4900 т.п.о
Saccharomyces cerevisiae – 12 млн п.о.
Arabidopsis thaliana – 101 млн.п.о
Triticum aestivum – 16 млрд. п.о.
Человек – 3 млрд.п.о.
Слайд 4

Секвенирование по Максаму-Гилберту Химическая деградация ДНК

Секвенирование по Максаму-Гилберту

Химическая деградация ДНК

Слайд 5

Реакция Сэнгера – не ПЦР, а многократный синтез с одной матрицы Секвенирование методом Сэнгера

Реакция Сэнгера – не ПЦР, а
многократный синтез с одной матрицы


Секвенирование методом Сэнгера

Слайд 6

96-capillary ABI 3730XL Первое поколение секвенаторов - капиллярные Нанофор 05 – российская модель

96-capillary ABI 3730XL

Первое поколение секвенаторов - капиллярные

Нанофор 05 – российская модель

Слайд 7

Начало проекта по секвенированию эукариотического генома А) Выбор объекта Б) Подробная

Начало проекта по секвенированию эукариотического генома

А) Выбор объекта
Б) Подробная биологическая характеристика

объекта, изучение его жизненного цикла, их особенностей, отбор варианта для получения и поддерживания материала.
В) Подробное кариотипирование.
С) Выбор стратегии секвенирования
Слайд 8

Стратегия секвенирования генома человека 1) 23 хромосомы человека – 23 подпроекта

Стратегия секвенирования генома человека

1) 23 хромосомы человека – 23 подпроекта по

каждой
2) Субклонирование больших фрагментов генома в BAC-библиотеках встройки 40 000 – 200 000 b.p. (YAC, дрожжевые – до 1 Mb, Cosmid, фаговые – до 45 kb). Суммарно получено 22,000 BAC - клона
3) отдельный Shotgun для каждого клона BAC (40 000 – 200 000 b.p.).

Проект «Геном человека» - 1990 – 2003 - 2006 гг., стоимость – от 3 до 15 млрд.$.
Секвенировано 92,3% генома.

Слайд 9

Упрощённая схема процесса секвенирования генома методом Shotgun Ферментативные методы фрагментации неприменимы

Упрощённая схема процесса секвенирования генома методом Shotgun

Ферментативные методы фрагментации неприменимы

для протяжённых районов.

Необходима комбинация библиотек с различным размером встроек.

Необходим высокопрофессиональный биоинформатический анализ.

Слайд 10

Подробнее Используемые векторы – ранее М13 phagemid Вентер – производная pBR322,

Подробнее

Используемые векторы – ранее М13 phagemid
Вентер – производная pBR322,
Говорун -

pCR2.1 (Invitrogen)
Лейшмания - pUC18
Для больших встроек (30-40 kb) – fosmid vektor pCC1FOS
Слайд 11

1998г. – старт проекта секвенирования первого индивидуального генома человека. Крейг Вентер,

1998г. – старт проекта секвенирования первого индивидуального генома человека. Крейг Вентер,

компания «Celera Genomics»
Использование метода Shotgun без предварительного деления генома на фракции
Преимущественно для бактерий и эукариот с малым геномом (простейшие, грибы).
Набор библиотек – обычно 2, 10, 50, редко до 150 kb
Геном Wenter’a – библиотеки со встройками 2 000 – 300 000 b.p.
Два варианта организации работы – только shotgun с покрытием по геному 6-7 х. Бык – 6х, собака – 7.6х, лошадь – 6.8х, слон 7х etc.
Сочетание shotgun и pair-mate библиотек пиросеквенатора Roche.
Кошка – 2х, кролик – 2х, тупайя – 2х, серый лемур 2х etc.

Whole genome shotgun

Слайд 12

Schook et al., 2005 Схема организации геномного проекта на примере генома

Schook et al., 2005

Схема организации геномного проекта на примере генома свиньи

(2.6 Gb)

А) Секвенирование транскриптома
Б) Секвенирование Shotgun-библиотек с расчётным 3х покрытием, использование библиотек с встройками 3 kb, 10 kb и 50 kb
В) Создание и секвенирование ВАС-библиотек с расчётным 3х покрытием
С) Комбинирование данных при биоинформатическом анализе

Слайд 13

Phred 10 = 90% точность, Phred 20 = 99%, Phred 30 = 99,9%, Phred quality score

Phred 10 = 90% точность, Phred 20 = 99%, Phred 30

= 99,9%,

Phred quality score

Слайд 14

Примеры ошибок и их соотнесение с Phred Компрессия Проскальзывание полимеразы Химерная последовательность - начало конец

Примеры ошибок и их соотнесение с Phred

Компрессия Проскальзывание полимеразы

Химерная

последовательность - начало конец
Слайд 15

Основную часть ДНК в эукариотических геномах составляют повторы. Это делает крайне

Основную часть ДНК в эукариотических геномах составляют повторы. Это делает крайне

затруднительным правильное ассемблирование одиночных последовательностей в длинные геномные контиги.

ДНК не является случайной последовательностью.

Часть последовательностей ДНК выпадает при клонировании/секвенировании, образуя не заполняемые разрывы (gap).

Слайд 16

Зависимость числа и длины контигов от покрытия Разрывы в контигах образуются и по чисто статистическим причинам.

Зависимость числа и длины контигов от покрытия

Разрывы в контигах образуются и

по чисто статистическим причинам.
Слайд 17

Нелинейность в выборе оптимальных параметров Shotgun Изменения в степени покрытия (%)

Нелинейность в выборе оптимальных параметров Shotgun

Изменения в степени покрытия (%) для

16-kb района при 3-х кратном покрытии (48 kb суммарных данных) для различных величин клонированных встроек

Для экономии средств в ходе проекта необходим корректный выбор среднего размера встроек. Кроме того, стремление к максимальной длине прочтения в ущерб количеству прочтений может оказать строго обратный эффект.

Для проекта секвенирования генома лейшмании (35 Mb) [Laurentino et al., 2004] библиотекой на основе pUC18 со встройкой 2 kb покрыто 15% генома

Слайд 18

Этапы биоинформатического анализа Собственно сборка секвенированных последовательностей в геном. Структурная аннотация,

Этапы биоинформатического анализа

Собственно сборка секвенированных последовательностей в геном.
Структурная аннотация, включающая :
идентификацию

различных элементов генома
выявление ORF и их локализация в определённых районах
определение экзон-интронной структуры генов, их кодирующих районов и вариантов транскрипции/сплайсинга
локализация регуляторных районов гена
Функциональная аннотация: связь различных районов генома с их биологической функцией, в том числе с биохимическими процессами, заболеваниями, регуляторными процессами в организме в целом и т.п.
Подтверждение сходства физической карты хромосом и взаимного расположения контигов\скаффолдов
Слайд 19

Революция цены в геномных исследованиях 454 GS20 1000 Геномов SOLiD 3.0 Illumina GA2

Революция цены в геномных исследованиях

454 GS20

1000 Геномов

SOLiD 3.0
Illumina GA2