Структура и полиморфизм геномов. Занятие 4

Содержание

Слайд 2

Филогенетическое древо живых организмов

Филогенетическое древо живых организмов

Слайд 3

Размеры геномов

Размеры геномов

Слайд 4

Открытая рамка считывания (Open Reading Frame, ORF) Потенциально кодирующая последовательность в

Открытая рамка считывания (Open Reading Frame, ORF)

Потенциально кодирующая последовательность в геноме:
Начинается

с инициирующего кодона (старт-кодон) (ATG)
На большом расстоянии отсутствуют терминирующие кодоны (стоп-кодоны) (TAA, TGA, TAG)
Один инициирующий кодон даёт 6 вариантов потенциальных генов (чтение из положений +1, +2, +3 с двух цепей ДНК).
Слайд 5

Транскрипция Кодирующая (смысловая; +) цепь: 5′-CTGCTAGAATCAT-3′ Матричная (-) цепь: 3′-GACGATCTTAGTA-5′ мРНК-транскрипт: 5′-CUGCUAGAAUCAU-3′

Транскрипция

Кодирующая (смысловая; +) цепь: 5′-CTGCTAGAATCAT-3′
Матричная (-) цепь: 3′-GACGATCTTAGTA-5′
мРНК-транскрипт: 5′-CUGCUAGAAUCAU-3′

Слайд 6

Особенности геномов прокариот (бактерий и архей) Сравнительно малый размер (~105-107п.н.) Гаплоидность

Особенности геномов прокариот (бактерий и архей)

Сравнительно малый размер (~105-107п.н.)
Гаплоидность
Унипартитность/Бипартитность (одна-две разные

хромосомы)
Распространённость кольцевых геномов
Наличие плазмидного эписомного генома (~103-106п.н.)
Большая плотность генов (90% генома – кодирующие последовательности)
Гены часто организованы в общую группу транскрипции (оперон)
Гены практически не содержат интронов
Средний размер гена ~ 1000 п.н.
Слайд 7

Структура бактериального оперона

Структура бактериального оперона

Слайд 8

Особенности геномов эукариот Сравнительно большой размер (~108-109 п.н.) Мультипартитность и мультиплоидность

Особенности геномов эукариот

Сравнительно большой размер (~108-109 п.н.)
Мультипартитность и мультиплоидность
Организация в виде

хроматина, имеющего тонкую структуру
Малая плотность генов (90% генома – некодирующие последовательности)
Гены крайне редко организованы в общую группу транскрипции (оперон), транскрибируются по отдельности
Гены мозаичны – содержат кодирующие участки экзоны (~5-6) и некодирующие интроны (~4-5)
Длина интрона (~2000 п.н.) в 10 раз превышает длину экзонов (~200 п.н.)
Средний размер гена ~ 10000 п.н.
Слайд 9

Открытая рамка считывания у эукариот Инициирующий кодон ATG Стоп-кодоны TAA/TAG/TGA Интроны

Открытая рамка считывания у эукариот

Инициирующий кодон ATG
Стоп-кодоны TAA/TAG/TGA
Интроны ограничены сайтами сплайсинга

(SS)
– 5' SS: GT
– 3' SS: AG
Слайд 10

Мозаичное строения эукариотного гена

Мозаичное строения эукариотного гена

Слайд 11

Инфраструктура генома Кодирующие последовательности (гены) – белковые (структурные и регуляторные) –

Инфраструктура генома

Кодирующие последовательности (гены)
– белковые (структурные и регуляторные)
– РНК-гены
– гены мобильных

генетических элементов и интронов (прокариоты)
Некодирующие последовательности
– контролирующие генетические элементы (промоторы, терминаторы, операторы)
– повторяющиеся последовательности (повторы)
– внутренние спейсеры (прокариоты) и интроны (эукариоты)
– другие регуляторные последовательности
Слайд 12

Гены белков Однокопийные/многокопийные Паралогичные Гены-сироты (orphan genes) Криптические (молчащие) Псевдогены Взаимноперекрывающиеся

Гены белков

Однокопийные/многокопийные
Паралогичные
Гены-сироты (orphan genes)
Криптические (молчащие)
Псевдогены
Взаимноперекрывающиеся

Слайд 13

РНК-гены snRNA – малая ядерная РНК lncRNA – длинная некодирующая РНК

РНК-гены

snRNA – малая ядерная РНК
lncRNA – длинная некодирующая РНК
miRNA – микроРНК
crRNA

– CRISPR-РНК
Слайд 14

Повторяющиеся некодирующие последовательности короткие ( 100 п.н.) прямые или инвертированные тандемные или диспергированные

Повторяющиеся некодирующие последовательности
короткие (<100 п.н.) или длинные (>100 п.н.)
прямые или инвертированные
тандемные

или диспергированные
Слайд 15

Тандемные повторы – результат ошибки в работе ДНК-полимеразы

Тандемные повторы – результат ошибки в работе ДНК-полимеразы

Слайд 16

Диспергированные повторы – ретротранспозоны

Диспергированные повторы – ретротранспозоны

Слайд 17

Пространственное взаимодействие в геноме эукариот

Пространственное взаимодействие в геноме эукариот

Слайд 18

Топологически ассоциированные домены (TAD) – области наиболее тесного взаимодействия в геноме

Топологически ассоциированные домены (TAD) – области наиболее тесного взаимодействия в геноме

Слайд 19

Генетический полиморфизм 1. Явление существования вариантов в нуклеотидной последовательности разных представителей

Генетический полиморфизм
1. Явление существования вариантов в нуклеотидной последовательности разных представителей одного

вида.
2. Собственно вариант в нуклеотидной последовательности.
Все представители вида Homo sapiens идентичны по нуклеотидной последовательности геномов на 99,9%
Слайд 20

Виды генетических полиморфизмов Однонуклеотидный полиморфизм (ОНП; single nucleotide polymorphism, SNP, ‘snip’)

Виды генетических полиморфизмов

Однонуклеотидный полиморфизм (ОНП; single nucleotide polymorphism, SNP, ‘snip’)
Инсерция/делеция (индел)

простая
– микросателлиты (полиморфизм коротких тандемных повторов; short tandem repeat polymorphisms, STRP)
– мини-сателлиты (переменное число тандемных повторов; variable number tandem repeats, VNTR)
– диспергированные повторы (напр., SINE)
Слайд 21

SNPs Самый частый вид полиморфизма Частота: 1 нуклеотид на каждую 1000

SNPs

Самый частый вид полиморфизма
Частота: 1 нуклеотид на каждую 1000 п.н. (~3*106

различий между любыми двумя геномами человека)
Отличие от точковой мутации: встречается в популяциях с вероятностью ≥1% (“распространённые SNP” >20%)
Виды SNP в экзоне:
– миссенс-замена (замена одной АК на другую)
– нонсенс-замена (замена кодона на стоп-кодон)
– синонимичная замена (новый кодон кодирует ту же АК)
Слайд 22

Полиморфизм тандемных повторов 1. Полиморфизм числа тандемных повторов – VNTR (полиморфные

Полиморфизм тандемных повторов

1. Полиморфизм числа тандемных повторов
– VNTR (полиморфные минисателлиты, отличающиеся

числом повторов в разных локусах у разных организмов)
2. Полиморфизм числа копий диспергированных повторов
– Alu-повторы (вариант SINE)
Слайд 23

Виды SNP в зависимости от природы меняющихся азотистых оснований Транзиции (~2/3

Виды SNP в зависимости от природы меняющихся азотистых оснований

Транзиции (~2/3 всех

SNP) – пуриновое основание заменяется пуриновым или пиримидиновое – пиримидиновым:
– A<=>G
– C<=>T
Трансверсии (~1/3 всех SNP) – пуриновое основание заменяется пиримидиновым или наоборот:
– A<=>T
– A<=>C
– G<=>C
– G<=>T
Слайд 24

Обозначение SNP в формате FASTA

Обозначение SNP в формате FASTA

Слайд 25

Номенклатура полиморфизмов 1. Указание источника последовательности геномная ДНК (g.) комплементарная ДНК

Номенклатура полиморфизмов

1. Указание источника последовательности
геномная ДНК (g.)
комплементарная ДНК (c.)
последовательность белка (p.)
мтДНК

(m.)
2. Положение полиморфизма от начала отсчёта
для кДНК начало – аденин инициирующего кодона ATG (А имеет номер +1, вправо положительные значения, влево отрицательные: -1, -2 и т.д.)
для гДНК начало – начало последовательности
для белка начало – концевой метионин (соответствует ATG)
3. Указание на вид полиморфизма (>, del, ins)
Слайд 26

Обозначение положения: длины экзонов неизвестны (интроны обозначаются IVS – intervening sequence)

Обозначение положения: длины экзонов неизвестны (интроны обозначаются IVS – intervening sequence)

Слайд 27

Обозначение положения: длины экзонов известны

Обозначение положения: длины экзонов известны

Слайд 28

Примеры записи SNPs c.1777A>C замена аденина на цитозин в положении 1777

Примеры записи SNPs

c.1777A>C
замена аденина на цитозин в положении 1777 кДНК
IVS33-2A>T
замена аденина

на тимин во -2-м положении (слева) от интрона 33
c.26+2T>C
замена тимина на цитозин во втором положении (справа) от экзона, заканчивающегося 26 позицией
S549R
замена серина на аргинин в положении 549 белковой молекулы
W1282X
стоп-кодон вместо триптофана в положении 1282 белковой молекулы
Слайд 29

Использование уникального идентификатора для обозначения SNP База данных dbSNP (>55 организмов,

Использование уникального идентификатора для обозначения SNP

База данных dbSNP (>55 организмов, >63

млн. SNP):
каждый SNP имеет идентификатор rs (reference SNP)
Напр.: замена c.1805T>G имеет идентификатор rs5743618
dbSNP связана с другими базами:
EntrezGene
GenBank
UniProt
HapMap
Ensembl
SNPedia
Слайд 30

Простая инсерция/делеция Однократная вставка/удаление короткого участка ДНК. Может приводить к сдвигу

Простая инсерция/делеция

Однократная вставка/удаление короткого участка ДНК. Может приводить к сдвигу рамки

считывания.
Номенклатура:
c.441delA
делеция 441 нуклеотида в кДНК
c.1524-1527delCGTA
делеция CGTA, занимающих положение с 1524 по 1527 в кДНК
c.1277-1278insTATC
инсерция TATC между нуклеотидами 1277 и 1278 в кДНК
c.852del22
делеция 22 нуклеотидов, начиная с 852 нуклеотида в кДНК
c.3320ins7
инсерция 7 нуклеотидов после нуклеотида в положении 3320 кДНК
Слайд 31

Полиморфизм числа повторов

Полиморфизм числа повторов