Майнор Биоинформатика 1 год 2021/22
Часть 1. Биоинформатика ДНК, РНК и белков (модули 1-2)
В курсе «Элементарная геномика» изучаются основные закономерности молекулярной эволюции и математические методы анализа молекулярных последовательностей, включая алгоритмы поиска гомологичных последовательностей, выравнивания последовательностей и построения филогенетических деревьев, алгоритмы поиска ортологов и горизонтально перенесенных генов, предсказания генов и поиск мотивов, методы аннотации геномов de novo генами и функциональными элементами. Изучаются алгоритмы и методы предсказания вторичной структуры ДНК, РНК и белков.
В течение курса студенты познакомятся с основными биоинформатическими ресурсами, включая базы данных, веб-порталы, компьютерные программы для работы с базами данных молекулярной биологии, а также программами, реализующими биоинформатические методы.
Лекции и семинары
Лекция 0. Организационная. Начало Лекции 1.
Лекция 1. Введение. Основы молекулярной биологии.
Клетка, геном, белки, поток информации, генетический код.
презентация
Семинар 1 Базы данных геномов бактерий. Файлы аннотации геномов генами. Стренды.
содержание
Лекция 2. Организация геномов прокариот и эукариот. Гены и регуляторные элементы.
Белок-кодирующие и РНК-кодирующие гены. Экзоны и интроны. Сплайсинг. Промоторы и энхансеры.
презентация
Семинар 2. Введение в систему Unix. Основные команды Unix. Файловая система. Навигация. Командная строка. Просмотр файлов. Поиск информации в файлах.
содержание данные
Лекция 3. Секвенирование от метода Сангера до технологий следующего поколения. Геном человека. Повторы. Однонуклеотидные замены и структурные варианты.
презентация
Семинар 3. UCSC genome browser. Геном человека. Строение генов. Треки консервативности, SNPs, структурных вариантов, повторов. Скачивание полного генома человека. Table browser.
содержание
Лекция 4.Молекулярная эволюция. Поиск схожих последовательностей. Алгоритм и программа BLAST. Статистика локального выравнивания.
презентация
Семинар 4. 29.09.21Программа BLAST. Поиск схожих последовательностей. Определение последовательностей из метагеномного исследования с помощью BLAST.
содержание
Семинар 4.5 06.10.21Программа BLAST. содержание
Лекция 5.Модели эволюции аминоклислотных последовательностей. Матрицы PAM и BLOSUM.
презентация
Семинар 5.Программа MEGA. Выравнивание последовательностей на примере коровых белков (ATP, DNA-poymerase, 16S-RNA).
содержание данные
Лекция 6.Алгоритмы попарного и множественного выравнивания последовательностей. Динамическое программирование.
презентация
Семинар 6. Построение филогенетических деревьев на примере коровых белков (ATP, DNA-poymerase, 16S-RNA). Программа MEGA.
содержание данные
Лекция 7.Алгоритмы попарного и множественного выравнивания последовательностей (продолжение). Филогенетика. Горизонатльный обмен генов. Методы построения филогенетических деревьев.
презентация
Семинар 7. Поиск белков в Swiss-Prot по мнемонике функции. Интеины. Определение горизонтально перенесенных генов. Филогенетика и астробиология.
содержание данные
Лекция 8. Филогения. Методы построения филогенетических деревьев. Метод ближайшего соседа (NJ). Метод максимальной бережливости. Метод максимального правдоподобия. Бутсрэп-оценка построенного дерева.
презентация
Семинар 8. Эволюционный анализ вируса SARS-cov-2 из разных популяций человека.
содержание данные
Лекция 9. Гомологи, ортологи и паралоги. Поиск горизонтально перенесенных генов.
презентация
Семинар 9. Определение ортологов и паралогов по филогенетическим деревьям.
содержание данные
Семинар 10. Знакомство с базами данных ортологов и знакомство с 3-х мерной структурой белков по базе данных PDB.
содержание
Семинар 11. Изучение структур белков Spike (S) вирусов SARS-cov и SARS-cov-2, а также фермента ACE2 и комплекса SARS-cov - ACE2
содержание данные
Семинар 12. Моделирование взаимодействия между SARS-Cov-2 RBD (receptor binding domain) и ACE2
содержание данные
Часть 2 Медицинская биоинформатика (Модули 3-4)
В курсе “Медицинская биоинформатика” изучается геномика человека, полиморфизмы и структурные варианты в популяции и их связь с заболеваниями. Дается представление о полногеномном поиске ассоциаций и консорциумных проектах, изучающих генетику рака и других заболеваний. Изучаются элементы системной биологии, показывающей как генетические изменения могут приводить к изменениям на функциональном уровне. Дается представление о метаболических и сигнальных сетях, онтологическом анализе. Изучаются ДНК-белковые взаимодействия и РНК-регуляция. Дается представление о сравнительном анализе геномов человека и ближайших видов, таких как шимпанзе или неандерталец. Дается представление о микробиоме и эволюции вирусов.
Лекция 1-2 Предсказание генов de novo. Алгоритмы в основе предсказания генов. Цепи Маркова. Скрытые цепи Маркова.
презентация
Лекция 3 Введение в геномику человека. Первый проект "Геном человека". Секвенирование методом Сангера. Полиморфизм человека. SNPs и структурные варианты. Связь с заболеваниями.
презентация
Лекция 4 Генотип и гаплотип. SNP и тегированные SNPы. Исследования GWAS. Тест хи-квадрат.
презентация
Лекция 5 Исследования GWAS. Элементы популяционной генетики. Гаплотипы и гаплогруппы. Митохондриальная Ева и Y-хромосомный Адам.
презентация
Лекция 6 Александр Ракитько, компания Генотек. Генетика здоровья.
презентация
Лекция 7 Александр Ракитько, компания Генотек. Генетическая генеалогия.
презентация
Семинары
Семинар 1. Предсказание генов de novo. Предсказание генов de novo. Программы Glimmer, Prodigal, GenMark.
содержание данные
Семинар 2. Базы данных SNP и структурных вариантов человека. Влияние SNP на структуру белка.
содержание данные
Семинар 3. Генотипы, минорные аллели, локусы. Пример GWAS для одного SNP. Тест хи-квадрат.
содержание
Подробное описание тестирования на ассоциацию и конкретные примеры см. в следующем семинаре.
Семинар 4. Ассоциациии признака с аллелью и генотипом. Отношение шансов и оценка риска. Примеры отчетов компании 23 and me.
содержание
Семинар 5. GWAS Catalog, eupedia, phenotype-Genotype Integrator, plink
содержание
Семинар 6. Исследование на ассоциацию варианта с заболеванием.
содержание
Семинар 7. Распространение гаплогрупп, поиск гаплогруппы А.С.Пушкина, PCA-анализ популяций
содержание
Лекция 8 Генетика рака.
презентация
Семинар 8. Классификация генов, связанных с раком. Исследование данных пациентов.
[Работа на семинаре с карточками генов и карточками пациентов]
Лекция 9 Проект Панрак (Pancancer). Краткий обзор последних результатов. Иммунотерапия рака.
презентация
Семинар 9. Классификация типов лейкемии по данным экспресси генов.
содержание данные
Обновленная версия блокнота
Лекция 10 Boston gene.
презентация
Лекция 11 Сравнительная геномика человека и шимпанзе.
презентация
Семинар 11. Сервер Vista - визуализации выравниваний геномов человека и шимпанзе. Анализ участка ускоренной эволюции HAR1. Анализ гена речи FOXP2.
содержание данные
Лекция 12 Неандерталец и денисовец. Сравнительная геномика человека, неандертальца и денисовца.
презентация
Семинар 12. Изучение эволюции неандертальце и денисовцев по митохондриальной ДНК.
содержание данные
Лекция 13 Вторичные структуры ДНК. Квадруплексы, триплексы, Z-ДНК
презентация
Семинар 13. Методы аннотации геномов квадруплексами, Z-ДНК, структурами стебель-петля
содержание Блокнот
Лекция 14 Вторичные структуры РНК. Методы предсказания вторичной структуры РНК.
презентация
Семинар 14. Программа RNAFold. Структурное выравнивание (LocARNA). База данных RFam.
содержание
Лекция 15 Транскрипционные факторы и мотивы. Позиционно-весовые матрицы. Генные сети.
презентация
Лекция 16. Insilico Medicine. Pandomics.
презентация
Лекция 17 MS Decisions-Кирилл Песков. Математическое моделирование в разработке лекарств: Фармакометрика vs Статистика.
Лекция 18 MS Decisions-Виктория Кулеш. Smart data science в разработке лекарств и здравоохранении: искусственный интеллект, машинное обучение, принятие решений.
презентации