Введение в статистику и машинное обучение
О курсе
Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле.
Лектор: Алексей Зайцев, Руководитель внешних академических исследований в блоке риски «Сбера»
Распределение часов по курсу: 28 часов в 2 модуле (14 часов лекций, 14 часов семинаров)
Цель курса «Введение в статистику и машинное обучение» — познакомить учащихся с основными методами статистики и машинного обучения, а также с ключевыми библиотеками Python (NumPy, Pandas, Matplotlib) для анализа данных. Программа охватывает теорию вероятностей, оценивание параметров, линейные и логистические модели, основы нейронных сетей и архитектуру Трансформер. Факультатив поможет подготовиться к исследовательским проектам и обязательным курсам по ML на втором курсе.
Задачи дисциплины:
- Элемент маркированного списка
Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib);
- Элемент маркированного списка
Применение теории вероятностей и статистических методов для анализа и интерпретации данных;
- Элемент маркированного списка
Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска;
- Элемент маркированного списка
Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах;
- Элемент маркированного списка
Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout;
- Элемент маркированного списка
Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания.
Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен.
Содержание дисциплины
| № | Раздел | Тема |
|---|---|---|
| 1 | Введение в Python для машинного обучения |
|
| 2 | Продолжение. Введение. Основы молекулярной биологии. Клетка, геном, белки, поток информации, генетический код. презентация | Генетический код, рамки считывания, biopython тетрадка |
| 3 | Организация геномов прокариот и эукариот. Гены и регуляторные элементы. Белок-кодирующие и РНК-кодирующие гены. Экзоны и интроны. Сплайсинг. Промоторы и энхансеры. презентация | UCSC genome browser. Геном человека. Строение генов. Треки консервативности, SNPs, структурных вариантов, повторов. Скачивание полного генома человека. Table browser. содержание |
| 4 | Продолжение. Организация геномов прокариот и эукариот. Гены и регуляторные элементы. Белок-кодирующие и РНК-кодирующие гены. Экзоны и интроны. Сплайсинг. Промоторы и энхансеры. презентация | Модели генов. Геномные браузеры.Table browser. таблица к заданию содержание |
| 5 | Молекулярная эволюция. Поиск схожих последовательностей. Алгоритм и программа BLAST. Статистика локального выравнивания. презентация |
BLAST. содержание |
| 6 | Модели эволюции аминоклислотных последовательностей. Матрицы PAM и BLOSUM. презентация |
BLAST.таблица к семинару Работа с bed файлами, bedtools. содержание |
| 7 | Алгоритмы попарного и множественного выравнивания последовательностей. Динамическое программирование. презентация |
Закрепляем NW. Обсуждение ДЗ. Работа с bed файлами, bedtools. содержание |
Полезные ссылки
Разделение по группам на факультативе
Преподаватели
| Группа | Преподаватель | Время занятия |
|---|---|---|
| Лекции | Алексей Зайцев | 18:10 - 19:30 |
| 1 | Аркадий Алиев | 19:40 - 21:00 |
| 2 | Александр Кудряшов | 19:40 - 21:00 |