Введение в статистику и машинное обучение — различия между версиями
(Новая страница: «== О курсе == Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле. Лектор - Алексей З…») |
|||
(не показано 15 промежуточных версии этого же участника) | |||
Строка 2: | Строка 2: | ||
Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле. | Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле. | ||
− | Лектор | + | '''Лектор''': Алексей Зайцев, Руководитель внешних академических исследований в блоке риски «Сбера» |
+ | |||
+ | '''Распределение часов по курсу:''' 28 часов в 2 модуле (14 часов лекций, 14 часов семинаров) | ||
+ | |||
+ | '''Цель курса''' «Введение в статистику и машинное обучение» — познакомить учащихся с основными методами статистики и машинного обучения, а также с ключевыми библиотеками Python (NumPy, Pandas, Matplotlib) для анализа данных. Программа охватывает теорию вероятностей, оценивание параметров, линейные и логистические модели, основы нейронных сетей и архитектуру Трансформер. Факультатив поможет подготовиться к исследовательским проектам и обязательным курсам по ML на втором курсе. | ||
+ | |||
+ | '''Задачи дисциплины:''' | ||
+ | * Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib); | ||
+ | * Применение теории вероятностей и статистических методов для анализа и интерпретации данных; | ||
+ | * Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска; | ||
+ | * Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах; | ||
+ | * Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout; | ||
+ | * Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания. | ||
+ | |||
+ | Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен. | ||
=== Полезные ссылки === | === Полезные ссылки === | ||
Строка 11: | Строка 25: | ||
[https://t.me/c/2449298363/5 Расписание пар] | [https://t.me/c/2449298363/5 Расписание пар] | ||
− | + | === Записи занятий === | |
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! !! Дата!! Ссылка | ||
+ | |- | ||
+ | | Занятие 1 || 06.11.2024 || | ||
+ | https://disk.yandex.ru/d/SNs4TmYBdckmvQ | ||
+ | |- | ||
+ | | Занятие 2 || 11.11.2024 || | ||
+ | https://disk.yandex.ru/d/cdQkvU6AwPrSdA | ||
+ | |- | ||
+ | | Занятие 3 || 18.11.2024 || | ||
+ | https://disk.yandex.ru/d/gfVohmylNMrcdg | ||
+ | |- | ||
+ | | Занятие 4 || 25.11.2024 || | ||
+ | https://disk.yandex.ru/d/qUo7R_3P8Il5tQ | ||
+ | |- | ||
+ | | Занятие 5 || 02.12.2024 || | ||
+ | https://disk.yandex.ru/d/4Mqa9k3bLaBk0w | ||
+ | |- | ||
+ | | Занятие 6 || 09.12.2024 || | ||
+ | https://disk.yandex.ru/d/Tbaz9M_gw7U2wA | ||
+ | |- | ||
+ | | Занятие 7 || 16.12.2024 || | ||
+ | https://disk.yandex.ru/d/cxLZEopf-FGxyw | ||
+ | |} | ||
+ | |||
+ | === Содержание дисциплины === | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! № !! Раздел!! Тема | ||
+ | |- | ||
+ | | 1 || Введение в Python для машинного обучения || | ||
+ | * Основы Python для машинного обучения | ||
+ | * Введение в библиотеки: NumPy, Pandas, Matplotlib | ||
+ | * Исследование данных и визуализация | ||
+ | |||
+ | |- | ||
+ | | 2 || Основы теории вероятностей || | ||
+ | * Дискретная теория вероятности | ||
+ | * Статистики: среднее, медиана, мода, дисперсия и стандартное отклонение | ||
+ | * Введение в основные распределения | ||
+ | * Распределение Бернулли | ||
+ | * Биномиальное распределение | ||
+ | * Нормальное распределение | ||
+ | |- | ||
+ | | 3 || Основы математической статистики || | ||
+ | * Оценивание параметров | ||
+ | * Оценки среднего и дисперсии | ||
+ | * Свойства оценок | ||
+ | |- | ||
+ | | 4 || Основы оптимизации для машинного обучения || | ||
+ | * Градиентный спуск | ||
+ | * Методы второго порядка | ||
+ | |||
+ | |- | ||
+ | | 5 || Классическое машинное обучение | ||
+ | || | ||
+ | * Обобщенные линейные модели | ||
+ | * Линейная регрессия | ||
+ | * Логистическая регрессия | ||
+ | * Переобучение | ||
+ | * Регуляризация | ||
+ | |||
+ | |- | ||
+ | | 6 || Основы нейронных сетей | ||
+ | || | ||
+ | * Основы нейронных сетей: персептроны и функции активации | ||
+ | * Прямое и обратное распространение ошибок | ||
+ | * Введение в глубокое обучение: сверточные нейронные сети (CNN) | ||
+ | |- | ||
+ | |- | ||
+ | | 7 || Механизм внимания | ||
+ | || | ||
+ | * Как устроены большие языковые модели | ||
+ | * Архитектура трансформер | ||
+ | * Основные концепции: фильтры, пулинг, функции активации | ||
+ | * Техники регуляризации: dropout и L2-регуляризация | ||
+ | |||
+ | |} | ||
+ | |||
+ | == Преподаватели == | ||
+ | {| class="wikitable" style="text-align:center" | ||
+ | |- | ||
+ | ! Группа !! Преподаватель !! Время занятия | ||
+ | |- | ||
+ | | Лекции || Алексей Зайцев || 18:10 - 19:30 | ||
+ | |- | ||
+ | | 1 || Аркадий Алиев || 19:40 - 21:00 | ||
+ | |- | ||
+ | | 2 || Александр Кудряшов || 19:40 - 21:00 |
Текущая версия на 20:09, 9 января 2025
Содержание
О курсе
Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле.
Лектор: Алексей Зайцев, Руководитель внешних академических исследований в блоке риски «Сбера»
Распределение часов по курсу: 28 часов в 2 модуле (14 часов лекций, 14 часов семинаров)
Цель курса «Введение в статистику и машинное обучение» — познакомить учащихся с основными методами статистики и машинного обучения, а также с ключевыми библиотеками Python (NumPy, Pandas, Matplotlib) для анализа данных. Программа охватывает теорию вероятностей, оценивание параметров, линейные и логистические модели, основы нейронных сетей и архитектуру Трансформер. Факультатив поможет подготовиться к исследовательским проектам и обязательным курсам по ML на втором курсе.
Задачи дисциплины:
- Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib);
- Применение теории вероятностей и статистических методов для анализа и интерпретации данных;
- Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска;
- Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах;
- Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout;
- Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания.
Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен.
Полезные ссылки
Разделение по группам на факультативе
Записи занятий
Дата | Ссылка | |
---|---|---|
Занятие 1 | 06.11.2024 | |
Занятие 2 | 11.11.2024 | |
Занятие 3 | 18.11.2024 | |
Занятие 4 | 25.11.2024 | |
Занятие 5 | 02.12.2024 | |
Занятие 6 | 09.12.2024 | |
Занятие 7 | 16.12.2024 |
Содержание дисциплины
№ | Раздел | Тема |
---|---|---|
1 | Введение в Python для машинного обучения |
|
2 | Основы теории вероятностей |
|
3 | Основы математической статистики |
|
4 | Основы оптимизации для машинного обучения |
|
5 | Классическое машинное обучение |
|
6 | Основы нейронных сетей |
|
7 | Механизм внимания |
|
Преподаватели
Группа | Преподаватель | Время занятия |
---|---|---|
Лекции | Алексей Зайцев | 18:10 - 19:30 |
1 | Аркадий Алиев | 19:40 - 21:00 |
2 | Александр Кудряшов | 19:40 - 21:00 |