Введение в статистику и машинное обучение — различия между версиями
| Строка 9: | Строка 9: | ||
'''Задачи дисциплины:''' | '''Задачи дисциплины:''' | ||
| − | * | + | * Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib); |
| − | Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib); | + | * Применение теории вероятностей и статистических методов для анализа и интерпретации данных; |
| − | * | + | * Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска; |
| − | Применение теории вероятностей и статистических методов для анализа и интерпретации данных; | + | * Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах; |
| − | * | + | * Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout; |
| − | Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска; | + | * Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания. |
| − | * | + | |
| − | Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах; | + | |
| − | * | + | |
| − | Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout; | + | |
| − | * | + | |
| − | Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания. | + | |
Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен. | Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен. | ||
| Строка 35: | Строка 29: | ||
|- | |- | ||
| − | | 2 || | + | | 2 || Основы теории вероятностей || |
| + | * Дискретная теория вероятности | ||
| + | * Статистики: среднее, медиана, мода, дисперсия и стандартное отклонение | ||
| + | * Введение в основные распределения | ||
| + | * Распределение Бернулли | ||
| + | * Биномиальное распределение | ||
| + | * Нормальное распределение | ||
|- | |- | ||
| − | | 3 || | + | | 3 || Основы математической статистики || |
| + | * Оценивание параметров | ||
| + | * Оценки среднего и дисперсии | ||
| + | * Свойства оценок | ||
|- | |- | ||
| − | | 4 || | + | | 4 || Основы оптимизации для машинного обучения || |
| + | * Градиентный спуск | ||
| + | * Методы второго порядка | ||
| + | |||
|- | |- | ||
| − | | 5 || | + | | 5 || Классическое машинное обучение |
|| | || | ||
| − | + | * Обобщенные линейные модели | |
| − | + | * Линейная регрессия | |
| + | * Логистическая регрессия | ||
| + | * Переобучение | ||
| + | * Регуляризация | ||
| + | |||
|- | |- | ||
| − | | 6 || | + | | 6 || Основы нейронных сетей |
|| | || | ||
| − | + | * Основы нейронных сетей: персептроны и функции активации | |
| + | * Прямое и обратное распространение ошибок | ||
| + | * Введение в глубокое обучение: сверточные нейронные сети (CNN) | ||
|- | |- | ||
|- | |- | ||
| − | | 7 || | + | | 7 || Механизм внимания |
|| | || | ||
| − | + | * Как устроены большие языковые модели | |
| + | * Архитектура трансформер | ||
| + | * Основные концепции: фильтры, пулинг, функции активации | ||
| + | * Техники регуляризации: dropout и L2-регуляризация | ||
| + | |||
|} | |} | ||
Версия 15:29, 6 ноября 2024
О курсе
Курс читается для студентов 1-го курса ПМИ (ИИ360) во 2 модуле.
Лектор: Алексей Зайцев, Руководитель внешних академических исследований в блоке риски «Сбера»
Распределение часов по курсу: 28 часов в 2 модуле (14 часов лекций, 14 часов семинаров)
Цель курса «Введение в статистику и машинное обучение» — познакомить учащихся с основными методами статистики и машинного обучения, а также с ключевыми библиотеками Python (NumPy, Pandas, Matplotlib) для анализа данных. Программа охватывает теорию вероятностей, оценивание параметров, линейные и логистические модели, основы нейронных сетей и архитектуру Трансформер. Факультатив поможет подготовиться к исследовательским проектам и обязательным курсам по ML на втором курсе.
Задачи дисциплины:
- Погружение в основные библиотеки Python для работы с данными и построения визуализаций (NumPy, Pandas, Matplotlib);
- Применение теории вероятностей и статистических методов для анализа и интерпретации данных;
- Решение оптимизационных задач, характерных для машинного обучения, с использованием методов градиентного спуска;
- Применение линейных и логистических моделей для анализа и обработки данных в реальных задачах;
- Разработка и настройка нейронных сетей для анализа сложных данных, включая использование сверточных сетей, методов регуляризации и dropout;
- Реализация моделей на основе архитектуры Трансформеров с применением механизмов внимания.
Оценивание включает домашние задания, midterm-экзамен и устный финальный экзамен.
Содержание дисциплины
| № | Раздел | Тема |
|---|---|---|
| 1 | Введение в Python для машинного обучения |
|
| 2 | Основы теории вероятностей |
|
| 3 | Основы математической статистики |
|
| 4 | Основы оптимизации для машинного обучения |
|
| 5 | Классическое машинное обучение |
|
| 6 | Основы нейронных сетей |
|
| 7 | Механизм внимания |
|
Полезные ссылки
Разделение по группам на факультативе
Преподаватели
| Группа | Преподаватель | Время занятия |
|---|---|---|
| Лекции | Алексей Зайцев | 18:10 - 19:30 |
| 1 | Аркадий Алиев | 19:40 - 21:00 |
| 2 | Александр Кудряшов | 19:40 - 21:00 |