Майнор Интеллектуальный анализ данных/Введение в анализ данных/2015-2016
Содержание
О курсе
В рамках курса «Введение в анализ данных» студенты овладевают базовыми понятиями и методами машинного обучения, учатся применять их в задачах анализа данных, а также приобретают практические навыки специалиста по анализу данных (data scientist). Практические задания и итоговый проект выполняются с использованием языка Python и инструментов PyData (iPython Notebook, NumPy, Pandas, scikit-learn и др.).
Читается: 3-4 модуль 2-го курса, 2015/2016 учебный год.
Пререквизиты: Введение в программирование
Трудоемкость: 5 кредитов
Программа дисциплины: ссылка
Продолжительность
Всего: 72 аудиторных часа:
Из них:
- 36 часов лекций
- 36 часов практических занятий
Формы контроля
- проверочные работы на семинарах
- домашние задания
- проект по анализу данных
- экзамен
Учебный процесс
Полезные ссылки
Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST
Второй поток
Почта потока (для домашних заданий и вопросов): hse.minor.dm@gmail.com
Почта лектора: sokolov.evg@gmail.com
Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на hse-minor-datamining-2+subscribe@googlegroups.com
Расписание лекций
Все занятия проходят по вторникам на ул. Шаболовка, 26.
Пара | Группы | Преподаватель |
---|---|---|
2, 10.30-11.50 | Второй поток, ИАД-11 – ИАД-20 (К-10) | Соколов Евгений Андреевич |
3, 12.10-13.30 | Первый поток, ИАД-1 – ИАД-10 (К-9) | Игнатов Дмитрий Игоревич |
Расписание семинаров
Все занятия проходят по вторникам на ул. Шаболовка, 26.
Пара | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель |
---|---|---|---|---|---|---|---|---|---|---|
1, 09.00-10.20 | ИАД-8 (ауд.4335) | Панов | ИАД-11 (ауд.3214) | Козлова | ИАД-13 (ауд.4336) | Ромов | ИАД-20 (ауд.3203) | Струминский | ИАД-19 (ауд.4428) | Квасов, Полякова |
2, 10.30-11.50 | ИАД-4 (ауд.4336) | Умнов | ИАД-8 (ауд.4335) | Панов | ИАД-9 (ауд.4427) | Папулин | ИАД-10 (ауд.4336) | Зиннурова | ||
3, 12.10-13.30 | ИАД-12 (ауд.3214) | Козлова | ИАД-14 (ауд.4427) | Папулин | ИАД-15 (ауд.4336) | Зиннурова | ИАД-16 (ауд.3203) | Даулбаев, Чиркова | ИАД-17 (ауд.4335) | Гитман, Захаров |
3, 12.10-13.30 | ИАД-18 (ауд.4428) | Гитман, Рысьмятова | ||||||||
4, 13.40-15.00 | ИАД-2 (ауд.4427) | Папулин | ИАД-3 (ауд.4428) | Шестаков | ИАД-5 (ауд.3203) | Паринов | ИАД-6 (ауд.3214) | Кашницкий | ИАД-7 (ауд.4336) | Умнов |
5, 15.10-16.30 | ИАД-1 (ауд.4427) | Папулин | ИАД-6 (ауд.3214) | Кашницкий |
Программа лекций
Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [Слайды, 1 поток] [Слайды, 2 поток]
Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [Слайды]
Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [Слайды]
Лекция 4 (02.02.2016). Математический анализ и анализ данных. [Слайды]
Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [Слайды]
Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [Слайды]
Лекция 7 (01.03.2016). Линейная регрессия. [Слайды]
Лекция 8 (15.03.2016). Линейная классификация. [Слайды]
Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [Слайды] [Доп. материал: конспект по метрикам качества]
Консультация (05.04.2016). Обзор: линейные модели и оценивание качества.
Лекция 10 (19.04.2016). Решающие деревья. [Слайды]
Лекция 11 (26.04.2016). Решающие деревья и случайные леса. [Слайды]
Лекция 12 (10.05.2016). Понижение размерности данных. [Слайды]
Лекция 13 (17.05.2016). Кластеризация. [Слайды]
Лекция 14 (31.05.2016). Метрические методы. [Слайды]
Лекция 15 (07.06.2016). Анализ частых множеств признаков и ассоциативных правил. [Слайды]
Дополнительные материалы. [Слайды Ю. Кашницкого] [Слайды К.В. Воронцова]
Лекция 16 (14.06.2016). Заключительная лекция.
Страницы семинаров
- ИАД-1, Папулин С.Ю.
- ИАД-2, Папулин С.Ю.
- ИАД-3, Шестаков А.
- ИАД-4, Умнов А.В.
- ИАД-5, Паринов А.А.
- ИАД-6, Кашницкий Ю.С.
- ИАД-7, Умнов А.В.
- ИАД-8, Панов А.И.
- ИАД-9, Папулин С.Ю.
- ИАД-10, Зиннурова Э.А.
- ИАД-11, Козлова А.
- ИАД-12, Козлова А.
- ИАД-13, Ромов П.А.
- ИАД-14, Папулин С.Ю.
- ИАД-15, Зиннурова Э.А.
- ИАД-16, Даулбаев Т., Чиркова Н.
- ИАД-17, Гитман И., Захаров Е.
- ИАД-18, Гитман И., Рысьмятова А.
- ИАД-19, Квасов А., Полякова Н.
- ИАД-20, Струминский К.
Коллоквиум
В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.
Дата проведения: 12 апреля
На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.
Расписание:
1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20
2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19
3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18
4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7
Экзамен
Дата проведения экзамена: 21 июня
На экзамене студенту будет предложено 3 вопроса из списка, а также будет задан вопрос о содержании проекта. По усмотрению преподавателя могут быть заданы дополнительные вопросы для уточнения оценки.
Распределение по аудиториям можно найти в РУЗ.
Полезные материалы
Курсы по машинному обучению и анализу данных
- Курс по машинному обучению К.В. Воронцова
- Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов
- Coursera: Машинное обучение и анализ данных (специализация)
- Coursera: Введение в машинное обучение, К.В. Воронцов
- Coursera: Machine Learning, Andrew Ng
Статьи
- An Introduction to Machine Learning Theory and Its Applications: A Visual Tutorial with Examples
- A Visual Introduction to Machine Learning
Книги
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
- James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.