Майнор Интеллектуальный анализ данных/Введение в анализ данных/2015-2016

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

В рамках курса «Введение в анализ данных» студенты овладевают базовыми понятиями и методами машинного обучения, учатся применять их в задачах анализа данных, а также приобретают практические навыки специалиста по анализу данных (data scientist). Практические задания и итоговый проект выполняются с использованием языка Python и инструментов PyData (iPython Notebook, NumPy, Pandas, scikit-learn и др.).

Читается: 3-4 модуль 2-го курса, 2015/2016 учебный год.
Пререквизиты: Введение в программирование
Трудоемкость: 5 кредитов
Программа дисциплины: ссылка

Продолжительность

Всего: 72 аудиторных часа:
Из них:

  • 36 часов лекций
  • 36 часов практических занятий

Формы контроля

  • проверочные работы на семинарах
  • домашние задания
  • проект по анализу данных
  • экзамен

Учебный процесс

Полезные ссылки

Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST

Второй поток

Почта потока (для домашних заданий и вопросов): hse.minor.dm@gmail.com

Почта лектора: sokolov.evg@gmail.com

Таблица с оценками

Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на hse-minor-datamining-2+subscribe@googlegroups.com

Расписание лекций

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группы Преподаватель
2, 10.30-11.50 Второй поток, ИАД-11 – ИАД-20 (К-10) Соколов Евгений Андреевич
3, 12.10-13.30 Первый поток, ИАД-1 – ИАД-10 (К-9) Игнатов Дмитрий Игоревич

Расписание семинаров

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель
1, 09.00-10.20 ИАД-8 (ауд.4335) Панов ИАД-11 (ауд.3214) Козлова ИАД-13 (ауд.4336) Ромов ИАД-20 (ауд.3203) Струминский ИАД-19 (ауд.4428) Квасов, Полякова
2, 10.30-11.50 ИАД-4 (ауд.4336) Умнов ИАД-8 (ауд.4335) Панов ИАД-9 (ауд.4427) Папулин ИАД-10 (ауд.4336) Зиннурова
3, 12.10-13.30 ИАД-12 (ауд.3214) Козлова ИАД-14 (ауд.4427) Папулин ИАД-15 (ауд.4336) Зиннурова ИАД-16 (ауд.3203) Даулбаев, Чиркова ИАД-17 (ауд.4335) Гитман, Захаров
3, 12.10-13.30 ИАД-18 (ауд.4428) Гитман, Рысьмятова
4, 13.40-15.00 ИАД-2 (ауд.4427) Папулин ИАД-3 (ауд.4428) Шестаков ИАД-5 (ауд.3203) Паринов ИАД-6 (ауд.3214) Кашницкий ИАД-7 (ауд.4336) Умнов
5, 15.10-16.30 ИАД-1 (ауд.4427) Папулин ИАД-6 (ауд.3214) Кашницкий

Программа лекций

Файлы со слайдами очень легко скачать с GitHub с помощью кнопки Raw!

Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [Слайды, 1 поток] [Слайды, 2 поток]

Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [Слайды]

Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [Слайды]

Лекция 4 (02.02.2016). Математический анализ и анализ данных. [Слайды]

Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [Слайды]

Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [Слайды]

Лекция 7 (01.03.2016). Линейная регрессия. [Слайды]

Лекция 8 (15.03.2016). Линейная классификация. [Слайды]

Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [Слайды] [Доп. материал: конспект по метрикам качества]

Консультация (05.04.2016). Обзор: линейные модели и оценивание качества.

Лекция 10 (19.04.2016). Решающие деревья. [Слайды]

Лекция 11 (26.04.2016). Решающие деревья и случайные леса. [Слайды]

Лекция 12 (10.05.2016). Понижение размерности данных. [Слайды]

Лекция 13 (17.05.2016). Кластеризация. [Слайды]

Лекция 14 (31.05.2016). Метрические методы. [Слайды]

Лекция 15 (07.06.2016). Анализ частых множеств признаков и ассоциативных правил. [Слайды]

Дополнительные материалы. [Слайды Ю. Кашницкого] [Слайды К.В. Воронцова]

Лекция 16 (14.06.2016). Заключительная лекция.

Страницы семинаров

Коллоквиум

В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.

Дата проведения: 12 апреля

Список вопросов

На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.

Расписание:

1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20

2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19

3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18

4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7

Экзамен

Дата проведения экзамена: 21 июня

Список вопросов

На экзамене студенту будет предложено 3 вопроса из списка, а также будет задан вопрос о содержании проекта. По усмотрению преподавателя могут быть заданы дополнительные вопросы для уточнения оценки.

Распределение по аудиториям можно найти в РУЗ.

Полезные материалы

Курсы по машинному обучению и анализу данных

Статьи

Книги

  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.