Майнор Интеллектуальный анализ данных/Введение в анализ данных

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

В рамках курса «Введение в анализ данных» студенты овладевают базовыми понятиями и методами машинного обучения, учатся применять их в задачах анализа данных, а также приобретают практические навыки специалиста по анализу данных (data scientist). Практические задания и итоговый проект выполняются с использованием языка Python и инструментов PyData (iPython Notebook, NumPy, Pandas, scikit-learn и др.).

Читается: 3-4 модуль 2-го курса, 2015/2016 учебный год.
Пререквизиты: Введение в программирование
Трудоемкость: 5 кредитов
Программа дисциплины: ссылка

Продолжительность

Всего: 72 аудиторных часа:
Из них:

  • 36 часов лекций
  • 36 часов практических занятий

Формы контроля

  • проверочные работы на семинарах
  • домашние задания
  • проект по анализу данных
  • экзамен

Учебный процесс

Полезные ссылки

Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST

Второй поток

Почта потока (для домашних заданий и вопросов): hse.minor.dm@gmail.com

Почта лектора: sokolov.evg@gmail.com

Таблица с оценками

Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на hse-minor-datamining-2+subscribe@googlegroups.com

Расписание лекций

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группы Преподаватель
2, 10.30-11.50 Второй поток, ИАД-11 – ИАД-20 (К-9) Соколов Евгений Андреевич
3, 12.10-13.30 Первый поток, ИАД-1 – ИАД-10 (К-9) Игнатов Дмитрий Игоревич

Расписание семинаров

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель
1, 09.00-10.20 ИАД-8 (ауд.4335) Панов ИАД-11 (ауд.3214) Козлова ИАД-13 (ауд.4336) Ромов ИАД-18 (ауд.4427) Гитман, Рысьмятова ИАД-19 (ауд.4428) Квасов, Полякова
1, 09.00-10.20 ИАД-20 (ауд.3203) Струминский
2, 10.30-11.50 ИАД-4 (ауд.4336) Умнов ИАД-8 (ауд.4335) Панов ИАД-9 (ауд.4427) Папулин ИАД-10 (ауд.4336) Зиннурова
3, 12.10-13.30 ИАД-12 (ауд.3214) Козлова ИАД-14 (ауд.4427) Папулин ИАД-15 (ауд.4336) Зиннурова ИАД-16 (ауд.3203) Даулбаев, Чиркова ИАД-17 (ауд.4335) Гитман, Захаров
4, 13.40-15.00 ИАД-2 (ауд.4427) Папулин ИАД-3 (ауд.4428) Шестаков ИАД-5 (ауд.3203) Паринов ИАД-6 (ауд.3214) Кашницкий ИАД-7 (ауд.4336) Умнов
5, 15.10-16.30 ИАД-1 (ауд.4427) Папулин ИАД-6 (ауд.3214) Кашницкий

Программа лекций

Файлы со слайдами очень легко скачать с GitHub с помощью кнопки Raw!

Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [Слайды, 1 поток] [Слайды, 2 поток]

Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [Слайды]

Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [Слайды]

Лекция 4 (02.02.2016). Математический анализ и анализ данных. [Слайды]

Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [Слайды]

Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [Слайды]

Лекция 7 (01.03.2016). Линейная регрессия. [Слайды]

Лекция 8 (15.03.2016). Линейная классификация. [Слайды]

Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [Слайды] [Доп. материал: конспект по метрикам качества]

Лекция 10 (05.04.2016). Обзор: линейные модели и оценивание качества.

Лекция 11. Логические методы и их интерпретируемость.

Лекция 12. Построение деревьев решений.

Лекция 13. Введение в композиции алгоритмов. Случайные леса.

Лекция 14. Особенности реальных данных.

Лекция 15. Анализ частых множеств признаков и ассоциативных правил.

Лекция 16. Задача кластеризации.

Лекция 17. Заключительная лекция.

Страницы семинаров

Коллоквиум

В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.

Дата проведения: 12 апреля

Список вопросов

На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.

Раписание:

1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20

2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19

3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18

4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7

Полезные материалы

Курсы по машинному обучению и анализу данных

Статьи

Книги

  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.