Майнор Интеллектуальный анализ данных/Введение в анализ данных

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Читается: 3-4 модуль 2-го курса
Пререквизиты: Введение в программирование
Трудоемкость: 5 кредитов
Карточка курса: https://www.hse.ru/edu/courses/185566965

Формы контроля

  • проверочные работы на семинарах
  • домашние задания
  • коллоквиум
  • экзамен

О курсе

Курс читается для студентов 2-го курса майнора ИАД в 3-4 модулях.

Проводится с 2015 года.

Лектор: Соколов Евгений Андреевич

Лекции проходят по вторникам, 10:30 - 11:50, ауд. 5307 (Шаболовка, 26).


Полезные ссылки

Карточка курса и программа

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий: hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm

Таблица с оценками

Оставить отзыв на курс: форма

Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. Вопросы по материалам лекций лучше всего оформлять в виде Issue в github-репозитории курса.

Семинары

Группа Преподаватель Учебный ассистент Страница Расписание
ИАД-1 Папулин Сергей Юрьевич среда, 12:10 - 13:30, ауд. 3214
ИАД-2 Шестаков Андрей Владимирович среда, 12:10 - 13:30, ауд. 4427
ИАД-3 Даулбаев Талгат Кайратулы среда, 09:00 - 10:20, ауд. 4335
ИАД-4 Чиркова Надежда Александровна среда, 12:10 - 13:30, ауд. 4335
ИАД-5 Яшков Даниил Дмитриевич среда, 12:10 - 13:30, ауд. 4336

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
  • Практические домашние работы на Python
  • Коллоквиум в конце 1-го модуля
  • Экзамен

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз

Оценка за работу в семестре вычисляется по формуле

Oнакопленная = 0.2 * Oсамостоятельные + 0.6 * Одз + 0.2 * Околлоквиум

Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям.

Также за каждое практическое задание и соревнование можно получить дополнительные баллы, которые влияют на выставление оценки за курс автоматом. Необходимым условием для получения автомата является накопленная оценка, равная 8 или выше.

Правила сдачи заданий

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работа не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён (при этом получить дополнительные баллы за призовые места на конкурсе можно только при участии в общий срок). Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Учебный процесс

Полезные ссылки

Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST

Второй поток

Почта потока (для домашних заданий и вопросов): hse.minor.dm@gmail.com

Почта лектора: sokolov.evg@gmail.com

Таблица с оценками

Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на hse-minor-datamining-2+subscribe@googlegroups.com

Расписание лекций

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группы Преподаватель
2, 10.30-11.50 Второй поток, ИАД-11 – ИАД-20 (К-10) Соколов Евгений Андреевич
3, 12.10-13.30 Первый поток, ИАД-1 – ИАД-10 (К-9) Игнатов Дмитрий Игоревич

Расписание семинаров

Все занятия проходят по вторникам на ул. Шаболовка, 26.

Пара Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель Группа Преподаватель
1, 09.00-10.20 ИАД-8 (ауд.4335) Панов ИАД-11 (ауд.3214) Козлова ИАД-13 (ауд.4336) Ромов ИАД-20 (ауд.3203) Струминский ИАД-19 (ауд.4428) Квасов, Полякова
2, 10.30-11.50 ИАД-4 (ауд.4336) Умнов ИАД-8 (ауд.4335) Панов ИАД-9 (ауд.4427) Папулин ИАД-10 (ауд.4336) Зиннурова
3, 12.10-13.30 ИАД-12 (ауд.3214) Козлова ИАД-14 (ауд.4427) Папулин ИАД-15 (ауд.4336) Зиннурова ИАД-16 (ауд.3203) Даулбаев, Чиркова ИАД-17 (ауд.4335) Гитман, Захаров
3, 12.10-13.30 ИАД-18 (ауд.4428) Гитман, Рысьмятова
4, 13.40-15.00 ИАД-2 (ауд.4427) Папулин ИАД-3 (ауд.4428) Шестаков ИАД-5 (ауд.3203) Паринов ИАД-6 (ауд.3214) Кашницкий ИАД-7 (ауд.4336) Умнов
5, 15.10-16.30 ИАД-1 (ауд.4427) Папулин ИАД-6 (ауд.3214) Кашницкий

Программа лекций

Файлы со слайдами очень легко скачать с GitHub с помощью кнопки Raw!

Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [Слайды, 1 поток] [Слайды, 2 поток]

Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [Слайды]

Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [Слайды]

Лекция 4 (02.02.2016). Математический анализ и анализ данных. [Слайды]

Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [Слайды]

Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [Слайды]

Лекция 7 (01.03.2016). Линейная регрессия. [Слайды]

Лекция 8 (15.03.2016). Линейная классификация. [Слайды]

Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [Слайды] [Доп. материал: конспект по метрикам качества]

Консультация (05.04.2016). Обзор: линейные модели и оценивание качества.

Лекция 10 (19.04.2016). Решающие деревья. [Слайды]

Лекция 11 (26.04.2016). Решающие деревья и случайные леса. [Слайды]

Лекция 12 (10.05.2016). Понижение размерности данных. [Слайды]

Лекция 13 (17.05.2016). Кластеризация. [Слайды]

Лекция 14 (31.05.2016). Метрические методы. [Слайды]

Лекция 15 (07.06.2016). Анализ частых множеств признаков и ассоциативных правил. [Слайды]

Дополнительные материалы. [Слайды Ю. Кашницкого] [Слайды К.В. Воронцова]

Лекция 16 (14.06.2016). Заключительная лекция.

Страницы семинаров

Коллоквиум

В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.

Дата проведения: 12 апреля

Список вопросов

На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.

Расписание:

1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20

2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19

3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18

4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7

Экзамен

Дата проведения экзамена: 21 июня

Список вопросов

На экзамене студенту будет предложено 3 вопроса из списка, а также будет задан вопрос о содержании проекта. По усмотрению преподавателя могут быть заданы дополнительные вопросы для уточнения оценки.

Распределение по аудиториям можно найти в РУЗ.

Полезные материалы

Курсы по машинному обучению и анализу данных

Статьи

Книги

  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.

Страницы прошлых лет

2015/16 учебный год