Майнор Интеллектуальный анализ данных/Введение в анализ данных — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(О курсе)
Строка 69: Строка 69:
 
При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
 
При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
  
==Учебный процесс==
+
==Лекции==
  
===Полезные ссылки===
 
Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST <br />
 
 
'''Второй поток'''
 
 
Почта потока (для домашних заданий и вопросов): [mailto:hse.minor.dm@gmail.com hse.minor.dm@gmail.com]
 
 
Почта лектора: [mailto:sokolov.evg@gmail.com sokolov.evg@gmail.com]
 
 
[https://docs.google.com/spreadsheets/d/1jZL_-ELf0Ogj2XHa6VVbkg8vrInycv2-Z9UR5keLDfM/edit?usp=sharing Таблица с оценками]
 
 
Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на [mailto:hse-minor-datamining-2+subscribe@googlegroups.com hse-minor-datamining-2+subscribe@googlegroups.com]
 
 
===Расписание лекций===
 
 
Все занятия проходят по вторникам на ул. Шаболовка, 26.
 
 
{| class="wikitable"
 
|-
 
! Пара !! Группы !! Преподаватель
 
|-
 
| 2, 10.30-11.50 || Второй поток, ИАД-11 – ИАД-20 (К-10) || Соколов Евгений Андреевич
 
|-
 
| 3, 12.10-13.30 || Первый поток, ИАД-1 – ИАД-10 (К-9) || Игнатов Дмитрий Игоревич
 
|}
 
 
===Расписание семинаров===
 
 
Все занятия проходят по вторникам на ул. Шаболовка, 26.
 
 
{| class="wikitable"
 
|-
 
! Пара !! Группа !! Преподаватель !! Группа !! Преподаватель !! Группа !! Преподаватель !! Группа !! Преподаватель !! Группа !! Преподаватель
 
|-
 
| 1,  09.00-10.20 || ИАД-8 (ауд.4335) || Панов || ИАД-11 (ауд.3214) || Козлова || ИАД-13 (ауд.4336) || Ромов || ИАД-20 (ауд.3203) || Струминский || ИАД-19 (ауд.4428) || Квасов, Полякова
 
|-
 
| 2,  10.30-11.50 || ИАД-4 (ауд.4336) || Умнов || ИАД-8 (ауд.4335) || Панов || ИАД-9 (ауд.4427) || Папулин || ИАД-10 (ауд.4336) || Зиннурова ||  || 
 
|-
 
| 3, 12.10-13.30  || ИАД-12 (ауд.3214) || Козлова || ИАД-14 (ауд.4427)  || Папулин || ИАД-15 (ауд.4336) || Зиннурова || ИАД-16 (ауд.3203)  || Даулбаев, Чиркова || ИАД-17 (ауд.4335) || Гитман, Захаров
 
|-
 
| 3,  12.10-13.30 || ИАД-18 (ауд.4428) || Гитман, Рысьмятова || ||  ||  || ||  || ||  || 
 
|-
 
| 4, 13.40-15.00 || ИАД-2 (ауд.4427) || Папулин || ИАД-3 (ауд.4428) || Шестаков || ИАД-5 (ауд.3203) || Паринов || ИАД-6 (ауд.3214)  || Кашницкий || ИАД-7 (ауд.4336) || Умнов
 
|-
 
| 5, 15.10-16.30 || ИАД-1 (ауд.4427) || Папулин || ИАД-6 (ауд.3214)  || Кашницкий ||  || ||  || ||  || 
 
|}
 
 
===Программа лекций===
 
[[Файл:how-to-download.png|thumb|right|200px|Файлы со слайдами очень легко скачать с GitHub с помощью кнопки Raw!]]
 
 
Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [[https://db.tt/c9XsAVym Слайды, 1 поток]] [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture01-intro.pdf Слайды, 2 поток]]
 
 
Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture02-intro.pdf Слайды]]
 
 
Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture03-linalg.pdf Слайды]]
 
 
Лекция 4 (02.02.2016). Математический анализ и анализ данных. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture04-calculus.pdf Слайды]]
 
 
Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture05-probability.pdf Слайды]]
 
 
Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture06-statistics.pdf Слайды]]
 
 
Лекция 7 (01.03.2016). Линейная регрессия. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture07-linreg.pdf Слайды]]
 
 
Лекция 8 (15.03.2016). Линейная классификация. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture08-linclass.pdf Слайды]]
 
 
Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture09-quality.pdf Слайды]] [[https://github.com/esokolov/ml-course-msu/blob/master/ML15/lecture-notes/Sem05_metrics.pdf Доп. материал: конспект по метрикам качества]]
 
 
Консультация (05.04.2016). Обзор: линейные модели и оценивание качества.
 
 
Лекция 10 (19.04.2016). Решающие деревья. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture10-trees.pdf Слайды]]
 
 
Лекция 11 (26.04.2016). Решающие деревья и случайные леса. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture11-trees-forests.pdf Слайды]]
 
 
Лекция 12 (10.05.2016). Понижение размерности данных. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture12-reduction.pdf Слайды]]
 
 
Лекция 13 (17.05.2016). Кластеризация. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture13-clustering.pdf Слайды]]
 
 
Лекция 14 (31.05.2016). Метрические методы. [[https://github.com/esokolov/ml-minor-hse/blob/master/lectures/lecture14-knn.pdf Слайды]]
 
 
Лекция 15 (07.06.2016). Анализ частых множеств признаков и ассоциативных правил. [[https://www.dropbox.com/s/whe9dhdqt2g5mng/ARFIM-ADMinor.pdf?dl=0 Слайды]]
 
 
Дополнительные материалы. [[https://www.dropbox.com/s/5w53twcuct7bm24/ML_marketing.pdf?dl=0 Слайды Ю. Кашницкого]] [[http://www.machinelearning.ru/wiki/images/7/7c/Voron-ML-AssocRules-slides.pdf Слайды К.В. Воронцова]]
 
 
Лекция 16 (14.06.2016). Заключительная лекция.
 
 
===Страницы семинаров===
 
* ИАД-1, Папулин С.Ю.
 
* ИАД-2, Папулин С.Ю.
 
* [[Minor_da2016_gr3|ИАД-3, Шестаков А.]]
 
* [[Майнор_Анализ_Данных_ИАД-4|ИАД-4, Умнов А.В.]]
 
* [[Minor_da2016_gr5|ИАД-5, Паринов А.А.]]
 
* [[Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-6|ИАД-6, Кашницкий Ю.С.]]
 
* [[Майнор_Анализ_Данных_ИАД-7|ИАД-7, Умнов А.В.]]
 
* ИАД-8, Панов А.И.
 
* ИАД-9, Папулин С.Ю.
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-10,_ИАД-15|ИАД-10, Зиннурова Э.А.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-11,12|ИАД-11, Козлова А.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-11,12|ИАД-12, Козлова А.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-13|ИАД-13, Ромов П.А.]]
 
* ИАД-14, Папулин С.Ю.
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-10,_ИАД-15|ИАД-15, Зиннурова Э.А.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-16|ИАД-16, Даулбаев Т., Чиркова Н.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-17|ИАД-17, Гитман И., Захаров Е.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-18|ИАД-18, Гитман И., Рысьмятова А.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-19|ИАД-19, Квасов А., Полякова Н.]]
 
* [[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/ИАД-20|ИАД-20, Струминский К.]]
 
 
=== Коллоквиум ===
 
В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.
 
 
Дата проведения: 12 апреля
 
 
[https://docs.google.com/document/d/17rXxZvS1gjZUwvns-bFrh1lsR2I5HygeNKJm5ZJQd_E/edit?usp=sharing Список вопросов]
 
 
На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.
 
 
Расписание:
 
 
1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20
 
 
2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19
 
 
3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18
 
 
4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7
 
 
=== Экзамен ===
 
Дата проведения экзамена: 21 июня
 
 
[https://docs.google.com/document/d/1WRtQqhegOwV1l7McyJAm-y4ql65B_6dY3z5YkRgpe1k/edit?usp=sharing Список вопросов]
 
 
На экзамене студенту будет предложено 3 вопроса из списка, а также будет задан вопрос о содержании проекта. По усмотрению преподавателя могут быть заданы дополнительные вопросы для уточнения оценки.
 
 
Распределение по аудиториям можно найти в РУЗ.
 
  
 
==Полезные материалы==
 
==Полезные материалы==

Версия 00:34, 18 января 2017

О курсе

Курс читается для студентов 2-го курса майнора ИАД в 3-4 модулях.

Проводится с 2015 года.

Лектор: Соколов Евгений Андреевич

Лекции проходят по средам, 10:30 - 11:50, ауд. 5307 (Шаболовка, 26).


Полезные ссылки

Карточка курса и программа

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий: hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm

Таблица с оценками

Оставить отзыв на курс: форма

Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. Вопросы по материалам лекций лучше всего оформлять в виде Issue в github-репозитории курса.

Семинары

Группа Преподаватель Учебный ассистент Страница Расписание
ИАД-1 Папулин Сергей Юрьевич среда, 12:10 - 13:30, ауд. 3214
ИАД-2 Шестаков Андрей Владимирович среда, 12:10 - 13:30, ауд. 4427
ИАД-3 Даулбаев Талгат Кайратулы среда, 09:00 - 10:20, ауд. 4335
ИАД-4 Чиркова Надежда Александровна среда, 12:10 - 13:30, ауд. 4335
ИАД-5 Яшков Даниил Дмитриевич среда, 12:10 - 13:30, ауд. 4336

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
  • Практические домашние работы на Python
  • Коллоквиум в конце 1-го модуля
  • Экзамен

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз

Оценка за работу в семестре вычисляется по формуле

Oнакопленная = 0.2 * Oсамостоятельные + 0.6 * Одз + 0.2 * Околлоквиум

Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям.

Правила сдачи заданий

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Полезные материалы

Курсы по машинному обучению и анализу данных

Статьи

Книги

  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.

Страницы прошлых лет

2015/16 учебный год