Майнор Интеллектуальный анализ данных/Введение в анализ данных — различия между версиями
Esokolov (обсуждение | вклад) (→О курсе) |
Esokolov (обсуждение | вклад) (→О курсе) |
||
Строка 11: | Строка 11: | ||
* коллоквиум | * коллоквиум | ||
* экзамен | * экзамен | ||
+ | |||
+ | == О курсе == | ||
+ | |||
+ | Курс читается для студентов 2-го курса [https://electives.hse.ru/2015/minor_intel/ майнора ИАД] в 3-4 модулях. | ||
+ | |||
+ | Проводится с 2015 года. | ||
+ | |||
+ | '''Лектор:''' [http://www.hse.ru/staff/esokolov Соколов Евгений Андреевич] | ||
+ | |||
+ | Лекции проходят по вторникам, 10:30 - 11:50, ауд. 5307 (Шаболовка, 26). | ||
+ | |||
+ | |||
+ | === Полезные ссылки === | ||
+ | |||
+ | [https://www.hse.ru/edu/courses/185566965 Карточка курса и программа] | ||
+ | |||
+ | [https://github.com/esokolov/ml-minor-hse Репозиторий с материалами на GitHub] | ||
+ | |||
+ | Почта для сдачи домашних заданий: hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com) | ||
+ | |||
+ | Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm | ||
+ | |||
+ | [https://docs.google.com/spreadsheets/d/1sFKaErC0N7YteroaNS8N9JkHZUdWKc3RFv1wv5kGyzw/edit?usp=sharing Таблица с оценками] | ||
+ | |||
+ | Оставить отзыв на курс: [http://goo.gl/forms/RwdMxnChST форма] | ||
+ | |||
+ | '''Вопросы''' по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. | ||
+ | Вопросы по материалам лекций лучше всего оформлять в виде [https://github.com/esokolov/ml-minor-hse/issues Issue] в [https://github.com/esokolov/ml-minor-hse github-репозитории курса]. | ||
+ | |||
+ | === Семинары === | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Группа !! Преподаватель !! Учебный ассистент !! Страница !! Расписание | ||
+ | |- | ||
+ | | ИАД-1 || [https://www.hse.ru/org/persons/161192709 Папулин Сергей Юрьевич] || || || среда, 12:10 - 13:30, ауд. 3214 | ||
+ | |- | ||
+ | | ИАД-2 || [https://www.hse.ru/staff/ashestakoff Шестаков Андрей Владимирович] || || || среда, 12:10 - 13:30, ауд. 4427 | ||
+ | |- | ||
+ | | ИАД-3 || [https://www.hse.ru/org/persons/??? Даулбаев Талгат Кайратулы] || || || среда, 09:00 - 10:20, ауд. 4335 | ||
+ | |- | ||
+ | | ИАД-4 || [https://www.hse.ru/org/persons/191576735 Чиркова Надежда Александровна] || || || среда, 12:10 - 13:30, ауд. 4335 | ||
+ | |- | ||
+ | | ИАД-5 || [https://www.hse.ru/org/persons/192085968 Яшков Даниил Дмитриевич] || || || среда, 12:10 - 13:30, ауд. 4336 | ||
+ | |- | ||
+ | |} | ||
+ | |||
+ | === Правила выставления оценок === | ||
+ | |||
+ | В курсе предусмотрено несколько форм контроля знания: | ||
+ | * Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров | ||
+ | * Практические домашние работы на Python | ||
+ | * Коллоквиум в конце 1-го модуля | ||
+ | * Экзамен | ||
+ | |||
+ | Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен: | ||
+ | |||
+ | O<sub>итоговая</sub> = 0.7 * O<sub>накопленная</sub> + 0.3 * О<sub>экз</sub> | ||
+ | |||
+ | Оценка за работу в семестре вычисляется по формуле | ||
+ | |||
+ | O<sub>накопленная</sub> = 0.2 * O<sub>самостоятельные</sub> + 0.6 * О<sub>дз</sub> + 0.2 * О<sub>коллоквиум</sub> | ||
+ | |||
+ | Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям. | ||
+ | |||
+ | Также за каждое практическое задание и соревнование можно получить дополнительные баллы, которые влияют на выставление оценки за курс автоматом. Необходимым условием для получения автомата является накопленная оценка, равная 8 или выше. | ||
+ | |||
+ | === Правила сдачи заданий === | ||
+ | |||
+ | Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работа не принимаются. | ||
+ | |||
+ | При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента. | ||
+ | |||
+ | При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён (при этом получить дополнительные баллы за призовые места на конкурсе можно только при участии в общий срок). Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис. | ||
==Учебный процесс== | ==Учебный процесс== |
Версия 00:27, 18 января 2017
О курсе
Читается: 3-4 модуль 2-го курса
Пререквизиты: Введение в программирование
Трудоемкость: 5 кредитов
Карточка курса: https://www.hse.ru/edu/courses/185566965
Формы контроля
- проверочные работы на семинарах
- домашние задания
- коллоквиум
- экзамен
О курсе
Курс читается для студентов 2-го курса майнора ИАД в 3-4 модулях.
Проводится с 2015 года.
Лектор: Соколов Евгений Андреевич
Лекции проходят по вторникам, 10:30 - 11:50, ауд. 5307 (Шаболовка, 26).
Полезные ссылки
Репозиторий с материалами на GitHub
Почта для сдачи домашних заданий: hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)
Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm
Оставить отзыв на курс: форма
Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. Вопросы по материалам лекций лучше всего оформлять в виде Issue в github-репозитории курса.
Семинары
Группа | Преподаватель | Учебный ассистент | Страница | Расписание |
---|---|---|---|---|
ИАД-1 | Папулин Сергей Юрьевич | среда, 12:10 - 13:30, ауд. 3214 | ||
ИАД-2 | Шестаков Андрей Владимирович | среда, 12:10 - 13:30, ауд. 4427 | ||
ИАД-3 | Даулбаев Талгат Кайратулы | среда, 09:00 - 10:20, ауд. 4335 | ||
ИАД-4 | Чиркова Надежда Александровна | среда, 12:10 - 13:30, ауд. 4335 | ||
ИАД-5 | Яшков Даниил Дмитриевич | среда, 12:10 - 13:30, ауд. 4336 |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
- Практические домашние работы на Python
- Коллоквиум в конце 1-го модуля
- Экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз
Оценка за работу в семестре вычисляется по формуле
Oнакопленная = 0.2 * Oсамостоятельные + 0.6 * Одз + 0.2 * Околлоквиум
Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям.
Также за каждое практическое задание и соревнование можно получить дополнительные баллы, которые влияют на выставление оценки за курс автоматом. Необходимым условием для получения автомата является накопленная оценка, равная 8 или выше.
Правила сдачи заданий
Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работа не принимаются.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён (при этом получить дополнительные баллы за призовые места на конкурсе можно только при участии в общий срок). Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Учебный процесс
Полезные ссылки
Написать отзыв (анонимно): http://goo.gl/forms/RwdMxnChST
Второй поток
Почта потока (для домашних заданий и вопросов): hse.minor.dm@gmail.com
Почта лектора: sokolov.evg@gmail.com
Подписаться на рассылку (информация об отменах и переносах занятий): напишите пустое письмо на hse-minor-datamining-2+subscribe@googlegroups.com
Расписание лекций
Все занятия проходят по вторникам на ул. Шаболовка, 26.
Пара | Группы | Преподаватель |
---|---|---|
2, 10.30-11.50 | Второй поток, ИАД-11 – ИАД-20 (К-10) | Соколов Евгений Андреевич |
3, 12.10-13.30 | Первый поток, ИАД-1 – ИАД-10 (К-9) | Игнатов Дмитрий Игоревич |
Расписание семинаров
Все занятия проходят по вторникам на ул. Шаболовка, 26.
Пара | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель | Группа | Преподаватель |
---|---|---|---|---|---|---|---|---|---|---|
1, 09.00-10.20 | ИАД-8 (ауд.4335) | Панов | ИАД-11 (ауд.3214) | Козлова | ИАД-13 (ауд.4336) | Ромов | ИАД-20 (ауд.3203) | Струминский | ИАД-19 (ауд.4428) | Квасов, Полякова |
2, 10.30-11.50 | ИАД-4 (ауд.4336) | Умнов | ИАД-8 (ауд.4335) | Панов | ИАД-9 (ауд.4427) | Папулин | ИАД-10 (ауд.4336) | Зиннурова | ||
3, 12.10-13.30 | ИАД-12 (ауд.3214) | Козлова | ИАД-14 (ауд.4427) | Папулин | ИАД-15 (ауд.4336) | Зиннурова | ИАД-16 (ауд.3203) | Даулбаев, Чиркова | ИАД-17 (ауд.4335) | Гитман, Захаров |
3, 12.10-13.30 | ИАД-18 (ауд.4428) | Гитман, Рысьмятова | ||||||||
4, 13.40-15.00 | ИАД-2 (ауд.4427) | Папулин | ИАД-3 (ауд.4428) | Шестаков | ИАД-5 (ауд.3203) | Паринов | ИАД-6 (ауд.3214) | Кашницкий | ИАД-7 (ауд.4336) | Умнов |
5, 15.10-16.30 | ИАД-1 (ауд.4427) | Папулин | ИАД-6 (ауд.3214) | Кашницкий |
Программа лекций
Лекция 1 (12.01.2016). Введение в машинное обучение и анализ данных. [Слайды, 1 поток] [Слайды, 2 поток]
Лекция 2 (19.01.2016). Постановки задач в машинном обучении. Примеры прикладных задач. [Слайды]
Лекция 3 (26.01.2016). Линейная алгебра и анализ данных. [Слайды]
Лекция 4 (02.02.2016). Математический анализ и анализ данных. [Слайды]
Лекция 5 (9.02.2016). Теория вероятностей и анализ данных. [Слайды]
Лекция 6 (16.02.2016). Математическая статистика и анализ данных. [Слайды]
Лекция 7 (01.03.2016). Линейная регрессия. [Слайды]
Лекция 8 (15.03.2016). Линейная классификация. [Слайды]
Лекция 9 (22.03.2016). Оценивание качества алгоритмов. [Слайды] [Доп. материал: конспект по метрикам качества]
Консультация (05.04.2016). Обзор: линейные модели и оценивание качества.
Лекция 10 (19.04.2016). Решающие деревья. [Слайды]
Лекция 11 (26.04.2016). Решающие деревья и случайные леса. [Слайды]
Лекция 12 (10.05.2016). Понижение размерности данных. [Слайды]
Лекция 13 (17.05.2016). Кластеризация. [Слайды]
Лекция 14 (31.05.2016). Метрические методы. [Слайды]
Лекция 15 (07.06.2016). Анализ частых множеств признаков и ассоциативных правил. [Слайды]
Дополнительные материалы. [Слайды Ю. Кашницкого] [Слайды К.В. Воронцова]
Лекция 16 (14.06.2016). Заключительная лекция.
Страницы семинаров
- ИАД-1, Папулин С.Ю.
- ИАД-2, Папулин С.Ю.
- ИАД-3, Шестаков А.
- ИАД-4, Умнов А.В.
- ИАД-5, Паринов А.А.
- ИАД-6, Кашницкий Ю.С.
- ИАД-7, Умнов А.В.
- ИАД-8, Панов А.И.
- ИАД-9, Папулин С.Ю.
- ИАД-10, Зиннурова Э.А.
- ИАД-11, Козлова А.
- ИАД-12, Козлова А.
- ИАД-13, Ромов П.А.
- ИАД-14, Папулин С.Ю.
- ИАД-15, Зиннурова Э.А.
- ИАД-16, Даулбаев Т., Чиркова Н.
- ИАД-17, Гитман И., Захаров Е.
- ИАД-18, Гитман И., Рысьмятова А.
- ИАД-19, Квасов А., Полякова Н.
- ИАД-20, Струминский К.
Коллоквиум
В рамках курса предусмотрен промежуточный контроль знаний в рамках устного коллоквиума.
Дата проведения: 12 апреля
На коллоквиуме студенту будет предложено 5 вопросов из списка, каждый из которых "стоит" 2 балла.
Расписание:
1 пара (5215): ИАД-8, ИАД-13, ИАД-14, ИАД-20
2 пара (К-10): ИАД-4, ИАД-9, ИАД-10, ИАД-11, ИАД-15, ИАД-16, ИАД-19
3 пара (К-9): ИАД-2, ИАД-3, ИАД-12, ИАД-17, ИАД-18
4 пара (5215): ИАД-1, ИАД-5, ИАД-6, ИАД-7
Экзамен
Дата проведения экзамена: 21 июня
На экзамене студенту будет предложено 3 вопроса из списка, а также будет задан вопрос о содержании проекта. По усмотрению преподавателя могут быть заданы дополнительные вопросы для уточнения оценки.
Распределение по аудиториям можно найти в РУЗ.
Полезные материалы
Курсы по машинному обучению и анализу данных
- Курс по машинному обучению К.В. Воронцова
- Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов
- Coursera: Машинное обучение и анализ данных (специализация)
- Coursera: Введение в машинное обучение, К.В. Воронцов
- Coursera: Machine Learning, Andrew Ng
Статьи
- An Introduction to Machine Learning Theory and Its Applications: A Visual Tutorial with Examples
- A Visual Introduction to Machine Learning
Книги
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
- James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.