Майнор Интеллектуальный анализ данных/Введение в анализ данных — различия между версиями
Esokolov (обсуждение | вклад) (→О курсе) |
Dyashkov (обсуждение | вклад) |
||
Строка 41: | Строка 41: | ||
| ИАД-4 || [https://www.hse.ru/org/persons/191576735 Чиркова Надежда Александровна] || Стрельцов Антон ||[https://github.com/iad34/seminars Ссылка] || среда, 12:10 - 13:30, ауд. 4335 | | ИАД-4 || [https://www.hse.ru/org/persons/191576735 Чиркова Надежда Александровна] || Стрельцов Антон ||[https://github.com/iad34/seminars Ссылка] || среда, 12:10 - 13:30, ауд. 4335 | ||
|- | |- | ||
− | | ИАД-5 || [https://www.hse.ru/org/persons/192085968 Яшков Даниил Дмитриевич] || ||[https://github.com/yashakb/minor_HSE/ github] || среда, 12:10 - 13:30, ауд. 4336 | + | | ИАД-5 || [https://www.hse.ru/org/persons/192085968 Яшков Даниил Дмитриевич] || Кохтев Вадим ||[https://github.com/yashakb/minor_HSE/ github] || среда, 12:10 - 13:30, ауд. 4336 |
|- | |- | ||
|} | |} |
Версия 12:34, 22 февраля 2017
Содержание
О курсе
Курс читается для студентов 2-го курса майнора ИАД в 3-4 модулях.
Проводится с 2015 года.
Лектор: Соколов Евгений Андреевич
Лекции проходят по средам, 10:30 - 11:50, ауд. 5215 (Шаболовка, 26).
Полезные ссылки
Репозиторий с материалами на GitHub
Почта для сдачи домашних заданий: hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)
Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm
Оставить отзыв на курс: форма
Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. Вопросы по материалам лекций лучше всего оформлять в виде Issue в github-репозитории курса.
Семинары
Группа | Преподаватель | Учебный ассистент | Страница | Расписание |
---|---|---|---|---|
ИАД-1 | Папулин Сергей Юрьевич | среда, 12:10 - 13:30, ауд. 3214 | ||
ИАД-2 | Шестаков Андрей Владимирович | Чеснокова Полина | Тут | среда, 12:10 - 13:30, ауд. 4427 |
ИАД-3 | Даулбаев Талгат Кайратулы | Першин Дмитрий | Ссылка | среда, 09:00 - 10:20, ауд. 4335 |
ИАД-4 | Чиркова Надежда Александровна | Стрельцов Антон | Ссылка | среда, 12:10 - 13:30, ауд. 4335 |
ИАД-5 | Яшков Даниил Дмитриевич | Кохтев Вадим | github | среда, 12:10 - 13:30, ауд. 4336 |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
- Практические домашние работы на Python
- Коллоквиум в конце 1-го модуля
- Экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз
Оценка за работу в семестре вычисляется по формуле
Oнакопленная = 0.2 * Oсамостоятельные + 0.6 * Одз + 0.2 * Околлоквиум
Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям.
Правила сдачи заданий
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Лекция 1 (18.01.2017). Введение в машинное обучение и анализ данных. [Слайды]
Лекция 2 (25.01.2017). Типы задач машинного обучения. Типы признаков. Обобщающая способность и переобучение. Примеры задач анализа данных. [Слайды]
Лекция 3 (01.02.2017). Векторы и матрицы. Норма, метрика и скалярное произведение. Качество классификации, доля верных ответов. Оценивание обобщающей способности, кросс-валидация. Гипотеза компактности. Метод k ближайших соседей. [Слайды]
Лекция 4 (08.02.2017). Метод k ближайших соседей в регрессии. Среднеквадратичная ошибка. Матричное умножение. Производные и градиенты. Экстремумы функций. Обучение линейной регрессии. [Слайды]
Лекция 5 (15.02.2017). Градиентный спуск. Линейные зависимости и мультиколлинеарность. Регуляризация линейных моделей. Масштабирование признаков. [Слайды]
Полезные материалы
Курсы по машинному обучению и анализу данных
- Курс по машинному обучению К.В. Воронцова
- Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов
- Coursera: Машинное обучение и анализ данных (специализация)
- Coursera: Введение в машинное обучение, К.В. Воронцов
- Coursera: Machine Learning, Andrew Ng
Статьи
- An Introduction to Machine Learning Theory and Its Applications: A Visual Tutorial with Examples
- A Visual Introduction to Machine Learning
Книги
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
- James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.