Извлечение и анализ интернет-данных — различия между версиями
(Шаблон для описания курса) |
(→О курсе) |
||
Строка 3: | Строка 3: | ||
[[Файл:ML_surfaces.png|280px|borderless|left]] | [[Файл:ML_surfaces.png|280px|borderless|left]] | ||
− | Курс читается для студентов | + | Курс читается для студентов Экономического факультета. |
− | + | ||
Проводится с 2016 года. | Проводится с 2016 года. | ||
− | + | Семинаристы: | |
− | + | Денике Екатерина Игоревна | |
− | + | Слинько Игорь Юрьевич | |
− | + | Семинары проходят по субботам, с 10:30 до 15:00 (16:30) с двумя перерывами. | |
− | + | ||
− | + | ||
− | + | ||
=== Полезные ссылки === | === Полезные ссылки === | ||
− | + | Почта для сдачи домашних заданий: hsewebmining@gmail.com | |
− | + | ||
− | + | ||
− | + | ||
− | Почта для сдачи домашних заданий: | + | |
Канал в telegram для объявлений: https://telegram.me/hse_cs_ml_course_2017 | Канал в telegram для объявлений: https://telegram.me/hse_cs_ml_course_2017 |
Версия 20:08, 19 сентября 2017
Содержание
О курсе
Курс читается для студентов Экономического факультета. Проводится с 2016 года.
Семинаристы: Денике Екатерина Игоревна Слинько Игорь Юрьевич Семинары проходят по субботам, с 10:30 до 15:00 (16:30) с двумя перерывами.
Полезные ссылки
Почта для сдачи домашних заданий: hsewebmining@gmail.com
Канал в telegram для объявлений: https://telegram.me/hse_cs_ml_course_2017
Чат в telegram для обсуждений: https://t.me/joinchat/A5rlQEQ7r16nvyHbyXtjNA
Оставить отзыв на курс: форма
Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (esokolov@) или семинаристу. Вопросы по материалам лекций/семинаров и по заданиям лучше всего оформлять в виде Issue в github-репозитории курса.
Семинары
Группа | Преподаватель | Учебный ассистент | Страница | Расписание |
---|---|---|---|---|
151 (МОП) | Зиннурова Эльвира Альбертовна | Атанов Андрей | пятница, 12:10 - 13:30, ауд. 300 | |
152 (МОП) | Неклюдов Кирилл Олегович | Гадецкий Артём | понедельник, 15:10 - 16:30, ауд. 505 | |
153 (АПР) | Никишин Евгений Сергеевич | Ковалёв Евгений | пятница, 12:10 - 13:30, ауд. 322 | |
154 (АДИС) | Каюмов Эмиль Марселевич | Панков Алексей | пятница, 12:10 - 13:30, ауд. 501 | |
155 (РС) | Яшков Даниил Дмитриевич | Кохтев Вадим | понедельник, 12:10 - 13:30, ауд. 513 | |
156 (ТИ) | Умнов Алексей Витальевич | Шевченко Александр | ссылка | пятница, 15:10 - 16:30, ауд. 311 |
Магистратура ФТиАД | Чиркова Надежда Александровна | Першин Максим |
Консультации
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций
- Теоретические домашние работы и их защиты
- Практические домашние работы на Python
- Контрольные работы
- Письменный экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз
Оценка за работу в семестре вычисляется по формуле
Oнакопленная = 0.1 * Oсамостоятельные + 0.4 * Опрактические дз + 0.3 * Отеоретические дз + 0.2 * Оконтрольные
Оценка за самостоятельную работу вычисляется как среднее по всем самостоятельным, оценка за домашнюю работу — как среднее по всем практическим заданиям и соревнованиям.
Правила сдачи заданий
Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работа не принимаются.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён (при этом получить дополнительные баллы за призовые места на конкурсе можно только при участии в общий срок). Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Лекция 1 (1 сентября). Введение в машинное обучение. Основные термины, постановки задач и примеры применения. [Конспект]
Лекция 2 (8 сентября). Линейная регрессия. Метрики качества регрессии. Градиентный спуск и способы оценивания градиента. Продвинутые градиентные методы. [Конспект]
Семинары
Семинар 1. Постановки задач, примеры применения, инструменты. [Ноутбук с семинара] [Ноутбук для самостоятельного изучения]
Семинар 2. Векторное дифференцирование. Линейная регрессия, аналитическое и численное решение. Свойства градиента. Сравнение градиентного спуска и стохастического градиентного спуска. Scikit-learn. [Конспект] [Notebook] [Домашнее задание]
Семинар 3. Предобработка данных для линейных моделей. Функции потерь в линейной регрессии. Вероятностный взгляд на линейную регрессию. [Notebook]
Практические задания
Задание 1. Библиотека numpy и работа с данными.
Дата выдачи: 18.09.2017
Мягкий дедлайн: 01.10.2017 23:59MSK
Жесткий дедлайн: 08.10.2017 23:59MSK.
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются.
Условие, архив с условием и шаблонами, соревнование в Яндекс.Контесте.
Полезные материалы
Книги
- Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
- Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
- Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.
- Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.
Курсы по машинному обучению и анализу данных
- Курс по машинному обучению К.В. Воронцова
- Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов
- Coursera: Машинное обучение и анализ данных (специализация)
- Coursera: Введение в машинное обучение, К.В. Воронцов