ММО Политология 201810 — различия между версиями
Строка 39: | Строка 39: | ||
'''Лекция 4. Линейные модели. Линейная регрессия ''' <br/> | '''Лекция 4. Линейные модели. Линейная регрессия ''' <br/> | ||
[https://shestakoff.github.io/hse-ml-poly/2018-10/l4-linear/lecture-linear.slides#/ Slides] <br/> | [https://shestakoff.github.io/hse-ml-poly/2018-10/l4-linear/lecture-linear.slides#/ Slides] <br/> | ||
− | FYI: | + | FYI: [http://www.cazaar.com/ta/econ113/interpreting-beta Интерпретация коэффициентов линейной модели] <br/> |
FYI: [https://www.youtube.com/watch?v=UcwI7tY7bss&list=PLu5flfwrnSD5d02G9YJcDv30Fp5_70-sI Курс по эконометрике от Демешева Б.Б.] <br/> | FYI: [https://www.youtube.com/watch?v=UcwI7tY7bss&list=PLu5flfwrnSD5d02G9YJcDv30Fp5_70-sI Курс по эконометрике от Демешева Б.Б.] <br/> | ||
Версия 19:35, 23 ноября 2018
Преподаватель - Шестаков Андрей
Форма обратной связи здесь
Оценки
Course repo
Telegram Group
Содержание
Описание курса
Целью данного курса является изучение
- Основных идеи и принципов машинного обучения с упором на их практическое применение
- Методов сбора и анализа сложный структур данных
Предполагается, что слушатели прошли вводный курс по языку Python и имеют базовые знания по высшей математике (линейная алгебра, мат. анализ)
Курс оценивается за счет
- Тестов на занятиях
- Практических и теоретических домашних заданий
- Коллоквиума в конце 2го модуля
- Проектной работы
- Экзамена
Материалы лекций
Лекция 1. Введение
Slides
Лекция 2. Метрические методы и метрики качества классификации
Slides
FYI: Статистические тесты для сравнения качества моделей
Лекция 3. Деревья принятия решений. Случайный лес
Slides
FYI: beautiful trees intro
FYI: trees and random forest interpretation
Лекция 4. Линейные модели. Линейная регрессия
Slides
FYI: Интерпретация коэффициентов линейной модели
FYI: Курс по эконометрике от Демешева Б.Б.
Семинары
Семинар 1. Введение (повторение)
Частично проработанный ноутбук
Семинар 2. Метрические методы
Частично проработанный ноутбук
Семинар 3. Деревья принятия решений
Частично проработанный ноутбук
Семинар 4. Линейные модели
Частично проработанный ноутбук
Домашние задания
Задание 1. Дедлайн - 2 Декабря 2018, 23:59
Курсовой проект
В рамках курса студенты должны применить полученные знания для решения прикладной задачи. Размеры проектных групп 1-3 человека.
Отчет по проекту должен состоять из следующих частей:
- Мотивация и цель проекта
- Формальная постановка задачи
- Выгрузка и описание исходных данных
- Описание экспериментов и их результаты
Защита проекта будет проходить в виде презентации
Плагиат
Карается жестоко и на месте
Дедлайны
Дедлайны по всем заданиям являются строгими (то есть после дедлайна работы приниматься не будут).
Сроки сдачи могут быть сдвинуты в индивидуальном порядке в случае существования уважительных причин.
Формат сдачи домашних заданий
Практические ДЗ должны быть выполнены в Jupyter Notebook на языке Python 3. Файл должен успешно выполняться (кроме случаев нестыковки модулей) и содержать только релевантную информацию.
Крайне желательно следовать правилам PEP8
Полезные Ссылки
Machine learning
- Открытый курс по МО
- Видео курс по анализу данных от CS Center часть 1 и часть 2
- Курс от Евгения Соколова
- machinelearning.ru
- Видео лекции Воронцова К.Ю.
- Подборка книг по ML
- Elements of Statistical Learning (Trevor Hastie, Robert Tibshirani, Jerome Friedman)
Python
- Основные библиотеки и документация: NumPy, Pandas, SciKit-Learn, Matplotlib.
- Краткое руководство: краткое руководство с примерами по Python 2
- Python from scratch: A Crash Course in Python for Scientists
- Lectures Scientific Python
- A book: Wes McKinney «Python for Data Analysis»
- Коллекция интересных IPython ноутбуков