Технологии анализа больших данных

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс позволяет получить целостное представление о возможностях и ограничениях современных статистических методов и машинного обучения, а также об особенностях анализа данных для решения задач, возникающих в области государственного управления.

Материалы курса

Лекции

Дата Тема Презентация
04.04.2019 Введение. Применимость анализа данных в повседневной жизни. Анализ данных в государственном управлении: области, задачи Лекция 1
18.04.2019 Введение в анализ данных. Описательные статистики. Корреляционный анализ Лекция 2
25.04.2019 Введение в машинное обучение. Регрессионный анализ. Лекция3
16.05.2019 Методы машинного обучения. Классификация. Лекция 4-5
23.05.2019 Методы машинного обучения. Кластеризация Лекция 4-5
30.05.2019 Статистические гипотезы. A/B тесты Лекция 6
06.06.2019 Визуализация данных Лекция 7
13.06.2019 Обсуждение проекта. -

Семинары

Семинар 1

Самостоятельная работа:

Смотреть здесь

Входной контроль:

Смотреть тут

Презентация:
Нажимать сюда

Семинар 2


ДемоДатасет C2
СР2
СР2 для 182, 183, 185

Семинар 3

Презентация тут

Демодлялогических

Самостоятельная тут

СР 182,183, 185

Семинар 4

Данные для тренировки Самостоятельная тут

Семинар 5

Данные для семинара тут:
Презентация тут
Демо. Статистика по преступлениям
Расшифровка данных
Демо. ESSR



СР5

Семинар 6

Презентация ТУТ!
Данные для тренировки


СР6
Семинар 7 и 8

Презентация
Данные для тренировки 1
Данные для тренировки 2
Макросы

Самостоятельные 7 и 8

Проект

Проект сдается в виде небольшого исследования на произвольную тему.

По группам разделиться и записаться можно тут:
Запись по группам


Оценка за проект складывается из следующих критериев (за каждый ставится оценка от 0 до 10):

  • Выбор темы – 0,1
  • Целостность – 0,1
  • Описательные статистики – 0,1
  • Анализ данных с интерпретацией– 0,2
  • Визуализация и представление результатов в презентации – 0,2
  • Оформление отчета и excel-файла – 0,1
  • Защита и ответы на вопросы – 0,2

Ведомости и оценки

Накопленная оценка формируется следующим образом:

0,05*Овходной+0,6*СР+0,35*ДЗ , где:

  • Овходной -входной тест для определения текущего уровня
  • СР - средняя оценка по еженедельным самостоятельным работам
  • ДЗ - большое дз по курсу

Оценка по курсу формируется следующим образом:

0,5*Онакопленная + 0.5*Оэкзамен

Ведомости

181 группа 182 группа 183 группа 184 группа 185 группа

Преподаватели курса

Лекции

Бурова Маргарита Борисовна

Семинары

Группа Семинарист Ассистент Контакты
БГУ181 Бурова Маргарита Борисовна Саломатин Юрий yuvsalomatin@edu.hse.ru, https://vk.com/id114420853
БГУ182 Горбунов Александр Андреевич Федоров Павел psfedorov@edu.hse.ru
БГУ183 Горбунов Александр Андреевич Федоров Павел psfedorov@edu.hse.ru
БГУ184 Бурова Маргарита Борисовна Черных Татьяна tochernykh@edu.hse.ru, vk.com/tanicher
БГУ185 Горбунов Александр Андреевич Екатерина Стасева kate.staseva8@gmail.com, vk.com/katy_staseva