Введение в Data Science 21-22

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 2-го курса программ УБ и МиРА в 4 модуле.

Лектор: Омелюсик Владимир Степанович

Лекции проходят по понедельникам в 13:00 в Teams.

Полезные ссылки

GitHub с материалами

Канал в Телеграме для объявлений

Анонимная Google-форма для фидбэка

Записи лекций и семинаров

Таблица с оценками

Семинары

Группа Семинарист Учебные ассистенты Ссылка Ссылка на чат Материалы семинаров
БМБ201 Анастасия Волкова Саид Дандамаев Чат Материалы
БМБ203 Дима Третьяков Светалана Кондратьева Zoom Чат
БМБ204 Юлия Тукмачева Айк Микаелян Чат
БМБ205 Кутынина Екатерина Анна Герцог Чат
БМБ206 Кутынина Екатерина Анна Герцог Чат
БМБ207 Владимир Омелюсик Никита Горевой Teams Чат Материалы
БМБ208 Дима Третьяков Светалана Кондратьева Zoom Чат
БММ201 Настя Максимовская Полина Ясакова Zoom на вторник Zoom на пятницу Чат
БММ202 Юлия Тукмачева Айк Микаелян Чат
БММ203 Маргарита Бурова София Сурова Чат Папка с материалами
БММ204 Пётр Панов София Сурова Чат Материалы к семинарам
БММ205 Анастасия Волкова Саид Дандамаев Чат Материалы

Правила выставления оценок

Формула оценки:

Итог = 0.5 * ДЗ + 0.2 * Квизы + 0.3 * Экзамен

  • ДЗ – средняя оценка за домашние задания. Домашние задания представляют собой практические работы на Python.
  • Квизы – средняя оценка за квизы. Квизы проводятся в Google-формах на лекциях и состоят из 4-5 вопросов с множественным или свободным вариантами ответов. О проведении квиза предупреждается заранее.
  • Экзамен - оценка за письменный экзамен (не блокирующий). "Автоматов" за экзамен не предусмотрено.

Каждая форма контроля нормируется к десятибалльной системе. Любая форма контроля на усмотрение преподавателя может быть представлена к устной защите.

Плагиат не допускается. Плагиатом считается смысловое совпадение решений студентов (например, идентичные решения с точностью до названий переменных). При обнаружении плагиата 0 за работу ставится всем участвующим, даже если можно однозначно определить, кто у кого списал.

Используется стандартное арифметическое округление, округляется только итоговая оценка.

Лекции

Лекция 1 (04.04.2022). Введение в статистику и ML. [Конспект] [Запись лекции]

Лекция 2 (04.04.2022). Теория вероятностей. [Конспект] [Запись лекции]

Лекция 3 (11.04.2022). Теория вероятностей (продолжение). [Конспект] [Запись лекции]

Лекция 4 (18.04.2022). Ковариация и корреляция. Проверка гипотез (начало). [Конспект] [Запись лекции]

Лекция 5 (25.04.2022). Проверка гипотез. Непараметрика. [Конспект] [Запись лекции]

Лекция 6 (25.04.2022). Линейная регрессия (начало). [Конспект] [Запись лекции]

Лекция 7 (16.05.2022). Линейная регрессия (продолжение). [Конспект] [Запись лекции]

Лекция 8 (16.05.2022). Введение в машинное обучение. [Конспект] [Запись лекции]

Лекция 9 (30.05.2022). Линейная регрессия в МО. kNN. [Конспект] [Запись лекции]

Семинары

Семинар 1. Повторение Python. [Тетрадка]

Семинар 2. Введение в Pandas. [Тетрадка]

Семинар 3. Визуализация. [Тетрадка]

Семинар 4. EDA. [Тетрадка]

Семинар 5. Тестирование гипотез. [Тетрадка]

Семинар 6. p-value. [Тетрадка]

Семинар 7. Непараметрика. [Тетрадка]

Семинар 8. EDA и тестирование гипотез. [Тетрадка]

Семинары 9-10. Линейная регрессия в статистике. [Тетрадка]

Семинар 11. Линейная регрессия в МО. [Тетрадка]

Семинар 12. Задача классификации. Метод kNN. [Тетрадка]

Доп. лекции

Доп. лекция 1 (26.04.2022). ООП. [Кодспект] [Запись лекции]

Доп. лекция 2 (24.05.2022). Множественная регрессия. [Конспект] [Запись лекции]

Доп. лекция 3 (31.05.2022). Метод максимального правдоподобия. Тесты правдоподобия.

Домашние задания

Домашнее задание 2

Дата выдачи: 27 апреля
Дедлайн: 18 мая, 23:59

[Условие]

[Ссылка на задание в Classroom]

Домашнее задание 3

Дата выдачи: 25 мая
Дедлайн: 2 июня, 23:59

[Условие]

[Ссылка на задание в Classroom]

Домашнее задание 4

Дата выдачи: 3 июня
Дедлайн: 10 июня, 23:59

[Условие]

[Ссылка на задание в Classroom]