Введение в Data Science 21-22 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Порядок групп)
(не показаны 44 промежуточные версии 5 участников)
Строка 16: Строка 16:
  
 
[https://youtube.com/playlist?list=PLEwK9wdS5g0pjLmeVVLKCmK2C1s_AZane Записи лекций и семинаров]
 
[https://youtube.com/playlist?list=PLEwK9wdS5g0pjLmeVVLKCmK2C1s_AZane Записи лекций и семинаров]
 +
 +
[https://docs.google.com/spreadsheets/d/1YgaN9aMxb4l9Xqj6kUDjdaJj_inZzrrnBkCaB8x3_N8/edit#gid=0 Таблица с оценками]
  
 
=== Семинары ===
 
=== Семинары ===
Строка 23: Строка 25:
 
! Группа !! Семинарист !! Учебные ассистенты !! Ссылка !! Ссылка на чат !! Материалы семинаров
 
! Группа !! Семинарист !! Учебные ассистенты !! Ссылка !! Ссылка на чат !! Материалы семинаров
 
|-
 
|-
| БММ201 || [https://t.me/anastasiyamaxx Настя Максимовская] || [https://t.me/Lunananas Полина Ясакова] || [https://us06web.zoom.us/j/84815973036?pwd=SzVCMjd6UlFnYkFPMy9hQnRMd1FGdz09 Zoom на вторник] [https://us06web.zoom.us/j/81752192615?pwd=N21yWW5jdFBIOTlIU0RNTThsV0JxUT09 Zoom на пятницу]|| [https://t.me/+soAWgiFqYxsyM2Ni Чат] ||
+
| БМБ201 || [https://t.me/vol_anastasia Анастасия Волкова] || [https://t.me/treasure_of Саид Дандамаев] || || [https://t.me/+HtftxG1HaAQ2Y2Ji Чат] || [https://drive.google.com/drive/folders/11qSDxUA_Z8CA_U2gTapZJ7_P_UWcl5Dx?usp=sharing Материалы]
|-
+
| БММ202 || [https://t.me/juliatukmacheva Юлия Тукмачева] || [https://t.me/mikayelyanjelo Айк Микаелян] || || [https://t.me/+BKgyoeGrIMcwYmUy Чат] ||
+
|-
+
| БММ203 || [https://t.me/Burritas Маргарита Бурова]  || [https://t.me/avorus София Сурова] ||  || [https://t.me/+XjArfAHuA3w3YmQy Чат] ||
+
|-
+
| БММ204 || Пётр Панов  || [https://t.me/avorus София Сурова] ||  || [https://t.me/+dSkKZtBShp4wNTEy Чат] ||
+
 
|-
 
|-
 
| БМБ203 || [https://t.me/tfdino Дима Третьяков] || [https://t.me/nim_85620 Светалана Кондратьева] || [https://us06web.zoom.us/j/82352305017?pwd=b2tweFBGaThRYVYrZW1jWlNaMnpYZz09 Zoom] || [https://t.me/+fIZEc59O_UswMzMy Чат] ||
 
| БМБ203 || [https://t.me/tfdino Дима Третьяков] || [https://t.me/nim_85620 Светалана Кондратьева] || [https://us06web.zoom.us/j/82352305017?pwd=b2tweFBGaThRYVYrZW1jWlNaMnpYZz09 Zoom] || [https://t.me/+fIZEc59O_UswMzMy Чат] ||
Строка 42: Строка 38:
 
|-
 
|-
 
|БМБ208 || [https://t.me/tfdino Дима Третьяков] || [https://t.me/nim_85620 Светалана Кондратьева] || [https://us06web.zoom.us/j/83706114395?pwd=bWJGM3pBTGVhdWNJblAyN1VvWW0wQT09 Zoom] || [https://t.me/+gYU9szPYDvplYmYy Чат] ||
 
|БМБ208 || [https://t.me/tfdino Дима Третьяков] || [https://t.me/nim_85620 Светалана Кондратьева] || [https://us06web.zoom.us/j/83706114395?pwd=bWJGM3pBTGVhdWNJblAyN1VvWW0wQT09 Zoom] || [https://t.me/+gYU9szPYDvplYmYy Чат] ||
|
+
|-
 +
| БММ201 || [https://t.me/anastasiyamaxx Настя Максимовская] || [https://t.me/Lunananas Полина Ясакова] || [https://us06web.zoom.us/j/84815973036?pwd=SzVCMjd6UlFnYkFPMy9hQnRMd1FGdz09 Zoom на вторник] [https://us06web.zoom.us/j/81752192615?pwd=N21yWW5jdFBIOTlIU0RNTThsV0JxUT09 Zoom на пятницу]|| [https://t.me/+soAWgiFqYxsyM2Ni Чат] ||
 +
|-
 +
| БММ202 || [https://t.me/juliatukmacheva Юлия Тукмачева] || [https://t.me/mikayelyanjelo Айк Микаелян] || || [https://t.me/+BKgyoeGrIMcwYmUy Чат] ||
 +
|-
 +
| БММ203 || [https://t.me/Burritas Маргарита Бурова]  || [https://t.me/avorus София Сурова] ||  || [https://t.me/+XjArfAHuA3w3YmQy Чат] || [https://drive.google.com/drive/folders/1NlWEnA6u7mJx9UKf7A-7hpzIrlQrLPUk?usp=sharing Папка с материалами]
 +
|-
 +
| БММ204 || [https://t.me/panov_pa Пётр Панов]  || [https://t.me/avorus София Сурова] ||  || [https://t.me/+dSkKZtBShp4wNTEy Чат] || [https://drive.google.com/drive/folders/1FcyRPLFRAKTDixCh3QArPTHnS3nwwbL2?usp=sharing Материалы к семинарам]
 +
|-
 +
| БММ205 || [https://t.me/vol_anastasia Анастасия Волкова] || [https://t.me/treasure_of Саид Дандамаев] ||  || [https://t.me/+3wLSqNjthEUwM2M6 Чат] || [https://drive.google.com/drive/folders/11qSDxUA_Z8CA_U2gTapZJ7_P_UWcl5Dx?usp=sharing Материалы]
 
|}
 
|}
  
Строка 68: Строка 73:
  
 
'''Лекция 2''' (04.04.2022). Теория вероятностей. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture02.pdf Конспект]] [[https://youtu.be/TRo9Q7zFEfo Запись лекции]]
 
'''Лекция 2''' (04.04.2022). Теория вероятностей. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture02.pdf Конспект]] [[https://youtu.be/TRo9Q7zFEfo Запись лекции]]
 +
 +
'''Лекция 3''' (11.04.2022). Теория вероятностей (продолжение). [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture03.pdf Конспект]] [[https://youtu.be/pQkpWoE2FmA Запись лекции]]
 +
 +
'''Лекция 4''' (18.04.2022). Ковариация и корреляция. Проверка гипотез (начало). [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture04.pdf Конспект]] [[https://youtu.be/XYRJo8ZIay4 Запись лекции]]
 +
 +
'''Лекция 5''' (25.04.2022). Проверка гипотез. Непараметрика. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture05.pdf Конспект]] [[https://youtu.be/o1CJ-0jParg Запись лекции]]
 +
 +
'''Лекция 6''' (25.04.2022). Линейная регрессия (начало). [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture06.pdf Конспект]] [[https://youtu.be/o1CJ-0jParg Запись лекции]]
 +
 +
'''Лекция 7''' (16.05.2022). Линейная регрессия (продолжение). [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture07.pdf Конспект]] [[https://youtu.be/MKXfVcpIdqQ Запись лекции]]
 +
 +
'''Лекция 8''' (16.05.2022). Введение в машинное обучение. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture08.pdf Конспект]] [[https://youtu.be/MKXfVcpIdqQ Запись лекции]]
 +
 +
'''Лекция 9''' (30.05.2022). Линейная регрессия в МО. kNN. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture09.pdf Конспект]] [[https://youtu.be/jgiUUvTvy28 Запись лекции]]
 +
 +
'''Лекция 10''' (06.06.2022). Логистическая регрессия. Метрики качества в задаче классификации. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/lectures/IDS_lecture10.pdf Конспект]] [[https://youtu.be/EUOsW5-9vuY Запись лекции]]
  
 
== Семинары ==
 
== Семинары ==
Строка 74: Строка 95:
  
 
'''Семинар 2.''' Введение в Pandas. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week2_pandas/sem02_pandas_intro.ipynb Тетрадка]]
 
'''Семинар 2.''' Введение в Pandas. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week2_pandas/sem02_pandas_intro.ipynb Тетрадка]]
 +
 +
'''Семинар 3.''' Визуализация. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week3_data-viz/sem_visual_ex.ipynb Тетрадка]]
 +
 +
'''Семинар 4.''' EDA. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week4_eda/sem04_eda.ipynb Тетрадка]]
 +
 +
'''Семинар 5.''' Тестирование гипотез. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week5_hypothesis/sem_5.ipynb Тетрадка]]
 +
 +
'''Семинар 6.''' p-value. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week6_hypothesis_2/sem_6.ipynb Тетрадка]]
 +
 +
'''Семинар 7.''' Непараметрика. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week7_nonparametric/Sem7.ipynb Тетрадка]]
 +
 +
'''Семинар 8.''' EDA и тестирование гипотез. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week8/Sem8_IntroDS.ipynb Тетрадка]]
 +
 +
'''Семинары 9-10.''' Линейная регрессия в статистике. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week10_linreg/sem10_linearRegression.ipynb Тетрадка]]
 +
 +
'''Семинар 11.''' Линейная регрессия в МО. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/Sem11_adv_linreg/S11_intro_Ds-Copy1.ipynb Тетрадка]]
 +
 +
'''Семинар 12.''' Задача классификации. Метод kNN. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week12%20-%20knn/sem12_classification.ipynb Тетрадка]]
 +
 +
'''Семинар 13.''' Логистическая регрессия. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/seminars/week13_logit/week13_logit.ipynb Тетрадка]]
 +
 +
'''Семинар 14.''' Разбор демо-варианта. Консультация.
 +
 +
== Доп. лекции ==
 +
 +
'''Доп. лекция 1''' (26.04.2022). ООП. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/additional_lectures/al01_OOP.ipynb Кодспект]] [[https://youtu.be/fMvxvCzJlaM Запись лекции]]
 +
 +
'''Доп. лекция 2''' (24.05.2022). Множественная регрессия. [[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/additional_lectures/al02_linreg.pdf Конспект]] [[https://youtu.be/GJeQS0dbtBc Запись лекции]]
 +
 +
'''Доп. лекция 3''' (31.05.2022). Метод максимального правдоподобия. Тесты правдоподобия.
 +
 +
* [[https://github.com/V-Marco/psmo_20_21/blob/master/seminars/sem1/PSMO_Sem1.pdf Конспект 1]] [[https://youtu.be/1OqPRX_wj_Y Запись лекции 1]]
 +
* [[https://github.com/V-Marco/psmo_20_21/blob/master/seminars/sem2/PSMO_Sem2.pdf Конспект 2]] [[https://www.youtube.com/watch?v=pGPi7xBbYgk&feature=youtu.be Запись лекции 2]]
  
 
== Домашние задания ==
 
== Домашние задания ==
  
== Полезные материалы ==
+
====Домашнее задание 2====
 +
 
 +
'''Дата выдачи:''' 27 апреля
 +
 
 +
'''Дедлайн:''' 18 мая, 23:59
 +
 
 +
[[https://github.com/V-Marco/public_intro_to_DS_mba_hse/tree/main/HW Условие]]
 +
 
 +
[[https://classroom.github.com/a/aeUpj39X Ссылка на задание в Classroom]]
 +
 
 +
====Домашнее задание 3====
 +
 
 +
'''Дата выдачи:''' 25 мая
 +
 
 +
'''Дедлайн:''' 2 июня, 23:59
 +
 
 +
[[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/HW/HW3/DZ3_DS.ipynb Условие]]
 +
 
 +
[[https://classroom.github.com/a/P49hezh7 Ссылка на задание в Classroom]]
 +
 
 +
====Домашнее задание 4 ====
 +
 
 +
'''Дата выдачи:''' 3 июня
 +
 
 +
'''Дедлайн:''' 10 июня, 23:59
 +
 
 +
[[https://github.com/V-Marco/public_intro_to_DS_mba_hse/blob/main/HW/HW4/intro_to_ds_hw4.ipynb Условие]]
 +
 
 +
[[https://classroom.github.com/a/vX7_k1kZ Ссылка на задание в Classroom]]
 +
 
 +
====Домашнее задание 5 ====
 +
 
 +
'''Дата выдачи:''' 12 июня
 +
 
 +
'''Дедлайн:''' 19 июня, 23:59
 +
 
 +
[[https://github.com/V-Marco/public_intro_to_DS_mba_hse/tree/main/HW/HW5 Условие]]
 +
 
 +
[[https://classroom.github.com/a/gyIk0okO Ссылка на задание в Classroom]]

Версия 14:25, 20 июня 2022

О курсе

Курс читается для студентов 2-го курса программ УБ и МиРА в 4 модуле.

Лектор: Омелюсик Владимир Степанович

Лекции проходят по понедельникам в 13:00 в Teams.

Полезные ссылки

GitHub с материалами

Канал в Телеграме для объявлений

Анонимная Google-форма для фидбэка

Записи лекций и семинаров

Таблица с оценками

Семинары

Группа Семинарист Учебные ассистенты Ссылка Ссылка на чат Материалы семинаров
БМБ201 Анастасия Волкова Саид Дандамаев Чат Материалы
БМБ203 Дима Третьяков Светалана Кондратьева Zoom Чат
БМБ204 Юлия Тукмачева Айк Микаелян Чат
БМБ205 Кутынина Екатерина Анна Герцог Чат
БМБ206 Кутынина Екатерина Анна Герцог Чат
БМБ207 Владимир Омелюсик Никита Горевой Teams Чат Материалы
БМБ208 Дима Третьяков Светалана Кондратьева Zoom Чат
БММ201 Настя Максимовская Полина Ясакова Zoom на вторник Zoom на пятницу Чат
БММ202 Юлия Тукмачева Айк Микаелян Чат
БММ203 Маргарита Бурова София Сурова Чат Папка с материалами
БММ204 Пётр Панов София Сурова Чат Материалы к семинарам
БММ205 Анастасия Волкова Саид Дандамаев Чат Материалы

Правила выставления оценок

Формула оценки:

Итог = 0.5 * ДЗ + 0.2 * Квизы + 0.3 * Экзамен

  • ДЗ – средняя оценка за домашние задания. Домашние задания представляют собой практические работы на Python.
  • Квизы – средняя оценка за квизы. Квизы проводятся в Google-формах на лекциях и состоят из 4-5 вопросов с множественным или свободным вариантами ответов. О проведении квиза предупреждается заранее.
  • Экзамен - оценка за письменный экзамен (не блокирующий). "Автоматов" за экзамен не предусмотрено.

Каждая форма контроля нормируется к десятибалльной системе. Любая форма контроля на усмотрение преподавателя может быть представлена к устной защите.

Плагиат не допускается. Плагиатом считается смысловое совпадение решений студентов (например, идентичные решения с точностью до названий переменных). При обнаружении плагиата 0 за работу ставится всем участвующим, даже если можно однозначно определить, кто у кого списал.

Используется стандартное арифметическое округление, округляется только итоговая оценка.

Лекции

Лекция 1 (04.04.2022). Введение в статистику и ML. [Конспект] [Запись лекции]

Лекция 2 (04.04.2022). Теория вероятностей. [Конспект] [Запись лекции]

Лекция 3 (11.04.2022). Теория вероятностей (продолжение). [Конспект] [Запись лекции]

Лекция 4 (18.04.2022). Ковариация и корреляция. Проверка гипотез (начало). [Конспект] [Запись лекции]

Лекция 5 (25.04.2022). Проверка гипотез. Непараметрика. [Конспект] [Запись лекции]

Лекция 6 (25.04.2022). Линейная регрессия (начало). [Конспект] [Запись лекции]

Лекция 7 (16.05.2022). Линейная регрессия (продолжение). [Конспект] [Запись лекции]

Лекция 8 (16.05.2022). Введение в машинное обучение. [Конспект] [Запись лекции]

Лекция 9 (30.05.2022). Линейная регрессия в МО. kNN. [Конспект] [Запись лекции]

Лекция 10 (06.06.2022). Логистическая регрессия. Метрики качества в задаче классификации. [Конспект] [Запись лекции]

Семинары

Семинар 1. Повторение Python. [Тетрадка]

Семинар 2. Введение в Pandas. [Тетрадка]

Семинар 3. Визуализация. [Тетрадка]

Семинар 4. EDA. [Тетрадка]

Семинар 5. Тестирование гипотез. [Тетрадка]

Семинар 6. p-value. [Тетрадка]

Семинар 7. Непараметрика. [Тетрадка]

Семинар 8. EDA и тестирование гипотез. [Тетрадка]

Семинары 9-10. Линейная регрессия в статистике. [Тетрадка]

Семинар 11. Линейная регрессия в МО. [Тетрадка]

Семинар 12. Задача классификации. Метод kNN. [Тетрадка]

Семинар 13. Логистическая регрессия. [Тетрадка]

Семинар 14. Разбор демо-варианта. Консультация.

Доп. лекции

Доп. лекция 1 (26.04.2022). ООП. [Кодспект] [Запись лекции]

Доп. лекция 2 (24.05.2022). Множественная регрессия. [Конспект] [Запись лекции]

Доп. лекция 3 (31.05.2022). Метод максимального правдоподобия. Тесты правдоподобия.

Домашние задания

Домашнее задание 2

Дата выдачи: 27 апреля
Дедлайн: 18 мая, 23:59

[Условие]

[Ссылка на задание в Classroom]

Домашнее задание 3

Дата выдачи: 25 мая
Дедлайн: 2 июня, 23:59

[Условие]

[Ссылка на задание в Classroom]

Домашнее задание 4

Дата выдачи: 3 июня
Дедлайн: 10 июня, 23:59

[Условие]

[Ссылка на задание в Classroom]

Домашнее задание 5

Дата выдачи: 12 июня
Дедлайн: 19 июня, 23:59

[Условие]

[Ссылка на задание в Classroom]