Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации") — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показано 48 промежуточных версии 5 участников)
Строка 1: Строка 1:
 
== О курсе ==
 
== О курсе ==
Курс читается для студентов 2-го курса ОП [https://www.hse.ru/ba/journ/ "Журналистика"] и [https://www.hse.ru/ba/media/ "Медиакоммуникации"] ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
+
Дисциплина читается для студентов 2-го курса ОП [https://www.hse.ru/ba/journ/ "Журналистика"] и [https://www.hse.ru/ba/media/ "Медиакоммуникации"] ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
  
 
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
 
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
 
Дисциплина реализуется с помощью [https://openedu.ru/course/hse/STATDA/ онлайн-курса «Статистика для анализа данных»]
 
  
 
[https://www.hse.ru/ba/journ/courses/646483446.html ПУД курса "Анализ данных"] и [https://www.hse.ru/ba/journ/courses/646487205.html ПУД "Независимого экзамена по анализу данных"] на ОП "Журналистика"
 
[https://www.hse.ru/ba/journ/courses/646483446.html ПУД курса "Анализ данных"] и [https://www.hse.ru/ba/journ/courses/646487205.html ПУД "Независимого экзамена по анализу данных"] на ОП "Журналистика"
Строка 11: Строка 9:
  
 
== Необходимые ссылки ==
 
== Необходимые ссылки ==
 +
Дисциплина реализуется с помощью '''[https://edu.hse.ru/course/view.php?id=136231 «Учебника по анализу данных (начальный)»]''' и направлена на формирование компетенций в области статистики и анализа данных, которые будет оцениваться на Независимом экзамене (НЭ).
 +
 +
Из чего состоит НЭ можно прочитать в '''[https://drive.google.com/file/d/1ireaP0hKlQCzS--BCtzi_-Q3RLkDjKPI/view Спецификации]''', а также посмотреть '''[https://drive.google.com/file/d/1ByikW4pZ2gdw4DLNbBc90bdfT7dJIcPK/view Демонстрационный вариант НЭ]'''.
 +
 +
[https://www.hse.ru/dataculture/exams Порядок организации Независимых экзаменов по Цифровым компетенциям] подробно описан в Приложении 17 к [https://www.hse.ru/docs/551872110.html ПОПАТКУСу]
 +
 +
'''[https://github.com/aaparshina/FCI_22-23_data_analysis Репозиторий]''' с материалами курса на гитхабе Анастасии Алексеевны Паршиной
  
 
== Команда курса ==
 
== Команда курса ==
Строка 18: Строка 23:
 
! Группа !! Преподаватель !! Контакты !! Ассистент !! Контакты
 
! Группа !! Преподаватель !! Контакты !! Ассистент !! Контакты
 
|-
 
|-
| БЖУР211, [# чат группы в Телеграме] || Перевышина Татьяна Олеговна || tg @prvshna || ||
+
| БЖУР211 || Перевышина Татьяна Олеговна || @prvshna || Софья Шандыбина || @esthesuntik
 
|-
 
|-
| БЖУР212 || Перевышина Татьяна Олеговна || tg @prvshna ||  ||
+
| БЖУР212 || Перевышина Татьяна Олеговна || @prvshna ||  ||
 
|-
 
|-
| БЖУР213 || Аброскин Илья Дмитриевич || tg @iiiiilllllyyyyyaaaa ||  ||
+
| БЖУР213 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa ||  ||
 
|-
 
|-
| БЖУР214 || Довгополый Иоанн Алексеевич || tg @TriariiMisha || ||
+
| БЖУР214 || Довгополый Иоанн Алексеевич || @TriariiMisha || Лика Капустина ||@lika_kapustina
 
|-
 
|-
| БЖУР215 || Паршина Анастасия Алексеевна || tg @aaparshina || ||
+
| БЖУР215 [https://t.me/+ZZwyTHOEldxmZTEy чат группы]|| Паршина Анастасия Алексеевна || @aaparshina || Жданова Мария || @avonadz
 
|-
 
|-
| БМД211 || Степановских Кирилл Олегович || tg @kir_stepanovskikh || ||
+
| БМД211 [https://t.me/+znsTom4TeO8xZmFi  чат группы] || Степановских Кирилл Олегович || @kir_stepanovskikh || Соколова Ирина || @irsklv
 
|-
 
|-
| БМД212 || Степановских Кирилл Олегович || tg @kir_stepanovskikh || ||
+
| БМД212 [https://t.me/+IMIqpRbPufJiNzUy чат группы] || Степановских Кирилл Олегович || @kir_stepanovskikh || Яковлева Паулина || @paulinebakst
 
|-
 
|-
| БМД213 || Волкова Анастасия Эдуардовна || tg @vol_anastasia ||  ||
+
| БМД213 || Волкова Анастасия Эдуардовна || @vol_anastasia ||  ||
 
|-
 
|-
| БМД214 || Волкова Анастасия Эдуардовна || tg @vol_anastasia ||  ||
+
| БМД214 || Волкова Анастасия Эдуардовна || @vol_anastasia ||  ||
 
|-
 
|-
| БМД215 || Степановских Кирилл Олегович || tg @kir_stepanovskikh || ||
+
| БМД215 [https://t.me/+1e5Q7i8jNLtjNjMy чат группы] || Степановских Кирилл Олегович || @kir_stepanovskikh || Киберча Анастасия || @Saranast
 
|-
 
|-
| БМД216 || Аброскин Илья Дмитриевич || tg @iiiiilllllyyyyyaaaa || ||
+
| БМД216 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa || Алкаев Владислав || @Avonna
 
|-
 
|-
| БМД217 || Аброскин Илья Дмитриевич || tg @iiiiilllllyyyyyaaaa ||  ||
+
| БМД217 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa ||  ||
 
|-
 
|-
| БМД218 || Перевышина Татьяна Олеговна || tg @prvshna || ||
+
| БМД218 || Перевышина Татьяна Олеговна || @prvshna || Анна Заремба || @anazaremba
 
|-
 
|-
 
|}
 
|}
  
 
== Материалы курса ==
 
== Материалы курса ==
 +
=== Лекции ===
 +
# '''Организация курса''' - [https://drive.google.com/file/d/1gLHhQZMOmwN1RlmJn33i_BpmsGsrFDn8/view?usp=share_link презентация]
 +
# '''Как выглядит образцовый проект''' - [https://drive.google.com/file/d/1u6kV0knt7ImHD-1BACWfRVRcTPlx-ykj/view?usp=sharing кодбук], [https://drive.google.com/file/d/1wfc3PpmezgjnVSlJbS9wO2fprdGF6bu2/view?usp=share_link запись]
 +
# '''Разбор демонстрационного вариант НЭ''' - здесь скоро будет ссылка на запись
 +
 +
=== Семинары ===
 +
{| class="wikitable"
 +
|-
 +
! № !! Тема занятия !! Задание к занятию !! Материалы занятия
 +
|-
 +
 +
| 1 || '''Модуль Pandas и NumPy'''
 +
||
 +
* Установить дистрибутив Anaconda
 +
* Вспомнить базовый Python
 +
* Посмотреть тему 1 в онлайн-курсе
 +
||
 +
[https://drive.google.com/file/d/1inXJ31isCET1_65DsSGZhEWh9OhEzpkk/view?usp=sharing Семинар 1]
 +
 +
[https://drive.google.com/file/d/1iwbJ948u2wvbrQZ5xmB_WY7_38nwXkOZ/view?usp=sharing Задачи 1]
 +
 +
[https://drive.google.com/file/d/1iy2RNBAqWWtAE-lAsSy9A4acJqzZ-PR3/view?usp=sharing Решения 1]
 +
|-
 +
 +
| 2 || '''Фильтрация и сортировка данных в Pandas'''
 +
||
 +
* Посмотреть тему 2 в онлайн-курсе
 +
||
 +
[https://drive.google.com/file/d/1j1lvo2qguJ6xD9EWTkxD44GSm9s6RG39/view?usp=sharing Семинар 2]
 +
 +
[https://drive.google.com/file/d/1j6OWrpTuAYx4M4V4fTZUSZCwicVHwkaQ/view?usp=sharing Задачи 2]
 +
 +
[https://drive.google.com/file/d/1kCCSEpmh_3R6sfXs9MjtVLWFbSt-WDi6/view?usp=sharing Решения 2]
 +
|-
 +
 +
| 3 || '''Типы данных. Создание новых переменных'''
 +
||
 +
* Посмотреть тему 3 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 3
 +
||
 +
[https://drive.google.com/file/d/1r758MJeHCZw571AxDkKLgoJ7mGLiAISt/view?usp=sharing Задачи 3]
 +
 +
[https://drive.google.com/file/d/1r8ysBrMmNT7NFYi_5_cq3IhzyPt9u_rn/view?usp=sharing Решения 3]
 +
 +
|-
 +
 +
| 4 || '''Генеральная совокупность и выборка. Частотные таблицы и распределения'''
 +
||
 +
* Посмотреть тему 4 в онлайн-курсе
 +
* Подготовиться к опросу по содержанию темы 4
 +
* Подготовиться к разбору заданий из темы 4
 +
||
 +
[https://drive.google.com/file/d/1rDNz96EnKWI1ukl5crwLYYEfMw1Z_D4O/view?usp=sharing Семинар 4]
 +
 +
[https://drive.google.com/file/d/1rEVFCDj2SDW3k8_SOYZ-5Pbmx18Arhmq/view?usp=sharing Задачи 4]
 +
 +
[https://drive.google.com/file/d/1rFITwEda-qCnKxgwdisTRVLor9ZkfZ8j/view?usp=sharing Решения 4]
 +
|-
 +
 +
| 5 || '''Описательные статистики: меры центральной тенденции и разброса'''
 +
||
 +
* Посмотреть тему 5 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 5
 +
* Подготовиться к '''письменному Тесту №1 по темам 3-4'''
 +
||
 +
[https://drive.google.com/file/d/1rJ2R4DY_3Sm-jxqooTVHN6tXhmJqQBmT/view?usp=sharing Семинар 5]
 +
 +
[https://drive.google.com/file/d/1rL42T7YCw7PcWxFdeHXOllai5FRbGQH1/view?usp=sharing Задачи 5.1]
 +
 +
[https://drive.google.com/file/d/1rRw9HODqrapzgeH31ASxfUgPKRX-3hUR/view?usp=sharing Задачи 5.2]
 +
 +
[https://drive.google.com/file/d/1uiwMA1SBGvVqdPziAaXsyi9WCFL7Dmso/view?usp=sharing Решения 5.1]
 +
 +
[https://drive.google.com/file/d/1ukIcMtC6xuIS--k6qDo5FdSzrocdt8Gj/view?usp=sharing Решения 5.2]
 +
|-
 +
 +
| 6 || '''Выбросы. Пропущенные значения'''
 +
||
 +
* Посмотреть тему 6 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 6
 +
||
 +
[https://drive.google.com/file/d/1tUIQo1aG9m1eTxGz-fOiXQW2QOaesbqG/view?usp=sharing Семинар 6]
 +
 +
[https://drive.google.com/file/d/1tNBf2gegM6dO7IN-jix-LEIDl7VXgLNg/view?usp=sharing Задачи 6]
 +
 +
[https://drive.google.com/file/d/1upmcIvos49O8POZ2pXN6akyHbtnXsl2g/view?usp=sharing Решения 6]
 +
|-
 +
 +
| 7 || '''Корреляция'''
 +
||
 +
* Посмотреть тему 7 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 7
 +
* Подготовиться к '''письменному Тесту №2 по темам 5-6'''
 +
||
 +
[https://drive.google.com/file/d/1vBzCamltf9GtEk-vgrjgrU7xU_5gRB6S/view?usp=sharing Задачи 7]
 +
 +
[https://drive.google.com/file/d/1v3MUWIAiqgYyf8gtw20KX4jsroi-UyWw/view?usp=sharing Решения 7]
 +
|-
 +
 +
| 8 || '''Контрольная работа'''
 +
||
 +
* Подготовиться к '''Контрольной работе по темам 3-7'''
 +
||
 +
[https://numpy.org/doc/stable/user/index.html NumPy doc]
 +
 +
[https://pandas.pydata.org/docs/user_guide/index.html Pandas doc]
 +
 +
[https://matplotlib.org/stable/plot_types/index.html Matplotlib doc]
 +
 +
[https://drive.google.com/file/d/1wkM_YK8VNVDlJf6ITmmWFvmMblarG9G6/view?usp=share_link CheatSheet]
 +
|-
 +
 +
| 9 || '''Линейная регрессия'''
 +
||
 +
* Посмотреть тему 10 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 10
 +
||
 +
[https://drive.google.com/file/d/1y2X62a1glg4KNHFd5tUF75OZ9mqVO41p/view?usp=sharing Семинар 8]
 +
 +
[https://drive.google.com/file/d/1w-tQgFG7Pz8-AMQeoorjBUUEGEdhA8x8/view?usp=sharing Задачи 8]
 +
 +
[https://drive.google.com/file/d/1w4hOxUB9KNJf8vceZJ1pwxukaesT5_p9/view?usp=share_link Решения 8]
 +
|-
 +
 +
| 10 || '''Введение в визуализацию данных'''
 +
||
 +
* Посмотреть тему 8 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 8
 +
||
 +
[https://drive.google.com/file/d/1x1A5hD58sEAAVAZ4B2OV5xa4CGHP80Y2/view?usp=sharing Задачи 9]
 +
 +
[https://drive.google.com/file/d/1yIfehMyXGy3akcvDLaeM8wv3twj0jAhq/view?usp=share_link Решения 9]
 +
|-
 +
 +
| 11 || '''Продвинутая визуализация данных'''
 +
||
 +
* Посмотреть тему 9 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 9
 +
* Подготовиться к '''письменному Тесту №3 по темам 7, 8, 10'''
 +
||
 +
[https://drive.google.com/file/d/1z7Q1krJrzts3WyJxVcur0EuVEG5pUL41/view?usp=share_link Задачи 10]
 +
 +
[https://drive.google.com/file/d/1zLxGuh70W25hd2fJ2ZL0drnkydFlbBbr/view?usp=share_link Решения 10]
 +
|-
 +
 +
| 12 || '''Подведение итогов'''
 +
||
 +
* Подготовиться к итоговой защите проектов
 +
||
 +
|-
 +
|}
  
 
== Правила выставления оценок ==
 
== Правила выставления оценок ==
 
=== Формула ===
 
=== Формула ===
 +
Итоговая оценка вычисляется по формуле:
 +
 +
* 0.2 * Активность на семинарах +
 +
* 0.2 * КР +
 +
* 0.2 * Тесты +
 +
* 0.2 * Проект +
 +
* 0.2 * Экзамен
 +
 +
где:
 +
 +
'''Активность на семинарах''' – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя
 +
 +
'''КР''' – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)
 +
 +
'''Тесты''' – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book
 +
 +
'''Проект''' – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:
 +
* Поиск и описание данных. Сортировка и фильтрация
 +
* Описание признаков, шкал данных и построение частотных таблиц
 +
* Расчет мер центральной тенденции, определение выбросов
 +
* Определение корреляции и ее интерпретация
 +
* Визуализация данных и подведение итогов проделанной работы
 +
 +
'''Экзамен''' – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)
 +
 +
Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)
 +
 
=== Правила дедлайнов ===
 
=== Правила дедлайнов ===
 +
'''Тесты''' и '''Активность''' – при пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля
 +
 +
'''КР''' – если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен
 +
 +
'''Проект''' – для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов
 +
 +
'''Экзамен''' – если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач
 +
 +
В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту
  
 
== Полезные материалы ==
 
== Полезные материалы ==
Строка 59: Строка 251:
  
 
[https://github.com/hse-python-jour/hse_intro_to_data_journalism/blob/main/Gustokashin_summary_python.pdf Конспект] лекций по Python от Михаила Густокашина
 
[https://github.com/hse-python-jour/hse_intro_to_data_journalism/blob/main/Gustokashin_summary_python.pdf Конспект] лекций по Python от Михаила Густокашина
 +
 +
=== Cheat sheets ===
 +
* Базовый питон - [https://drive.google.com/file/d/1r6s_mpd9PcwjQXc4_24t3OL_uxgOGEgQ/view?usp=sharing раз]
 +
* NumPy - [https://drive.google.com/file/d/1qreUTqpv0X9n4oBjfidPpX9DXJnnPDpQ/view?usp=sharing раз], [https://drive.google.com/file/d/1qpQfvqEZp0BbqdmUY8qml-0BGm0qBW3k/view?usp=sharing два]
 +
* Pandas - [https://drive.google.com/file/d/1qoybMvNXR9ISqWlrO2m9mfIg452tJmHG/view?usp=sharing раз], [https://drive.google.com/file/d/1qn9ZP8FptBg_n5rlUarsvKBKJ4E-m4ms/view?usp=sharing два]
  
 
===Книги===
 
===Книги===
 +
==== Рекомендуемая основная литература ====
 +
* Elementary statistics : a step by step approach, Bluman, A. G.,
 +
* Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
  
 +
==== Рекомендуемая дополнительная литература ====
 +
* Савельев В. Статистика и котики.
  
 
[[Категория:Data Culture]]
 
[[Категория:Data Culture]]
 
[[Категория:Курсы по Анализу данных (DC) в 2022/23 году]]
 
[[Категория:Курсы по Анализу данных (DC) в 2022/23 году]]

Текущая версия на 18:01, 13 декабря 2022

О курсе

Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.

ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"

ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"

Необходимые ссылки

Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)» и направлена на формирование компетенций в области статистики и анализа данных, которые будет оцениваться на Независимом экзамене (НЭ).

Из чего состоит НЭ можно прочитать в Спецификации, а также посмотреть Демонстрационный вариант НЭ.

Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу

Репозиторий с материалами курса на гитхабе Анастасии Алексеевны Паршиной

Команда курса

Группа Преподаватель Контакты Ассистент Контакты
БЖУР211 Перевышина Татьяна Олеговна @prvshna Софья Шандыбина @esthesuntik
БЖУР212 Перевышина Татьяна Олеговна @prvshna
БЖУР213 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa
БЖУР214 Довгополый Иоанн Алексеевич @TriariiMisha Лика Капустина @lika_kapustina
БЖУР215 чат группы Паршина Анастасия Алексеевна @aaparshina Жданова Мария @avonadz
БМД211 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Соколова Ирина @irsklv
БМД212 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Яковлева Паулина @paulinebakst
БМД213 Волкова Анастасия Эдуардовна @vol_anastasia
БМД214 Волкова Анастасия Эдуардовна @vol_anastasia
БМД215 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Киберча Анастасия @Saranast
БМД216 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa Алкаев Владислав @Avonna
БМД217 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa
БМД218 Перевышина Татьяна Олеговна @prvshna Анна Заремба @anazaremba

Материалы курса

Лекции

  1. Организация курса - презентация
  2. Как выглядит образцовый проект - кодбук, запись
  3. Разбор демонстрационного вариант НЭ - здесь скоро будет ссылка на запись

Семинары

Тема занятия Задание к занятию Материалы занятия
1 Модуль Pandas и NumPy
  • Установить дистрибутив Anaconda
  • Вспомнить базовый Python
  • Посмотреть тему 1 в онлайн-курсе

Семинар 1

Задачи 1

Решения 1

2 Фильтрация и сортировка данных в Pandas
  • Посмотреть тему 2 в онлайн-курсе

Семинар 2

Задачи 2

Решения 2

3 Типы данных. Создание новых переменных
  • Посмотреть тему 3 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 3

Задачи 3

Решения 3

4 Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Посмотреть тему 4 в онлайн-курсе
  • Подготовиться к опросу по содержанию темы 4
  • Подготовиться к разбору заданий из темы 4

Семинар 4

Задачи 4

Решения 4

5 Описательные статистики: меры центральной тенденции и разброса
  • Посмотреть тему 5 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 5
  • Подготовиться к письменному Тесту №1 по темам 3-4

Семинар 5

Задачи 5.1

Задачи 5.2

Решения 5.1

Решения 5.2

6 Выбросы. Пропущенные значения
  • Посмотреть тему 6 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 6

Семинар 6

Задачи 6

Решения 6

7 Корреляция
  • Посмотреть тему 7 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 7
  • Подготовиться к письменному Тесту №2 по темам 5-6

Задачи 7

Решения 7

8 Контрольная работа
  • Подготовиться к Контрольной работе по темам 3-7

NumPy doc

Pandas doc

Matplotlib doc

CheatSheet

9 Линейная регрессия
  • Посмотреть тему 10 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 10

Семинар 8

Задачи 8

Решения 8

10 Введение в визуализацию данных
  • Посмотреть тему 8 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 8

Задачи 9

Решения 9

11 Продвинутая визуализация данных
  • Посмотреть тему 9 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 9
  • Подготовиться к письменному Тесту №3 по темам 7, 8, 10

Задачи 10

Решения 10

12 Подведение итогов
  • Подготовиться к итоговой защите проектов

Правила выставления оценок

Формула

Итоговая оценка вычисляется по формуле:

  • 0.2 * Активность на семинарах +
  • 0.2 * КР +
  • 0.2 * Тесты +
  • 0.2 * Проект +
  • 0.2 * Экзамен

где:

Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя

КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)

Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book

Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:

  • Поиск и описание данных. Сортировка и фильтрация
  • Описание признаков, шкал данных и построение частотных таблиц
  • Расчет мер центральной тенденции, определение выбросов
  • Определение корреляции и ее интерпретация
  • Визуализация данных и подведение итогов проделанной работы

Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)

Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)

Правила дедлайнов

Тесты и Активность – при пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля

КР – если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен

Проект – для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов

Экзамен – если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач

В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту

Полезные материалы

Python

Как установить дистрибутив Anaconda на Windows и MacOS

Онлайн-курс по Python для начинающих

Конспект лекций по Python от Михаила Густокашина

Cheat sheets

Книги

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G.,
  • Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.

Рекомендуемая дополнительная литература

  • Савельев В. Статистика и котики.