Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации") — различия между версиями
(→Команда курса) |
Kir.sth (обсуждение | вклад) |
||
(не показано 27 промежуточных версии 3 участников) | |||
Строка 9: | Строка 9: | ||
== Необходимые ссылки == | == Необходимые ссылки == | ||
− | Дисциплина реализуется с помощью '''[https://edu.hse.ru/course/view.php?id=136231 «Учебника по анализу данных (начальный)»]''' | + | Дисциплина реализуется с помощью '''[https://edu.hse.ru/course/view.php?id=136231 «Учебника по анализу данных (начальный)»]''' и направлена на формирование компетенций в области статистики и анализа данных, которые будет оцениваться на Независимом экзамене (НЭ). |
− | '''[https:// | + | Из чего состоит НЭ можно прочитать в '''[https://drive.google.com/file/d/1ireaP0hKlQCzS--BCtzi_-Q3RLkDjKPI/view Спецификации]''', а также посмотреть '''[https://drive.google.com/file/d/1ByikW4pZ2gdw4DLNbBc90bdfT7dJIcPK/view Демонстрационный вариант НЭ]'''. |
− | + | ||
[https://www.hse.ru/dataculture/exams Порядок организации Независимых экзаменов по Цифровым компетенциям] подробно описан в Приложении 17 к [https://www.hse.ru/docs/551872110.html ПОПАТКУСу] | [https://www.hse.ru/dataculture/exams Порядок организации Независимых экзаменов по Цифровым компетенциям] подробно описан в Приложении 17 к [https://www.hse.ru/docs/551872110.html ПОПАТКУСу] | ||
+ | |||
+ | '''[https://github.com/aaparshina/FCI_22-23_data_analysis Репозиторий]''' с материалами курса на гитхабе Анастасии Алексеевны Паршиной | ||
== Команда курса == | == Команда курса == | ||
Строка 22: | Строка 23: | ||
! Группа !! Преподаватель !! Контакты !! Ассистент !! Контакты | ! Группа !! Преподаватель !! Контакты !! Ассистент !! Контакты | ||
|- | |- | ||
− | | БЖУР211 || Перевышина Татьяна Олеговна || @prvshna || | + | | БЖУР211 || Перевышина Татьяна Олеговна || @prvshna || Софья Шандыбина || @esthesuntik |
|- | |- | ||
| БЖУР212 || Перевышина Татьяна Олеговна || @prvshna || || | | БЖУР212 || Перевышина Татьяна Олеговна || @prvshna || || | ||
Строка 42: | Строка 43: | ||
| БМД215 [https://t.me/+1e5Q7i8jNLtjNjMy чат группы] || Степановских Кирилл Олегович || @kir_stepanovskikh || Киберча Анастасия || @Saranast | | БМД215 [https://t.me/+1e5Q7i8jNLtjNjMy чат группы] || Степановских Кирилл Олегович || @kir_stepanovskikh || Киберча Анастасия || @Saranast | ||
|- | |- | ||
− | | БМД216 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa || | + | | БМД216 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa || Алкаев Владислав || @Avonna |
|- | |- | ||
| БМД217 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa || || | | БМД217 || Аброскин Илья Дмитриевич || @iiiiilllllyyyyyaaaa || || | ||
|- | |- | ||
− | | БМД218 || Перевышина Татьяна Олеговна || @prvshna || | + | | БМД218 || Перевышина Татьяна Олеговна || @prvshna || Анна Заремба || @anazaremba |
|- | |- | ||
|} | |} | ||
== Материалы курса == | == Материалы курса == | ||
+ | === Лекции === | ||
+ | # '''Организация курса''' - [https://drive.google.com/file/d/1gLHhQZMOmwN1RlmJn33i_BpmsGsrFDn8/view?usp=share_link презентация] | ||
+ | # '''Как выглядит образцовый проект''' - [https://drive.google.com/file/d/1u6kV0knt7ImHD-1BACWfRVRcTPlx-ykj/view?usp=sharing кодбук], [https://drive.google.com/file/d/1wfc3PpmezgjnVSlJbS9wO2fprdGF6bu2/view?usp=share_link запись] | ||
+ | # '''Разбор демонстрационного вариант НЭ''' - здесь скоро будет ссылка на запись | ||
+ | |||
+ | === Семинары === | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
Строка 76: | Строка 83: | ||
[https://drive.google.com/file/d/1j6OWrpTuAYx4M4V4fTZUSZCwicVHwkaQ/view?usp=sharing Задачи 2] | [https://drive.google.com/file/d/1j6OWrpTuAYx4M4V4fTZUSZCwicVHwkaQ/view?usp=sharing Задачи 2] | ||
+ | |||
+ | [https://drive.google.com/file/d/1kCCSEpmh_3R6sfXs9MjtVLWFbSt-WDi6/view?usp=sharing Решения 2] | ||
|- | |- | ||
Строка 83: | Строка 92: | ||
* Подготовиться к разбору заданий из темы 3 | * Подготовиться к разбору заданий из темы 3 | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1r758MJeHCZw571AxDkKLgoJ7mGLiAISt/view?usp=sharing Задачи 3] | ||
+ | |||
+ | [https://drive.google.com/file/d/1r8ysBrMmNT7NFYi_5_cq3IhzyPt9u_rn/view?usp=sharing Решения 3] | ||
+ | |||
|- | |- | ||
Строка 91: | Строка 104: | ||
* Подготовиться к разбору заданий из темы 4 | * Подготовиться к разбору заданий из темы 4 | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1rDNz96EnKWI1ukl5crwLYYEfMw1Z_D4O/view?usp=sharing Семинар 4] | ||
+ | |||
+ | [https://drive.google.com/file/d/1rEVFCDj2SDW3k8_SOYZ-5Pbmx18Arhmq/view?usp=sharing Задачи 4] | ||
+ | |||
+ | [https://drive.google.com/file/d/1rFITwEda-qCnKxgwdisTRVLor9ZkfZ8j/view?usp=sharing Решения 4] | ||
|- | |- | ||
Строка 99: | Строка 117: | ||
* Подготовиться к '''письменному Тесту №1 по темам 3-4''' | * Подготовиться к '''письменному Тесту №1 по темам 3-4''' | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1rJ2R4DY_3Sm-jxqooTVHN6tXhmJqQBmT/view?usp=sharing Семинар 5] | ||
+ | |||
+ | [https://drive.google.com/file/d/1rL42T7YCw7PcWxFdeHXOllai5FRbGQH1/view?usp=sharing Задачи 5.1] | ||
+ | |||
+ | [https://drive.google.com/file/d/1rRw9HODqrapzgeH31ASxfUgPKRX-3hUR/view?usp=sharing Задачи 5.2] | ||
+ | |||
+ | [https://drive.google.com/file/d/1uiwMA1SBGvVqdPziAaXsyi9WCFL7Dmso/view?usp=sharing Решения 5.1] | ||
+ | |||
+ | [https://drive.google.com/file/d/1ukIcMtC6xuIS--k6qDo5FdSzrocdt8Gj/view?usp=sharing Решения 5.2] | ||
|- | |- | ||
Строка 106: | Строка 133: | ||
* Подготовиться к разбору заданий из темы 6 | * Подготовиться к разбору заданий из темы 6 | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1tUIQo1aG9m1eTxGz-fOiXQW2QOaesbqG/view?usp=sharing Семинар 6] | ||
+ | |||
+ | [https://drive.google.com/file/d/1tNBf2gegM6dO7IN-jix-LEIDl7VXgLNg/view?usp=sharing Задачи 6] | ||
+ | |||
+ | [https://drive.google.com/file/d/1upmcIvos49O8POZ2pXN6akyHbtnXsl2g/view?usp=sharing Решения 6] | ||
|- | |- | ||
Строка 114: | Строка 146: | ||
* Подготовиться к '''письменному Тесту №2 по темам 5-6''' | * Подготовиться к '''письменному Тесту №2 по темам 5-6''' | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1vBzCamltf9GtEk-vgrjgrU7xU_5gRB6S/view?usp=sharing Задачи 7] | ||
+ | |||
+ | [https://drive.google.com/file/d/1v3MUWIAiqgYyf8gtw20KX4jsroi-UyWw/view?usp=sharing Решения 7] | ||
|- | |- | ||
Строка 120: | Строка 155: | ||
* Подготовиться к '''Контрольной работе по темам 3-7''' | * Подготовиться к '''Контрольной работе по темам 3-7''' | ||
|| | || | ||
+ | [https://numpy.org/doc/stable/user/index.html NumPy doc] | ||
+ | |||
+ | [https://pandas.pydata.org/docs/user_guide/index.html Pandas doc] | ||
+ | |||
+ | [https://matplotlib.org/stable/plot_types/index.html Matplotlib doc] | ||
+ | |||
+ | [https://drive.google.com/file/d/1wkM_YK8VNVDlJf6ITmmWFvmMblarG9G6/view?usp=share_link CheatSheet] | ||
|- | |- | ||
| 9 || '''Линейная регрессия''' | | 9 || '''Линейная регрессия''' | ||
|| | || | ||
− | * Посмотреть тему | + | * Посмотреть тему 10 в онлайн-курсе |
− | * Подготовиться к разбору заданий из темы | + | * Подготовиться к разбору заданий из темы 10 |
|| | || | ||
+ | [https://drive.google.com/file/d/1y2X62a1glg4KNHFd5tUF75OZ9mqVO41p/view?usp=sharing Семинар 8] | ||
+ | |||
+ | [https://drive.google.com/file/d/1w-tQgFG7Pz8-AMQeoorjBUUEGEdhA8x8/view?usp=sharing Задачи 8] | ||
+ | |||
+ | [https://drive.google.com/file/d/1w4hOxUB9KNJf8vceZJ1pwxukaesT5_p9/view?usp=share_link Решения 8] | ||
|- | |- | ||
Строка 134: | Строка 181: | ||
* Подготовиться к разбору заданий из темы 8 | * Подготовиться к разбору заданий из темы 8 | ||
|| | || | ||
+ | [https://drive.google.com/file/d/1x1A5hD58sEAAVAZ4B2OV5xa4CGHP80Y2/view?usp=sharing Задачи 9] | ||
+ | |||
+ | [https://drive.google.com/file/d/1yIfehMyXGy3akcvDLaeM8wv3twj0jAhq/view?usp=share_link Решения 9] | ||
|- | |- | ||
Строка 140: | Строка 190: | ||
* Посмотреть тему 9 в онлайн-курсе | * Посмотреть тему 9 в онлайн-курсе | ||
* Подготовиться к разбору заданий из темы 9 | * Подготовиться к разбору заданий из темы 9 | ||
− | * Подготовиться к '''письменному Тесту №3 по темам 7, 8, | + | * Подготовиться к '''письменному Тесту №3 по темам 7, 8, 10''' |
|| | || | ||
+ | [https://drive.google.com/file/d/1z7Q1krJrzts3WyJxVcur0EuVEG5pUL41/view?usp=share_link Задачи 10] | ||
+ | |||
+ | [https://drive.google.com/file/d/1zLxGuh70W25hd2fJ2ZL0drnkydFlbBbr/view?usp=share_link Решения 10] | ||
|- | |- | ||
| 12 || '''Подведение итогов''' | | 12 || '''Подведение итогов''' | ||
|| | || | ||
− | * Подготовиться к | + | * Подготовиться к итоговой защите проектов |
|| | || | ||
|- | |- | ||
Строка 198: | Строка 251: | ||
[https://github.com/hse-python-jour/hse_intro_to_data_journalism/blob/main/Gustokashin_summary_python.pdf Конспект] лекций по Python от Михаила Густокашина | [https://github.com/hse-python-jour/hse_intro_to_data_journalism/blob/main/Gustokashin_summary_python.pdf Конспект] лекций по Python от Михаила Густокашина | ||
+ | |||
+ | === Cheat sheets === | ||
+ | * Базовый питон - [https://drive.google.com/file/d/1r6s_mpd9PcwjQXc4_24t3OL_uxgOGEgQ/view?usp=sharing раз] | ||
+ | * NumPy - [https://drive.google.com/file/d/1qreUTqpv0X9n4oBjfidPpX9DXJnnPDpQ/view?usp=sharing раз], [https://drive.google.com/file/d/1qpQfvqEZp0BbqdmUY8qml-0BGm0qBW3k/view?usp=sharing два] | ||
+ | * Pandas - [https://drive.google.com/file/d/1qoybMvNXR9ISqWlrO2m9mfIg452tJmHG/view?usp=sharing раз], [https://drive.google.com/file/d/1qn9ZP8FptBg_n5rlUarsvKBKJ4E-m4ms/view?usp=sharing два] | ||
===Книги=== | ===Книги=== |
Текущая версия на 18:01, 13 декабря 2022
Содержание
О курсе
Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"
Необходимые ссылки
Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)» и направлена на формирование компетенций в области статистики и анализа данных, которые будет оцениваться на Независимом экзамене (НЭ).
Из чего состоит НЭ можно прочитать в Спецификации, а также посмотреть Демонстрационный вариант НЭ.
Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу
Репозиторий с материалами курса на гитхабе Анастасии Алексеевны Паршиной
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БЖУР211 | Перевышина Татьяна Олеговна | @prvshna | Софья Шандыбина | @esthesuntik |
БЖУР212 | Перевышина Татьяна Олеговна | @prvshna | ||
БЖУР213 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БЖУР214 | Довгополый Иоанн Алексеевич | @TriariiMisha | Лика Капустина | @lika_kapustina |
БЖУР215 чат группы | Паршина Анастасия Алексеевна | @aaparshina | Жданова Мария | @avonadz |
БМД211 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Соколова Ирина | @irsklv |
БМД212 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Яковлева Паулина | @paulinebakst |
БМД213 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД214 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД215 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Киберча Анастасия | @Saranast |
БМД216 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | Алкаев Владислав | @Avonna |
БМД217 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД218 | Перевышина Татьяна Олеговна | @prvshna | Анна Заремба | @anazaremba |
Материалы курса
Лекции
- Организация курса - презентация
- Как выглядит образцовый проект - кодбук, запись
- Разбор демонстрационного вариант НЭ - здесь скоро будет ссылка на запись
Семинары
№ | Тема занятия | Задание к занятию | Материалы занятия |
---|---|---|---|
1 | Модуль Pandas и NumPy |
|
|
2 | Фильтрация и сортировка данных в Pandas |
|
|
3 | Типы данных. Создание новых переменных |
|
|
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения |
|
|
5 | Описательные статистики: меры центральной тенденции и разброса |
|
|
6 | Выбросы. Пропущенные значения |
|
|
7 | Корреляция |
|
|
8 | Контрольная работа |
|
|
9 | Линейная регрессия |
|
|
10 | Введение в визуализацию данных |
|
|
11 | Продвинутая визуализация данных |
|
|
12 | Подведение итогов |
|
Правила выставления оценок
Формула
Итоговая оценка вычисляется по формуле:
- 0.2 * Активность на семинарах +
- 0.2 * КР +
- 0.2 * Тесты +
- 0.2 * Проект +
- 0.2 * Экзамен
где:
Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя
КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)
Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book
Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:
- Поиск и описание данных. Сортировка и фильтрация
- Описание признаков, шкал данных и построение частотных таблиц
- Расчет мер центральной тенденции, определение выбросов
- Определение корреляции и ее интерпретация
- Визуализация данных и подведение итогов проделанной работы
Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)
Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)
Правила дедлайнов
Тесты и Активность – при пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля
КР – если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен
Проект – для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов
Экзамен – если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач
В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту
Полезные материалы
Python
Как установить дистрибутив Anaconda на Windows и MacOS
Онлайн-курс по Python для начинающих
Конспект лекций по Python от Михаила Густокашина
Cheat sheets
Книги
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.