Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации") — различия между версиями
Kir.sth (обсуждение | вклад) |
Kir.sth (обсуждение | вклад) |
||
(не показаны 3 промежуточные версии этого же участника) | |||
Строка 55: | Строка 55: | ||
# '''Организация курса''' - [https://drive.google.com/file/d/1gLHhQZMOmwN1RlmJn33i_BpmsGsrFDn8/view?usp=share_link презентация] | # '''Организация курса''' - [https://drive.google.com/file/d/1gLHhQZMOmwN1RlmJn33i_BpmsGsrFDn8/view?usp=share_link презентация] | ||
# '''Как выглядит образцовый проект''' - [https://drive.google.com/file/d/1u6kV0knt7ImHD-1BACWfRVRcTPlx-ykj/view?usp=sharing кодбук], [https://drive.google.com/file/d/1wfc3PpmezgjnVSlJbS9wO2fprdGF6bu2/view?usp=share_link запись] | # '''Как выглядит образцовый проект''' - [https://drive.google.com/file/d/1u6kV0knt7ImHD-1BACWfRVRcTPlx-ykj/view?usp=sharing кодбук], [https://drive.google.com/file/d/1wfc3PpmezgjnVSlJbS9wO2fprdGF6bu2/view?usp=share_link запись] | ||
− | # '''Разбор демонстрационного вариант НЭ''' | + | # '''Разбор демонстрационного вариант НЭ''' - здесь скоро будет ссылка на запись |
=== Семинары === | === Семинары === | ||
Строка 166: | Строка 166: | ||
| 9 || '''Линейная регрессия''' | | 9 || '''Линейная регрессия''' | ||
|| | || | ||
− | * Посмотреть тему | + | * Посмотреть тему 10 в онлайн-курсе |
− | * Подготовиться к разбору заданий из темы | + | * Подготовиться к разбору заданий из темы 10 |
|| | || | ||
[https://drive.google.com/file/d/1y2X62a1glg4KNHFd5tUF75OZ9mqVO41p/view?usp=sharing Семинар 8] | [https://drive.google.com/file/d/1y2X62a1glg4KNHFd5tUF75OZ9mqVO41p/view?usp=sharing Семинар 8] | ||
[https://drive.google.com/file/d/1w-tQgFG7Pz8-AMQeoorjBUUEGEdhA8x8/view?usp=sharing Задачи 8] | [https://drive.google.com/file/d/1w-tQgFG7Pz8-AMQeoorjBUUEGEdhA8x8/view?usp=sharing Задачи 8] | ||
+ | |||
+ | [https://drive.google.com/file/d/1w4hOxUB9KNJf8vceZJ1pwxukaesT5_p9/view?usp=share_link Решения 8] | ||
|- | |- | ||
Строка 180: | Строка 182: | ||
|| | || | ||
[https://drive.google.com/file/d/1x1A5hD58sEAAVAZ4B2OV5xa4CGHP80Y2/view?usp=sharing Задачи 9] | [https://drive.google.com/file/d/1x1A5hD58sEAAVAZ4B2OV5xa4CGHP80Y2/view?usp=sharing Задачи 9] | ||
+ | |||
+ | [https://drive.google.com/file/d/1yIfehMyXGy3akcvDLaeM8wv3twj0jAhq/view?usp=share_link Решения 9] | ||
|- | |- | ||
Строка 186: | Строка 190: | ||
* Посмотреть тему 9 в онлайн-курсе | * Посмотреть тему 9 в онлайн-курсе | ||
* Подготовиться к разбору заданий из темы 9 | * Подготовиться к разбору заданий из темы 9 | ||
− | * Подготовиться к '''письменному Тесту №3 по темам 7, 8, | + | * Подготовиться к '''письменному Тесту №3 по темам 7, 8, 10''' |
|| | || | ||
+ | [https://drive.google.com/file/d/1z7Q1krJrzts3WyJxVcur0EuVEG5pUL41/view?usp=share_link Задачи 10] | ||
+ | |||
+ | [https://drive.google.com/file/d/1zLxGuh70W25hd2fJ2ZL0drnkydFlbBbr/view?usp=share_link Решения 10] | ||
|- | |- | ||
Текущая версия на 18:01, 13 декабря 2022
Содержание
О курсе
Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"
Необходимые ссылки
Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)» и направлена на формирование компетенций в области статистики и анализа данных, которые будет оцениваться на Независимом экзамене (НЭ).
Из чего состоит НЭ можно прочитать в Спецификации, а также посмотреть Демонстрационный вариант НЭ.
Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу
Репозиторий с материалами курса на гитхабе Анастасии Алексеевны Паршиной
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БЖУР211 | Перевышина Татьяна Олеговна | @prvshna | Софья Шандыбина | @esthesuntik |
БЖУР212 | Перевышина Татьяна Олеговна | @prvshna | ||
БЖУР213 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БЖУР214 | Довгополый Иоанн Алексеевич | @TriariiMisha | Лика Капустина | @lika_kapustina |
БЖУР215 чат группы | Паршина Анастасия Алексеевна | @aaparshina | Жданова Мария | @avonadz |
БМД211 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Соколова Ирина | @irsklv |
БМД212 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Яковлева Паулина | @paulinebakst |
БМД213 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД214 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД215 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Киберча Анастасия | @Saranast |
БМД216 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | Алкаев Владислав | @Avonna |
БМД217 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД218 | Перевышина Татьяна Олеговна | @prvshna | Анна Заремба | @anazaremba |
Материалы курса
Лекции
- Организация курса - презентация
- Как выглядит образцовый проект - кодбук, запись
- Разбор демонстрационного вариант НЭ - здесь скоро будет ссылка на запись
Семинары
№ | Тема занятия | Задание к занятию | Материалы занятия |
---|---|---|---|
1 | Модуль Pandas и NumPy |
|
|
2 | Фильтрация и сортировка данных в Pandas |
|
|
3 | Типы данных. Создание новых переменных |
|
|
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения |
|
|
5 | Описательные статистики: меры центральной тенденции и разброса |
|
|
6 | Выбросы. Пропущенные значения |
|
|
7 | Корреляция |
|
|
8 | Контрольная работа |
|
|
9 | Линейная регрессия |
|
|
10 | Введение в визуализацию данных |
|
|
11 | Продвинутая визуализация данных |
|
|
12 | Подведение итогов |
|
Правила выставления оценок
Формула
Итоговая оценка вычисляется по формуле:
- 0.2 * Активность на семинарах +
- 0.2 * КР +
- 0.2 * Тесты +
- 0.2 * Проект +
- 0.2 * Экзамен
где:
Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя
КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)
Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book
Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:
- Поиск и описание данных. Сортировка и фильтрация
- Описание признаков, шкал данных и построение частотных таблиц
- Расчет мер центральной тенденции, определение выбросов
- Определение корреляции и ее интерпретация
- Визуализация данных и подведение итогов проделанной работы
Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)
Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)
Правила дедлайнов
Тесты и Активность – при пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля
КР – если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен
Проект – для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов
Экзамен – если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач
В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту
Полезные материалы
Python
Как установить дистрибутив Anaconda на Windows и MacOS
Онлайн-курс по Python для начинающих
Конспект лекций по Python от Михаила Густокашина
Cheat sheets
Книги
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.