Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации")
Содержание
О курсе
Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"
Необходимые ссылки
Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)»
Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БЖУР211 | Перевышина Татьяна Олеговна | @prvshna | ||
БЖУР212 | Перевышина Татьяна Олеговна | @prvshna | ||
БЖУР213 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БЖУР214 | Довгополый Иоанн Алексеевич | @TriariiMisha | ||
БЖУР215 чат группы | Паршина Анастасия Алексеевна | @aaparshina | Жданова Мария | @avonadz |
БМД211 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Соколова Ирина | @irsklv |
БМД212 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Яковлева Паулина | @paulinebakst |
БМД213 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД214 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД215 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Киберча Анастасия | @Saranast |
БМД216 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД217 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД218 | Перевышина Татьяна Олеговна | @prvshna |
Материалы курса
№ | Тема занятия | Задание к занятию | Материалы занятия |
---|---|---|---|
1 | Модуль Pandas и NumPy |
|
|
2 | Фильтрация и сортировка данных в Pandas |
|
|
3 | Типы данных. Создание новых переменных |
|
|
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения |
|
|
5 | Описательные статистики: меры центральной тенденции и разброса |
|
|
6 | Выбросы. Пропущенные значения |
|
|
7 | Корреляция |
|
|
8 | Контрольная работа |
|
|
9 | Линейная регрессия |
|
|
10 | Введение в визуализацию данных |
|
|
11 | Продвинутая визуализация данных |
|
|
12 | Подведение итогов |
|
Правила выставления оценок
Формула
Итоговая оценка вычисляется по формуле:
- 0.2 * Активность на семинарах +
- 0.2 * КР +
- 0.2 * Тесты +
- 0.2 * Проект +
- 0.2 * Экзамен
где:
Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя
КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)
Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book
Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:
- Поиск и описание данных. Сортировка и фильтрация
- Описание признаков, шкал данных и построение частотных таблиц
- Расчет мер центральной тенденции, определение выбросов
- Определение корреляции и ее интерпретация
- Визуализация данных и подведение итогов проделанной работы
Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)
Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)
Правила дедлайнов
Для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов.
В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту.
При пропуске формы контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля.
Полезные материалы
Python
Как установить дистрибутив Anaconda на Windows и MacOS
Онлайн-курс по Python для начинающих
Конспект лекций по Python от Михаила Густокашина