Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации")
Содержание
О курсе
Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"
ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"
Необходимые ссылки
Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)»
Репозиторий с материалами курса на гитхабе Анастасии Алексеевны Паршиной
Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БЖУР211 | Перевышина Татьяна Олеговна | @prvshna | Софья Шандыбина | @esthesuntik |
БЖУР212 | Перевышина Татьяна Олеговна | @prvshna | ||
БЖУР213 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БЖУР214 | Довгополый Иоанн Алексеевич | @TriariiMisha | Лика Капустина | @lika_kapustina |
БЖУР215 чат группы | Паршина Анастасия Алексеевна | @aaparshina | Жданова Мария | @avonadz |
БМД211 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Соколова Ирина | @irsklv |
БМД212 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Яковлева Паулина | @paulinebakst |
БМД213 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД214 | Волкова Анастасия Эдуардовна | @vol_anastasia | ||
БМД215 чат группы | Степановских Кирилл Олегович | @kir_stepanovskikh | Киберча Анастасия | @Saranast |
БМД216 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД217 | Аброскин Илья Дмитриевич | @iiiiilllllyyyyyaaaa | ||
БМД218 | Перевышина Татьяна Олеговна | @prvshna |
Материалы курса
№ | Тема занятия | Задание к занятию | Материалы занятия |
---|---|---|---|
1 | Модуль Pandas и NumPy |
|
|
2 | Фильтрация и сортировка данных в Pandas |
|
|
3 | Типы данных. Создание новых переменных |
|
|
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения |
|
|
5 | Описательные статистики: меры центральной тенденции и разброса |
|
|
6 | Выбросы. Пропущенные значения |
|
|
7 | Корреляция |
|
|
8 | Контрольная работа |
|
|
9 | Линейная регрессия |
|
|
10 | Введение в визуализацию данных |
|
|
11 | Продвинутая визуализация данных |
|
|
12 | Подведение итогов |
|
Правила выставления оценок
Формула
Итоговая оценка вычисляется по формуле:
- 0.2 * Активность на семинарах +
- 0.2 * КР +
- 0.2 * Тесты +
- 0.2 * Проект +
- 0.2 * Экзамен
где:
Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя
КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)
Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book
Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:
- Поиск и описание данных. Сортировка и фильтрация
- Описание признаков, шкал данных и построение частотных таблиц
- Расчет мер центральной тенденции, определение выбросов
- Определение корреляции и ее интерпретация
- Визуализация данных и подведение итогов проделанной работы
Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)
Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)
Правила дедлайнов
Тесты и Активность – при пропуске форм контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля
КР – если студент не может написать контрольную работу по уважительной причине, то вес контрольной работы для него переносится на экзамен
Проект – для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов
Экзамен – если студент не может написать экзамен по уважительной причине, то он может написать экзамен в период пересдач
В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту
Полезные материалы
Python
Как установить дистрибутив Anaconda на Windows и MacOS
Онлайн-курс по Python для начинающих
Конспект лекций по Python от Михаила Густокашина
Книги
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.