Анализ данных 2022 (ОП "Журналистика" и "Медиакоммуникации") — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 50: Строка 50:
  
 
== Материалы курса ==
 
== Материалы курса ==
 +
{| class="wikitable"
 +
|-
 +
! № !! Тема занятия !! Задание к занятию !! Материалы занятия
 +
|-
 +
 +
| 1 || '''Модуль Pandas и NumPy'''
 +
||
 +
* Установить дистрибутив Anaconda
 +
* Вспомнить базовый Python
 +
* Посмотреть тему 1 в онлайн-курсе
 +
||
 +
|-
 +
 +
| 2 || '''Фильтрация и сортировка данных в Pandas'''
 +
||
 +
* Посмотреть тему 2 в онлайн-курсе
 +
||
 +
|-
 +
 +
| 3 || '''Типы данных. Создание новых переменных'''
 +
||
 +
* Посмотреть тему 3 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 3
 +
||
 +
|-
 +
 +
| 4 || '''Генеральная совокупность и выборка. Частотные таблицы и распределения'''
 +
||
 +
* Посмотреть тему 4 в онлайн-курсе
 +
* Подготовиться к опросу по содержанию темы 4
 +
* Подготовиться к разбору заданий из темы 4
 +
||
 +
|-
 +
 +
| 5 || '''Описательные статистики: меры центральной тенденции и разброса'''
 +
||
 +
* Посмотреть тему 5 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 5
 +
* Подготовиться к '''письменному Тесту №1 по темам 3-4'''
 +
||
 +
|-
 +
 +
| 6 || '''Выбросы. Пропущенные значения'''
 +
||
 +
* Посмотреть тему 6 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 6
 +
||
 +
|-
 +
 +
| 7 || '''Корреляция'''
 +
||
 +
* Посмотреть тему 7 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 7
 +
* Подготовиться к '''письменному Тесту №2 по темам 5-6'''
 +
||
 +
|-
 +
 +
| 8 || '''Контрольная работа'''
 +
||
 +
* Подготовиться к '''Контрольной работе по темам 3-7'''
 +
||
 +
|-
 +
 +
| 9 || '''Линейная регрессия'''
 +
||
 +
* Посмотреть тему 12 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 12
 +
||
 +
|-
 +
 +
| 10 || '''Введение в визуализацию данных'''
 +
||
 +
* Посмотреть тему 8 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 8
 +
||
 +
|-
 +
 +
| 11 || '''Продвинутая визуализация данных'''
 +
||
 +
* Посмотреть тему 9 в онлайн-курсе
 +
* Подготовиться к разбору заданий из темы 9
 +
* Подготовиться к '''письменному Тесту №3 по темам 7, 8, 12'''
 +
||
 +
|-
 +
 +
| 12 || '''Подведение итогов'''
 +
||
 +
* Подготовиться к разбору заданий из демоверсии Независимого экзамена
 +
||
 +
|-
  
 
== Правила выставления оценок ==
 
== Правила выставления оценок ==

Версия 21:01, 20 сентября 2022

О курсе

Дисциплина читается для студентов 2-го курса ОП "Журналистика" и "Медиакоммуникации" ФКМД ВШЭ в 1-2 модулях 2022/2023 уч. г.

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ факультета коммуникаций, медиа и дизайна и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с сетевым анализом и основы машинного обучения.

ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Журналистика"

ПУД курса "Анализ данных" и ПУД "Независимого экзамена по анализу данных" на ОП "Медиакоммуникации"

Необходимые ссылки

Дисциплина реализуется с помощью «Учебника по анализу данных (начальный)»

Порядок организации Независимых экзаменов по Цифровым компетенциям подробно описан в Приложении 17 к ПОПАТКУСу

Команда курса

Группа Преподаватель Контакты Ассистент Контакты
БЖУР211 Перевышина Татьяна Олеговна @prvshna
БЖУР212 Перевышина Татьяна Олеговна @prvshna
БЖУР213 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa
БЖУР214 Довгополый Иоанн Алексеевич @TriariiMisha
БЖУР215 чат группы Паршина Анастасия Алексеевна @aaparshina Жданова Мария @avonadz
БМД211 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Соколова Ирина @irsklv
БМД212 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Яковлева Паулина @paulinebakst
БМД213 Волкова Анастасия Эдуардовна @vol_anastasia
БМД214 Волкова Анастасия Эдуардовна @vol_anastasia
БМД215 чат группы Степановских Кирилл Олегович @kir_stepanovskikh Киберча Анастасия @Saranast
БМД216 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa
БМД217 Аброскин Илья Дмитриевич @iiiiilllllyyyyyaaaa
БМД218 Перевышина Татьяна Олеговна @prvshna

Материалы курса

Правила выставления оценок

Формула

Итоговая оценка вычисляется по формуле:

  • 0.2 * Активность на семинарах +
  • 0.2 * КР +
  • 0.2 * Тесты +
  • 0.2 * Проект +
  • 0.2 * Экзамен

где:

Активность на семинарах – самостоятельное написание решения задач, а также его комментирование и ответы на вопросы преподавателя

КР – контрольная работа в формате Независимого экзамена по Анализу данных 2022-23 года начального уровня (80 мин)

Тесты – среднее арифметическое 3 тестов, которые проводятся в начале семинара (5-10 мин) по пройденным темам в формате closed book

Проект – выполняется в группах из 2 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно:

  • Поиск и описание данных. Сортировка и фильтрация
  • Описание признаков, шкал данных и построение частотных таблиц
  • Расчет мер центральной тенденции, определение выбросов
  • Определение корреляции и ее интерпретация
  • Визуализация данных и подведение итогов проделанной работы

Экзамен – аналогичен Независимому экзамену по Анализу данных 2022-23 года начального уровня (120 мин)

Ни одна из форм контроля не округляется. Округляется только итоговая оценка арифметически (3.49 округляется до 3, 3.50 – до 4)

Правила дедлайнов

Для каждого этапа устанавливается соответствующий дедлайн. Если группа не сдала этап работы в установленный дедлайн, то от итоговой оценки за проект отнимается 1 балл. Если вовремя не был сдан ни один из этапов проекта, то максимальная возможная оценка за проект – 5 баллов.

В случае подозрения в несамостоятельном выполнении задания преподаватель имеет право обнулить оценку за него или провести устную защиту.

При пропуске формы контроля по уважительной причине (подтверждённой учебным офисом или документально лично преподавателям) студент имеет право на перерасчет итоговой оценки без пропущенных форм контроля.

Полезные материалы

Python

Как установить дистрибутив Anaconda на Windows и MacOS

Онлайн-курс по Python для начинающих

Конспект лекций по Python от Михаила Густокашина

Книги

Тема занятия Задание к занятию Материалы занятия
1 Модуль Pandas и NumPy
  • Установить дистрибутив Anaconda
  • Вспомнить базовый Python
  • Посмотреть тему 1 в онлайн-курсе
2 Фильтрация и сортировка данных в Pandas
  • Посмотреть тему 2 в онлайн-курсе
3 Типы данных. Создание новых переменных
  • Посмотреть тему 3 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 3
4 Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Посмотреть тему 4 в онлайн-курсе
  • Подготовиться к опросу по содержанию темы 4
  • Подготовиться к разбору заданий из темы 4
5 Описательные статистики: меры центральной тенденции и разброса
  • Посмотреть тему 5 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 5
  • Подготовиться к письменному Тесту №1 по темам 3-4
6 Выбросы. Пропущенные значения
  • Посмотреть тему 6 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 6
7 Корреляция
  • Посмотреть тему 7 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 7
  • Подготовиться к письменному Тесту №2 по темам 5-6
8 Контрольная работа
  • Подготовиться к Контрольной работе по темам 3-7
9 Линейная регрессия
  • Посмотреть тему 12 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 12
10 Введение в визуализацию данных
  • Посмотреть тему 8 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 8
11 Продвинутая визуализация данных
  • Посмотреть тему 9 в онлайн-курсе
  • Подготовиться к разбору заданий из темы 9
  • Подготовиться к письменному Тесту №3 по темам 7, 8, 12
12 Подведение итогов
  • Подготовиться к разбору заданий из демоверсии Независимого экзамена