Основы анализа и визуализация данных для медиа 2019/2020

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

"Основы анализа и визуализации данных для медиа" читается на 4 курсе, в 1 модуле 2019/2020 учебного года

Программа курса

Группа курса в Telegram

Преподаватель

Рогович Татьяна Владимировна

Ассистент

Филатов Михаил

Материалы курса

Ссылка для установки Tableau Public на собственные компьютеры

Нужно ввести e-mail и нажать оранжевую кнопку DOWNLOAD THE APP.

Лекции и семинары

Неделя Тема Презентациии Файлы
2-8 сентября Лекции 1-2 Введение. Статистические данные и журналистика. Лекции 1-2 NA
2-8 сентября Семинар 1 Введение в статистику. Основные понятия: методы эксперимента и наблюдения, переменные, ошибка измерения, валидность и надежность. Семинар 1 NA
9-15 сентября Лекция 3 Статистика выводов и описательная статистика. Выборка и генеральная совокупность. Частотные таблицы и распределения. График рассеяния. Лекция 3 NA
9-15 сентября Лекция 4 Введение в визуализацию данных. Лекция 4 NA
9-15 сентября Семинар 2 Меры центральной тенденции. Работа с таблицами в Excel Семинар 2 Excel Tutorial Titanic Titanic Data
16-22 сентября Лекции 5-6 Принципы хорошей визуализации по Э. Тафти. Психологоческие особенности визуального восприятия. Лучшие практики работы с основными видами графиков. Лекции 5-6 NA
16-22 сентября Семинар 3 Меры разброса. Начало работы с Tableau Public Семинар 3 Titanic Data Tutorial по работе с титаником в tableau (c 8 минуты)
23-29 сентября Лекция 7 Корреляция. Тестирование гипотез на разность средних значений Лекция 7 НЕ НУЖНО ДЛЯ КОНТРОЛЬНОЙ

Часть лекции 7 про тестирование гипотез (разница между средними выборок). НУЖНО ДЛЯ КОНТРОЛЬНОЙ! || NA

23-29 сентября Семинар 5 Введение в Tableau. Базовые типы графиков Книга Tableau Семинара 5 NY garbage data
30 сентября-6 октября Семинар 6 Работа с барчартами в Tableau. Использование переменных из нескольких файлов. Создание дашборда Книга Семинара 6 NY garbage data Сensus Data
7-13 октября Семинар 7 Работа с линейными графиками. Самостоятельная работа Задания для упражнения Данные по именам новорожденных Moscow flats US Crimes Пример визуализации 1 Пример визуализации 2
14-20 октября Семинар 8 Решаем пробный вариант контрольной работы Группа 1634-164 Группа 161-162 Данные
14-20 октября Семинар 9 Графики рассеяния и карты: Gapminder. Вкладка Pages. Другие типы визуализаций. Gapminder Tutorial Axios Sexual Misconduct Visualisation Sexual Misconduct Data Axios Misconduct Data Gapminder Data Данные по суицидам Tooltip view example
14-20 октября Семинар 10 Самостоятельная в Tableau

Видео 1 Работаем в Excel с Титаником

Titanic Data

Видео 2 Работаем в Tableau с Титаником

Titanic Data

Tableau файл по итогам видео

Видео: Titanic Tableau Tutorial. Введение в интерфейс Tableau

Видео 3 NY Garbage Data - одни данные, разные графики

Garbage Data

Tableau файл по итогам видео

Видео: создаем разные графики по двум переменным. Кратко говорим о дашбордах

Видео 4 NY Garbage Data - делаем дашборд про Queens

Garbage Data Census Data

Tableau файл по итогам видео

Видео: считаем пропорции. Создаем индекс и ранжирование. Считаем значения на душу населения. Делаем небольшой дашборд про Queens

Видео 5 Baby Names - работаем с линейными графиками. Фильтры и контекст Добавляем подписи.

Tableau файл по итогам видео

Данные. National data

Видео: линейные графики. Фильтры и контекст. ВАЖНО

Видео 6 US Crimes - Мультивариативные графики рассеяния и интерпретация регрессии.

Данные

Видео: мультивариативный график. Анализ регрессии и коэффицента корелляции

Видео 7 Moscow Flats - Решение самостоятельного задания.

Данные

Задания

Видео: решение самостоятельного задания Moscow Flats

Видео 8 Life Expectancy - Решение Mock Test.

Видео: Решение Mock Test

Контрольные работы и презентации

Дата Тема Файлы Оценки
2 октября 10.30 Письменная контрольная работа по статистике Пробный вариант
1, 8 октября и 2, 10 октября по записи Презентация плохой визуализации Ссылка на запись
14 октября в 12.10 и 13.40 Контрольная в Tableau

Экзамен

Информация о экзамене и дедлайны Хорошие источники данных

Дедлайн утверждения темы: 16 октября 23:59 в ЛМС

Дедлайн сдачи проекта: 23 октября 23.59 в ЛМС

Защита проекта: 24 октября

Формула оценивания

Окончательная оценка = Округление(0.6 * (КР1 + КР2)/2 + 0.15 * ДЗ1 + 0.25 * Проект)

Промежуточная аттестация

Список рекомендуемой литературы

Data Journalists who use Tableau La Nacion Data Portfolio

Основная литература

Дополнительная литература

  • Уилан Ч. Голая статистика.
  • Gray J, Bounegru L, Chambers L. The Data Journalist Handbook.
  • Huff D. How to lie with statistics.
  • Livingston C, Voakes P. Working with numbers and statistics.
  • Савельев В. Статистика и котики.