Основы работы с данными: сбор, анализ, визуализация (ОП "Журналистика")
Содержание
О курсе
Курс читается для студентов 3-го курса ОП "Журналистика" ФКМД ВШЭ в 1-2 модулях 2021/2022 уч. г.
Лектор: Карпов Максим Евгеньевич
Лекции проходят по вторникам, 11:10 - 12:30, в zoom (ссылка).
Полезные ссылки
Репозиторий с материалами на GitHub
Видеозаписи лекций и семинаров Youtube
Канал в telegram для объявлений
Чат в telegram для обсуждений
Оставить отзыв на курс: форма
Вопросы по курсу можно задавать на почту mekarpov@hse.ru, а также в телеграм лектору (@buntar29) или семинаристу.
Семинары
Группа | Преподаватель | Учебный ассистент |
---|---|---|
191 | Максимовская Анастасия Максимовна | Стрельцов Тёма |
192 | Максимовская Анастасия Максимовна | Никулина Женя |
193 | Быков Кирилл Валерьевич | Егорова Настя |
194 | Перевышина Татьяна Олеговна | Кордзахия Натела |
195 | Перевышина Татьяна Олеговна | Васильев Коля |
Консультации
Убедительная просьба предупреждать заранее, что вы собираетесь прийти на консультацию, в личку в телеграмме преподавателю. Если желающих нет, консультация в выбранный день не проводится.
- Карпов Максим, по вторникам, 16:20 - 17:40, в зуме (ссылка)
- Быков Кирилл, по четвергам, 18:10 - 19:30, по предварительному согласованию, а так же круглосуточно в телеграме и ВК
- Стрельцов Тёма -- по предварительной договоренности, фиксированного дня/времени консультации нет. Можно 24/7 стучаться в телеграм.
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Работа на семинарах, написание кода для решения задач
- Мини-тесты на лекциях, проверяющие знание основных моментов с предыдущей недели
- Повторение базового Python в рамках онлайн курса
- Практические домашние работы на Python (всего 5 домашних заданий)
- Прикладной проект по сбору, анализу и визуализации данных на заданную тему
- Письменный экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Итог = Минимум(10, 0.1 * Онлайн курс + 0.1 * Работа на семинарах + 0.1 * Тесты на лекциях + 0.5 * ДЗ + 0.15 * Проект + 0.15 * Экзамен)
Округление арифметическое. Всего можно набрать за курс 11 баллов, но выставляется по итогу оценка не выше 10. Экзамен неблокирующий.
Правила сдачи заданий
Каждый элемент контроля (домашнее задание, проект, контрольные точки онлайн курса) имеет жёсткий дедлайн. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее. Есть исключение: в течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки вычитается по два балла. В таком случае, студент должен предупредить своего ассистента о выбранной опции.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Ко всем конспектам на GitHub есть исходники. Исправления и дополнения всячески приветствуются!
Лекция 1 (3 сентября). Введение в дата-журналистику. Логистика курса, актуальность и мотивация. [Слайды] [Запись лекции]
Лекция 2 (28 сентября). Recap Python. Функции, методы. [Ноутбук][Запись лекции]
Лекция 3 (5 октября). Базовые понятия анализа данных. Основы Парсинга html-страниц. [Слайды][Ноутбук][Запись лекции]
Лекция 4 (12 октября)
Лекция 5 (26 октября)
Лекция 6 (2 ноября)
Лекция 7 (16 ноября)
Лекция 8 (23 ноября)
Лекция 9 (7 декабря)
Семинары
Семинар 1. Базовые типы данных. Методы работы со строками, списками. [Слайды] [Ноутбук]
Семинар 2. Решение задач по словарям, циклам, условиям. [Слайды] [Ноутбук] Ноутбук c решением
Практические задания
После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки вычитается по два балла. В таком случае, студент должен предупредить своего ассистента о выбранной опции.
Онлайн курс. Задачи недели 1, 2. Ввод и вывод. Переменные. Арифметические операции.
Жесткий дедлайн:
Проект
Здесь скоро появится описание и примеры проектов. Проекты выполняются в командах строго из двух человек.
Экзамен
Здесь скоро появится вариант экзамена и вопросы для подготовки.
Полезные материалы
Установка дистрибутива Anaconda
Инструкция по установке питона на Windows и MacOS.
Конспект лекций по Python от Михаила Густокашина.
Книги
Рекомендуемая основная литература
- McKinney, W. (2012). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython. Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=495822
- Митчелл Р. - Скрапинг веб-сайтов с помощю Python - Издательство "ДМК Пресс" - 2016 - 280с. - ISBN: 978-5-97060-223-2 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100903
- Yau, N. (2013). Data Points : Visualization That Means Something. New York: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=566405
Рекомендуемая дополнительная литература
- Anoshin, D., Matic, T., Bogdanovic, S., Lincoln, T., & Shirokov, D. (2019). Tableau 2019.x Cookbook : Over 115 Recipes to Build End-to-end Analytical Solutions Using Tableau. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2022993
- Joshua N. Milligan. (2019). Learning Tableau 2019 : Tools for Business Intelligence, Data Prep, and Visual Analytics, 3rd Edition. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2092866