Основы анализа данных в международных отношениях 22/23
Содержание
О курсе
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Международные отношения» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных.
Дисциплина реализуется с помощью онлайн-курса «Статистика для анализа данных».
ПУД курса: https://www.hse.ru/ba/ia/courses/646523779.html
ПУД независимого экзамена: https://www.hse.ru/ba/ia/courses/646471128.html
Необходимые ссылки
Ссылка на онлайн-курс «Статистика для анализа данных»
Приложение №17 к ПОПАТКУСу, Порядок организации Независимых экзаменов по Цифровым компетенциям
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БМО211, чат группы в Телеграме | Бурова Маргарита | @Burritas | Мохова Елизавета | @SuntAmara |
БМО212, чат группы в Телеграме | Бочарова Александра | @ashebulka | Капустина Лика | @lika_kapustina |
БМО213, чат группы в Телеграме | Маркина Дарья | @MarkinaDaria | Прохоров Кирилл | @kirillp001 |
БМО214, чат группы в Телеграме | Маркина Дарья | @MarkinaDaria | Рубанов Владислав | @rubanoww |
Материалы курса
Семинарские материалы
№ | Тема | БМО211 | БМО212 | БМО213 | БМО214 |
---|---|---|---|---|---|
1 | Введение в инструменты | Семинар 1 | |||
2 | Введение в статистику. Базовые манипуляции с данными | Семинар 2 | |||
3 | Типы данных. Создание новых переменных | Семинар 3 Данные 1 | |||
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения | ||||
5 | Описательные статистики: меры центральной тенденции и разброса | ||||
6 | Z-оценка. Выбросы | ||||
7 | Корреляция | ||||
8 | Введение в визуализацию данных | ||||
9 | Продвинутая визуализация данных | ||||
10 | Введение в тестирование гипотез. Непараметрические критерии | ||||
11 | Параметрические критерии для проверки гипотез | ||||
12 | Линейная регрессия | ||||
13 | Логистическая регрессия | ||||
14 | Введение в машинное обучение |
Домашние задания
№ и дедлайн | БМО211 | БМО212 | БМО213 | БМО214 |
---|---|---|---|---|
ДЗ 1 (28.09.2022, 25:59) | [Файл] [Данные] | [Файл] [Данные] | Файл Данные | Файл Данные |
ДЗ 2 | ||||
ДЗ 3 | ||||
ДЗ 4 | ||||
ДЗ 5 | ||||
ДЗ 6 |
План курса
№ | Тема | Описание |
---|---|---|
1 | Введение в инструменты | Инструменты для работы с Python. |
2 | Введение в статистику. Базовые манипуляции с данными | Фильтрация данных, сортировка данных, использованием функций. |
3 | Типы данных. Создание новых переменных | Типы признаков. Создание новых переменных по условию. |
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения | Понятия генеральной совокупности, выборки, репрезентативности. Составление частотных таблиц, визуализация частотных таблиц: гистограмма и полигон. Группировка данных и сводные таблицы. |
5 | Описательные статистики: меры центральной тенденции и разброса | Методы центральной тенденции (мода, среднее арифметическое, медиана). Меры разброса ( размах, стандартное отклонение, дисперсия, межквартильный размах). Вычисление описательных статистик с группировкой. |
6 | Z-оценка. Выбросы | Перевод значений в z-оценки. Работа с пропущенными значениями и с выбросами. |
7 | Корреляция | Вычисление коэффициента корреляции Пирсона. Построение уравнения простой линейной регрессии, линия тренда. |
8 | Введение в визуализацию данных | Использование простейших визуализаций. Линейный график, столбчатая диаграмма, точечная диаграмма. |
9 | Продвинутая визуализация данных | Использование продвинутых методов визуализации данных, создание различных диаграмм. Разведочный анализ данных. Создание интерактивных визуализаций. |
10 | Введение в тестирование гипотез. Непараметрические критерии | Основы тестирования гипотез. Использование непараметрических критериев. Критерий согласия Хи-квадрат и критерий независимости Хи-квадрат. |
11 | Параметрические критерии для проверки гипотез | Параметрические статистические критерии. Т-тест : одновыборочный, парный, двухвыборочный. |
12 | Линейная регрессия | Предпосылки линейной регрессии. Построение уравнения простой и множественной линейной регрессии. Оценка качества построенной модели. |
13 | Логистическая регрессия | Введение в логистическую регрессию. Построение предсказаний с использованием логистической регрессии, интерпретация коэффициентов. |
14 | Введение в машинное обучение | Основные понятия, связанные с машинным обучением. Решение задачи регрессии и классификации. Оценка качества. |
Правила выставления оценок
Формула
Итог = МИН(10, 0.2*КР1 + 0.2*Экзамен + 0.2*ДЗ + 0.2*Тесты + 0.2*Проект + 0.1*Квизы)
- 0.2 * КР1
- 0.2 * Экзамен
- 0.2 * ДЗ (среднее арифметическое по 6 дз)
- 0.2 * мини-тесты на семинарах
- 0.2 * исследовательский проект
- 0.1 * Квизы
Округление стандартное арифметическое. Округляется только итоговый результат.
Правила дедлайнов
- Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл за каждый день просрочки.
- Проект: проект не может быть засчитан, если студент не пришел на защиту - даже если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время.
- Контрольные: жёсткий дедлайн.
- Все дедлайны – общие для всего курса.
Литература
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.