Основы анализа данных в международных отношениях 22/23 — различия между версиями
Mbburova (обсуждение | вклад) |
Kpdon03 (обсуждение | вклад) м (Добавлены материалы) |
||
(не показано 15 промежуточных версии 4 участников) | |||
Строка 76: | Строка 76: | ||
|| [https://disk.yandex.ru/d/tUCJUNnG7TYPCA Семинар 7] [https://disk.yandex.ru/d/_A-yRAoVyCrnQA Данные] | || [https://disk.yandex.ru/d/tUCJUNnG7TYPCA Семинар 7] [https://disk.yandex.ru/d/_A-yRAoVyCrnQA Данные] | ||
|- | |- | ||
− | |8 || Введение в визуализацию данных || [https://drive.google.com/file/d/1YxHt7x3V0pY0FWCHL9AdrPSwahJIHSxR/view?usp=sharing Семинар 8] || || [https://drive.google.com/file/d/1PNj3-klzZaW5pSW7agLYF1tZ1thDkvu-/view?usp=sharing Файл] [https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] || | + | |8 || Введение в визуализацию данных || [https://drive.google.com/file/d/1YxHt7x3V0pY0FWCHL9AdrPSwahJIHSxR/view?usp=sharing Семинар 8] || || [https://drive.google.com/file/d/1PNj3-klzZaW5pSW7agLYF1tZ1thDkvu-/view?usp=sharing Файл] [https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] |
+ | || [https://disk.yandex.ru/d/hwtyeLm1ylTmWA Семинар 8] | ||
|- | |- | ||
|9 || Продвинутая визуализация данных || [https://drive.google.com/file/d/15bYzUMoBgQqn_NK-CEkLEwtQvJR66UmM/view?usp=sharing Файл] [https://drive.google.com/file/d/1mjh2MjxiCwndOzPfFFUAnq4O2FoU4dBf/view?usp=sharing Данные 1] [https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] || || [https://drive.google.com/file/d/15bYzUMoBgQqn_NK-CEkLEwtQvJR66UmM/view?usp=sharing Файл] | |9 || Продвинутая визуализация данных || [https://drive.google.com/file/d/15bYzUMoBgQqn_NK-CEkLEwtQvJR66UmM/view?usp=sharing Файл] [https://drive.google.com/file/d/1mjh2MjxiCwndOzPfFFUAnq4O2FoU4dBf/view?usp=sharing Данные 1] [https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] || || [https://drive.google.com/file/d/15bYzUMoBgQqn_NK-CEkLEwtQvJR66UmM/view?usp=sharing Файл] | ||
[https://drive.google.com/file/d/1mjh2MjxiCwndOzPfFFUAnq4O2FoU4dBf/view?usp=sharing Данные 1] | [https://drive.google.com/file/d/1mjh2MjxiCwndOzPfFFUAnq4O2FoU4dBf/view?usp=sharing Данные 1] | ||
[https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] | [https://drive.google.com/file/d/1nCh0WSOlaP8x5DRJomY1WBO2s-oyqnaR/view?usp=sharing Данные 2] | ||
− | || | + | || [https://disk.yandex.ru/d/ZDeZ8kC2KLN7-A Семинар 9] [https://disk.yandex.ru/i/jYXoa6NehvKjGg Данные 1] [https://disk.yandex.ru/d/lyMDav96URXqMQ Данные 2] |
|- | |- | ||
− | |10 || Введение в тестирование гипотез. Непараметрические критерии || [https://drive.google.com/file/d/1BcpQ3pYjyt-BMxoH3Vynlhaa2gfePv_W/view?usp=sharing Семинар 11] [https://drive.google.com/file/d/1TcqLqR6q4h2fmny2wk77BiNSMraV9GCQ/view?usp=sharing Данные 1] [https://drive.google.com/file/d/1vRMniPf4ziLYRK_TUC_KSjM10qetf3fS/view?usp=sharing Данные 2]|| || [https://drive.google.com/file/d/1-hSJ73gyzgSj0eefnedT37xj9LueVU9g/view?usp=sharing Файл] [https://drive.google.com/file/d/1dao0kQ9sK2vI2RZ8XajM-UiSPMckbjZI/view?usp=sharing Данные] || | + | |10 || Введение в тестирование гипотез. Непараметрические критерии || [https://drive.google.com/file/d/1BcpQ3pYjyt-BMxoH3Vynlhaa2gfePv_W/view?usp=sharing Семинар 11] [https://drive.google.com/file/d/1TcqLqR6q4h2fmny2wk77BiNSMraV9GCQ/view?usp=sharing Данные 1] [https://drive.google.com/file/d/1vRMniPf4ziLYRK_TUC_KSjM10qetf3fS/view?usp=sharing Данные 2]|| || [https://drive.google.com/file/d/1-hSJ73gyzgSj0eefnedT37xj9LueVU9g/view?usp=sharing Файл] [https://drive.google.com/file/d/1dao0kQ9sK2vI2RZ8XajM-UiSPMckbjZI/view?usp=sharing Данные] |
+ | || [https://disk.yandex.ru/d/7zd-hjkejElmlA Семинар 10] [https://disk.yandex.ru/d/HBJBos7wEsweCw Данные] | ||
|- | |- | ||
− | |11 || Параметрические критерии для проверки гипотез || || || || | + | |11 || Параметрические критерии для проверки гипотез || [https://drive.google.com/file/d/1EGp8N4OfD9hH81-0Veq-dgi7uNB-bkjV/view?usp=sharing Семинар 12] [https://drive.google.com/file/d/1BdGSk9jpwcGl4Qb-8ZRLmzbZBhPHDO_z/view?usp=sharing Данные]|| |
+ | || [https://drive.google.com/file/d/1BxkuVpSXnQBRLskFv5eZo1I1x6GXJo6S/view?usp=share_link Файл] [https://drive.google.com/file/d/1laTwWaIfiFJvF2gvFA0XLzhZlfigeaXV/view?usp=share_link Данные] | ||
+ | || [https://disk.yandex.ru/d/MqtJ3iltJ31ZrQ Семинар 12] [https://disk.yandex.ru/d/uKKruDJAzELXgg Семинар 12 (лекция)] [https://disk.yandex.ru/d/BSNVAbn4N7HNmg Данные 1] [https://disk.yandex.ru/i/cUWae12htCTNlw Данные 2] | ||
|- | |- | ||
− | |12 || Линейная регрессия || || || || | + | |12 || Линейная регрессия || [https://drive.google.com/file/d/1lfkyH3PrQlMlq6MZgONTY2QnJSUi2S0G/view?usp=sharing Семинар 13] [https://drive.google.com/file/d/1_UYvc12rIFA25bMng5fgQHT5KKKa-RqK/view?usp=sharing Данные] || |
+ | || [https://drive.google.com/file/d/1NeEBdkRnLdbzYWiMfAXL6jJEY0Of2AEV/view?usp=share_link Файл] [https://docs.google.com/spreadsheets/d/1kpsceMHgdl8doYc54sQbit7lNdt7kkr-/edit?usp=share_link&ouid=113216238343799592570&rtpof=true&sd=true Данные] | ||
+ | || [https://disk.yandex.ru/d/8iP0GCtPriJiyw Семинар 13] [https://disk.yandex.ru/i/4tzfPszoc19mbQ Данные] | ||
|- | |- | ||
− | |13 || Логистическая регрессия || || || || | + | |13 || Логистическая регрессия || [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные] [https://drive.google.com/file/d/18QCUh9Yjcz5doV9gVi15pGcHpW8TFON_/view?usp=sharing Или тут] || || [https://drive.google.com/file/d/1fpH7aikcGX58iTf7oGrWaaSfqmzWuELc/view?usp=share_link Файл] [https://drive.google.com/file/d/1TA_4Ya_BrEXhfYn71Il4bkedzZaYu8-N/view?usp=share_link Данные] |
+ | || [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные] | ||
|- | |- | ||
− | |14 || Введение в машинное обучение || || || || | + | |14 || Введение в машинное обучение || || || [https://drive.google.com/file/d/1U0c4b3PzCF7GcMbs8gueQRx2RDOttOOI/view?usp=sharing Файл] |
+ | [https://drive.google.com/file/d/1l4vcv2_SVHmI9Fk7ADPeIAzq_dFEcRII/view?usp=share_link Данные 1] | ||
+ | [https://drive.google.com/file/d/1QOnFwqnp1Sw6nRjg1YwPF0kTBVYa2cr2/view?usp=share_link Данные 2] | ||
+ | [https://drive.google.com/file/d/11iYO0SAI8IMMeLXYssNGzqK0A7F007OI/view?usp=share_link Данные 3] | ||
+ | || [https://disk.yandex.ru/d/ouTuhXfg4AfH_w Файл] [https://disk.yandex.ru/i/M3fzifYFWebLuw Данные 1] [https://disk.yandex.ru/i/NLQejZ0HxMmFUQ Данные 2] [https://disk.yandex.ru/i/64QrsizMQOS8aA Данные 3] | ||
|} | |} | ||
Строка 105: | Строка 116: | ||
|| [https://disk.yandex.ru/d/rHliZC05Fru9DQ Файл] [https://disk.yandex.ru/d/19XTP242ElEvJg Данные] | || [https://disk.yandex.ru/d/rHliZC05Fru9DQ Файл] [https://disk.yandex.ru/d/19XTP242ElEvJg Данные] | ||
|- | |- | ||
− | |ДЗ 3 (04.12.2022, 23:59) || || [https://drive.google.com/file/d/1ZuxJWCDm0l_rs4Myfg20qIEZGj7IYVZw/view?usp=share_link Файл] [https://drive.google.com/file/d/1pJ7Kp5TFBKwj4qTCn5hF2yPmPGGBhfiu/view?usp=sharing Данные] || [https://drive.google.com/file/d/1DJAeuIg9TH0aiTlAYY-EjtP9LDUoAY4c/view?usp=sharing Файл] [https://drive.google.com/file/d/1pJ7Kp5TFBKwj4qTCn5hF2yPmPGGBhfiu/view?usp=sharing Данные] || | + | |ДЗ 3 (04.12.2022, 23:59) || || [https://drive.google.com/file/d/1ZuxJWCDm0l_rs4Myfg20qIEZGj7IYVZw/view?usp=share_link Файл] [https://drive.google.com/file/d/1pJ7Kp5TFBKwj4qTCn5hF2yPmPGGBhfiu/view?usp=sharing Данные] || [https://drive.google.com/file/d/1DJAeuIg9TH0aiTlAYY-EjtP9LDUoAY4c/view?usp=sharing Файл] [https://drive.google.com/file/d/1pJ7Kp5TFBKwj4qTCn5hF2yPmPGGBhfiu/view?usp=sharing Данные] || |
+ | [https://disk.yandex.ru/d/RU2MW6_ilywUzw Файл] [https://disk.yandex.ru/d/ZDwZrQeQhD9KQg Данные] | ||
|- | |- | ||
− | |ДЗ 4 || || || || | + | |ДЗ 4 (20.12.2022, 23:59)|| || [https://drive.google.com/file/d/1R15ie5Fqh2v01d5yNcC7HRFfQmfia6Zh/view?usp=share_link Файл] [https://drive.google.com/file/d/1jzZipGvdrgcm1zKrLg5k3boajJHRNxXq/view?usp=share_link Данные1] [https://drive.google.com/file/d/1Qf9nrz8uzebeL-pgTPRdyuIgms-4CVw3/view?usp=share_link Данные2] || [https://drive.google.com/file/d/1lJqD76VVor8js3ed-mF60UeZ_wOa5-S7/view?usp=share_link Файл] [https://drive.google.com/file/d/19Ki0cVAKlc4GsqV4hI3SvrSvrL51HHZS/view?usp=share_link Данные] |
+ | || [https://disk.yandex.ru/d/puoyVBo2oJxcAA Файл] [https://disk.yandex.ru/i/EfcNogI2Cti_uw Данные] | ||
|} | |} | ||
Текущая версия на 23:10, 11 декабря 2022
Содержание
О курсе
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Международные отношения» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных.
Дисциплина реализуется с помощью онлайн-курса «Статистика для анализа данных».
ПУД курса: https://www.hse.ru/ba/ia/courses/646523779.html
ПУД независимого экзамена: https://www.hse.ru/ba/ia/courses/646471128.html
Необходимые ссылки
Ссылка на онлайн-курс «Статистика для анализа данных»
Приложение №17 к ПОПАТКУСу, Порядок организации Независимых экзаменов по Цифровым компетенциям
Команда курса
Группа | Преподаватель | Контакты | Ассистент | Контакты |
---|---|---|---|---|
БМО211, чат группы в Телеграме | Бурова Маргарита | @Burritas | Мохова Елизавета | @SuntAmara |
БМО212, чат группы в Телеграме | Бочарова Александра | @ashebulka | Капустина Лика | @lika_kapustina |
БМО213, чат группы в Телеграме | Маркина Дарья | @MarkinaDaria | Прохоров Кирилл | @kirillp001 |
БМО214, чат группы в Телеграме | Маркина Дарья | @MarkinaDaria | Рубанов Владислав | @rubanoww |
Материалы курса
Семинарские материалы
№ | Тема | БМО211 | БМО212 | БМО213 | БМО214 |
---|---|---|---|---|---|
1 | Введение в инструменты | Семинар 1 | Файл Данные | Семинар 1 Данные Архив | |
2 | Введение в статистику. Базовые манипуляции с данными | Семинар 2 | Файл | Семинар 2 Данные 1 Данные 2 | |
3 | Типы данных. Создание новых переменных | Семинар 3 Данные 1 | Файл Данные | Семинар 3 Данные | |
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения | Файл Данные | Семинар 4 Данные | ||
5 | Описательные статистики: меры центральной тенденции и разброса | Семинар 5 Данные | Файл Данные | Семинар 5 Данные | |
6 | Z-оценка. Выбросы | Файл Данные | Файл Данные | Семинар 6 Данные | |
7 | Корреляция | Файл Данные | Файл Данные | Семинар 7 Данные | |
8 | Введение в визуализацию данных | Семинар 8 | Файл Данные 2 | Семинар 8 | |
9 | Продвинутая визуализация данных | Файл Данные 1 Данные 2 | Файл | Семинар 9 Данные 1 Данные 2 | |
10 | Введение в тестирование гипотез. Непараметрические критерии | Семинар 11 Данные 1 Данные 2 | Файл Данные | Семинар 10 Данные | |
11 | Параметрические критерии для проверки гипотез | Семинар 12 Данные | Файл Данные | Семинар 12 Семинар 12 (лекция) Данные 1 Данные 2 | |
12 | Линейная регрессия | Семинар 13 Данные | Файл Данные | Семинар 13 Данные | |
13 | Логистическая регрессия | Семинар 14 Данные Или тут | Файл Данные | Семинар 14 Данные | |
14 | Введение в машинное обучение | Файл | Файл Данные 1 Данные 2 Данные 3 |
Домашние задания
№ и дедлайн | БМО211 | БМО212 | БМО213 | БМО214 |
---|---|---|---|---|
ДЗ 1 (28.09.2022, 23:59) | [Файл] [Данные] | Файл Данные | Файл Данные | Файл Данные |
ДЗ 2 (16.10.2022, 23:59) | Файл Данные | Файл Данные | Файл Данные | |
ДЗ 3 (04.12.2022, 23:59) | Файл Данные | Файл Данные | ||
ДЗ 4 (20.12.2022, 23:59) | Файл Данные1 Данные2 | Файл Данные | Файл Данные |
План курса
№ | Тема | Описание |
---|---|---|
1 | Введение в инструменты | Инструменты для работы с Python. |
2 | Введение в статистику. Базовые манипуляции с данными | Фильтрация данных, сортировка данных, использованием функций. |
3 | Типы данных. Создание новых переменных | Типы признаков. Создание новых переменных по условию. |
4 | Генеральная совокупность и выборка. Частотные таблицы и распределения | Понятия генеральной совокупности, выборки, репрезентативности. Составление частотных таблиц, визуализация частотных таблиц: гистограмма и полигон. Группировка данных и сводные таблицы. |
5 | Описательные статистики: меры центральной тенденции и разброса | Методы центральной тенденции (мода, среднее арифметическое, медиана). Меры разброса ( размах, стандартное отклонение, дисперсия, межквартильный размах). Вычисление описательных статистик с группировкой. |
6 | Z-оценка. Выбросы | Перевод значений в z-оценки. Работа с пропущенными значениями и с выбросами. |
7 | Корреляция | Вычисление коэффициента корреляции Пирсона. Построение уравнения простой линейной регрессии, линия тренда. |
8 | Введение в визуализацию данных | Использование простейших визуализаций. Линейный график, столбчатая диаграмма, точечная диаграмма. |
9 | Продвинутая визуализация данных | Использование продвинутых методов визуализации данных, создание различных диаграмм. Разведочный анализ данных. Создание интерактивных визуализаций. |
10 | Введение в тестирование гипотез. Непараметрические критерии | Основы тестирования гипотез. Использование непараметрических критериев. Критерий согласия Хи-квадрат и критерий независимости Хи-квадрат. |
11 | Параметрические критерии для проверки гипотез | Параметрические статистические критерии. Т-тест : одновыборочный, парный, двухвыборочный. |
12 | Линейная регрессия | Предпосылки линейной регрессии. Построение уравнения простой и множественной линейной регрессии. Оценка качества построенной модели. |
13 | Логистическая регрессия | Введение в логистическую регрессию. Построение предсказаний с использованием логистической регрессии, интерпретация коэффициентов. |
14 | Введение в машинное обучение | Основные понятия, связанные с машинным обучением. Решение задачи регрессии и классификации. Оценка качества. |
Правила выставления оценок
Формула
Итог = МИН(10, 0.2*КР1 + 0.2*Экзамен + 0.2*ДЗ + 0.2*Тесты + 0.2*Проект + 0.1*Квизы)
- 0.2 * КР1
- 0.2 * Экзамен
- 0.2 * ДЗ (среднее арифметическое по 6 дз)
- 0.2 * мини-тесты на семинарах
- 0.2 * исследовательский проект
- 0.1 * Квизы
Округление стандартное арифметическое. Округляется только итоговый результат.
Правила дедлайнов
- Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл за каждый день просрочки.
- Проект: проект не может быть засчитан, если студент не пришел на защиту - даже если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время.
- Контрольные: жёсткий дедлайн.
- Все дедлайны – общие для всего курса.
Литература
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.