Основы анализа данных в международных отношениях 22/23 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинарские материалы)
м (Добавлены материалы)
 
(не показано 6 промежуточных версии 3 участников)
Строка 95: Строка 95:
 
|| [https://disk.yandex.ru/d/8iP0GCtPriJiyw Семинар 13] [https://disk.yandex.ru/i/4tzfPszoc19mbQ Данные]
 
|| [https://disk.yandex.ru/d/8iP0GCtPriJiyw Семинар 13] [https://disk.yandex.ru/i/4tzfPszoc19mbQ Данные]
 
|-
 
|-
|13 || Логистическая регрессия || [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные] || || [https://drive.google.com/file/d/1fpH7aikcGX58iTf7oGrWaaSfqmzWuELc/view?usp=share_link Файл] [https://drive.google.com/file/d/1TA_4Ya_BrEXhfYn71Il4bkedzZaYu8-N/view?usp=share_link Данные]
+
|13 || Логистическая регрессия || [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные] [https://drive.google.com/file/d/18QCUh9Yjcz5doV9gVi15pGcHpW8TFON_/view?usp=sharing Или тут] || || [https://drive.google.com/file/d/1fpH7aikcGX58iTf7oGrWaaSfqmzWuELc/view?usp=share_link Файл] [https://drive.google.com/file/d/1TA_4Ya_BrEXhfYn71Il4bkedzZaYu8-N/view?usp=share_link Данные]
 
|| [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные]
 
|| [https://disk.yandex.ru/d/w5ExcTwJ_zrfMw Семинар 14] [https://disk.yandex.ru/i/t-sy_HxVHCAuBw Данные]
 
|-
 
|-
|14 || Введение в машинное обучение || || || [ Файл] [ Данные] ||
+
|14 || Введение в машинное обучение || || || [https://drive.google.com/file/d/1U0c4b3PzCF7GcMbs8gueQRx2RDOttOOI/view?usp=sharing Файл]  
 +
[https://drive.google.com/file/d/1l4vcv2_SVHmI9Fk7ADPeIAzq_dFEcRII/view?usp=share_link Данные 1]
 +
[https://drive.google.com/file/d/1QOnFwqnp1Sw6nRjg1YwPF0kTBVYa2cr2/view?usp=share_link Данные 2]
 +
[https://drive.google.com/file/d/11iYO0SAI8IMMeLXYssNGzqK0A7F007OI/view?usp=share_link Данные 3]
 +
|| [https://disk.yandex.ru/d/ouTuhXfg4AfH_w Файл] [https://disk.yandex.ru/i/M3fzifYFWebLuw Данные 1] [https://disk.yandex.ru/i/NLQejZ0HxMmFUQ Данные 2] [https://disk.yandex.ru/i/64QrsizMQOS8aA Данные 3]
 
|}
 
|}
  
Строка 115: Строка 119:
 
[https://disk.yandex.ru/d/RU2MW6_ilywUzw Файл] [https://disk.yandex.ru/d/ZDwZrQeQhD9KQg Данные]
 
[https://disk.yandex.ru/d/RU2MW6_ilywUzw Файл] [https://disk.yandex.ru/d/ZDwZrQeQhD9KQg Данные]
 
|-
 
|-
|ДЗ 4 (20.12.2022, 23:59)|| || [https://drive.google.com/file/d/1R15ie5Fqh2v01d5yNcC7HRFfQmfia6Zh/view?usp=share_link Файл1] [https://drive.google.com/file/d/1jzZipGvdrgcm1zKrLg5k3boajJHRNxXq/view?usp=share_link Файл2] [https://drive.google.com/file/d/1Qf9nrz8uzebeL-pgTPRdyuIgms-4CVw3/view?usp=share_link Данные] || ||  
+
|ДЗ 4 (20.12.2022, 23:59)|| || [https://drive.google.com/file/d/1R15ie5Fqh2v01d5yNcC7HRFfQmfia6Zh/view?usp=share_link Файл] [https://drive.google.com/file/d/1jzZipGvdrgcm1zKrLg5k3boajJHRNxXq/view?usp=share_link Данные1] [https://drive.google.com/file/d/1Qf9nrz8uzebeL-pgTPRdyuIgms-4CVw3/view?usp=share_link Данные2] || [https://drive.google.com/file/d/1lJqD76VVor8js3ed-mF60UeZ_wOa5-S7/view?usp=share_link Файл] [https://drive.google.com/file/d/19Ki0cVAKlc4GsqV4hI3SvrSvrL51HHZS/view?usp=share_link Данные]
 +
|| [https://disk.yandex.ru/d/puoyVBo2oJxcAA Файл] [https://disk.yandex.ru/i/EfcNogI2Cti_uw Данные]
 
|}
 
|}
  

Текущая версия на 23:10, 11 декабря 2022

О курсе

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Международные отношения» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных.

Дисциплина реализуется с помощью онлайн-курса «Статистика для анализа данных».

ПУД курса: https://www.hse.ru/ba/ia/courses/646523779.html

ПУД независимого экзамена: https://www.hse.ru/ba/ia/courses/646471128.html

Необходимые ссылки

Ссылка на онлайн-курс «Статистика для анализа данных»


Приложение №17 к ПОПАТКУСу, Порядок организации Независимых экзаменов по Цифровым компетенциям

Команда курса

Группа Преподаватель Контакты Ассистент Контакты
БМО211, чат группы в Телеграме Бурова Маргарита @Burritas Мохова Елизавета @SuntAmara
БМО212, чат группы в Телеграме Бочарова Александра @ashebulka Капустина Лика @lika_kapustina
БМО213, чат группы в Телеграме Маркина Дарья @MarkinaDaria Прохоров Кирилл @kirillp001
БМО214, чат группы в Телеграме Маркина Дарья @MarkinaDaria Рубанов Владислав @rubanoww

Материалы курса

Семинарские материалы

Тема БМО211 БМО212 БМО213 БМО214
1 Введение в инструменты Семинар 1

Данные

Файл Данные Семинар 1 Данные Архив
2 Введение в статистику. Базовые манипуляции с данными Семинар 2

Данные 1 Данные 2

Файл

Данные 1 Данные 2

Семинар 2 Данные 1 Данные 2
3 Типы данных. Создание новых переменных Семинар 3 Данные 1 Файл Данные Семинар 3 Данные
4 Генеральная совокупность и выборка. Частотные таблицы и распределения Файл Данные Семинар 4 Данные
5 Описательные статистики: меры центральной тенденции и разброса Семинар 5 Данные Файл Данные Семинар 5 Данные
6 Z-оценка. Выбросы Файл Данные Файл Данные Семинар 6 Данные
7 Корреляция Файл Данные Файл Данные Семинар 7 Данные
8 Введение в визуализацию данных Семинар 8 Файл Данные 2 Семинар 8
9 Продвинутая визуализация данных Файл Данные 1 Данные 2 Файл

Данные 1 Данные 2

Семинар 9 Данные 1 Данные 2
10 Введение в тестирование гипотез. Непараметрические критерии Семинар 11 Данные 1 Данные 2 Файл Данные Семинар 10 Данные
11 Параметрические критерии для проверки гипотез Семинар 12 Данные Файл Данные Семинар 12 Семинар 12 (лекция) Данные 1 Данные 2
12 Линейная регрессия Семинар 13 Данные Файл Данные Семинар 13 Данные
13 Логистическая регрессия Семинар 14 Данные Или тут Файл Данные Семинар 14 Данные
14 Введение в машинное обучение Файл

Данные 1 Данные 2 Данные 3

Файл Данные 1 Данные 2 Данные 3

Домашние задания

№ и дедлайн БМО211 БМО212 БМО213 БМО214
ДЗ 1 (28.09.2022, 23:59) [Файл] [Данные] Файл Данные Файл Данные Файл Данные
ДЗ 2 (16.10.2022, 23:59) Файл Данные Файл Данные Файл Данные
ДЗ 3 (04.12.2022, 23:59) Файл Данные Файл Данные

Файл Данные

ДЗ 4 (20.12.2022, 23:59) Файл Данные1 Данные2 Файл Данные Файл Данные

План курса

Тема Описание
1 Введение в инструменты Инструменты для работы с Python.
2 Введение в статистику. Базовые манипуляции с данными Фильтрация данных, сортировка данных, использованием функций.
3 Типы данных. Создание новых переменных Типы признаков. Создание новых переменных по условию.
4 Генеральная совокупность и выборка. Частотные таблицы и распределения Понятия генеральной совокупности, выборки, репрезентативности. Составление частотных таблиц, визуализация частотных таблиц: гистограмма и полигон. Группировка данных и сводные таблицы.
5 Описательные статистики: меры центральной тенденции и разброса Методы центральной тенденции (мода, среднее арифметическое, медиана). Меры разброса ( размах, стандартное отклонение, дисперсия, межквартильный размах). Вычисление описательных статистик с группировкой.
6 Z-оценка. Выбросы Перевод значений в z-оценки. Работа с пропущенными значениями и с выбросами.
7 Корреляция Вычисление коэффициента корреляции Пирсона. Построение уравнения простой линейной регрессии, линия тренда.
8 Введение в визуализацию данных Использование простейших визуализаций. Линейный график, столбчатая диаграмма, точечная диаграмма.
9 Продвинутая визуализация данных Использование продвинутых методов визуализации данных, создание различных диаграмм. Разведочный анализ данных. Создание интерактивных визуализаций.
10 Введение в тестирование гипотез. Непараметрические критерии Основы тестирования гипотез. Использование непараметрических критериев. Критерий согласия Хи-квадрат и критерий независимости Хи-квадрат.
11 Параметрические критерии для проверки гипотез Параметрические статистические критерии. Т-тест : одновыборочный, парный, двухвыборочный.
12 Линейная регрессия Предпосылки линейной регрессии. Построение уравнения простой и множественной линейной регрессии. Оценка качества построенной модели.
13 Логистическая регрессия Введение в логистическую регрессию. Построение предсказаний с использованием логистической регрессии, интерпретация коэффициентов.
14 Введение в машинное обучение Основные понятия, связанные с машинным обучением. Решение задачи регрессии и классификации. Оценка качества.

Правила выставления оценок

Формула

Итог = МИН(10, 0.2*КР1 + 0.2*Экзамен + 0.2*ДЗ + 0.2*Тесты + 0.2*Проект + 0.1*Квизы)

  • 0.2 * КР1
  • 0.2 * Экзамен
  • 0.2 * ДЗ (среднее арифметическое по 6 дз)
  • 0.2 * мини-тесты на семинарах
  • 0.2 * исследовательский проект
  • 0.1 * Квизы

Округление стандартное арифметическое. Округляется только итоговый результат.

Правила дедлайнов

  • Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл за каждый день просрочки.
  • Проект: проект не может быть засчитан, если студент не пришел на защиту - даже если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время.
  • Контрольные: жёсткий дедлайн.
  • Все дедлайны – общие для всего курса.

Литература

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G.,
  • Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.

Рекомендуемая дополнительная литература

  • Савельев В. Статистика и котики.