Основы анализа данных в международных отношениях

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Важные даты и дедлайны

Групповое дз

  • БМО161-16 июня
  • БМО162-16 июня
  • БМО163-9 июня
  • БМО164-26 мая

Практическая самостоятельная работа

  • БМО161-16 июня
  • БМО162-16 июня
  • БМО163-9 июня
  • БМО164-26 мая

Индивидуальное дз

Для всех групп 9 июня 23:59

Экзамен

Для всех групп 18 июня

О курсе

Курс читается на 2 курсе ОП "Международные отношения", в 4 модуле.

Преподаватели

Лекции

Бурова Маргарита Борисовна

Семинары

Группа Семинарист Ассистент
БМО161 Бурова Маргарита Борисовна Максим Артемьев
БМО162 Попенова Полина Сергеевна Арсений Турышев
БМО163 Попенова Полина Сергеевна Пузырев Дмитрий
БМО164 Петросян Артур Тигранович Закирова Ксения

Материалы курса

Лекции

Дата лекции Тема Презентация
1 3 апреля 2018 г. Введение в анализ данных. Описательные статистики. Корреляции Лекция 1
2 3 апреля 2018 г. Регрессии. Введение в проверку гипотез. Ошибки 1 и 2 рода. Лекция 2
3 10 апреля 2018 г. Классификация и кластеризация. Повторение гипотез, дисперсионный анализ. Факторный анализ. Лекция 3
4 10 апреля 2018 г. Визуализация данных Лекция 4
5 17 апреля 2018 г. Статистический анализ в международных отношениях: разбор полного цикла анализа данных на примерах кейсов. Введение в анализ социальных сетей.
6 17 апреля 2018 г. Введение в теорию графов. Основные метрики. Анализ социальных сетей.
7 24 апреля 2018 г. Применение анализа социальных сетей в исследованиях Лекция 7
8 24 апреля 2018 г. Введение в обработку текстов Лекция 8
9 15 мая 2018 г. Самостоятельная работа по лекциям 1-9
10 22 мая 2018 г. Разбор самостоятельной работы. Анализ текстовой информации
11 29 мая 2018 г.
12 5 июня 2018 г.

Семинары

Тема Ссылка на материалы Бонусные задания Дополнительные ссылки
Введение в Python.

Семинар 1

Разбор семинара 1

Задание 1

Данные для задания можно взять, например, здесь.

Веб-уроки по Python (для желающих)

Альтернативная ссылка на семинар 1 (Dropbox)

Описательные статистики, гипотезы и регрессия.

Семинар 2

Задание 2

Данные лежат в той же папке.

Факторный анализ и визуализация.

Семинар 3

Графы и анализ сетей.

Семинар 4

Задание 4

Данные лежат в той же папке.

Как скачать с github

  1. Clone or download
  2. Download ZIP
  • можно скачать архив с отдельной папкой:
  1. просто вставить ссылку на папку (пример ссылки) сюда
  2. Download
  • можно скачать отдельный файл:
  1. открыть нужный файл (пример ссылки)
  2. кнопка Raw
  3. ПКМ и Сохранить как
  4. заменить расширение на Все файлы и удалить расширение .txt из имени

Бонусные ДЗ

Домашнее задание №1

Ноутбук: Бонусное задание №1

Примерные датасеты высланы в телеграм-чат.

Дедлайн сдачи -- первый семинар после майских праздников.

Домашнее задание №2

Ноутбук: Бонусное задание №2

Датасет для анализа выслан в телеграм-чат.

Дедлайн сдачи -- следующий семинар после прохождения темы (отличается для разных групп).

Домашнее задание №4

Ноутбук: Бонусное задание №4

Данные лежат в той же папке.


Правила отправки

Отправлять на почту mo.dataculture@gmail.com
ВНИМАНИЕ! В тему письма ставим номер группы, например "БМО161". Именно в таком виде. Больше в теме письма НИЧЕГО не надо писать.
Файл назовите ДЗ<номер дз>_ФамилияИмя_группа.

Важное ограничение: итоговое решение о добавлении бонусов выносится в конце курса при условии успешной устной защиты бонусных заданий (проще говоря, надо будет ответить на 1-2 вопроса по любому месту Вашего кода)

Критерии оценивания и ведомости

Оценка за курс складывается из следующих форм контроля:

  • Индивидуальный проект (ДЗ1)
  • Групповой проект с устной защитой (ДЗ2)
  • Две самостоятельных аудиторных работы, состоящих из теоретических вопросов и практического задания (СР1 и СР2)
  • Письменный экзамен

Оценка за курс вычисляется по следующей формуле:

0,6*Накопленная + 0,4*Экзамен

Формула для вычисления накопленной оценки:

Накопленная = 0,25*ДЗ1 + 0,25*ДЗ2 + 0,25*СР1 + 0,25*СР2

Оценки

Текущие оценки

Оценки за бонусные дз (старая таблица, актуальные данные выше)

Бонусы

Дополнительно предусмотрены 5 бонусных заданий, баллы за каждое из которых приводятся к шкале [0, 1].

В конце модуля накопленная оценка вычисляется следующим образом:

Накопленная = min(Накопленная + 0,4*Бонус, 10)

Индивидуальный проект

Дедлайн 9 июня 23:59, дедлайн жесткий, работы позже не принимаются.

Исследование

Форма отчетности: отчет+код в файле ipynb
Критерии:

  • код 0.2
  • отчет 0.1
  • исследовательский вопрос и подбор данных 0.1
  • структура и целостность исследования 0.2
  • анализ данных 0.3
  • визуализация 0.1

Анализ статьи

Форма отчетности:отчет

  • подбор статьи 0.1
  • анализ метода формирования выборки+ критические замечания по ее дополнению и общие критические замечания по статье и исследованию 0.2
  • анализ методов исследования 0.3
  • оформление отчета 0.1
  • придумать , как можно развить исследование, подробно описать все этапы пошагово от добора выборки до реализации исследования. 0.3

Групповой проект

Записать группу

Критерии:

1. Исследовательский вопрос + грамотный подбор подходящих данных 0.1

2. Описательные статистики (как и обсуждалось на лекции, для всех исследуемых переменных необходимо предоставлять описательные статистики) 0.1

3.Анализ данных: включает в себя грамотный выбор метода анализа данных (или методов), их реализация, представление численных результатов, содержательная интерпретация 0.3

4.Визуализация (включает в себя само оформление презентации, визуализация полученных результатов с помощью подходящих типов диаграмм, оформление диаграмм) 0.2

5.Защита+ответы на вопросы + соблюдение тайминга (не более 5 минут) 0.3

Каждый критерий оценивается по десятибальной шкале.