Основы анализа данных в международных отношениях — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Бонусные ДЗ)
(Содержимое страницы заменено на « == О курсе == Курс читается на 2 курсе ОП "Международные отношения", в 1-2 мо…»)
Строка 1: Строка 1:
==Важные даты и дедлайны==
 
'''Групповое дз'''
 
*БМО161-16 июня
 
*БМО162-16 июня
 
*БМО163-9 июня
 
*БМО164-26 мая
 
'''Практическая самостоятельная работа'''
 
*БМО161-16 июня
 
*БМО162-16 июня
 
*БМО163-9 июня
 
*БМО164-26 мая
 
'''Индивидуальное дз'''<br />
 
  
Для всех групп 9 июня 23:59<br />
 
 
'''Экзамен'''<br />
 
 
Для всех групп 18 июня<br />
 
  
 
== О курсе ==
 
== О курсе ==
Курс читается на 2 курсе ОП "Международные отношения", в 4 модуле.
+
Курс читается на 2 курсе ОП "Международные отношения", в 1-2 модуле.
 
==Преподаватели==
 
==Преподаватели==
 
===Лекции===
 
===Лекции===
Строка 29: Строка 12:
  
 
===Семинары===
 
===Семинары===
{| class="wikitable"
+
 
|-
+
! Группа !! Семинарист !! Ассистент
+
|-
+
| БМО161 || Бурова Маргарита Борисовна || [https://t.me/MRArtemev Максим Артемьев]
+
|-
+
| БМО162|| [https://vk.com/id14920896 Попенова Полина Сергеевна] || [https://t.me/rseny Арсений Турышев]
+
|-
+
| БМО163|| [https://t.me/polyhex Попенова Полина Сергеевна] || [https://t.me/adhaesitadimo Пузырев Дмитрий]
+
|-
+
| БМО164|| [https://t.me/pet67 Петросян Артур Тигранович] ||  [https://t.me/ksemiya Закирова Ксения]
+
|}
+
  
 
== Материалы курса ==
 
== Материалы курса ==
 
===Лекции===
 
===Лекции===
{| class="wikitable"
 
|-
 
! № !! Дата лекции!! Тема !! Презентация
 
|-
 
| 1 || 3 апреля 2018 г. || Введение в анализ данных. Описательные статистики. Корреляции || [https://github.com/burrita/datacultureMO/blob/master/Лекция%201.pdf Лекция 1]
 
|-
 
| 2 || 3 апреля 2018 г. || Регрессии. Введение в проверку гипотез. Ошибки 1 и 2 рода. ||  [https://github.com/burrita/datacultureMO/blob/master/Лекция2.pdf Лекция 2]
 
|-
 
| 3 || 10 апреля 2018 г. || Классификация и кластеризация. Повторение гипотез, дисперсионный анализ. Факторный анализ.  || [https://drive.google.com/file/d/1TmwWuFYoakpC1acy4PEl-_cBxNN0YZlC/view?usp=sharing Лекция 3]
 
|-
 
| 4 || 10 апреля 2018 г. || Визуализация данных ||  [https://drive.google.com/file/d/1htRh6_PBknB6oF7my8u-ILgNz0wtxIch/view?usp=sharing Лекция 4]
 
|-
 
| 5 || 17 апреля 2018 г. || Статистический анализ в международных отношениях: разбор полного цикла анализа данных на примерах кейсов. Введение в анализ социальных сетей.  ||
 
|-
 
| 6 || 17 апреля 2018 г. || Введение в теорию графов. Основные метрики. Анализ социальных сетей. ||
 
|-
 
| 7 || 24 апреля 2018 г. || Применение анализа социальных сетей в исследованиях || [https://drive.google.com/file/d/1IJSyP3nRGZKtrc5Q1ERGOE1UQgm7SMvd/view?usp=sharing Лекция 7]
 
|-
 
| 8 || 24 апреля 2018 г. || Введение в обработку текстов || [https://drive.google.com/file/d/1-r-RNEpQRmiocU6sii4r8_orBTyyn5ZO/view?usp=sharing Лекция 8]
 
|-
 
| 9 || 15 мая 2018 г. || Самостоятельная работа по лекциям 1-9 ||
 
|-
 
| 10 || 22 мая 2018 г. || Разбор самостоятельной работы. Анализ текстовой информации ||
 
|-
 
| 11 || 29 мая 2018 г. ||  ||
 
|-
 
| 12 || 5 июня 2018 г. ||  ||
 
|}
 
 
===Семинары===
 
{| class="wikitable"
 
|-
 
! Тема !! Ссылка на материалы !! Бонусные задания !! Дополнительные ссылки
 
|-
 
| Введение в Python.||
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1 Семинар 1]
 
 
[https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar1_extra Разбор семинара 1]
 
 
||
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/bonus_homework_1.ipynb Задание 1]
 
 
Данные для задания можно взять, например, [https://archive.ics.uci.edu/ml/datasets.html здесь].
 
||
 
[http://pythontutor.ru Веб-уроки по Python] (для желающих)
 
 
[https://www.dropbox.com/sh/2fn28iaqhiburns/AADYP8q2SXXDyDVKVk7gPeiVa?dl=0 Альтернативная ссылка на семинар 1] (Dropbox)
 
|-
 
| Описательные статистики, гипотезы и регрессия. ||
 
[https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar2 Семинар 2]
 
||
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/Bonus2.ipynb Задание 2]
 
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/DataLE.csv Данные] лежат в той же папке.
 
||
 
|-
 
| Факторный анализ и визуализация. ||
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar%203/Seminar_3%20(1).ipynb Семинар 3]
 
||  ||
 
|-
 
| Графы и анализ сетей. ||
 
[https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar4 Семинар 4]
 
||
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/bonus_homework_networks.ipynb Задание 4]
 
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/polblogs_edgelist.txt Данные] лежат в той же папке.
 
 
||
 
|}
 
 
===Как скачать с [https://github.com/ github]===
 
* можно зайти на [https://github.com/polyhex-sqr/data_culture_hse/ страницу репозитория] и скачать архив со всеми материалами:
 
# '''Clone or download'''
 
# '''Download ZIP'''
 
* можно скачать архив с отдельной папкой:
 
# просто вставить ссылку на папку ([https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1 пример ссылки]) [https://minhaskamal.github.io/DownGit/#/home сюда]
 
# '''Download'''
 
* можно скачать отдельный файл:
 
# открыть нужный файл ([https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/python_intro.ipynb пример ссылки])
 
# кнопка '''Raw'''
 
# '''ПКМ''' и '''Сохранить как'''
 
# заменить расширение на '''Все файлы''' и удалить расширение '''.txt''' из имени
 
 
===Бонусные ДЗ===
 
'''Домашнее задание №1'''<br />
 
 
Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/bonus_homework_1.ipynb Бонусное задание №1]
 
 
Примерные датасеты высланы в телеграм-чат.
 
 
Дедлайн сдачи -- первый семинар после майских праздников.<br />
 
 
'''Домашнее задание №2'''<br />
 
 
Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/Bonus2.ipynb Бонусное задание №2]
 
 
Датасет для анализа выслан в телеграм-чат.
 
 
Дедлайн сдачи -- следующий семинар после прохождения темы (отличается для разных групп).
 
 
'''Домашнее задание №4'''<br />
 
 
Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/bonus_homework_networks.ipynb Бонусное задание №4]
 
 
[https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/polblogs_edgelist.txt Данные] лежат в той же папке.
 
 
 
'''Правила отправки'''
 
 
Отправлять на почту '''mo.dataculture@gmail.com''' <br />
 
ВНИМАНИЕ! В тему письма ставим номер группы, например "БМО161". Именно в таком виде. Больше в теме письма НИЧЕГО не надо писать. <br />
 
Файл назовите ДЗ<номер дз>_ФамилияИмя_группа. <br />
 
 
'''Важное ограничение:''' итоговое решение о добавлении бонусов выносится в конце курса при условии успешной устной защиты бонусных заданий (проще говоря, надо будет ответить на 1-2 вопроса по любому месту Вашего кода)
 
 
== Критерии оценивания и ведомости ==
 
 
Оценка за курс складывается из следующих форм контроля:
 
* Индивидуальный проект (ДЗ1)
 
* Групповой проект с устной защитой (ДЗ2)
 
* Две самостоятельных аудиторных работы, состоящих из теоретических вопросов и практического задания (СР1 и СР2)
 
* Письменный экзамен
 
 
Оценка за курс вычисляется по следующей формуле:
 
 
0,6*Накопленная + 0,4*Экзамен
 
 
Формула для вычисления накопленной оценки:
 
 
Накопленная = 0,25*ДЗ1 + 0,25*ДЗ2 + 0,25*СР1 + 0,25*СР2
 
===Оценки===
 
[https://docs.google.com/spreadsheets/d/12EYo3wQcQjt9ryUgW4c5wJ9xs8qVkCM2aX0e82sDpWY/edit?usp=sharing Текущие оценки]
 
 
[https://docs.google.com/spreadsheets/u/4/d/13_8-Q3IiZgX3EnN8Wiu-gNDD7ci3LCUkXHvsJ-kkwQ0/edit?usp=sharing Оценки за бонусные дз] (старая таблица, актуальные данные выше)
 
 
===Бонусы===
 
Дополнительно предусмотрены 5 бонусных заданий, баллы за каждое из которых приводятся к шкале [0, 1].
 
 
В конце модуля накопленная оценка вычисляется следующим образом:
 
 
Накопленная = min(Накопленная + 0,4*Бонус, 10)
 
 
===Индивидуальный проект===
 
Дедлайн 9 июня 23:59, дедлайн жесткий, работы позже не принимаются.
 
====Исследование====
 
Форма отчетности: отчет+код в файле ipynb<br />
 
Критерии:
 
*код 0.2
 
*отчет 0.1
 
*исследовательский вопрос и подбор данных 0.1
 
*структура и целостность исследования 0.2
 
*анализ данных 0.3
 
*визуализация 0.1
 
====Анализ статьи====
 
Форма отчетности:отчет<br />
 
*подбор статьи 0.1
 
*анализ метода формирования выборки+ критические замечания по ее дополнению и общие критические замечания по статье и исследованию 0.2
 
*анализ методов исследования 0.3
 
*оформление отчета 0.1
 
*придумать , как можно развить исследование, подробно описать все этапы пошагово от добора выборки до реализации исследования. 0.3
 
 
===Групповой проект===
 
 
[https://docs.google.com/spreadsheets/d/1Wl8rwJHKrtoEF1AaIFhw4haGf8dqVbUnRdpdfox27-A/edit?usp=sharing Записать группу]<br />
 
 
'''Критерии:'''<br />
 
 
1. Исследовательский вопрос + грамотный подбор подходящих данных 0.1<br />
 
 
2. Описательные статистики (как и обсуждалось на лекции, для всех исследуемых переменных необходимо предоставлять описательные статистики) 0.1<br />
 
 
3.Анализ данных: включает в себя грамотный выбор метода анализа данных (или методов), их реализация, представление численных результатов, содержательная интерпретация 0.3<br />
 
 
4.Визуализация (включает в себя само оформление презентации, визуализация полученных результатов с помощью подходящих типов диаграмм, оформление диаграмм) 0.2<br />
 
 
5.Защита+ответы на вопросы + соблюдение тайминга (не более 5 минут) 0.3<br />
 
 
Каждый критерий оценивается по десятибальной шкале.<br />
 

Версия 10:31, 3 сентября 2019


О курсе

Курс читается на 2 курсе ОП "Международные отношения", в 1-2 модуле.

Преподаватели

Лекции

Бурова Маргарита Борисовна

Семинары

Материалы курса

Лекции