|
|
Строка 1: |
Строка 1: |
− | ==Важные даты и дедлайны==
| |
− | '''Групповое дз'''
| |
− | *БМО161-16 июня
| |
− | *БМО162-16 июня
| |
− | *БМО163-9 июня
| |
− | *БМО164-26 мая
| |
− | '''Практическая самостоятельная работа'''
| |
− | *БМО161-16 июня
| |
− | *БМО162-16 июня
| |
− | *БМО163-9 июня
| |
− | *БМО164-26 мая
| |
− | '''Индивидуальное дз'''<br />
| |
| | | |
− | Для всех групп 9 июня 23:59<br />
| |
− |
| |
− | '''Экзамен'''<br />
| |
− |
| |
− | Для всех групп 18 июня<br />
| |
| | | |
| == О курсе == | | == О курсе == |
− | Курс читается на 2 курсе ОП "Международные отношения", в 4 модуле. | + | Курс читается на 2 курсе ОП "Международные отношения", в 1-2 модуле. |
| ==Преподаватели== | | ==Преподаватели== |
| ===Лекции=== | | ===Лекции=== |
Строка 29: |
Строка 12: |
| | | |
| ===Семинары=== | | ===Семинары=== |
− | {| class="wikitable"
| + | |
− | |-
| + | |
− | ! Группа !! Семинарист !! Ассистент
| + | |
− | |-
| + | |
− | | БМО161 || Бурова Маргарита Борисовна || [https://t.me/MRArtemev Максим Артемьев]
| + | |
− | |-
| + | |
− | | БМО162|| [https://vk.com/id14920896 Попенова Полина Сергеевна] || [https://t.me/rseny Арсений Турышев]
| + | |
− | |-
| + | |
− | | БМО163|| [https://t.me/polyhex Попенова Полина Сергеевна] || [https://t.me/adhaesitadimo Пузырев Дмитрий]
| + | |
− | |-
| + | |
− | | БМО164|| [https://t.me/pet67 Петросян Артур Тигранович] || [https://t.me/ksemiya Закирова Ксения]
| + | |
− | |}
| + | |
| | | |
| == Материалы курса == | | == Материалы курса == |
| ===Лекции=== | | ===Лекции=== |
− | {| class="wikitable"
| |
− | |-
| |
− | ! № !! Дата лекции!! Тема !! Презентация
| |
− | |-
| |
− | | 1 || 3 апреля 2018 г. || Введение в анализ данных. Описательные статистики. Корреляции || [https://github.com/burrita/datacultureMO/blob/master/Лекция%201.pdf Лекция 1]
| |
− | |-
| |
− | | 2 || 3 апреля 2018 г. || Регрессии. Введение в проверку гипотез. Ошибки 1 и 2 рода. || [https://github.com/burrita/datacultureMO/blob/master/Лекция2.pdf Лекция 2]
| |
− | |-
| |
− | | 3 || 10 апреля 2018 г. || Классификация и кластеризация. Повторение гипотез, дисперсионный анализ. Факторный анализ. || [https://drive.google.com/file/d/1TmwWuFYoakpC1acy4PEl-_cBxNN0YZlC/view?usp=sharing Лекция 3]
| |
− | |-
| |
− | | 4 || 10 апреля 2018 г. || Визуализация данных || [https://drive.google.com/file/d/1htRh6_PBknB6oF7my8u-ILgNz0wtxIch/view?usp=sharing Лекция 4]
| |
− | |-
| |
− | | 5 || 17 апреля 2018 г. || Статистический анализ в международных отношениях: разбор полного цикла анализа данных на примерах кейсов. Введение в анализ социальных сетей. ||
| |
− | |-
| |
− | | 6 || 17 апреля 2018 г. || Введение в теорию графов. Основные метрики. Анализ социальных сетей. ||
| |
− | |-
| |
− | | 7 || 24 апреля 2018 г. || Применение анализа социальных сетей в исследованиях || [https://drive.google.com/file/d/1IJSyP3nRGZKtrc5Q1ERGOE1UQgm7SMvd/view?usp=sharing Лекция 7]
| |
− | |-
| |
− | | 8 || 24 апреля 2018 г. || Введение в обработку текстов || [https://drive.google.com/file/d/1-r-RNEpQRmiocU6sii4r8_orBTyyn5ZO/view?usp=sharing Лекция 8]
| |
− | |-
| |
− | | 9 || 15 мая 2018 г. || Самостоятельная работа по лекциям 1-9 ||
| |
− | |-
| |
− | | 10 || 22 мая 2018 г. || Разбор самостоятельной работы. Анализ текстовой информации ||
| |
− | |-
| |
− | | 11 || 29 мая 2018 г. || ||
| |
− | |-
| |
− | | 12 || 5 июня 2018 г. || ||
| |
− | |}
| |
− |
| |
− | ===Семинары===
| |
− | {| class="wikitable"
| |
− | |-
| |
− | ! Тема !! Ссылка на материалы !! Бонусные задания !! Дополнительные ссылки
| |
− | |-
| |
− | | Введение в Python.||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1 Семинар 1]
| |
− |
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar1_extra Разбор семинара 1]
| |
− |
| |
− | ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/bonus_homework_1.ipynb Задание 1]
| |
− |
| |
− | Данные для задания можно взять, например, [https://archive.ics.uci.edu/ml/datasets.html здесь].
| |
− | ||
| |
− | [http://pythontutor.ru Веб-уроки по Python] (для желающих)
| |
− |
| |
− | [https://www.dropbox.com/sh/2fn28iaqhiburns/AADYP8q2SXXDyDVKVk7gPeiVa?dl=0 Альтернативная ссылка на семинар 1] (Dropbox)
| |
− | |-
| |
− | | Описательные статистики, гипотезы и регрессия. ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar2 Семинар 2]
| |
− | ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/Bonus2.ipynb Задание 2]
| |
− |
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/DataLE.csv Данные] лежат в той же папке.
| |
− | ||
| |
− | |-
| |
− | | Факторный анализ и визуализация. ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar%203/Seminar_3%20(1).ipynb Семинар 3]
| |
− | || ||
| |
− | |-
| |
− | | Графы и анализ сетей. ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/tree/master/seminar4 Семинар 4]
| |
− | ||
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/bonus_homework_networks.ipynb Задание 4]
| |
− |
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/polblogs_edgelist.txt Данные] лежат в той же папке.
| |
− |
| |
− | ||
| |
− | |}
| |
− |
| |
− | ===Как скачать с [https://github.com/ github]===
| |
− | * можно зайти на [https://github.com/polyhex-sqr/data_culture_hse/ страницу репозитория] и скачать архив со всеми материалами:
| |
− | # '''Clone or download'''
| |
− | # '''Download ZIP'''
| |
− | * можно скачать архив с отдельной папкой:
| |
− | # просто вставить ссылку на папку ([https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1 пример ссылки]) [https://minhaskamal.github.io/DownGit/#/home сюда]
| |
− | # '''Download'''
| |
− | * можно скачать отдельный файл:
| |
− | # открыть нужный файл ([https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/python_intro.ipynb пример ссылки])
| |
− | # кнопка '''Raw'''
| |
− | # '''ПКМ''' и '''Сохранить как'''
| |
− | # заменить расширение на '''Все файлы''' и удалить расширение '''.txt''' из имени
| |
− |
| |
− | ===Бонусные ДЗ===
| |
− | '''Домашнее задание №1'''<br />
| |
− |
| |
− | Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar1/bonus_homework_1.ipynb Бонусное задание №1]
| |
− |
| |
− | Примерные датасеты высланы в телеграм-чат.
| |
− |
| |
− | Дедлайн сдачи -- первый семинар после майских праздников.<br />
| |
− |
| |
− | '''Домашнее задание №2'''<br />
| |
− |
| |
− | Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar2/Bonus2.ipynb Бонусное задание №2]
| |
− |
| |
− | Датасет для анализа выслан в телеграм-чат.
| |
− |
| |
− | Дедлайн сдачи -- следующий семинар после прохождения темы (отличается для разных групп).
| |
− |
| |
− | '''Домашнее задание №4'''<br />
| |
− |
| |
− | Ноутбук: [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/bonus_homework_networks.ipynb Бонусное задание №4]
| |
− |
| |
− | [https://github.com/polyhex-sqr/data_culture_hse/blob/master/seminar4/polblogs_edgelist.txt Данные] лежат в той же папке.
| |
− |
| |
− |
| |
− | '''Правила отправки'''
| |
− |
| |
− | Отправлять на почту '''mo.dataculture@gmail.com''' <br />
| |
− | ВНИМАНИЕ! В тему письма ставим номер группы, например "БМО161". Именно в таком виде. Больше в теме письма НИЧЕГО не надо писать. <br />
| |
− | Файл назовите ДЗ<номер дз>_ФамилияИмя_группа. <br />
| |
− |
| |
− | '''Важное ограничение:''' итоговое решение о добавлении бонусов выносится в конце курса при условии успешной устной защиты бонусных заданий (проще говоря, надо будет ответить на 1-2 вопроса по любому месту Вашего кода)
| |
− |
| |
− | == Критерии оценивания и ведомости ==
| |
− |
| |
− | Оценка за курс складывается из следующих форм контроля:
| |
− | * Индивидуальный проект (ДЗ1)
| |
− | * Групповой проект с устной защитой (ДЗ2)
| |
− | * Две самостоятельных аудиторных работы, состоящих из теоретических вопросов и практического задания (СР1 и СР2)
| |
− | * Письменный экзамен
| |
− |
| |
− | Оценка за курс вычисляется по следующей формуле:
| |
− |
| |
− | 0,6*Накопленная + 0,4*Экзамен
| |
− |
| |
− | Формула для вычисления накопленной оценки:
| |
− |
| |
− | Накопленная = 0,25*ДЗ1 + 0,25*ДЗ2 + 0,25*СР1 + 0,25*СР2
| |
− | ===Оценки===
| |
− | [https://docs.google.com/spreadsheets/d/12EYo3wQcQjt9ryUgW4c5wJ9xs8qVkCM2aX0e82sDpWY/edit?usp=sharing Текущие оценки]
| |
− |
| |
− | [https://docs.google.com/spreadsheets/u/4/d/13_8-Q3IiZgX3EnN8Wiu-gNDD7ci3LCUkXHvsJ-kkwQ0/edit?usp=sharing Оценки за бонусные дз] (старая таблица, актуальные данные выше)
| |
− |
| |
− | ===Бонусы===
| |
− | Дополнительно предусмотрены 5 бонусных заданий, баллы за каждое из которых приводятся к шкале [0, 1].
| |
− |
| |
− | В конце модуля накопленная оценка вычисляется следующим образом:
| |
− |
| |
− | Накопленная = min(Накопленная + 0,4*Бонус, 10)
| |
− |
| |
− | ===Индивидуальный проект===
| |
− | Дедлайн 9 июня 23:59, дедлайн жесткий, работы позже не принимаются.
| |
− | ====Исследование====
| |
− | Форма отчетности: отчет+код в файле ipynb<br />
| |
− | Критерии:
| |
− | *код 0.2
| |
− | *отчет 0.1
| |
− | *исследовательский вопрос и подбор данных 0.1
| |
− | *структура и целостность исследования 0.2
| |
− | *анализ данных 0.3
| |
− | *визуализация 0.1
| |
− | ====Анализ статьи====
| |
− | Форма отчетности:отчет<br />
| |
− | *подбор статьи 0.1
| |
− | *анализ метода формирования выборки+ критические замечания по ее дополнению и общие критические замечания по статье и исследованию 0.2
| |
− | *анализ методов исследования 0.3
| |
− | *оформление отчета 0.1
| |
− | *придумать , как можно развить исследование, подробно описать все этапы пошагово от добора выборки до реализации исследования. 0.3
| |
− |
| |
− | ===Групповой проект===
| |
− |
| |
− | [https://docs.google.com/spreadsheets/d/1Wl8rwJHKrtoEF1AaIFhw4haGf8dqVbUnRdpdfox27-A/edit?usp=sharing Записать группу]<br />
| |
− |
| |
− | '''Критерии:'''<br />
| |
− |
| |
− | 1. Исследовательский вопрос + грамотный подбор подходящих данных 0.1<br />
| |
− |
| |
− | 2. Описательные статистики (как и обсуждалось на лекции, для всех исследуемых переменных необходимо предоставлять описательные статистики) 0.1<br />
| |
− |
| |
− | 3.Анализ данных: включает в себя грамотный выбор метода анализа данных (или методов), их реализация, представление численных результатов, содержательная интерпретация 0.3<br />
| |
− |
| |
− | 4.Визуализация (включает в себя само оформление презентации, визуализация полученных результатов с помощью подходящих типов диаграмм, оформление диаграмм) 0.2<br />
| |
− |
| |
− | 5.Защита+ответы на вопросы + соблюдение тайминга (не более 5 минут) 0.3<br />
| |
− |
| |
− | Каждый критерий оценивается по десятибальной шкале.<br />
| |