Введение в анализ данных 2020 МирЭк — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «== О курсе == "Введение в анализ данных" читается на 1 курсе, в 4 модуле. Канал курса в Telegram [htt…»)
 
(Материалы курса)
 
(не показано 86 промежуточных версии 6 участников)
Строка 1: Строка 1:
 
== О курсе ==
 
== О курсе ==
"Введение в анализ данных" читается на 1 курсе, в 4 модуле.
+
"Введение в анализ данных" читается на 1 курсе, в 3-4 модуле. Карточка [https://www.hse.ru/edu/courses/292690878 курса].  
  
Канал курса в Telegram [https://t.me/MirEk_DataAnalysis_2019 здесь]
+
Канал курса в Telegram [https://t.me/MirEk_DataAnalysis_2020 здесь] или вбить в поисковой строке телеграм MirEk_DataAnalysis_2020.
 +
 
 +
Курс разработан для студентов факультета мировой экономики и мировой политики. В ходе курса студенты изучат начала статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в экономике. Особое внимание уделяется методам постановки и проверки гипотез и простейшему анализу данных. В конце курса студенты познакомятся с основами SQL. Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах. Практические занятия по SQL проходят в среде SQLite Browser.
  
 
==Преподаватели==
 
==Преподаватели==
Деркач Денис Александрович - лекции
+
{| class="wikitable" border="1" cellpadding="2"  style="text-align:center"
* [mailto:dderkach@hse.ru E-mail]
+
|+
Арзыматов Кененбек - семинары (группы 181, 182)
+
|-
* [mailto:karzymatov@hse.ru E-mail]
+
! Группы !! БМЭ191 !! БМЭ192, 195 !! БМЭ193, 194!! БМЭ196, 197, 198
Карпов Максим Евгеньевич - семинары (группы 183, 184)
+
|-
* [mailto:mekarpov@hse.ru E-mail]
+
! Лектор
Хатбуллина Лейла Равилевна - семинары (группы 185, 186)
+
|colspan="4"| Деркач Денис Александрович
* [mailto:lhatbullina@hse.ru E-mail]
+
|-
 
+
! E-mail
==Ассистенты==
+
|colspan="4"| dderkach@hse.ru
Буюклийски Иван, Максимовская Анастасия, Федоров Павел, Охрименко Дмитрий, Пичужкина Ольга, Аброскин Илья
+
|-
 +
! Чат группы
 +
| [https://t.me/MirEk_191_DataAnalysis здесь] <br> или вбить в поиск телеграм MirEk_191_DataAnalysis || [https://t.me/DataAnalysis192195 здесь]  <br> или вбить в поиск телеграм DataAnalysis192195 || [https://t.me/joinchat/FCe_OBO7rxI_9bx2fLbZ7w здесь]  <br> или вбить в поиск телеграм DataAnalysis193194 || [https://tlgg.ru/joinchat/A9Y3Z1IFNMa_zeLOx4_tsA здесь] или [https://t.me/joinchat/A9Y3Z1IFNMa_zeLOx4_tsA здесь]
 +
|-
 +
! Семинарист
 +
| Карпов Максим Евгеньевич || Перевышина Татьяна Олеговна || Арзыматов Кененбек || Аброскин Илья Дмитриевич
 +
|-
 +
! E-mail, Telegram
 +
| mekarpov@hse.ru || prvshna@ya.ru <br> @prvshna || karzymatov@hse.ru || allen.ilya@gmail.com <br> @iiiiilllllyyyyyaaaa
 +
|-
 +
! Ассистент
 +
| Матюшина Екатерина || Литвинова Полина || Черкасских Дарья ||  Андрей Цакоев  <br> и Алишер Жураев
 +
|-
 +
! E-mail, Telegram
 +
| k_a_t_e_77@mail.ru <br> @kaatya_ma || litvinovapolina127@gmail.com <br> @syeveny ||  dscherkasskikh@edu.hse.ru <br> @whatsun || @Terminator2005 <br> @Alisher_Zhuraev2
 +
|-
 +
|}
  
 
== Материалы курса ==
 
== Материалы курса ==
 +
 +
'''Он-лайн курс'''
 +
 +
Реализуется на платформе https://online.hse.ru/, название курса "[Февраль 2020] Цифровая грамотность для ОП "Мировая экономика".
 +
 +
Видео по Excel на [https://www.youtube.com/channel/UCBMZwS-YbRy_m_dyMN48Jwg YouTube].
 +
 +
 +
Все очные занятия состоялись в дистанционном режиме, записи лекций/семинаров размещены на канале курса на [https://www.youtube.com/playlist?list=PLEwK9wdS5g0p1oLDm3ZSmRoI7kTRv8oaB YouTube].
 +
 
===Лекции===
 
===Лекции===
 
{| class="wikitable"
 
{| class="wikitable"
Строка 23: Строка 51:
 
! № !! Тема !! Презентация
 
! № !! Тема !! Презентация
 
|-
 
|-
| 1 || Введение и примеры применения || [https://www.dropbox.com/s/s5f8khpi1lgkgd1/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F1.pdf?dl=0]
 
 
|-
 
|-
| 2 || Базовые характеристики, разведочный анализ || [https://yadi.sk/i/BTKJhnFIQ4dOrA]  
+
! 1 !! Введение !! [https://www.dropbox.com/s/ip0r2b2m5w5od7q/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F1.pdf?dl=0 Слайды]
 
|-
 
|-
| 3 || Гипотезы, доверительные интервалы || [https://www.dropbox.com/s/rce6bo87kp568vz/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F3.pdf?dl=0]
 
 
|-
 
|-
| 4 || Регрессии || [https://yadi.sk/i/iBQiwQzDH8EnLA]  
+
! 2 !! Линейный анализ данных !! [https://www.dropbox.com/s/b309jsp2q1eapsr/%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D1%8F2.pdf?dl=0 Слайды]
 
|-
 
|-
| 5 || Базы данных || [https://www.dropbox.com/s/cl861r4go625zz5/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F5.pdf?dl=0]  
+
! 3 !! Гипотезы !! [https://www.dropbox.com/s/x8ros75h1pozon5/%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D1%8F3.pdf?dl=0 Слайды]
 
|-
 
|-
| 6 || Этика || [https://www.dropbox.com/s/zi4sl3hj8x14fs5/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F6.pdf?dl=0]  
+
! 4 !! Дисперсионный анализ !! [https://yadi.sk/i/V7mkth3TOGWqjg Слайды]
 +
|-
 +
! 5 !! Доверительные интервалы. Этика !! [https://yadi.sk/i/Pto10W_8YeRkAg Слайды]
 +
|-
 +
! 6 !! Хранение данных !! [https://yadi.sk/i/qVDs63HYallG-Q Слайды]
 
|-
 
|-
 
|}
 
|}
Строка 42: Строка 72:
 
! № !! Тема !! Презентация !! Файлы
 
! № !! Тема !! Презентация !! Файлы
 
|-
 
|-
| 1-2 || Знакомство с Excel, основные функции. Построение графиков. || [https://yadi.sk/i/rnJUAkVrJXx2Tg Slides1-2.pdf] || [https://yadi.sk/d/rguZWgdqEvXizg Practice1-2.zip]
 
 
|-
 
|-
| 3 || Добыча данных в сети, построение графиков и основных статистик в Excel. || [https://yadi.sk/i/yzlJhurAEWA7SA Slides3.pdf] || [https://yadi.sk/i/aPZfMK1O1TsQBw Practice3.xlsx]
+
| 1 || Получение данных из сети Интернет. Определение простейших характеристик распределений. || [https://yadi.sk/i/V-hGBdH5DukHcg слайды] || [https://yadi.sk/i/HXs9_DqoCkBd4g дз]
 
|-
 
|-
| 4 || Контрольная №1 || ||
+
| 2 || Очистка данных. Поиск ошибок в данных. || [https://yadi.sk/i/IAb6c81_dPvEyw слайды] || [https://yadi.sk/i/vR4DyEr0WUQvBg дз]
 
|-
 
|-
| 5 || Очистка данных. Поиск ошибок в данных || [https://docs.google.com/presentation/d/1NIRGegiw8GqsXiq9KACgvoD3UFvfFDwJ-90ej0l2gbE/edit?usp=sharing Slides5.pdf] || [https://yadi.sk/i/A0fIW8T4x5k0VQ Practice5.xlsx]
+
| 3 || Линейный анализ данных. Простая регрессия. || [https://yadi.sk/i/9i36y8t814uSEg слайды], [https://jamboard.google.com/d/1vEByF20tRJXMX47j94OV7bshk_NZ2EUxFuxv9sZ0cMQ/viewer?f=0 доска] || [https://yadi.sk/i/JzRxE2R51quknw дз]
 
|-
 
|-
| 6 || Проверка статистических гипотез || [https://docs.google.com/presentation/d/1bxpOrG-XtYzJo_PI_oirkG97KNYzpdnaBjY_aRY1sOk/edit#slide=id.p Slides6.pdf] ||
+
| 4 || Введение в тестирование гипотез. Множественная регрессия. || [https://yadi.sk/i/ZJ7NBCPZI4UZnQ слайды], [https://docs.google.com/document/d/1IkAmMJ0hlMs2MkGoy_J9APELYN06SCXtmZ36JIzo2pg/edit?usp=sharing гайд] || [https://yadi.sk/i/ymWrEKS2874soA дз]
 
|-
 
|-
| 7 || Построение линейного анализа данных || [https://yadi.sk/i/eXBA4TBf9Rv0CQ Slides7.pdf] || –
+
| 5 || Тестирование гипотез. Дисперсионный анализ. Анализ результатов регрессии. || [https://docs.google.com/presentation/d/1fPTApeQyR56MIBq3mg3ZiXSoy0MaNTvrJ4ytx-zleNU/edit?usp=sharing слайды] || [https://yadi.sk/i/fRXGs93g19n1HQ дз]
 
|-
 
|-
| 8 || Введение в SQL || [https://docs.google.com/presentation/d/1XbR2-HH8SG49O3p-hYOhekvV_iOJ4gM6re_dfNaft6E/edit?usp=sharing Slides8.pdf] || [https://drive.google.com/file/d/1swR-UDY0E2yph5SQ7PEQFwriZmnStqMk/view?usp=sharing WB-data.zip]
+
| 6 || Введение в SQL. Работа с таблицами || [https://docs.google.com/presentation/d/19Jo36DARIBBnuDi7PZN9_bs6VUt_h-9yIXQZdiWoI88/edit?usp=sharing слайды] || [https://docs.google.com/document/d/1TzOHLJ9hCGOS5lZ5bgZBHUEvUVFzXwMJ_U3GGkNhLmU/edit?usp=sharing дз]
 
|-
 
|-
| 9 || Функции в SQL || [https://docs.google.com/presentation/d/1qMMLMpQNYYRtkask1BbqmCwGcJF-r9FJcilMbobD-0A/edit?usp=sharing Slides8.pdf] || [https://drive.google.com/file/d/155rVnqniswbqueRLg9g929hKgHvDS_sZ/view?usp=sharing Soccer-data.zip]
+
| 7 || Операции по объединению таблиц || [https://docs.google.com/presentation/d/1a6vYC6EF4ZZPLgLHy251gdpZa72eziKHanQmqg1acK8/edit?usp=sharing слайды] || [https://docs.google.com/document/d/1alwZDcFnhladksXc5fnEwCp65ccd1t9tRWUHCaBU9gE/edit?usp=sharing дз]  
 
|-
 
|-
| 10 || Операции по объединению таблиц || [https://docs.google.com/presentation/d/13UlGEp-ga9vXyeWKgP2hDi9cwXmW4UMmTHkJxusrvbs/edit?usp=sharing Slides9.pdf]  || [https://drive.google.com/file/d/155rVnqniswbqueRLg9g929hKgHvDS_sZ/view?usp=sharing Soccer-data.zip]
+
| 8 || Работа со строками в SQL || [https://docs.google.com/presentation/d/1r4KUsOZiyprt9wWdWppj7ImxBmrZNZjVqbbu00i5o8w/edit?usp=sharing слайды]  || --
 
|-
 
|-
|11 || Работа со строками в SQL || [https://docs.google.com/presentation/d/1f0cBqR3wRWA4V9f5gvPuMfBUiN-DDOXp1ozNhbVBLqQ/edit?usp=sharing Slides10.pdf] ||
 
[https://drive.google.com/file/d/155rVnqniswbqueRLg9g929hKgHvDS_sZ/view?usp=sharing Soccer-data.zip]
 
 
|}
 
|}
За работу на семинарах можно получать бонусные баллы, с помощью которых можно будет улучшить свои текущую и итоговую оценки.
 
 
Дополнительный материал к семинарам по Excel:
 
 
1) [https://docs.google.com/document/d/1XIuduaalaNIYJktkuwLcJmWRyLh6NRqJYf-aGg2c9AQ/edit# Полезности № 1]
 
 
2) [https://docs.google.com/document/d/1OtgoAGUsx-QcUvQbIteCAJE-nmv0TEalvP4QYrfaxW8/edit?usp=sharing Полезности № 2]
 
 
[https://docs.google.com/document/d/1XfJ2Fqq3qZQTGrL3dktrvmBuB1pO-JuSpEC5qmTQxsc/edit Комментарий] к контрольной работе №1.
 
  
 
== Список рекомендуемой литературы ==
 
== Список рекомендуемой литературы ==
Строка 79: Строка 97:
 
* Савельев В. Статистика и котики.
 
* Савельев В. Статистика и котики.
  
== MS Excel 2016 ==
+
== MS Excel ==
ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке [https://docs.google.com/document/d/1_49BpcYiCXa8EO7G69lQGXeQRae7x1RrZ2R2-eJJ6io/edit тут].
+
ВШЭ дает студентам возможность установить MS Office бесплатно. Инструкция по установке [https://docs.google.com/document/d/1_49BpcYiCXa8EO7G69lQGXeQRae7x1RrZ2R2-eJJ6io/edit тут].

Текущая версия на 20:13, 19 июня 2020

О курсе

"Введение в анализ данных" читается на 1 курсе, в 3-4 модуле. Карточка курса.

Канал курса в Telegram здесь или вбить в поисковой строке телеграм MirEk_DataAnalysis_2020.

Курс разработан для студентов факультета мировой экономики и мировой политики. В ходе курса студенты изучат начала статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в экономике. Особое внимание уделяется методам постановки и проверки гипотез и простейшему анализу данных. В конце курса студенты познакомятся с основами SQL. Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах. Практические занятия по SQL проходят в среде SQLite Browser.

Преподаватели

Группы БМЭ191 БМЭ192, 195 БМЭ193, 194 БМЭ196, 197, 198
Лектор Деркач Денис Александрович
E-mail dderkach@hse.ru
Чат группы здесь
или вбить в поиск телеграм MirEk_191_DataAnalysis
здесь
или вбить в поиск телеграм DataAnalysis192195
здесь
или вбить в поиск телеграм DataAnalysis193194
здесь или здесь
Семинарист Карпов Максим Евгеньевич Перевышина Татьяна Олеговна Арзыматов Кененбек Аброскин Илья Дмитриевич
E-mail, Telegram mekarpov@hse.ru prvshna@ya.ru
@prvshna
karzymatov@hse.ru allen.ilya@gmail.com
@iiiiilllllyyyyyaaaa
Ассистент Матюшина Екатерина Литвинова Полина Черкасских Дарья Андрей Цакоев
и Алишер Жураев
E-mail, Telegram k_a_t_e_77@mail.ru
@kaatya_ma
litvinovapolina127@gmail.com
@syeveny
dscherkasskikh@edu.hse.ru
@whatsun
@Terminator2005
@Alisher_Zhuraev2

Материалы курса

Он-лайн курс

Реализуется на платформе https://online.hse.ru/, название курса "[Февраль 2020] Цифровая грамотность для ОП "Мировая экономика".

Видео по Excel на YouTube.


Все очные занятия состоялись в дистанционном режиме, записи лекций/семинаров размещены на канале курса на YouTube.

Лекции

Тема Презентация
1 Введение Слайды
2 Линейный анализ данных Слайды
3 Гипотезы Слайды
4 Дисперсионный анализ Слайды
5 Доверительные интервалы. Этика Слайды
6 Хранение данных Слайды

Семинары

Тема Презентация Файлы
1 Получение данных из сети Интернет. Определение простейших характеристик распределений. слайды дз
2 Очистка данных. Поиск ошибок в данных. слайды дз
3 Линейный анализ данных. Простая регрессия. слайды, доска дз
4 Введение в тестирование гипотез. Множественная регрессия. слайды, гайд дз
5 Тестирование гипотез. Дисперсионный анализ. Анализ результатов регрессии. слайды дз
6 Введение в SQL. Работа с таблицами слайды дз
7 Операции по объединению таблиц слайды дз
8 Работа со строками в SQL слайды --

Список рекомендуемой литературы

  • Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
  • Tufte E. The visual display of quantitative information.
  • Huff D. How to lie with statistics.
  • Савельев В. Статистика и котики.

MS Excel

ВШЭ дает студентам возможность установить MS Office бесплатно. Инструкция по установке тут.