Основы анализа и визуализации данных ДИЯ 2020-2021 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Преподаватели)
(План курса и материалы)
 
(не показано 25 промежуточных версии 2 участников)
Строка 6: Строка 6:
 
Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.
 
Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.
  
[https://www.hse.ru/edu/courses/292661917 ПУД Курса]
+
[https://www.hse.ru/ba/lang/courses/339552494.html ПУД Курса]
  
[https://t.me/lang_data_analysis2019 lang_data_analysis2019 : Канал курса в Telegram]
+
==Контакты==
  
[https://docs.google.com/spreadsheets/d/1Jr1J4RFAaD15jRiOy4tc26QX-KXEKU6Uye0Goc2jAso/edit#gid=2146292622 Таблица с оценками]
+
[https://t.me/joinchat/A9Y3Z0oijZlw6KZcg_6vyg Чат курса в Telegram для объявлений]
  
За работу на семинарах можно получать бонусные баллы, с помощью которых можно будет улучшить свои текущую и итоговую оценки.
+
Инвайт-код в гугл-классрум: dp4r3sy
  
Условия получения оценки за курс автоматом: накопленная оценка - 8 и больше, и написано не менее 6 тестов на лекциях.
+
Елена Олеговна Кантонистова - лектор
 
+
==Преподаватели==
+
Елена Олеговна Кантонистова - лекции
+
 
* [mailto:elena.kantonistova@yandex.ru  E-mail]
 
* [mailto:elena.kantonistova@yandex.ru  E-mail]
Аброскин Илья Дмитриевич - семинары
+
Аброскин Илья Дмитриевич - семинарист
 
* [mailto:allen.ilya@gmail.com E-mail]
 
* [mailto:allen.ilya@gmail.com E-mail]
  
Строка 25: Строка 22:
 
* telegram: prvshna
 
* telegram: prvshna
  
== Материалы курса ==
+
== План курса и материалы ==
===Лекции===
+
Записи всех лекций и семинаров [https://www.youtube.com/playlist?list=PLEwK9wdS5g0pK4fYsuuuUmfGTvAK1mKLu тут]
{| class="wikitable"
+
 
 +
Материалы всех семинаров и задания публикаются в class-room.
 +
{| class="wikitable"  
 
|-
 
|-
! !! Тема !! Презентация !! Тест
+
! #
 +
! Лекция
 
|-
 
|-
| 1 || Введение, основы статистики. || [ Лекция1] ||
+
| style="text-align:center;" | 1
|-
+
| Введение в анализ данных. ([https://yadi.sk/i/GRqSutleOJFoXg слайды], [https://yadi.sk/i/SLkHUnhFrJ3HTQ примеры в Excel])
| 2 || Этика и сбор данных. || [ Лекция2] || [ Тест1]
+
|-
+
| 3 || Распределения. Центральная предельная теорема || [ Лекция3] || 
+
|-
+
| 4 || Погрешности. Доверительные интервалы || [ Лекция4]  || 
+
|-
+
| 5 || Тестирование гипотез 1 || [ Лекция5]  || 
+
|-
+
| 6 || Тестирование гипотез 2 || [ Лекция6]  || 
+
|}
+
  
===Семинары===
 
{| class="wikitable"
 
|-
 
! № !! Тема !! Презентация !! Файлы
 
|-
 
| 1 || Знакомство с Excel. Основные функции. || [] || []
 
 
|-
 
|-
| 2 || Продвинутый функционал Excel. || [ Указания к практике] || [ test1], [ Семинар]
+
| style="text-align:center;" | 2
 +
| Числовые характеристики данных, этика работы с данными. ([https://yadi.sk/i/AZtaTWzMady7cQ слайды], [https://yadi.sk/i/vUdglbzkI1F36g примеры в Excel])
 
|-
 
|-
| 3 || Визуализация в Excel. Сводные таблицы|| [ Ошибки при построении графиков] || [], [ Семинар. Сводные таблицы]  
+
| style="text-align:center;" | 3
 +
| Распределения. Корреляция и причинность. Сводные таблицы. ([https://yadi.sk/i/EIKSRXWBtBCb-w слайды])
 
|-
 
|-
| 4 ||Работа с текстом и функции подсчета с условием|| - || [ test 3], [ Семинар]  
+
| style="text-align:center;" | 4
 +
| Регрессия. ([https://yadi.sk/i/dd8UynFjomY-kA слайды])
 
|-
 
|-
| 5 || Проверка гипотез 1 (доверительные интервалы, t-тест)|| [ Слайды. Проверка гипотез 1] || [ Семинар]  
+
| style="text-align:center;" | 5
 +
| Многофакторная линейная регрессия. ([https://yadi.sk/i/Nkwfek8L-bB-VQ слайды])
 
|-
 
|-
| 6 || Проверка гипотез 2 (F-тест, t-тест, однофакторный анализ) || [ Слайды. Проверка гипотез 2] || [ Семинар]
+
| style="text-align:center;" | 6
 +
| Доверительные интервалы. ([https://yadi.sk/i/L0v5bQuWCT7wZg слайды])
 
|-
 
|-
| 7 || Практическая работа || - || [ ПР2: Задачи по проверке гипотез]  
+
| style="text-align:center;" | 7
 +
| Проверка гипотез. ([https://yadi.sk/i/_mwzy2bGVynv4Q слайды])
 
|-
 
|-
| 8|| Линейная зависимость в данных || [ Слайды. Линейная зависимость в данных] || [ Семинар]
+
| style="text-align:center;" | 8
 +
| Задачи анализа данных. Этапы работы над проектом по анализу данных. ([https://yadi.sk/i/NY9YXLxF4XRvNw слайды])
 
|-
 
|-
| 9|| Линейная регрессия || [ Слайды. Линейная регрессия] || [ Семинар (решенный)] [ Проект]
+
| style="text-align:center;" | 9
 +
| Проверка гипотез - 2. ([https://yadi.sk/i/1cA1EnHWXgSVLA слайды])
 
|-
 
|-
| 10|| Множественная регрессия || - || [ Семинар (решенный) ]
 
 
|}
 
|}
  

Текущая версия на 18:02, 28 декабря 2020

О курсе

"Основы анализа и визуализации данных" читается на 2 курсе, в 1 и 2 модулях.

Курс разработан для студентов Департамента иностранных языков. В ходе курса студенты изучат основы статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в лингвистике. Особое внимание уделяется методам постановки и проверки гипотез и регрессионному анализу.

Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.

ПУД Курса

Контакты

Чат курса в Telegram для объявлений

Инвайт-код в гугл-классрум: dp4r3sy

Елена Олеговна Кантонистова - лектор

Аброскин Илья Дмитриевич - семинарист

Перевышина Татьяна - учебный ассистент

  • telegram: prvshna

План курса и материалы

Записи всех лекций и семинаров тут

Материалы всех семинаров и задания публикаются в class-room.

# Лекция
1 Введение в анализ данных. (слайды, примеры в Excel)
2 Числовые характеристики данных, этика работы с данными. (слайды, примеры в Excel)
3 Распределения. Корреляция и причинность. Сводные таблицы. (слайды)
4 Регрессия. (слайды)
5 Многофакторная линейная регрессия. (слайды)
6 Доверительные интервалы. (слайды)
7 Проверка гипотез. (слайды)
8 Задачи анализа данных. Этапы работы над проектом по анализу данных. (слайды)
9 Проверка гипотез - 2. (слайды)

Список рекомендуемой литературы

  • Мхитарян, В. С.: Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов
  • С. А. Айвазян, С. С. Иванова Эконометрика : учеб. пособие для вузов
  • Центр справки Excel https://support.office.com/ru-ru/excel
  • Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
  • Tufte E. The visual display of quantitative information.
  • Huff D. How to lie with statistics.

MS Excel 2016

ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке тут.