Основы анализа и визуализации данных ДИЯ 2020-2021 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинары)
(Материалы курса)
Строка 20: Строка 20:
  
 
== Материалы курса ==
 
== Материалы курса ==
===Лекции===
+
{| class="wikitable"  
{| class="wikitable"
+
|- style="text-align:center;"
 +
! style="text-align:left;" | №
 +
! Тема лекции
 +
! Тема семинара
 
|-
 
|-
! № !! Тема !! Презентация !! Тест
+
| 1
 +
| Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков.
 +
| Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка.
 
|-
 
|-
| 1 || Введение, основы статистики. ||  ||
+
| 2
 +
| Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel.
 +
| Задания на вычисление числовых характеристик.
 
|-
 
|-
| 2 || Этика и сбор данных. || ||
+
| 3
 +
| Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel.
 +
| Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы.
 
|-
 
|-
| 3 || Распределения. Центральная предельная теорема ||  || 
+
| 4
 +
| Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel.
 +
| Линейная регрессия.
 
|-
 
|-
| 4 || Погрешности. Доверительные интервалы ||  || 
+
| 5
 +
| Многофакторная линейная регрессия. Примеры. Пример в MS Excel.
 +
| Многофакторная линейная регрессия.
 
|-
 
|-
| 5 || Тестирование гипотез 1 ||  || 
+
| 6
 +
| Доверительные интервалы.
 +
| Контрольная работа-1.
 
|-
 
|-
| 6 || Тестирование гипотез 2 ||  || 
+
| 7
|}
+
| Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel.
 
+
| Доверительные интервалы. Проверка гипотез-1.
===Семинары===
+
{| class="wikitable"
+
 
|-
 
|-
! № !! Тема !! Презентация !! Файлы
+
| 8
 +
| Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов)..
 +
| Проверка гипотез-1 (продолжение).
 
|-
 
|-
| 1 || Знакомство с Excel. Основные функции. ||  ||
+
| 9
 +
| Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel.
 +
| Проверка гипотез-2.
 
|-
 
|-
| 2 || Продвинутый функционал Excel. ||  ||
+
| 10
 +
|  
 +
| Защита проектов.
 
|-
 
|-
| 3 || Визуализация в Excel. Сводные таблицы||  ||
+
| 11
|-
+
|  
| 4 ||Работа с текстом и функции подсчета с условием||  ||  
+
| Контрольная работа-2.
|-
+
| 5 || Проверка гипотез 1 (доверительные интервалы, t-тест)||  ||
+
|-
+
| 6 || Проверка гипотез 2 (F-тест, t-тест, однофакторный анализ) ||  ||
+
|-
+
| 7 || Практическая работа ||  ||
+
|-
+
| 8|| Линейная зависимость в данных ||  ||
+
|-
+
| 9|| Линейная регрессия || ||
+
|-
+
| 10|| Множественная регрессия ||  || 
+
 
|}
 
|}
  

Версия 00:00, 1 сентября 2020

О курсе

"Основы анализа и визуализации данных" читается на 2 курсе, в 1 и 2 модулях.

Курс разработан для студентов Департамента иностранных языков. В ходе курса студенты изучат основы статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в лингвистике. Особое внимание уделяется методам постановки и проверки гипотез и регрессионному анализу.

Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.

ПУД Курса

Преподаватели

Елена Олеговна Кантонистова - лекции

Аброскин Илья Дмитриевич - семинары

Перевышина Татьяна - учебный ассистент

  • telegram: prvshna

Чат курса в Telegram для объявлений

Материалы курса

Тема лекции Тема семинара
1 Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков. Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка.
2 Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel. Задания на вычисление числовых характеристик.
3 Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel. Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы.
4 Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel. Линейная регрессия.
5 Многофакторная линейная регрессия. Примеры. Пример в MS Excel. Многофакторная линейная регрессия.
6 Доверительные интервалы. Контрольная работа-1.
7 Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel. Доверительные интервалы. Проверка гипотез-1.
8 Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов).. Проверка гипотез-1 (продолжение).
9 Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel. Проверка гипотез-2.
10 Защита проектов.
11 Контрольная работа-2.

Список рекомендуемой литературы

  • Мхитарян, В. С.: Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов
  • С. А. Айвазян, С. С. Иванова Эконометрика : учеб. пособие для вузов
  • Центр справки Excel https://support.office.com/ru-ru/excel
  • Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
  • Tufte E. The visual display of quantitative information.
  • Huff D. How to lie with statistics.

MS Excel 2016

ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке тут.