Основы анализа и визуализации данных ДИЯ 2020-2021 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Контакты)
(Контакты)
Строка 9: Строка 9:
  
 
==Контакты==
 
==Контакты==
 +
 +
[https://t.me/joinchat/A9Y3Z0oijZlw6KZcg_6vyg Чат курса в Telegram для объявлений]
 +
 +
 
Елена Олеговна Кантонистова - лектор  
 
Елена Олеговна Кантонистова - лектор  
 
* [mailto:elena.kantonistova@yandex.ru  E-mail]
 
* [mailto:elena.kantonistova@yandex.ru  E-mail]
Строка 16: Строка 20:
 
Перевышина Татьяна - учебный ассистент
 
Перевышина Татьяна - учебный ассистент
 
* telegram: prvshna
 
* telegram: prvshna
 
[https://t.me/joinchat/A9Y3Z0oijZlw6KZcg_6vyg Чат курса в Telegram для объявлений]
 
  
 
== План курса ==
 
== План курса ==

Версия 00:03, 1 сентября 2020

О курсе

"Основы анализа и визуализации данных" читается на 2 курсе, в 1 и 2 модулях.

Курс разработан для студентов Департамента иностранных языков. В ходе курса студенты изучат основы статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в лингвистике. Особое внимание уделяется методам постановки и проверки гипотез и регрессионному анализу.

Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.

ПУД Курса

Контакты

Чат курса в Telegram для объявлений


Елена Олеговна Кантонистова - лектор

Аброскин Илья Дмитриевич - семинарист

Перевышина Татьяна - учебный ассистент

  • telegram: prvshna

План курса

Тема лекции Тема семинара
1 Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков. Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка.
2 Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel. Задания на вычисление числовых характеристик.
3 Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel. Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы.
4 Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel. Линейная регрессия.
5 Многофакторная линейная регрессия. Примеры. Пример в MS Excel. Многофакторная линейная регрессия.
6 Доверительные интервалы. Контрольная работа-1.
7 Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel. Доверительные интервалы. Проверка гипотез-1.
8 Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов).. Проверка гипотез-1 (продолжение).
9 Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel. Проверка гипотез-2.
10 Защита проектов.
11 Контрольная работа-2.

Список рекомендуемой литературы

  • Мхитарян, В. С.: Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов
  • С. А. Айвазян, С. С. Иванова Эконометрика : учеб. пособие для вузов
  • Центр справки Excel https://support.office.com/ru-ru/excel
  • Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
  • Tufte E. The visual display of quantitative information.
  • Huff D. How to lie with statistics.

MS Excel 2016

ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке тут.