Основы анализа и визуализации данных ДИЯ 2020-2021 — различия между версиями
Ilya (обсуждение | вклад) (→Семинары) |
Ilya (обсуждение | вклад) (→Материалы курса) |
||
Строка 20: | Строка 20: | ||
== Материалы курса == | == Материалы курса == | ||
− | + | {| class="wikitable" | |
− | {| class="wikitable" | + | |- style="text-align:center;" |
+ | ! style="text-align:left;" | № | ||
+ | ! Тема лекции | ||
+ | ! Тема семинара | ||
|- | |- | ||
− | + | | 1 | |
+ | | Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков. | ||
+ | | Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка. | ||
|- | |- | ||
− | | | + | | 2 |
+ | | Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel. | ||
+ | | Задания на вычисление числовых характеристик. | ||
|- | |- | ||
− | | | + | | 3 |
+ | | Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel. | ||
+ | | Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы. | ||
|- | |- | ||
− | | | + | | 4 |
+ | | Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel. | ||
+ | | Линейная регрессия. | ||
|- | |- | ||
− | | | + | | 5 |
+ | | Многофакторная линейная регрессия. Примеры. Пример в MS Excel. | ||
+ | | Многофакторная линейная регрессия. | ||
|- | |- | ||
− | | | + | | 6 |
+ | | Доверительные интервалы. | ||
+ | | Контрольная работа-1. | ||
|- | |- | ||
− | | | + | | 7 |
− | | | + | | Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel. |
− | + | | Доверительные интервалы. Проверка гипотез-1. | |
− | + | ||
− | + | ||
|- | |- | ||
− | + | | 8 | |
+ | | Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов).. | ||
+ | | Проверка гипотез-1 (продолжение). | ||
|- | |- | ||
− | | | + | | 9 |
+ | | Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel. | ||
+ | | Проверка гипотез-2. | ||
|- | |- | ||
− | | | + | | 10 |
+ | | | ||
+ | | Защита проектов. | ||
|- | |- | ||
− | | | + | | 11 |
− | + | | | |
− | + | | Контрольная работа-2. | |
− | |- | + | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
|} | |} | ||
Версия 00:00, 1 сентября 2020
Содержание
О курсе
"Основы анализа и визуализации данных" читается на 2 курсе, в 1 и 2 модулях.
Курс разработан для студентов Департамента иностранных языков. В ходе курса студенты изучат основы статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в лингвистике. Особое внимание уделяется методам постановки и проверки гипотез и регрессионному анализу.
Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.
Преподаватели
Елена Олеговна Кантонистова - лекции
Аброскин Илья Дмитриевич - семинары
Перевышина Татьяна - учебный ассистент
- telegram: prvshna
Чат курса в Telegram для объявлений
Материалы курса
№ | Тема лекции | Тема семинара |
---|---|---|
1 | Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков. | Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка. |
2 | Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel. | Задания на вычисление числовых характеристик. |
3 | Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel. | Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы. |
4 | Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel. | Линейная регрессия. |
5 | Многофакторная линейная регрессия. Примеры. Пример в MS Excel. | Многофакторная линейная регрессия. |
6 | Доверительные интервалы. | Контрольная работа-1. |
7 | Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel. | Доверительные интервалы. Проверка гипотез-1. |
8 | Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов).. | Проверка гипотез-1 (продолжение). |
9 | Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel. | Проверка гипотез-2. |
10 | Защита проектов. | |
11 | Контрольная работа-2. |
Список рекомендуемой литературы
- Мхитарян, В. С.: Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов
- С. А. Айвазян, С. С. Иванова Эконометрика : учеб. пособие для вузов
- Центр справки Excel https://support.office.com/ru-ru/excel
- Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
- Tufte E. The visual display of quantitative information.
- Huff D. How to lie with statistics.
MS Excel 2016
ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке тут.