Основы анализа и визуализации данных ДИЯ 2020-2021 — различия между версиями
Ilya (обсуждение | вклад) (→Материалы курса) |
Ilya (обсуждение | вклад) (→Преподаватели) |
||
Строка 8: | Строка 8: | ||
[https://www.hse.ru/ba/lang/courses/339552494.html ПУД Курса] | [https://www.hse.ru/ba/lang/courses/339552494.html ПУД Курса] | ||
− | == | + | ==Контакты== |
Елена Олеговна Кантонистова - лекции | Елена Олеговна Кантонистова - лекции | ||
* [mailto:elena.kantonistova@yandex.ru E-mail] | * [mailto:elena.kantonistova@yandex.ru E-mail] |
Версия 00:02, 1 сентября 2020
Содержание
[убрать]О курсе
"Основы анализа и визуализации данных" читается на 2 курсе, в 1 и 2 модулях.
Курс разработан для студентов Департамента иностранных языков. В ходе курса студенты изучат основы статистического анализа данных, его основные этапы, а также познакомятся с наиболее характерными приложениями статистических анализов в лингвистике. Особое внимание уделяется методам постановки и проверки гипотез и регрессионному анализу.
Практическая часть проходит в среде MS Excel и разделена на два этапа. Простейшие функции объясняются в онлайн курсе. Практика применения методов статистического анализа в MS Excel проходит на семинарах.
Контакты
Елена Олеговна Кантонистова - лекции
Аброскин Илья Дмитриевич - семинары
Перевышина Татьяна - учебный ассистент
- telegram: prvshna
Чат курса в Telegram для объявлений
План курса
№ | Тема лекции | Тема семинара |
---|---|---|
1 | Введение в анализ данных. Примеры правильного и неправильного применения науки о данных. Основная терминология. Свойства данных. Программа MS Excel: описание, демонстрация, сортировка/фильтрация и другие простейшие функции. Правила рисования графиков. | Задание на найти и скачать данные. Задание на графики. Фильтрация и сортировка. |
2 | Числовые характеристики данных, выбросы. Открытые и коммерческие данные: правила и этика использования. Источники данных в интернете. Пример поиска, скачивания и работы с данными в MS Excel. | Задания на вычисление числовых характеристик. |
3 | Корреляция и причинность. Распределения. Примеры распределений на реальных данных: анализ в MS Excel. Cводные таблицы в MS Excel. | Задания на построение диаграмм и получениие характеристик распределений, вычисление корреляций, условные операторы и сводные таблицы. |
4 | Линейная регрессия: постановка задачи, этапы решения и оценки качества. Примеры. Пример в MS Excel. | Линейная регрессия. |
5 | Многофакторная линейная регрессия. Примеры. Пример в MS Excel. | Многофакторная линейная регрессия. |
6 | Доверительные интервалы. | Контрольная работа-1. |
7 | Проверка гипотез-1: типы тестов, выбор теста, однофакторный анализ. Примеры проверки гипотез в MS Excel. | Доверительные интервалы. Проверка гипотез-1. |
8 | Полный цикл решения задачи анализа данных: от постановки задачи до решения задачи регрессии и проверки гипотез. Пример решения задачи анализа данных (для проектов).. | Проверка гипотез-1 (продолжение). |
9 | Проверка гипотез-2: другие тесты, многофакторный анализ. Пример в MS Excel. | Проверка гипотез-2. |
10 | Защита проектов. | |
11 | Контрольная работа-2. |
Список рекомендуемой литературы
- Мхитарян, В. С.: Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов
- С. А. Айвазян, С. С. Иванова Эконометрика : учеб. пособие для вузов
- Центр справки Excel https://support.office.com/ru-ru/excel
- Salganik, Matthew J. 2017. Bit by Bit: Social Research in the Digital Age. (http://www.bitbybitbook.com/ )
- Tufte E. The visual display of quantitative information.
- Huff D. How to lie with statistics.
MS Excel 2016
ВШЭ дает студентам возможность установить MS Office 2016 бесплатно. Инструкция по установке тут.