Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-19 — различия между версиями
Строка 22: | Строка 22: | ||
Сроки: 02.03.16 - 11.03.16 23:59 | Сроки: 02.03.16 - 11.03.16 23:59 | ||
+ | ==Проект== | ||
+ | [https://www.dropbox.com/s/w21779wxjjxspf0/project.ipynb?dl=1 Скачать файл] | ||
+ | |||
+ | Для выполнения проекта требуется скачать данные согласно [https://drive.google.com/open?id=1UUlgsu5TD-_YUNVtGkhrFr1zaQSHiQ8JfZ7VfbzYKAg варианту]. | ||
+ | *[https://www.dropbox.com/s/k6ns1tb94e3bayn/student-mat.csv?dl=1 student-mat.csv] | ||
+ | *[https://www.dropbox.com/s/np709twg10rng4n/student-por.csv?dl=1 student-por.csv] | ||
+ | Для тех, кто хочет поработать с другими данными: | ||
+ | |||
+ | Описание данных: TODO, [https://www.kaggle.com/c/whats-cooking kaggle competition] | ||
+ | *[https://www.dropbox.com/s/ne4l1l984bk6dwm/train.json?dl=1 what's cooking] | ||
+ | |||
+ | Сроки: до 10.04.16 23:59 | ||
==Расписание семинаров== | ==Расписание семинаров== | ||
Версия 15:59, 22 марта 2016
Выложено домашнее задание №2. Срок сдачи - 11 марта в 23:59 |
Содержание
Организационная информация
Семинаристы: Нина Полякова, Андрей Квасов
Чтобы задать вопрос по курсу/отправить домашнее задание следует написать письмо на hse.minor.dm@gmail.com
Тема письма обязательно должна соответствовать формату: [ИАД-19], Фамилия Имя, Ваш текст
Домашние задания
Задание 1.
Скачать файл с домашним заданием без GitHub и танцев с бубном.
Примечание: при выполнении задания запрещается использовать все библиотеки кроме NumPy, Pandas, Matplotlib
Материалы по установке Jupyter на свой компьютер можно найти на cтраницe курса на github.com
Задание 2.
Скачать файл Задание на исследование возможностей линейной регрессии с помощи библиотеки scikit-learn
Сроки: 02.03.16 - 11.03.16 23:59
Проект
Для выполнения проекта требуется скачать данные согласно варианту.
Для тех, кто хочет поработать с другими данными:
Описание данных: TODO, kaggle competition
Сроки: до 10.04.16 23:59
Расписание семинаров
Дата | № занятия | Занятие | Материалы |
---|---|---|---|
12 января 2016 | 1 | Вводный семинар. Обсуждение основных понятий анализа данных. | |
19 января 2016 | 2 | Python для анализа данных. Pandas. |
IPython Notebook "Pandas_(sem2)" |
26 января 2016 | 3 | Python для анализа данных. Numpy. Проверочная работа. |
IPython Notebook "Numpy_1(sem3)" |
2 февраля 2016 | 4 | Python для анализа данных. Numpy часть 2. Matplotlib. Линейная алгебра. Выдача ДЗ №1 (до 16.02.16 до 23:59) |
IPython Notebook "NumpyScipyMatplotlib_(sem4)" |
9 февраля 2016 | 5 | Метод градиентного спуска в линейных моделях (линейной регрессии). |
Пример работы градиентного спуска |
1 марта 2016 | 7 | Линейная регрессия. Scikit-learn. |
IPython Notebook Семинара №7 |