Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-19 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 22: Строка 22:
 
Сроки: 02.03.16 - 11.03.16 23:59
 
Сроки: 02.03.16 - 11.03.16 23:59
  
 +
==Проект==
 +
[https://www.dropbox.com/s/w21779wxjjxspf0/project.ipynb?dl=1 Скачать файл]
 +
 +
Для выполнения проекта требуется скачать данные согласно [https://drive.google.com/open?id=1UUlgsu5TD-_YUNVtGkhrFr1zaQSHiQ8JfZ7VfbzYKAg варианту].
 +
*[https://www.dropbox.com/s/k6ns1tb94e3bayn/student-mat.csv?dl=1 student-mat.csv]
 +
*[https://www.dropbox.com/s/np709twg10rng4n/student-por.csv?dl=1 student-por.csv]
 +
Для тех, кто хочет поработать с другими данными:
 +
 +
Описание данных: TODO, [https://www.kaggle.com/c/whats-cooking kaggle competition]
 +
*[https://www.dropbox.com/s/ne4l1l984bk6dwm/train.json?dl=1 what's cooking]
 +
 +
Сроки: до 10.04.16 23:59
 
==Расписание семинаров==
 
==Расписание семинаров==
  

Версия 15:59, 22 марта 2016

Announce.png Выложено домашнее задание №2. Срок сдачи - 11 марта в 23:59

Организационная информация

Семинаристы: Нина Полякова, Андрей Квасов

Чтобы задать вопрос по курсу/отправить домашнее задание следует написать письмо на hse.minor.dm@gmail.com

Тема письма обязательно должна соответствовать формату: [ИАД-19], Фамилия Имя, Ваш текст

Домашние задания

Задание 1.

Скачать файл с домашним заданием без GitHub и танцев с бубном.

Примечание: при выполнении задания запрещается использовать все библиотеки кроме NumPy, Pandas, Matplotlib

Материалы по установке Jupyter на свой компьютер можно найти на cтраницe курса на github.com

Задание 2.

Скачать файл Задание на исследование возможностей линейной регрессии с помощи библиотеки scikit-learn

Сроки: 02.03.16 - 11.03.16 23:59

Проект

Скачать файл

Для выполнения проекта требуется скачать данные согласно варианту.

Для тех, кто хочет поработать с другими данными:

Описание данных: TODO, kaggle competition

Сроки: до 10.04.16 23:59

Расписание семинаров

Ссылки

Оценки за курс

Страница курса на github.com

Дата № занятия Занятие Материалы
12 января 2016 1 Вводный семинар. Обсуждение основных понятий анализа данных.
19 января 2016 2 Python для анализа данных. Pandas.
IPython Notebook "Pandas_(sem2)"
26 января 2016 3 Python для анализа данных. Numpy. Проверочная работа.
IPython Notebook "Numpy_1(sem3)"
2 февраля 2016 4 Python для анализа данных. Numpy часть 2. Matplotlib. Линейная алгебра. Выдача ДЗ №1 (до 16.02.16 до 23:59)
IPython Notebook "NumpyScipyMatplotlib_(sem4)"
9 февраля 2016 5 Метод градиентного спуска в линейных моделях (линейной регрессии).
Пример работы градиентного спуска
1 марта 2016 7 Линейная регрессия. Scikit-learn.
IPython Notebook Семинара №7