Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-19

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Announce.png Выложено домашнее задание №3. Срок сдачи - 9 июня в 23:59

Выложена информация о проекте. Срок сдачи - 15 июня в 23:59

Организационная информация

Семинаристы: Нина Полякова, Андрей Квасов

Чтобы задать вопрос по курсу/отправить домашнее задание следует написать письмо на hse.minor.dm@gmail.com

Тема письма обязательно должна соответствовать формату: [ИАД-19], Фамилия Имя, Ваш текст

Домашние задания

Задание 1.

Скачать файл с домашним заданием без GitHub и танцев с бубном.

Примечание: при выполнении задания запрещается использовать все библиотеки кроме NumPy, Pandas, Matplotlib

Материалы по установке Jupyter на свой компьютер можно найти на cтраницe курса на github.com

Задание 2.

Скачать файл Задание на исследование возможностей линейной регрессии с помощи библиотеки scikit-learn

Сроки: 02.03.16 - 11.03.16 23:59

Задание 3.

Скачать файл Задание на исследование кластеризации текстовых данных с помощью k-means. Задание, выложено на виртуальной машине, **обязательно** скачайте файл к себе в папку или на собственный компьютер.

Сроки: 30.05.16 - 09.06.16

Проект

Часть 1. (модуль 3)

Скачать файл

Для выполнения проекта требуется скачать данные согласно варианту.

Для тех, кто хочет поработать с другими данными:

Описание данных: TODO, kaggle competition

Сроки: до 10.04.16 23:59

Часть 2. (модуль 4)

Продолжается работа с данными от первой части проекта. Задание.

Сроки: до 15.06.16 23:59

Расписание семинаров

Ссылки

Оценки за курс

Страница курса на github.com

Дата № занятия Занятие Материалы
12 января 2016 1 Вводный семинар. Обсуждение основных понятий анализа данных.
19 января 2016 2 Python для анализа данных. Pandas.
IPython Notebook "Pandas_(sem2)"
26 января 2016 3 Python для анализа данных. Numpy. Проверочная работа.
IPython Notebook "Numpy_1(sem3)"
2 февраля 2016 4 Python для анализа данных. Numpy часть 2. Matplotlib. Линейная алгебра. Выдача ДЗ №1 (до 16.02.16 до 23:59)
IPython Notebook "NumpyScipyMatplotlib_(sem4)"
9 февраля 2016 5 Метод градиентного спуска в линейных моделях (линейной регрессии).
Пример работы градиентного спуска
1 марта 2016 7 Линейная регрессия. Scikit-learn.
IPython Notebook Семинара №7