Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-11,12
Содержание
Общая информация
Семинарист — Козлова Анна.
Здесь можно оставить анонимный отзыв по курсу
Почта курса: hse.minor.dm@gmail.com (обратите внимание на оформление темы письма)
Для быстрой связи с семинаристом и ассистентом: слак (чтобы добавиться, пришлите свою почту и мы вышлем приглашения. Большая просьба регистрироваться на канале с понятными никами (должен содержать фамилию).
Домашние задания
Дата выдачи | Дата сдачи | Задание | |
---|---|---|---|
Лабораторная работа 1 | 26.01.2016 | 09.02.2016 09:00MSK | Условие |
Лабораторная работа 2 | 09.02.2016 | 01.03.2016 09:00MSK | Условие |
Лабораторная работа 3 | 08.03.2016 | 29.03.2016 09:00MSK | Условие |
Проект | 08.03.2016 | 05.04.2016 09:00MSK | Условие |
Вопросы для подготовки к проверочной | 20.03.2016 | Вопросы | |
Лабораторная работа 4 | 20.04.2016 | 10.05.2016 09:00MSK | Условие |
Лабораторная работа 5 | 31.05.2016 | 15.06.2016 09:00MSK | Условие |
Проект (продолжение) | 31.05.2016 | 19.06.2016 09:00MSK | Условие |
Семинары
Дата | Тема | Материалы семинара |
---|---|---|
12.01.2016 | Вводный семинар | |
19.01.2016 | Библиотеки для анализа данных | IPython-notebook с семинара |
26.01.2016 | Продолжение библиотек для анализа данных. Немного о визуализации | IPython-notebook с семинара |
02.02.2016 | Линейная алгебра | IPython-notebook с семинара |
09.02.2016 | Градиентный спуск | IPython-notebook с семинара |
24.02.2016 | Консультация | IPython-notebook |
01.03.2016 | Теория вероятности. Наивный байесовский классификатор | IPython-notebook с семинара |
15.03.2016 | Визуализация. Библиотека sklearn | IPython-notebook с семинара |
22.03.2016 | Линейная классификация | IPython-notebook с семинара |
05.04.2016 | Метрики классификации. Многоклассовая классификация. Полиномиальная регрессия | IPython-notebook с семинара |
19.04.2016 | Восстановление нелинейных зависимостей с помощью линейных моделей. Решающие деревья. | IPython-notebook с семинара |
26.04.2016 | Решающие деревья и случайные леса | IPython-notebook с семинара |
10.05.2016 | Решение задач | Задачи с семинара |
17.05.2016 | Проверочная работа. Отбор признаков | IPython-notebook с семинара |
24.05.2016 | Понижение размерности данных. Кластеризация | IPython-notebook с семинара |
Правила игры
Информация о домашних заданиях появится позже.
Иногда на семинарах будут проводиться проверочные работы. Об этом будет объявляться заранее. Также каждый студент делает проект в течение двух модулей (решение какой-то задачи анализа данных, информация будет объявлена позже).
Про домашние задания
Каждое ДЗ выдается на две (полных) недели. Дедлайн строгий, после него задание сдать нельзя.
Плагиат будет строго наказываться: вся компонента — и те, кто списал, и те, у кого списали — получает не более 0 баллов за задание. Цените свое время.
Оформление темы письма
При написании письма необходимо указывать тему, как описано ниже (почта, на которую вы отправляете вопросы и работы, является почтой всего майнора, поэтому указывая тему письма правильно вы повышаете шансы дождаться ответа). Далее NN - номер вашей группы. X - номер лабораторной работы.
- Для вопросов: [ИАД-NN] - Вопрос - Фамилия Имя Отчество
- Для домашних лабораторных работ: [ИАД-NN] - Лабораторная работа X - Фамилия Имя Отчество
Установка python и необходимых библиотек
Виртуальная машина
Для работы на семинарах а также для небольших лабораторных работ можно воспользоваться онлайн-сервисом, на котором установлены уже все необходимые библиотеки. Для получения адреса и пароля необходимо написать на почту курса (тема письма: [ИАД-NN] - Виртуальная машина - Фамилия Имя Отчество). Обратите внимание, что этот сервис поднят только для нужд семинаров и заданий, поэтому запрещается использовать его для личного пользования.
Установка на домашнем компьютере
1. Самый простой способ — установить дистрибутив Anaconda, который содержит все необходимые библиотеки и доступен для всех платформ. 2. Откройте командную строку:
- комбинация клавиш Win+R в операционной системе Windows, в открывшемся окне набрать "cmd" (без кавычек) и нажать Enter)
- Ctrl+Space в MacOs, набрать "terminal" и нажать Enter
3. В окне командной строки наберите "conda install jupyter" (без кавычек)
Для запуска ipython notebook повторите шаг 2 инструкции выше, а затем в окне командной строки наберите "ipython notebook" (без кавычек)
Откройте браузер (если он у вас не открылся в течении пары секунд сам) и в адресную строку введите localhost:8888 Вы увидите папки директории, из которой был запущен ipython. Чтобы создать ноутбук или открыть существующий перейдите в директорию где будете работать (просто нажимая на папки). Далее либо вам нужно открыть файл с расширением ipynb, либо создать новый: справа нажать на New и выбрать вариант Python (2 или 3 в зависимости от версии).
Чтобы исполнить ячейку необходимо выделить ее мышью и либо сверху нажать на стрелочку (Run), либо Ctrl+Enter.
Чтобы выключить питон, откройте консоль в которой запущен ipython notebook и нажмите Ctrl+C пару раз.
Если у вас что-то не получилось установить — пишите на почту курса (с правильной темой письма и подробным описанием ошибки и на какой платформе все происходит). Тем временем можно воспользоваться виртуальной машиной.
Дополнительные материалы
- Видеозаписи курса лекций К. В. Воронцова в ШАДе
- Лекции Andrew Ng на coursera.org: начинается 25 января, но практические задания на языке MATLAB/Octave
- Вводный курс К. В. Воронцова на coursera.org: на русском языке, начинается 26 января, практические задания на языке Python
- dataquest.io: сайт с интерактивными заданиями по Python для анализа данных