Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-2 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(События)
 
(не показано 17 промежуточных версии этого же участника)
Строка 1: Строка 1:
 
==Организационная информация==
 
==Организационная информация==
Семинарист: Евгений Ковалев
+
Семинарист: Евгений Ковалев (telegram: @blacKitten13)
  
Telegram: @blacKitten13
+
Ассистент: Максим Мухортов (telegram: @mmukhortov)
  
 
==Основные ссылки==
 
==Основные ссылки==
Строка 12: Строка 12:
 
==События==
 
==События==
  
30.01 - проверочная №1 (основные определения)
+
29.05 - проверочная №4 по лекциям 8-10, основные темы: решающие деревья, композиции (случайный лес, бустинг)
 +
 
 +
24.05 - дедлайн дз №3 (в 23:59)
 +
 
 +
22.05 - ПЕРЕНОСИТСЯ НА НЕДЕЛЮ проверочная №4
 +
 
 +
24.04 - контрольная работа для тех, кто не писал в 17.04 по причине сдачи IELTS
 +
 
 +
17.04 - контрольная работа
 +
 
 +
03.04 - два семинара (с 10:30 до 13:30) и проверочная №3 по лекциям 6-7, основные темы: линейная классификация, метрики качества классификации.
 +
 
 +
20.03 - семинара и проверочной не будет, переносятся на следующую неделю
 +
 
 +
17.03 - дедлайн дз №2 (в 23:59)
 +
 
 +
27.02 - проверочная №2 по лекциям 3-5, основные темы: kNN, линейная регрессия.
 +
 
 +
10.02 - дедлайн дз №1 (в 23:59)
 +
 
 +
06.02 - два семинара (с 12 до 15) и проверочная №1 (основные определения). Занятия пройдут на ФКН (Кочновский проезд, дом 3), аудитория 301.
 +
 
 +
30.01 - семинара и проверочной не будет, переносятся на следующую неделю
  
 
==Полезные ссылки==
 
==Полезные ссылки==
 +
 +
'''''Начало работы'''''
 +
 +
* Anaconda (дистрибутив для Python, содержащий в том числе Jupyter Notebook и сам Python): https://www.anaconda.com/download/ - рекомендуется версия Python 3.6 или больше; не забудьте выбрать нужную операционную систему!
 +
* документация по Jupyter: https://jupyter.readthedocs.io/en/latest/
 +
* документация по pip (для установки пакетов в Python с помощью pip install): https://pip.readthedocs.io/en/latest/
 +
* PyCharm: https://www.jetbrains.com/pycharm/
 +
 +
'''''Общее'''''
 +
 +
* для любых вопросов: https://www.google.com/
 +
* для (почти) любых ответов: https://stackoverflow.com/
 +
* профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных: http://www.machinelearning.ru/wiki/index.php?title=Заглавная_страница
 +
* A visual introduction to machine learning: http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
 +
 +
'''''Python & Jupyter'''''
 +
 +
* A Crash Course in Python for Scientists: http://nbviewer.jupyter.org/gist/rpmuller/5920182
 +
* A Gallery of interesting Jupyter Notebooks: https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks
 +
* Markdown Cheatsheet: https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet
 +
 +
'''''numpy'''''
 +
 +
* документация: http://www.numpy.org/
 +
* Python Numpy Array Tutorial: https://www.datacamp.com/community/tutorials/python-numpy-tutorial
 +
* 100 numpy exercises: http://www.labri.fr/perso/nrougier/teaching/numpy.100/
 +
 +
'''''pandas'''''
 +
 +
* документация: http://pandas.pydata.org/pandas-docs/stable/
 +
* 10 minutes to pandas: https://pandas.pydata.org/pandas-docs/stable/10min.html
 +
* Pandas Tutorial: DataFrames in Python: https://www.datacamp.com/community/tutorials/pandas-tutorial-dataframe-python
 +
* Cheet Sheet: https://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/
 +
* Visualization: http://pandas.pydata.org/pandas-docs/stable/visualization.html
 +
 +
'''''sklearn'''''
 +
 +
* документация и многое другое: http://scikit-learn.org/stable/
 +
 +
'''''Другие библиотеки'''''
 +
 +
* matplotlib: https://matplotlib.org/users/pyplot_tutorial.html
 +
* seaborn: http://seaborn.pydata.org/
 +
 +
'''''Онлайн-курсы'''''
 +
 +
* Andrew Ng, "Machine Learning": https://www.coursera.org/learn/machine-learning
 +
* ВШЭ & Яндекс, «Введение в машинное обучение»: https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie
 +
* ВШЭ & Яндекс, специализация "Advanced Machine Learning": https://www.coursera.org/courses?query=advanced%20machine%20learning (более продвинутый уровень)
 +
* обзор онлайн-курсов Coursera: https://habr.com/post/248069/
 +
* Dataquest: https://www.dataquest.io/
 +
* Learn Python: https://www.codecademy.com/learn/learn-python
 +
 +
'''''Соревнования'''''
 +
 +
* Kaggle: https://www.kaggle.com/
 +
* DrivenData: https://www.drivendata.org/
 +
 +
'''''For fun'''''
 +
 +
* http://tylervigen.com/spurious-correlations
 +
* http://blog.yhat.com/posts/7-funny-datasets.html
 +
* https://vk.com/weirdreparametrizationtrick

Текущая версия на 23:19, 21 мая 2019

Организационная информация

Семинарист: Евгений Ковалев (telegram: @blacKitten13)

Ассистент: Максим Мухортов (telegram: @mmukhortov)

Основные ссылки

Чат в Telegram

Страница группы на github.com

События

29.05 - проверочная №4 по лекциям 8-10, основные темы: решающие деревья, композиции (случайный лес, бустинг)

24.05 - дедлайн дз №3 (в 23:59)

22.05 - ПЕРЕНОСИТСЯ НА НЕДЕЛЮ проверочная №4

24.04 - контрольная работа для тех, кто не писал в 17.04 по причине сдачи IELTS

17.04 - контрольная работа

03.04 - два семинара (с 10:30 до 13:30) и проверочная №3 по лекциям 6-7, основные темы: линейная классификация, метрики качества классификации.

20.03 - семинара и проверочной не будет, переносятся на следующую неделю

17.03 - дедлайн дз №2 (в 23:59)

27.02 - проверочная №2 по лекциям 3-5, основные темы: kNN, линейная регрессия.

10.02 - дедлайн дз №1 (в 23:59)

06.02 - два семинара (с 12 до 15) и проверочная №1 (основные определения). Занятия пройдут на ФКН (Кочновский проезд, дом 3), аудитория 301.

30.01 - семинара и проверочной не будет, переносятся на следующую неделю

Полезные ссылки

Начало работы

Общее

Python & Jupyter

numpy

pandas

sklearn

Другие библиотеки

Онлайн-курсы

Соревнования

For fun