Minor da2016 gr3 — различия между версиями
(→Семинар 2) |
|||
(не показано 67 промежуточных версии этого же участника) | |||
Строка 7: | Строка 7: | ||
При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД 2016]'' | При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД 2016]'' | ||
− | '''Пройдите [https://docs.google.com/forms/d/1e_-EB5AOvE4zOgXVN-DGV67tUPxvO8m4B3IVYE4ZAxo/viewform?c=0&w=1 опрос!]''' | + | ''' [http://wiki.cs.hse.ru/%D0%9C%D0%B0%D0%B9%D0%BD%D0%BE%D1%80_%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85/%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85#.D0.9A.D0.BE.D0.BB.D0.BB.D0.BE.D0.BA.D0.B2.D0.B8.D1.83.D0.BC Страница] курса''' <br/> |
+ | '''[https://docs.google.com/document/d/1WRtQqhegOwV1l7McyJAm-y4ql65B_6dY3z5YkRgpe1k/edit Вопросы к экзамену]'''<br/> | ||
+ | '''Пройдите [https://docs.google.com/forms/d/1e_-EB5AOvE4zOgXVN-DGV67tUPxvO8m4B3IVYE4ZAxo/viewform?c=0&w=1 опрос!]'''<br/> | ||
+ | '''Таблица с результатами''' содержится [https://drive.google.com/open?id=1Ab8RR942JAaoJyHpIcR7j9yIqgumyfReuMsHWd3Au8I здесь]<br/> | ||
+ | '''Анонимные''' комментарии, замечания и пожелания можно оставить [https://docs.google.com/forms/d/1JevHn2TS5KD83KLNbwbstDUgOjF7dZ8SaY0pLeRTTIw/viewform здесь]<br/> | ||
== Семинары == | == Семинары == | ||
− | ''' 12 Января 2016:''' Введение в Python, настройка среды программирования - [http://nbviewer. | + | '''1) 12 Января 2016:''' Введение в Python, настройка среды программирования - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/setting_ur_env.ipynb IPython Notebook] <br/> |
− | ''' 19 Января 2016:''' Исследование данных с помощью Pandas и Seaborn - [http://nbviewer. | + | '''2) 19 Января 2016:''' Исследование данных с помощью Pandas и Seaborn - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/da_with_pandas_seaborn.ipynb IPython Notebook] <br/> |
+ | '''3) 26 Января 2016:''' Элементы работы с матрицами. Меры расстояний и сходства - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/da_with_matrices.ipynb IPython Notebook] <br/> | ||
+ | '''4) 2 Февраля 2016:''' Оптимизация функций. Символьные вычисления - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/da_and_opt.ipynb IPython Notebook] <br/> | ||
+ | '''5) 9 Февраля 2016:''' Вероятность и мат. статистика, ч. 1 - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/da_prob_stat1.ipynb IPython Notebook] <br/> | ||
+ | '''6) 16 Февраля 2016:''' Вероятность и мат. статистика, ч. 2 - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/da_prob_stat2.ipynb IPython Notebook] <br/> | ||
+ | '''7) 1 Марта 2016:''' Линейная регрессия - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/lin_regression.ipynb IPython Notebook] <br/> | ||
+ | '''8) 15 Марта 2016:''' Линейные методы классификации - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/classification.ipynb IPython Notebook] <br/> | ||
+ | '''9) 22 Марта 2016:''' + оценка качества, кросс-валидация - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/classification_plus.ipynb IPython Notebook] <br/> | ||
+ | '''10) 5 Апреля 2016:''' Консультация перед коллоквиумом <br/> | ||
+ | '''11) 19 Апреля 2016:''' Деревья решений - [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/dec_trees.ipynb IPython Notebook] <br/> | ||
+ | '''12) 26 Апреля 2016:''' Разбор одного проекта [http://nbviewer.jupyter.org/github/esokolov/ml-course-msu/blob/master/ML15-spring/contests/contest01-dota/contest01-dota-statement.ipynb IPython Notebook], [https://www.dropbox.com/s/fgojcww4nfvw8ik/features.csv?dl=0 Данные]<br/> | ||
+ | '''13) 10 Мая 2016''' Ансамблевые методы. Методы понижения размерности данных [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/ensembles_dim_reduction.ipynb IPython Notebook] <br/> | ||
+ | '''14) 17 Мая 2016''' Работа в программе [http://orange.biolab.si/ Orange] [https://github.com/shestakoff/minor_da_16/blob/master/orange_sem_170516.ows Orange File]<br/> | ||
+ | '''15) 24 Мая 2016''' Кластеризация [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/clustering.ipynb IPython Notebook] <br/> | ||
+ | '''16) 31 Мая 2016''' Метрические методы [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/knn.ipynb IPython Notebook] [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/knn_seminar_sol.ipynb Решение с семинара] <br/> | ||
+ | '''17) 7 Июня 2016''' Ассоциативные правила и частые множества признаков <br/> | ||
+ | '''17) 14 Июня 2016''' Презентации проектов <br/> | ||
+ | '''17) 21 Июня 2016''' Экзамен <br/> | ||
== Домашние Задания == | == Домашние Задания == | ||
− | + | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/hw1.ipynb ДЗ 1]. ''Срок - 2 февраля 2016'' <br/> | |
+ | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/hw2.ipynb ДЗ 2]. ''Срок - 20 февраля 2016'' <br/> | ||
+ | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/hw3.ipynb ДЗ 3]. ''Срок - 4 марта 2016'' <br/> | ||
+ | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/hw4_short.ipynb ДЗ 4]. ''Срок - 20 мая 2016'' <br/> | ||
+ | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/hw5.ipynb ДЗ 5]. ''Срок - 8 июня 2016'' <br/> | ||
+ | |||
+ | == Проект == | ||
+ | [http://nbviewer.jupyter.org/github/shestakoff/minor_da_16/blob/master/project_task.ipynb '''Задание на проект'''] <br/> | ||
+ | Согласование состава группы и набора данных: 25.03.2016 23:59 <br/> | ||
+ | Срок сдачи первой части: 11.04.2016 23:59 <br/> | ||
+ | Срок сдачи второй части: 10 дней до даты защиты проекта <br/> | ||
== Полезные ссылки (Будут пополняться) == | == Полезные ссылки (Будут пополняться) == | ||
− | + | ''' Семинар 16''' | |
− | ''' Pandas & Seaborn | + | |
+ | # [http://www.visiondummy.com/2014/04/curse-dimensionality-affect-classification/ Curse of Dimensionality] | ||
+ | |||
+ | ''' Семинар 12''' | ||
+ | |||
+ | ''Ensemble methods'' | ||
+ | # [https://en.wikipedia.org/wiki/Ensemble_learning Ensemble Learning Wikipedia] | ||
+ | # [http://scikit-learn.org/stable/modules/ensemble.html Sklearn Ensemble Learning] | ||
+ | # [http://www.cs.umd.edu/class/spring2006/cmsc726/Lectures/EnsembleMethods.pdf Bias-Variance and Ensemble Methods] | ||
+ | |||
+ | ''Feature Selection\Dimention Reduction'' | ||
+ | # [http://research.microsoft.com/pubs/150728/FnT_dimensionReduction.pdf Dimention Reduction Overview] | ||
+ | # [http://blog.datadive.net/selecting-good-features-part-i-univariate-selection/ Publication on Feature Selection ] | ||
+ | |||
+ | ''' Семинар 9 ''' | ||
+ | # [https://ccrma.stanford.edu/workshops/mir2009/references/ROCintro.pdf ROC-Curve Introduction] | ||
+ | # [http://scikit-learn.org/stable/modules/cross_validation.html sklearn Cross-Validation Routines] | ||
+ | |||
+ | ''' Семинар 8 ''' | ||
+ | # [http://aimotion.blogspot.ru/2011/11/machine-learning-with-python-logistic.html On Logistic Regression with examples] | ||
+ | # [http://www.stat.cmu.edu/~cshalizi/350/lectures/25/lecture-25.pdf Perceptron Algorithm] | ||
+ | # [http://www.eecs.yorku.ca/course_archive/2012-13/F/4404-5327/lectures/05%20Linear%20Classifiers.pdf On Linear Classifiers] | ||
+ | |||
+ | ''' Семинар 7 ''' | ||
+ | # [http://scikit-learn.org/stable/modules/linear_model.html Sklearn Linear Models] | ||
+ | # [http://statsmodels.sourceforge.net/devel/examples/ Statmodels Examples] | ||
+ | |||
+ | ''' Семинар 6''' | ||
+ | # [http://docs.scipy.org/doc/scipy/reference/stats.html SciPy Stats reference] | ||
+ | |||
+ | ''' Семинар 5 ''' | ||
+ | # [https://www.fourmilab.ch/rpkp/experiments/statistics.html Good Intro to Probability and Statistics] | ||
+ | # [http://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf Probability Cheat-Sheet] | ||
+ | # [http://documents.software.dell.com/Statistics/Textbook/Naive-Bayes-Classifier Naive Bayes] | ||
+ | # [http://www.lancaster.ac.uk/pg/jamest/Group/stats2.html Monte-Carlo] | ||
+ | |||
+ | ''' Семинар 4 ''' | ||
+ | |||
+ | '' Optimization '' | ||
+ | # [https://www.coursera.org/learn/machine-learning/lecture/8SpIM/gradient-descent Gradient Descent - Coursera] | ||
+ | # [http://cs229.stanford.edu/notes/cs229-notes1.pdf Regression Lecture Notes] | ||
+ | # [http://www.scipy-lectures.org/advanced/mathematical_optimization/ Optimization Methods in Scipy] | ||
+ | # [http://matplotlib.org/mpl_toolkits/mplot3d/tutorial.html 3D plotting in Matplotlib] | ||
+ | |||
+ | ''' Семинар 3 ''' | ||
+ | |||
+ | '' Probability And Linear Algebra '' | ||
+ | # [http://www.math.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf Matrix Cookbook] | ||
+ | # [http://arxiv.org/pdf/1404.1100.pdf PCA Tutorial] | ||
+ | # [http://www4.ncsu.edu/~swu6/documents/A-probability-and-statistics-cheatsheet.pdf Probability & Statistics Cheat-Sheet] | ||
+ | |||
+ | ''' Семинар 2 ''' | ||
+ | |||
+ | '' Pandas & Seaborn '' | ||
# [http://pandas.pydata.org/ Pandas] | # [http://pandas.pydata.org/ Pandas] | ||
# [http://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/ Pandas Cheat-Sheet] | # [http://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/ Pandas Cheat-Sheet] | ||
+ | # [http://pandas.pydata.org/pandas-docs/stable/visualization.html Pandas Visualization] | ||
# [http://stanford.edu/~mwaskom/software/seaborn/ Seaborn] | # [http://stanford.edu/~mwaskom/software/seaborn/ Seaborn] | ||
− | + | '' Наборы данных '' | |
# [http://data.gov.ru/ Портал Открытых Данных РФ] | # [http://data.gov.ru/ Портал Открытых Данных РФ] | ||
# [http://blog.yhat.com/posts/7-funny-datasets.html Funny Datasets] | # [http://blog.yhat.com/posts/7-funny-datasets.html Funny Datasets] | ||
# [https://github.com/caesar0301/awesome-public-datasets Сборник Открытых Данных (!!!)] | # [https://github.com/caesar0301/awesome-public-datasets Сборник Открытых Данных (!!!)] | ||
+ | # [http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm Еще наборы данных] | ||
− | + | '' FYI '' | |
# [http://tylervigen.com/spurious-correlations Spurious Correlations] | # [http://tylervigen.com/spurious-correlations Spurious Correlations] | ||
+ | # [https://xkcd.com/552/ Correlation] | ||
+ | |||
+ | ''' Семинар 1 ''' | ||
− | + | '' Python '' | |
− | + | ||
# [https://www.pkimber.net/open/_downloads/pep8_cheat.pdf PEP-8 Code Style Guide Cheat-sheet] | # [https://www.pkimber.net/open/_downloads/pep8_cheat.pdf PEP-8 Code Style Guide Cheat-sheet] | ||
# [http://www.tutorialspoint.com/python/ Python Tutorials Point] | # [http://www.tutorialspoint.com/python/ Python Tutorials Point] | ||
Строка 41: | Строка 129: | ||
# [https://www.yhat.com/products/rodeo yhat Rodeo] | # [https://www.yhat.com/products/rodeo yhat Rodeo] | ||
− | + | '' Ресурсы и Книги '' | |
# [http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Sixth%20Printing.pdf James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning] | # [http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Sixth%20Printing.pdf James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning] | ||
# [http://www.springer.com/br/book/9780387310732 Bishop — Pattern Recognition and Machine Learning (первые главы)] | # [http://www.springer.com/br/book/9780387310732 Bishop — Pattern Recognition and Machine Learning (первые главы)] | ||
Строка 47: | Строка 135: | ||
# [https://www.kaggle.com/ Kaggle] | # [https://www.kaggle.com/ Kaggle] | ||
# [http://archive.ics.uci.edu/ml/ UCI Repo] | # [http://archive.ics.uci.edu/ml/ UCI Repo] | ||
+ | # [http://www.r2d3.us/visual-intro-to-machine-learning-part-1/ Visual Intro to ML] | ||
''' Онлайн Курсы ''' | ''' Онлайн Курсы ''' |
Текущая версия на 23:36, 13 июня 2016
Содержание
Майнор по Анализу Данных -- ИАД-3
На данной странице будут вывешиваться последние новости и материалы для семинарских занятий группы ИАД-3
Семинарист: Шестаков Андрей shestakoffandrey@gmail.com
При обращении по почте, начинайте тему письма со слов [Майнор ИАД 2016]
Страница курса
Вопросы к экзамену
Пройдите опрос!
Таблица с результатами содержится здесь
Анонимные комментарии, замечания и пожелания можно оставить здесь
Семинары
1) 12 Января 2016: Введение в Python, настройка среды программирования - IPython Notebook
2) 19 Января 2016: Исследование данных с помощью Pandas и Seaborn - IPython Notebook
3) 26 Января 2016: Элементы работы с матрицами. Меры расстояний и сходства - IPython Notebook
4) 2 Февраля 2016: Оптимизация функций. Символьные вычисления - IPython Notebook
5) 9 Февраля 2016: Вероятность и мат. статистика, ч. 1 - IPython Notebook
6) 16 Февраля 2016: Вероятность и мат. статистика, ч. 2 - IPython Notebook
7) 1 Марта 2016: Линейная регрессия - IPython Notebook
8) 15 Марта 2016: Линейные методы классификации - IPython Notebook
9) 22 Марта 2016: + оценка качества, кросс-валидация - IPython Notebook
10) 5 Апреля 2016: Консультация перед коллоквиумом
11) 19 Апреля 2016: Деревья решений - IPython Notebook
12) 26 Апреля 2016: Разбор одного проекта IPython Notebook, Данные
13) 10 Мая 2016 Ансамблевые методы. Методы понижения размерности данных IPython Notebook
14) 17 Мая 2016 Работа в программе Orange Orange File
15) 24 Мая 2016 Кластеризация IPython Notebook
16) 31 Мая 2016 Метрические методы IPython Notebook Решение с семинара
17) 7 Июня 2016 Ассоциативные правила и частые множества признаков
17) 14 Июня 2016 Презентации проектов
17) 21 Июня 2016 Экзамен
Домашние Задания
ДЗ 1. Срок - 2 февраля 2016
ДЗ 2. Срок - 20 февраля 2016
ДЗ 3. Срок - 4 марта 2016
ДЗ 4. Срок - 20 мая 2016
ДЗ 5. Срок - 8 июня 2016
Проект
Задание на проект
Согласование состава группы и набора данных: 25.03.2016 23:59
Срок сдачи первой части: 11.04.2016 23:59
Срок сдачи второй части: 10 дней до даты защиты проекта
Полезные ссылки (Будут пополняться)
Семинар 16
Семинар 12
Ensemble methods
Feature Selection\Dimention Reduction
Семинар 9
Семинар 8
Семинар 7
Семинар 6
Семинар 5
Семинар 4
Optimization
- Gradient Descent - Coursera
- Regression Lecture Notes
- Optimization Methods in Scipy
- 3D plotting in Matplotlib
Семинар 3
Probability And Linear Algebra
Семинар 2
Pandas & Seaborn
Наборы данных
FYI
Семинар 1
Python
- PEP-8 Code Style Guide Cheat-sheet
- Python Tutorials Point
- Matplotlib Tutorial
- Matrix Manipulation Cheat-sheet
- Ipython Notebook
- Beaker Notebook
- yhat Rodeo
Ресурсы и Книги
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
- Bishop — Pattern Recognition and Machine Learning (первые главы)
- MachineLearning.ru
- Kaggle
- UCI Repo
- Visual Intro to ML
Онлайн Курсы