Data analysis (Software Engineering) — различия между версиями

Версия 00:40, 13 января 2016

Контакты: Виктор Китов v.v.kitov@yandex.ru

Обратная связь: написать комментарий или пожелание по курсу

Краткое описание

В курсе рассматриваются основные задачи анализа данных и обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности, ранжирование, коллаборативная фильрация. По изложению для каждой рассматриваемой задачи изучаются математические основы методов, лежащие в их основе предположения о данных, взаимосвязи методов между собой и особенности их практического применения.

Большое внимание уделено освоению практических навыков анализа данных, отрабатываемых на семинарах, которое будет вестись с использованием языка python и соответствующих библиотек для научных вычислений.

От студентов требуются знания линейной алгебры, математического анализа и теории вероятностей.

Программа курса

Introduction to machine learning.
K-nearest neighbours classification and regression. Extensions. Optimization techniques.
Decision tree methods.
Bayesian decision theory. Model evaluation:

confusion matrix, accuaracy, ROC, AUC.

Linear classification methods. Adding regularization to linear methods.
Regression.
Kernel generalization of standard methods.
Neural networks.
Ensemble methods: bagging, boosting, etc.
Feature selection.

based on correlation, mutual information, forward-stagewise, backward-stagewise, forward-backward, L1, tree-based importances.

Feature extraction

PCA, SVD

EM algorithm. Density estimation using mixtures.
Clustering
Collaborative filtering
Ranking

Темы лекций

Лекция 1. Основные понятия и примеры прикладных задач.

Загрузить

Дополнительные материалы: The Field Guide to Data Science

@@ Строка 15: / Строка 15: @@
 == Программа курса ==
+# Introduction to machine learning.
+# K-nearest neighbours classification and regression. Extensions. Optimization techniques.
+# Decision tree methods.
+# Bayesian decision theory. Model evaluation:
+::*confusion matrix, accuaracy, ROC, AUC.
+# Linear classification methods. Adding regularization to linear methods.
+# Regression.
+# Kernel generalization of standard methods.
+# Neural networks.
+# Ensemble methods: bagging, boosting, etc.
+# Feature selection.
+::* based on correlation, mutual information, forward-stagewise, backward-stagewise, forward-backward, L1, tree-based importances.
+# Feature extraction
+::* PCA, SVD
+# EM algorithm. Density estimation using mixtures.
+# Clustering
+# Collaborative filtering
+# Ranking
 == Темы лекций ==

Data analysis (Software Engineering) — различия между версиями

Версия 00:40, 13 января 2016

Краткое описание

Программа курса

Темы лекций

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты