Основные методы анализа данных — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 21: Строка 21:
  
 
[https://drive.google.com/file/d/1eoageWEC_PYp-PPefraJYLzdQTH-faGT/view?usp=sharing Mirkin Rules for Cluster Interpretation]
 
[https://drive.google.com/file/d/1eoageWEC_PYp-PPefraJYLzdQTH-faGT/view?usp=sharing Mirkin Rules for Cluster Interpretation]
 +
 +
[https://drive.google.com/file/d/1FbYH-3vKI7Gm4AYTm2FDMjHO727aotsb/view?usp=sharing Лекция 12.10]
  
 
== Домашний проект ==
 
== Домашний проект ==

Версия 13:30, 18 октября 2018

О курсе

Курс читается для студентов 3-го курса ПМИ ФКН ВШЭ специализации "Анализ Данных и Интеллектуальные Системы" в 1-2 модулях 2018-2019 учебного года.

Лектор: Миркин Борис Григорьевич

Занятия проходят по пятницам, 15:10-16:30 и 16:40-18:00, ауд. 501.

Программа курса

Порядок формирования итоговой оценки

Контроль знаний проводится в виде двухступенчатой процедуры. Отдельно оцениваются Домашний проект и Экзаменационная контрольная работа: Oитоговая = 0.4 * Oд/п + 0.6 * Оэкз

Лекции

Лекция 28.09

Лекция 5.10

Mirkin Rules for Cluster Interpretation

Лекция 12.10

Домашний проект

Экзамен

Время работы: 80 мин. Количество вопросов: 6-7 (2 – теоретических, 4 – практических).

Каждому вопросу приписана максимально возможная оценка по нему; сумма этих оценок равна 100%. При проверке каждый ответ оценивается в соответствии с уровнем покрытия материала в пределах приписанного к вопросу максимума. Сумма составляет оценку в процентах, и затем округляется до традиционной 10-балльной шкалы. Считается справедливым, если 52 и 53 округляются до 5, а 67 и 68 – до 7. Округление оценок, таких как 55 или 66 может основываться на дополнительной информации о прилежании студента.

Примеры вопросов см. в программе курса.

Обратная связь

Миркин Борис Григорьевич: bmirkin@hse.ru

Литература

Основная

1. B. Mirkin (2011/18) Core Concepts in Data Analysis: Summarization, Correlation, Visualization, Springer-London. Авторская версия

2. Б. Миркин (2017) Введение в анализ данных, М., Юрайт. Авторская версия

3. R.O. Duda, P.E. Hart, D.G. Stork (2001) Pattern Classification, Wiley-Interscience, ISBN 0-471-05669-3

4. H. Lohninger (1999) Teach Me Data Analysis, Springer-Verlag, Berlin-New York-Tokyo, 1999. ISBN 3-540-14743-8.

Дополнительная

1. M. Berthold, D. Hand (2003), Intelligent Data Analysis, Springer-Verlag.

2. L. Breiman, J.H. Friedman, R.A. Olshen and C.J. Stone (1984) Classification and Regression Trees, Belmont, Ca: Wadswarth.

3. B. Efron and R. Tibshirani (1993) An Introduction to Bootstrap, Chapman & Hall.

4. J.F. Hair, W.C. Black, B.J. Babin, R.E. Anderson (2010) Multivariate Data Analysis, 7th Edition, Prentice Hall, ISBN-10: 0-13-813263-1.

5. J. Han, M. Kamber, J. Pei (2010) Data Mining: Concepts and Techniques, 3d Edition, Morgan Kaufmann Publishers.

6. М. Дж. Кендалл, А. Стьюарт (1973) Статистические выводы и связи, Наука, Москва.

7. М.Б. Лагутин (2009) Наглядная математическая статистика, БИНОМ, Москва.

8. L. Lebart, A. Morineau, M. Piron (1995) Statistique Exploratoire Multidimensionelle, Dunod, Paris, ISBN 2-10-002886-3.

9. C.D. Manning, P. Raghavan, H. Schütze (2008) Introduction to Information Retrieval, Cambridge University Press.

10. R. Mazza (2009) Introduction to Information Visualization, Springer, ISBN: 978-1-84800-218-0.

11. W. McKinney (2013) Python for Data Analysis, O’Reilly Media, Sebastopol USA.

12. Б.Г. Миркин (1985) Группировки в социально-экономических исследованиях, Финансы и статистика, Москва.

13. T.M. Mitchell (2005) Machine Learning, McGraw Hill. (В библиотеке ВШЭ есть издание 1997 года)

14. B. Schölkopf, A.J. Smola (2005) Learning with Kernels, The MIT Press.

15. Дж, Тьюки (1981) Анализ результатов наблюдений. Разведочный анализ. Мир, Москва.

16. V. Vapnik (2006) Estimation of Dependences Based on Empirical Data, Springer Science + Business Media Inc., 2d edition.

17. A. Webb (2002) Statistical Pattern Recognition, Wiley and Son.

Дополнительная информация и ссылки