Основные методы анализа данных — различия между версиями
(→О курсе) |
|||
Строка 7: | Строка 7: | ||
Занятия проходят по пятницам, 15:10-16:30 и 16:40-18:00, ауд. 501. | Занятия проходят по пятницам, 15:10-16:30 и 16:40-18:00, ауд. 501. | ||
− | [https://drive.google.com/file/d/1bR_PI96by0KHhfmQ86RmSfeemRjKowpV/view?usp=sharing '''Программа курса'''] | + | Консультации по выполнению домашней работы проводятся по пятницам с 16:30. |
+ | |||
+ | [https://drive.google.com/file/d/1bR_PI96by0KHhfmQ86RmSfeemRjKowpV/view?usp=sharing '''Программа курса'''] | ||
== Порядок формирования итоговой оценки == | == Порядок формирования итоговой оценки == |
Версия 22:26, 3 ноября 2018
Содержание
О курсе
Курс читается для студентов 3-го курса ПМИ ФКН ВШЭ специализации "Анализ Данных и Интеллектуальные Системы" в 1-2 модулях 2018-2019 учебного года.
Лектор: Миркин Борис Григорьевич
Занятия проходят по пятницам, 15:10-16:30 и 16:40-18:00, ауд. 501.
Консультации по выполнению домашней работы проводятся по пятницам с 16:30.
Порядок формирования итоговой оценки
Контроль знаний проводится в виде двухступенчатой процедуры. Отдельно оцениваются Домашний проект и Экзаменационная контрольная работа: Oитоговая = 0.4 * Oд/п + 0.6 * Оэкз
Лекции
Mirkin Rules for Cluster Interpretation
Домашний проект
Экзамен
Время работы: 80 мин. Количество вопросов: 6-7 (2 – теоретических, 4 – практических).
Каждому вопросу приписана максимально возможная оценка по нему; сумма этих оценок равна 100%. При проверке каждый ответ оценивается в соответствии с уровнем покрытия материала в пределах приписанного к вопросу максимума. Сумма составляет оценку в процентах, и затем округляется до традиционной 10-балльной шкалы. Считается справедливым, если 52 и 53 округляются до 5, а 67 и 68 – до 7. Округление оценок, таких как 55 или 66 может основываться на дополнительной информации о прилежании студента.
Примеры вопросов см. в программе курса.
Обратная связь
Миркин Борис Григорьевич: bmirkin@hse.ru
Литература
Основная
1. B. Mirkin (2011/18) Core Concepts in Data Analysis: Summarization, Correlation, Visualization, Springer-London. Авторская версия
2. Б. Миркин (2017) Введение в анализ данных, М., Юрайт. Авторская версия
3. R.O. Duda, P.E. Hart, D.G. Stork (2001) Pattern Classification, Wiley-Interscience, ISBN 0-471-05669-3
4. H. Lohninger (1999) Teach Me Data Analysis, Springer-Verlag, Berlin-New York-Tokyo, 1999. ISBN 3-540-14743-8.
Дополнительная
1. M. Berthold, D. Hand (2003), Intelligent Data Analysis, Springer-Verlag.
3. B. Efron and R. Tibshirani (1993) An Introduction to Bootstrap, Chapman & Hall.
5. J. Han, M. Kamber, J. Pei (2010) Data Mining: Concepts and Techniques, 3d Edition, Morgan Kaufmann Publishers.
6. М. Дж. Кендалл, А. Стьюарт (1973) Статистические выводы и связи, Наука, Москва.
7. М.Б. Лагутин (2009) Наглядная математическая статистика, БИНОМ, Москва.
8. L. Lebart, A. Morineau, M. Piron (1995) Statistique Exploratoire Multidimensionelle, Dunod, Paris, ISBN 2-10-002886-3.
10. R. Mazza (2009) Introduction to Information Visualization, Springer, ISBN: 978-1-84800-218-0.
11. W. McKinney (2013) Python for Data Analysis, O’Reilly Media, Sebastopol USA.
13. T.M. Mitchell (2005) Machine Learning, McGraw Hill. (В библиотеке ВШЭ есть издание 1997 года)
14. B. Schölkopf, A.J. Smola (2005) Learning with Kernels, The MIT Press.
15. Дж, Тьюки (1981) Анализ результатов наблюдений. Разведочный анализ. Мир, Москва.
16. V. Vapnik (2006) Estimation of Dependences Based on Empirical Data, Springer Science + Business Media Inc., 2d edition.
17. A. Webb (2002) Statistical Pattern Recognition, Wiley and Son.