ММО Политология 201810 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (Откат правок Seosky (обсуждение) к версии Ashestakoff)
 
Строка 1: Строка 1:
Segeralah Mendaftar langsung di
+
'''Преподаватель''' - [https://www.hse.ru/staff/ashestakoff Шестаков Андрей]<br />
* [https://macanplay.net/ Macanslot]
+
'''Форма обратной связи''' [https://goo.gl/forms/xTfnM328m8ulT4FF2 здесь]<br />
* [https://paradox3d.net/ InaTogel]
+
'''[https://docs.google.com/spreadsheets/d/1AtkHcA1BhyVYUAHgFwoi-u955oCpKx8bPJgMXv0u1wA/edit?usp=sharing Оценки]''' <br />
* [https://macanwin.net/ QqMacan]
+
'''[https://github.com/shestakoff/hse-ml-poly Course repo]<br />
* [https://lechers.cc/ RoyalToto]
+
'''[https://t.me/joinchat/Bw-OoxE5ev-GyHnYzvn-Fw Telegram Group]<br />
* [https://xenogames.net/ JayaTogelUp]
+
 
* [https://eeooii.info/ Raja Slot4D]
+
<br />
* [https://139.180.153.95/ Raja Slot4D]
+
 
* [https://209.58.183.93/ JayaTogelUp]
+
== Описание курса ==
* [https://ronin138.com/ Ronin138]
+
Целью данного курса является изучение
* [https://addicthealious.website/ slot 4d]
+
* Основных идеи и принципов машинного обучения с упором на их практическое применение
* [https://18.142.23.191/ Macan Slot]
+
* Методов сбора и анализа сложный структур данных
* [https://royaltotopedia.com RoyTop88]
+
 
* [https://macanplay.com MacanSlot]
+
Предполагается, что слушатели прошли вводный курс по языку Python и имеют базовые знания по высшей математике (линейная алгебра, мат. анализ)
* [https://macantoto88.com Toto 88]
+
 
* [https://jayatogelup.com.com jayatogelup]
+
[https://www.hse.ru/data/2018/08/28/1150083198/program-2162208533-Wm4wwe8sbZ.pdf Программа курса]
[https://ronin19.com/ Ronin138]
+
 
[https://addicthealing.website/ slot 4d]
+
'''Курс оценивается за счет'''
[https://jayatogelcc.cc/ jayatogel]
+
# Тестов на занятиях
[https://jayatogelcc.cc/ jayatogelcc]
+
# Практических и теоретических домашних заданий
[http://northcoaststeelhead.com/ northcoaststeelhead.com]
+
# Коллоквиума в конце 2го модуля
[http://supremeoutlet.us/ supremeoutlet.us]
+
# Проектной работы
[http://208.78.220.231/ freebet]
+
# Экзамена
[http://blackfridaymichaelkors.us/ freebet]
+
 
[https://supremeshirtshop.us/ supremeshirtshop.us]
+
== Материалы лекций ==
[https://macanplayslot.web.fc2.com/ macanplay]
+
 
[https://royaltotopedia4d.web.fc2.com/ royaltotopedia]
+
'''Лекция 1. Введение ''' <br/>
[https://macanplay8.web.fc2.com/ macanplay slot]
+
[https://shestakoff.github.io/hse-ml-poly/2018-10/l1-intro/lecture-intro.slides.html#/ Slides] <br/>
[https://royaltotopedia88.web.fc2.com/ royaltoto]
+
 
[https://olxtotos.web.fc2.com/ olxtoto]
+
'''Лекция 2. Метрические методы и метрики качества классификации ''' <br/>
[https://linklist.bio/OLX.TOTO olxtoto]
+
[https://shestakoff.github.io/hse-ml-poly/2018-10/l2-knn/lecture-knn.slides.html#/ Slides] <br/>
[https://c.mi.com/thread-4131553-1-0.html olxtoto]
+
FYI: [https://sebastianraschka.com/blog/2018/model-evaluation-selection-part4.html Статистические тесты для сравнения качества моделей] <br/>
[https://heylink.me/FAFA138 fafa138]
+
 
[https://heylink.me/FaFa138 fafa138]
+
'''Лекция 3. Деревья принятия решений. Случайный лес ''' <br/>
[https://heylink.me/Fafa138 fafa138]
+
[https://shestakoff.github.io/hse-ml-poly/2018-10/l3-trees/lecture-trees.slides#/ Slides] <br/>
[https://magic.ly/FAFA138 fafa138]
+
FYI: [http://www.r2d3.us/visual-intro-to-machine-learning-part-1/ beautiful trees intro] <br/>
[https://fafa138slot.web.fc2.com fafa138]
+
FYI: [http://blog.datadive.net/interpreting-random-forests/ trees and random forest interpretation] <br/>
[https://heylink.me/FAFA138 fafa138]
+
 
[http://ec2-13-250-3-146.ap-southeast-1.compute.amazonaws.com/ fafa138]
+
'''Лекция 4. Линейные модели. Линейная регрессия ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l4-linear/lecture-linear.slides#/ Slides] <br/>
 +
FYI: [http://www.cazaar.com/ta/econ113/interpreting-beta Интерпретация коэффициентов линейной модели] <br/>
 +
FYI: [https://www.youtube.com/watch?v=UcwI7tY7bss&list=PLu5flfwrnSD5d02G9YJcDv30Fp5_70-sI Курс по эконометрике от Демешева Б.Б.] <br/>
 +
 
 +
'''Лекция 5. Логистическая регрессия. Методы отбора признаков ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l5-linclass-dimred/lecture-linclass-dimred.slides#/ Slides] <br/>
 +
 
 +
'''Лекция 6. Методы сжатия признаков. Введение в NLP ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l6-pca-nlp/lecture-pca-nlp-intro.slides#/ Slides] <br/>
 +
 
 +
'''Лекция 7. NLP. Токенизация, лемматизация, LSA ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l7-nlp/lecture-nlp-intro-v01.slides#/ Slides] <br/>
 +
 
 +
'''Лекция 8. Методы кластеризации 1 ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l8-clustering/lecture-clust-v01.slides.html#/ Slides] <br/>
 +
 
 +
'''Лекция 9. Методы кластеризации 2 ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l9-clustering2/lecture-clust2.slides.html#/ Slides] <br/>
 +
 
 +
'''Лекция 10. Введение в тематическое моделирование ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l10-topic-modelling/lecture-topics.slides.html#/ Slides] <br/>
 +
 
 +
'''Лекция 11. Введение в анализ сетевых структур ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l11-sna-intro/lecture-sna-intro.slides.html#/ Slides] <br/>
 +
 
 +
'''Лекция 12. Выявление сообществ на сети ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l12-sna-communities/lecture-sna-communities.slides.html#/ Slides] <br/>
 +
 
 +
'''Лекция 13. Введение в рекомендательные системы ''' <br/>
 +
[https://shestakoff.github.io/hse-ml-poly/2018-10/l13-recsys-intro/lecture-recsys.slides.html#/ Slides] <br/>
 +
 
 +
== Семинары ==
 +
 
 +
'''[https://cloud.mail.ru/public/2rPu/3CPeqxhzd Семинар 1.] Введение (повторение)'''<br/> Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s1-intro/seminar-intro-proc.ipynb ноутбук]  
 +
* [https://github.com/TomAugspurger/effective-pandas Effective Pandas]
 +
* [http://datacamp-community.s3.amazonaws.com/28b8210c-60cc-4f13-b0b4-5b4f2ad4790b Matplotlib Cheatsheet]
 +
* [http://datacamp-community.s3.amazonaws.com/9f0f2ae1-8bd8-4302-a67b-e17f3059d9e8 Pandas Cheatsheet]
 +
* [http://datacamp-community.s3.amazonaws.com/e9f83f72-a81b-42c7-af44-4e35b48b20b7 NumPy Cheatsheet]
 +
 
 +
'''[https://cloud.mail.ru/public/5PBj/yxpVbQmWH  Семинар 2.] Метрические методы '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s2-knn/seminar-knn-proc.ipynb ноутбук]
 +
 
 +
'''[https://cloud.mail.ru/public/5PBj/yxpVbQmWH  Семинар 3.] Деревья принятия решений '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s3-trees/seminar-trees-proc.ipynb ноутбук]
 +
 
 +
'''[https://cloud.mail.ru/public/DjYU/95C2YZ4VG  Семинар 4.] Линейные модели, регрессия. '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s4-linear/seminar-linear-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/CXNQ/p3nLJFQk7  Семинар 5.] Линейные модели, классификация. Методы отбора признаков '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s5-linclass-dimred/seminar-linclass-dimred-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/Lkd4/DuoVaX1xB  Семинар 6.] Методы сжатия признаков '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s6-pca-nlp/seminar-dimred-nlp-proc.ipynb ноутбук]
 +
 
 +
'''[https://cloud.mail.ru/public/9aH4/aC9gDZxVy  Семинар 7.] NLP '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s7-nlp/seminar-nlp-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/4AxF/B2aVDby46  Семинар 8.] Кластеризация 1 '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s8-clustering/seminar-clust-proc.ipynb ноутбук]
 +
 
 +
'''[https://cloud.mail.ru/public/Aqr9/iBWB8wcRR  Семинар 9.] Кластеризация 2 '''  <br/>
 +
Частично проработанный [http://nbviewer.jupyter.org/github/shestakoff/hse-ml-poly/blob/master/2018-10/s9-clustering2/seminar-clust2-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/4hqt/tA1nUFq3G  Семинар 10.] Введение в тематические модели'''  <br/>
 +
Частично проработанный [https://github.com/shestakoff/hse-ml-poly/blob/master/2018-10/s10-topic-modelling/seminar-topics-proc.ipynb ноутбук]  
 +
<br/>
 +
'''[https://cloud.mail.ru/public/DgSH/2uUd58zwg  Разбор коллоквиума.]'''  <br/>
 +
 
 +
'''[https://cloud.mail.ru/public/HV4k/k6Dmwim8V  Семинар 11.] Анализ сетевых структур'''  <br/>
 +
Частично проработанный [https://github.com/shestakoff/hse-ml-poly/blob/master/2018-10/s11-sna-intro/seminar-sna-intro-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/9bEX/nDQ8u6XbM  Семинар 12.] Cообщества в сетях'''  <br/>
 +
Частично проработанный [https://github.com/shestakoff/hse-ml-poly/blob/master/2018-10/s12-communities/seminar-sna-communities-proc.ipynb ноутбук]  
 +
 
 +
'''[https://cloud.mail.ru/public/AZ2X/vathduSDg  Семинар 13.] Рекомендашки'''  <br/>
 +
Частично проработанный [https://github.com/shestakoff/hse-ml-poly/blob/master/2018-10/s13-recsys-intro/seminar-recsys-proc.ipynb ноутбук]  
 +
 
 +
 
 +
<br/>
 +
 
 +
== Домашние задания ==
 +
 
 +
'''[https://cloud.mail.ru/public/NHt7/S32JLe6qM Задание 1]. Дедлайн - 2 Декабря 2018, 23:59 <br/>
 +
'''[https://cloud.mail.ru/public/21Xj/SBo1qMnA6 Задание 2]. Дедлайн - 9 Декабря 2018, 23:59 <br/>
 +
'''[https://cloud.mail.ru/public/6dJB/DBrDFr2Ad Задание 3]. Дедлайн - 8 Февраля 2019, 23:59 <br/>
 +
'''[https://cloud.mail.ru/public/LWCE/Eb1uiQ4nN Задание 4]. Дедлайн - 19 февраля 2019, 23:59
 +
 
 +
== Курсовой проект ==
 +
 
 +
В рамках курса студенты должны применить полученные знания для решения прикладной задачи. Размеры проектных групп 1-3 человека.
 +
 
 +
К 1 марта надо прислать ссылку на собранные данные для анализа и краткий план самого анализа и выполнения задач:
 +
# Какие будут шаги,
 +
# Какие методы использованы,
 +
# Что будет получено на выходе,
 +
# Как будет измерен результат
 +
 
 +
[https://docs.google.com/spreadsheets/d/1yzepgq1jU6idIYCvQFN3a8-1QwodeMAbeVFJzpysYTU/edit?usp=sharing Файл с группами]
 +
 
 +
Защита проекта будет проходить в виде презентации.
 +
 
 +
Вес проектной работы = 2 домашкам
 +
 
 +
Для вдохновения:
 +
# https://fivethirtyeight.com/
 +
# [https://cloud.mail.ru/public/3kgZ/A5ZcV2j3J Статьи]
 +
 
 +
== Плагиат ==
 +
Карается жестоко и на месте
 +
 
 +
== Дедлайны ==
 +
 
 +
Дедлайны по всем заданиям являются строгими (то есть после дедлайна работы приниматься не будут). <br/>
 +
Сроки сдачи могут быть сдвинуты в индивидуальном порядке в случае существования уважительных причин.
 +
 
 +
== Формат сдачи домашних заданий ==
 +
Практические ДЗ должны быть выполнены в Jupyter Notebook на языке Python 3. Файл должен успешно выполняться (кроме случаев нестыковки модулей) и содержать только релевантную информацию.<br/>
 +
Крайне желательно следовать правилам [https://www.python.org/dev/peps/pep-0008/ PEP8]
 +
 
 +
== Полезные Ссылки ==
 +
=== Machine learning ===
 +
* [https://habr.com/company/ods/blog/322626/ Открытый курс по МО]
 +
* Видео курс по анализу данных от CS Center [https://www.youtube.com/playlist?list=PLlb7e2G7aSpRb95_Wi7lZ-zA6fOjV3_l7 часть 1] и [https://www.youtube.com/playlist?list=PLlb7e2G7aSpT1ntsozWmWJ4kGUsUs141Y часть 2]
 +
* [https://github.com/esokolov/ml-course-hse Курс от Евгения Соколова]
 +
* [http://www.machinelearning.ru/wiki/index.php?title=Заглавная_страница machinelearning.ru]
 +
* [https://yandexdataschool.ru/edu-process/courses/machine-learning Видео лекции Воронцова К.Ю.]
 +
* [https://www.dataoptimal.com/wp-content/uploads/Data-Science-Books-for-2018.pdf Подборка книг по ML]
 +
* [http://web.stanford.edu/~hastie/local.ftp/Springer/ESLII_print10.pdf Elements of Statistical Learning (Trevor Hastie, Robert Tibshirani, Jerome Friedman)]
 +
 
 +
=== Python ===
 +
* Основные библиотеки и документация: [http://www.numpy.org/ NumPy], [http://pandas.pydata.org/ Pandas], [http://scikit-learn.org/stable/ SciKit-Learn], [http://matplotlib.org/ Matplotlib].
 +
* Краткое руководство: [http://nbviewer.ipython.org/gist/voron13e02/83a86f2e0fc5e7f8424d краткое руководство с примерами по Python 2]
 +
* Python from scratch: [http://nbviewer.ipython.org/gist/rpmuller/5920182 A Crash Course in Python for Scientists]
 +
* Lectures [https://github.com/jrjohansson/scientific-python-lectures#online-read-only-versions Scientific Python]
 +
* A book: [http://www.cin.ufpe.br/~embat/Python%20for%20Data%20Analysis.pdf Wes McKinney «Python for Data Analysis»]
 +
* [https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks Коллекция интересных IPython ноутбуков]

Текущая версия на 13:35, 26 августа 2022

Преподаватель - Шестаков Андрей
Форма обратной связи здесь
Оценки
Course repo
Telegram Group


Описание курса

Целью данного курса является изучение

  • Основных идеи и принципов машинного обучения с упором на их практическое применение
  • Методов сбора и анализа сложный структур данных

Предполагается, что слушатели прошли вводный курс по языку Python и имеют базовые знания по высшей математике (линейная алгебра, мат. анализ)

Программа курса

Курс оценивается за счет

  1. Тестов на занятиях
  2. Практических и теоретических домашних заданий
  3. Коллоквиума в конце 2го модуля
  4. Проектной работы
  5. Экзамена

Материалы лекций

Лекция 1. Введение
Slides

Лекция 2. Метрические методы и метрики качества классификации
Slides
FYI: Статистические тесты для сравнения качества моделей

Лекция 3. Деревья принятия решений. Случайный лес
Slides
FYI: beautiful trees intro
FYI: trees and random forest interpretation

Лекция 4. Линейные модели. Линейная регрессия
Slides
FYI: Интерпретация коэффициентов линейной модели
FYI: Курс по эконометрике от Демешева Б.Б.

Лекция 5. Логистическая регрессия. Методы отбора признаков
Slides

Лекция 6. Методы сжатия признаков. Введение в NLP
Slides

Лекция 7. NLP. Токенизация, лемматизация, LSA
Slides

Лекция 8. Методы кластеризации 1
Slides

Лекция 9. Методы кластеризации 2
Slides

Лекция 10. Введение в тематическое моделирование
Slides

Лекция 11. Введение в анализ сетевых структур
Slides

Лекция 12. Выявление сообществ на сети
Slides

Лекция 13. Введение в рекомендательные системы
Slides

Семинары

Семинар 1. Введение (повторение)
Частично проработанный ноутбук

Семинар 2. Метрические методы
Частично проработанный ноутбук

Семинар 3. Деревья принятия решений
Частично проработанный ноутбук

Семинар 4. Линейные модели, регрессия.
Частично проработанный ноутбук

Семинар 5. Линейные модели, классификация. Методы отбора признаков
Частично проработанный ноутбук

Семинар 6. Методы сжатия признаков
Частично проработанный ноутбук

Семинар 7. NLP
Частично проработанный ноутбук

Семинар 8. Кластеризация 1
Частично проработанный ноутбук

Семинар 9. Кластеризация 2
Частично проработанный ноутбук

Семинар 10. Введение в тематические модели
Частично проработанный ноутбук
Разбор коллоквиума.

Семинар 11. Анализ сетевых структур
Частично проработанный ноутбук

Семинар 12. Cообщества в сетях
Частично проработанный ноутбук

Семинар 13. Рекомендашки
Частично проработанный ноутбук



Домашние задания

Задание 1. Дедлайн - 2 Декабря 2018, 23:59
Задание 2. Дедлайн - 9 Декабря 2018, 23:59
Задание 3. Дедлайн - 8 Февраля 2019, 23:59
Задание 4. Дедлайн - 19 февраля 2019, 23:59

Курсовой проект

В рамках курса студенты должны применить полученные знания для решения прикладной задачи. Размеры проектных групп 1-3 человека.

К 1 марта надо прислать ссылку на собранные данные для анализа и краткий план самого анализа и выполнения задач:

  1. Какие будут шаги,
  2. Какие методы использованы,
  3. Что будет получено на выходе,
  4. Как будет измерен результат

Файл с группами

Защита проекта будет проходить в виде презентации.

Вес проектной работы = 2 домашкам

Для вдохновения:

  1. https://fivethirtyeight.com/
  2. Статьи

Плагиат

Карается жестоко и на месте

Дедлайны

Дедлайны по всем заданиям являются строгими (то есть после дедлайна работы приниматься не будут).
Сроки сдачи могут быть сдвинуты в индивидуальном порядке в случае существования уважительных причин.

Формат сдачи домашних заданий

Практические ДЗ должны быть выполнены в Jupyter Notebook на языке Python 3. Файл должен успешно выполняться (кроме случаев нестыковки модулей) и содержать только релевантную информацию.
Крайне желательно следовать правилам PEP8

Полезные Ссылки

Machine learning

Python