Анализ данных в Python (Политологи 1 семестр 1-2 модули) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Rogovich (обсуждение | вклад) |
Rogovich (обсуждение | вклад) |
||
Строка 75: | Строка 75: | ||
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng] | * [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng] | ||
* [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers] | * [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers] | ||
+ | |||
+ | ==== Материала по ML ==== | ||
+ | * [https://www.kaggle.com/learn/machine-learning Simple Decision Tree] | ||
+ | * [https://books.google.ru/books?id=vbQlDQAAQBAJ&dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&hl=ru&source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists] | ||
+ | |||
+ | ====Статистика==== | ||
+ | * Бослав С. Статистика для всех (Есть в библиотеке) | ||
+ | * Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке) | ||
==== Web scraping ==== | ==== Web scraping ==== | ||
* [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs] | * [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs] |
Версия 13:00, 21 ноября 2018
О курсе
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
Организаторы
Лектор и семинарист: Рогович Татьяна Владимировна
Ассистент: Гергель Анастасия Игоревна
Материалы курса
Лекции
№ | Дата лекции | Тема | Презентация |
---|---|---|---|
1 | 4 сентября 2018 г. | Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python | Лекция 1 |
2 | 6 сентября 2018 г. | Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними | см. материалы к семинару |
3 | 20 сентября 2018 г. | Введение в Pandas: Базовые принципы работы модуля | Pandas Cheat Sheet |
Семинары
Самостоятельные работы и домашнее задание
№ | Тип | Дедлайн | Папка для ответов | Результаты | Комментарии |
---|---|---|---|---|---|
1 | Домашнее задание №1 | 23.59 7.10.18 | ДЗ 1 | Результаты ДЗ 1 | Комментарии ДЗ 1 |
2 | Домашнее задание №2 | 23.59 18.11.18 | Ответы высылать на почту | ||
3 | Домашнее задание №3 | TBA |
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
Материалы
Опрос
Порядок формирования оценок
- Оценка за курс накопительная, экзамен не проводится.
- Предусмотрена защита проекта во время сессии.
- Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
- Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)