Анализ данных в Python (Политологи 1 семестр 1-2 модули)
Материал из Wiki - Факультет компьютерных наук
О курсе
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
Организаторы
Лектор и семинарист: Рогович Татьяна Владимировна
Ассистент: Гергель Анастасия Игоревна
Материалы курса
Лекции
№ | Дата лекции | Тема | Презентация |
---|---|---|---|
1 | 4 сентября 2018 г. | Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python | Лекция 1 |
2 | 6 сентября 2018 г. | Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними | см. материалы к семинару |
3 | 20 сентября 2018 г. | Введение в Pandas: Базовые принципы работы модуля | Pandas Cheat Sheet |
4 | 15 ноября 2018 г. | Введение в Machine Learning. Решающие деревья. | Лекция |
5 | 22 ноября 2018 г. | Анализ текстов | Лекция |
Семинары
Самостоятельные работы и домашнее задание
№ | Тип | Дедлайн | Папка для ответов | Результаты | Комментарии |
---|---|---|---|---|---|
1 | Домашнее задание №1 | 23.59 7.10.18 | ДЗ 1 | Результаты ДЗ 1 | |
2 | Домашнее задание №2 | 23.59 18.11.18 | Ответы высылать на почту | Результаты ДЗ 2 | Фидбэк |
3 | Домашнее задание №3 | 23.59 12.12.18 | Ответы высылать на почту |
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
Проект
Дедлайн 20 декабря 12.00
Информаци об итоговом проекте
Запись на экзамен
Материалы
Опрос
Порядок формирования оценок
- Оценка за курс накопительная, экзамен не проводится.
- Предусмотрена защита проекта во время сессии.
- Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
- Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)