Python для сбора и анализа данных КНАД 25/26
Содержание
Преподаватели, учебные ассистенты и ссылки
| Группы | БКНАД251 | БКНАД252 | БКНАД253 |
|---|---|---|---|
| Лектор | Горшков Сергей Сергеевич | ||
| Семинаристы | Потапов Иван Андреевич | Береснева Екатерина Николаевна | |
| Ассистенты | Дима Проскуряков | Сахават Биннатов | Алика Сидорова |
| Ассистент Лектора | Сахават Биннатов | ||
Форма обратной связи. Можно заполнять когда угодно с любыми вопросами
Лекции
Четверг 11:10 – 12:30
| № | Дата | Тема | Материалы |
|---|---|---|---|
| 1 | 16 января | Модуль numpy. Основные операции для работы с numpy.array. | Презентация Ноутбук |
| 2 | 22 января | Модуль pandas. | Ноутбук |
| 3 | 29 января | Параллельность: GIL, многопоточность, многопроцессность, синхронизация. | параллельностьcolab performance презентация |
| 4 | 5 февраля | Визуализация данных в Python | matplotlib1 matplotlib2 pandas_plot plotly seaborn magic в jupyter |
| 5 | 12 февраля | SQL | презентация |
Семинары
Код семинаров github
Домашнее задание
Сдача и оценивание
Сдача задач проводится в anytask, инвайты будут опубликованы в телеграм-канале курса.
Максимум за одно ДЗ – 10 баллов. По решению проверяющего могут быть добавлены бонусные баллы за изящные решения.
Указанный в anytask максимальный балл – чисто формальное ограничение платформы: он больше, чем наш максимум, так как в него входят возможные бонусные баллы.
Дедлайны
Ко всем заданиям применяется система мягких и жёстких дедлайнов.
В таблице ДЗ ниже для каждого задания указаны и мягкий, и жёсткий дедлайн.
За каждый день просрочки начисляется штраф –1 балл.
Если работа сдана после жёсткого дедлайна без уважительной причины – за неё ставится 0.
При этом у вас есть одна возможность досдать ДЗ до жёсткого дедлайна без штрафа.
| № | Задание | Мягкий дедлайн | Жёсткий дедлайн |
|---|---|---|---|
| 1 | numpy | 25.01.2026 23:59 | 28.01.2026 23:59 |
| 2 | pandas | 03.02.2026 23:59 | 06.02.2026 23:59 |
| 3 | join | 08.02.2026 23:59 | 11.02.2026 23:59 |
| 4 | visualization | 12.02.2026 23:59 | 15.02.2026 23:59 |
Оценивание
| Показатель | Формула |
|---|---|
| Накоп | МИНИМУМ((ДЗ1 + ДЗ2 + ДЗ3 + ДЗ4 + ДЗ5 + ДЗ6 + ДЗ7 + ДЗ8) / 8, 10)
|
| Итог | ОКРУГЛЕНИЕ(0.7 * Накоп + 0.3 * экз)
|
| Автомат | Накоп, если Накоп >= 6 и есть желание получить автомат
|
Рекомендуемая основная литература
- Hadoop. Система для обработки больших объемов данных
- Основы SQL – курс Андрея Созыкина
- Курс Техносферы: методы распределенной обработки больших объемов данных в Hadoop
- NumPy
- pandas
- Matplotlib
Рекомендуемая дополнительная литература
- MRJob documentation
- Devpractice Team. Python. Визуализация данных. Matplotlib. Seaborn. Mayavi.
- ITCookies: Python
- О функции apply в pandas