Python для сбора и анализа данных КНАД 22/23 — различия между версиями
Serggor (обсуждение | вклад) |
Serggor (обсуждение | вклад) |
||
Строка 21: | Строка 21: | ||
==Семинары== | ==Семинары== | ||
− | Пятница 13:00 – 14:20, [https://us06web.zoom.us/j/87433550226?pwd=RWtRc1YwUTdnWGtPWEJ4cnBXNVh3QT09 | + | Пятница 13:00 – 14:20, [https://us06web.zoom.us/j/87433550226?pwd=RWtRc1YwUTdnWGtPWEJ4cnBXNVh3QT09 zoom 222 (Денис)] [https://us06web.zoom.us/j/83134885209?pwd=NHpnc3JoZGtqT2g5WStKN1kzOFBaUT09 zoom 221 (Михаил)] |
+ | |||
+ | [https://github.com/sanityseeker/lspy-2023 GitHub 222 группы (Денис)] | ||
1. '''13 января''' Продолжение лекции по numpy [https://colab.research.google.com/drive/1ji_2UDhQFlvq6sDUm6XObR8IGg-KCCM9?usp=sharing colab] | 1. '''13 января''' Продолжение лекции по numpy [https://colab.research.google.com/drive/1ji_2UDhQFlvq6sDUm6XObR8IGg-KCCM9?usp=sharing colab] | ||
Строка 31: | Строка 33: | ||
4. '''3 февраля''' Практика построения визуализаций с помощью matplotlib и plotly [https://colab.research.google.com/drive/1XL-pkSCZ1lJ8lCxF2aBRGYQtiJlySUfl?usp=sharing задачи] | 4. '''3 февраля''' Практика построения визуализаций с помощью matplotlib и plotly [https://colab.research.google.com/drive/1XL-pkSCZ1lJ8lCxF2aBRGYQtiJlySUfl?usp=sharing задачи] | ||
− | |||
==Домашнее задание== | ==Домашнее задание== |
Версия 04:47, 3 февраля 2023
Содержание
Записи занятий
https://disk.yandex.ru/d/jWp8yYwALIy8AQ
Вики-страница курса "Программирование на Python", 1 модуль
Лекции
Вторник 13:00 – 14:20, zoom
1. 10 января Модуль numpy. Основные операции для работы с numpy.array. презентация colab
2. 17 января Модуль pandas. series и работа с одним датафреймом colab, первый пункт
3. 24 января Вопросы производительности. GIL. Работа в Pandas с несколькими таблицами презентация colab colab performance
4. 31 января Визуализация данных в Python magic в jupyter matplotlib1 matplotlib2 pandas_plot plotly seaborn
Семинары
Пятница 13:00 – 14:20, zoom 222 (Денис) zoom 221 (Михаил)
1. 13 января Продолжение лекции по numpy colab
2. 20 января Решение задач на numpy упражнения отсюда начиная с 9го
3. 27 января Решение задач на pandas. Решение задач на применение функций к датафреймам, работу с несколькими датафреймами. Сравнение производительности операций задачи
4. 3 февраля Практика построения визуализаций с помощью matplotlib и plotly задачи
Домашнее задание
Сдача задач проводится в anytask, инвайты в закреплённом сообщении телеграм чата. Максимум за одно дз – 10 баллов, по решению проверяющего могут быть добавлены бонусные баллы за изящные решения. Указанный в anytask максимальный балл – чисто формальное ограничение, оно больше, чем наш максимум, ибо в него входят бонусные баллы.
Ваше задание может быть проверено и возвращено на доработку на усмотрение преподавателя.
1. numpy. Дедлайн 24.01.2022 10:30. Максимум без учёта бонусов – 10 баллов
2. pandas. Дедлайн 31.01.2022 10:30. Максимум без учёта бонусов – 10 баллов
3. join. Дедлайн 07.02.2022 10:30. Максимум без учёта бонусов – 10 баллов
4. visualization. Дедлайн 14.02.2022 10:30. Максимум без учёта бонусов – 10 баллов
Оценивание
Накоп = МИНИМУМ((ДЗ1 + ДЗ2 + ДЗ3 + ДЗ4 + ДЗ5 + ДЗ6 + Пр) / 6, 10)
Итог = 0.7 * Накоп + 0.3 * экз
Автомат = Накоп если Накоп >= 6 и есть желание получить автомат
Рекомендуемая основная литература
1. Python для анализа данных – курс от МФТИ и Mail.Ru Group
2. Hadoop. Система для обработки больших объемов данных
3. Основы SQL – курс Андрея Созыкина
4. Курс Техносферы Методы распределенной обработки больших объемов данных в Hadoop
5. https://numpy.org/, https://pandas.pydata.org/, https://matplotlib.org/
Рекомендуемая дополнительная литература
1. https://mrjob.readthedocs.io/en/latest/
2. Devpractice Team. Python. Визуализация данных. Matplotlib. Seaborn. Mayavi.