Введение в программирование 25/26 — различия между версиями
Ekononova (обсуждение | вклад) (→Проект) |
Ekononova (обсуждение | вклад) (→Проект) |
||
| Строка 143: | Строка 143: | ||
Проект необходимо оформить в формате '''Jupyter Notebook'''. | Проект необходимо оформить в формате '''Jupyter Notebook'''. | ||
| − | Загрузите ссылку на файл проекта и файл набора данных через эту форму: [ | + | Загрузите ссылку на файл проекта и файл набора данных через эту форму: [https://forms.gle/co6HqqcR153qw7yz5 форма для сдачи проекта]. |
Выбрав набор данных для проекта, отправьте его в эту форму: [https://forms.gle/CbbVXsQsDigiMkFp7 форма выбора датасета]. | Выбрав набор данных для проекта, отправьте его в эту форму: [https://forms.gle/CbbVXsQsDigiMkFp7 форма выбора датасета]. | ||
Версия 16:12, 6 ноября 2025
Содержание
О курсе
Курс читается для студентов 2-го курса майнора ИАД в 1-2 модулях.
Лектор - Вознесенская Тамара Васильевна
Полезные ссылки
Общая таблица с оценками и контестами (кондуит 2025)
Преподаватели и учебные ассистенты
| Группа | Преподаватель | Время занятия | Учебные ассистенты | Ссылка на чат в тг |
|---|---|---|---|---|
| Лекции | Вознесенская Тамара Васильевна | 09:30-10:50 | Хчоян Вильсон Амаякович | Лекции |
| ИАД-1 | Вознесенская Тамара Васильевна | 11:10-12:30 | Чернова Алла Андреенва | ИАД-1 |
| ИАД-2 | Вознесенская Тамара Васильевна | 13:00-14:20 | Пекерская Даниэла Михайловна | ИАД-2 |
| ИАД-3 | Вознесенская Тамара Васильевна | 14:40-16:00 | Катаев Максим Вячеславович | ИАД-3 |
| ИАД-4 | Смоленчук Иван Константинович | 11:10-12:30 | Курченко Михаил Алексеевич | ИАД-4 |
| ИАД-5 | Смоленчук Иван Константинович | 13:00-14:20 | Белаш Валерия Андреевна | ИАД-5 |
| ИАД-6 | Абасканов Аскар | 13:00-14:20 | Левченко Александр | ИАД-6 |
| ИАД-7 | Абасканов Аскар | 14:40-16:00 | Семенов Иван Дмитриевич | ИАД-7 |
| ИАД-8 | Присталов Ярослав Алексеевич | 18:10-19:30 | Милосердов Даниил | ИАД-8 |
| ИАД-9 | Присталов Ярослав Алексеевич | 13:00-14:20 | Бичурина Елизавета Петровна | ИАД-9 |
| ИАД-10 | Ярцев Михаил Сергеевич | 13:00-14:20 | Клычева Карина | ИАД-10 |
Правила оценивания
Итоговая оценка рассчитывается по формуле:
Итоговая = 0.25 * КР + 0.1 * Контесты + 0.25 * Проект + 0.3 * Экзамен + 0.1 * Bonus
Контесты = 10 * (НБ / Бmax)
- НБ — набранные баллы,
- Бmax — максимальное возможное число баллов.
Задания берутся в основном из онлайн-курса.
Bonus (<=10) — бонусы, раздаваемые семинаристами, в итоге нормируются по 10-балльной шкале.
Студенты могут выборочно приглашаться на защиту любого элемента контроля. В случае отказа элемент контроля обнуляется.
В случае плагиата одна задача обнуляет всю работу.
Округляется только итоговая оценка по следующим правилам:
- 4 начинается с 4.00
- 9 и 10 начинаются с 8.90 и 9.90 соответственно
- для остальных оценок: 0.50 округляется вниз, 0.51 и выше — вверх
Контрольная
Контрольная пройдет с использованием асинхронного прокторинга 22 октября в 10:00.
В 10:00 всем нужно зайти в лекционный zoom для финального инструктажа, далее этот zoom будет использоваться как чат для общения с преподавателями во время контрольной в случае необходимости.
Каждому студенту необходимо записать процесс выполнения заданий контрольной с использованием OBS Studio, выложить результат в облачное хранилище сразу после контрольной и предоставить ссылку на запись. Ваши видео будут просмотрены только преподавателями и ассистентами, после выставления оценок видео можно будет удалить (об этом будет сообщено дополнительно).
Контест стартует в 10:20, завершается в 11:50. Ссылка на контест будет выдана в начале контрольной.
В 10:15, за 5 минут до начала контрольной начните запись.
Опоздавшие студенты (начавшие запись не до начала контрольной) будут дисквалифицированы.
Студенты, столкнувшиеся с техническими проблемами, должны сообщить об этом до контрольной своему учебному ассистенту или семинаристу. Если проблему устранить не получилось, то необходимо зайти в другой zoom по ссылке и писать контрольную под наблюдением (будьте готовы к дальнейшей защите своих решений) в режиме демонстрации своего экрана.
Запись
- Потребуется компьютер с веб-камерой и микрофоном (в частности, все современные ноутбуки оборудованы ими) и выходом в интернет
- Необходимо установить OBS Studio по ссылке https://obsproject.com/ru
- Необходимо настроить три источника входных потоков: микрофон, веб-камера и захват экрана. Подробнее о настройке в видео: https://www.youtube.com/watch?v=KVKrvPvPLYg
Пожалуйста, заранее проверьте, что вы научились записывать видео в требуемом формате (MKV, MP4)- этот процесс иногда может вызывать проблемы. Все решения проблем, связанных с записью в OBS Studio описаны в интернете.
Во время контрольной разрешается пользоваться :
- Сайтом тестирующей системы (только вкладкой с контрольной)
- Средой разработки (не онлайн, а заранее установленной на компьютере). Открыть новый чистый проект, не содержащий решений каких-либо задач. Если ваша среда имеет функцию AI-помощника, то отключить ее.
- Презентациями лекций (ссылки в кондуите)
- Этим конспектом онлайн-курса
- Семинарскими тетрадками (ссылки в кондуите)
- Документацией на https://docs.python.org/
Во время контрольной не разрешается:
- Общение с другими людьми, заранее предупредите об этом тех людей, которые находятся с вами в месте написания контрольной
- использование любых средств коллективной работы (Collab тоже запрещен) и онлайн ресурсов (кроме разрешенных выше)
Действия, которые вы должны совершить до контрольной:
- Заранее отключить все мессенджеры и закрыть лишние вкладки
- Физически отключить и удалить любые электронные устройства и дополнительные мониторы с рабочего места
- Подготовиться к тому, что вы не сможете покидать рабочее место в течение 1.5 часов
- Включить запись из трех источников: экран, веб-камера и микрофон в OBS Studio
- Снять свое рабочее место со всех сторон и его окружение
- Показать с помощью Диспетчера задач/ Activity Monitor, какие приложения работают на Вашем компьютере
- Показать чистые листы, которые вы планируете использовать в качестве черновиков
Порядок действий во время контрольной:
- Любые вопросы вы должны задавать через чат в zoom.
- В случае, если вы работаете с черновиком, направьте веб-камеру так, чтобы были видны ваши руки. Не забудьте направить веб-камеру на лицо, когда вы возвращаетесь к работе за компьютером.
- В случае, если вы хотите досрочно завершить выполнение контрольной - напишите об этом сообщение в чат соответствующего зума и выполните все действия, которые вы должны выполнить после окончания контрольной. В случае попыток решения задач после этого сообщения вы будете дисквалифицированы.
После окончания контрольной:
- В течение 30 минут необходимо разместить видео, которое вы записывали в течение контрольной, в открытом доступе и заполнить форму.
- В случае слишком медленного интернета и невозможности загрузить видео в течение 30 минут заполните форму дважды: первый раз (в течение 30 мин.) укажите размер видео-файла с точностью до байта. Второй раз укажите ссылку на видео.
Проект
Команда: 2 человека. (В описании необходимо чётко указать, кто какую часть делал).
Deadline: 05 декабря, 23:59.
Проект необходимо оформить в формате Jupyter Notebook.
Загрузите ссылку на файл проекта и файл набора данных через эту форму: форма для сдачи проекта.
Выбрав набор данных для проекта, отправьте его в эту форму: форма выбора датасета.
При выборе набора данных сверьтесь с таблицей с ответами формы, чтобы убедиться, что ваш набор данных ещё не выбран другими студентами.
Структура проекта
В рамках проекта необходимо выбрать набор данных и выполнить разведочный анализ данных (Exploratory Data Analysis, EDA). Проект должен быть оформлен в виде отчёта, демонстрирующего предпринятые шаги и полученную информацию о данных. Формат — тетрадка Jupyter Notebook.
Ваш проект должен содержать следующее: 1. Описательные статистики как минимум для трёх числовых полей (среднее значение, медиана, стандартное отклонение). 2. Очистку данных. Удалите строки с NaN или замените их на значения по вашему выбору (обязательно поясните выбор). Проверьте типы данных. Если данные уже чистые, продемонстрируйте это. 3. Визуализацию как минимум для трёх числовых полей. Используйте три разных типа графиков (гистограммы, линейные графики, диаграммы рассеяния и т.д.). 4. Детальный анализ как минимум двух графиков: сравнения подмножеств, несколько линий/серий на одном графике, два графика рядом и т.п. 5. Формулировку и проверку не менее двух гипотез. Сформулируйте гипотезы, постройте соответствующие графики и/или рассчитайте статистики. При необходимости выполните преобразования данных. 6. Преобразование данных. Создайте несколько новых переменных и проверьте гипотезы с их использованием. 7. Пояснения. Каждый этап сопровождайте описанием: что вы делаете и зачем.
Вся визуализация должна быть выполнена с помощью Matplotlib, Seaborn, Pandas или Plotly.
Критерии оценивания
- Описательные статистики — до 0.5 балла
- Очистка данных — до 0.5 балла
- Преобразование данных — до 0.5 балла
- Простые графики — до 0.5 балла
- Сложные графики (сравнения) — до 1 балла
- Проверка гипотез — до 1 балла
- Качество пояснений и формулировок — до 1 балла
- Защита проекта — до 5 баллов
Dataset
Рекомендуется использовать набор данных с сайта kaggle.com. Выберите набор данных как минимум с тремя числовыми полями. Категориальные переменные можно преобразовать в числовые (например, «месяц», «уровень образования», «место в рейтинге»). Примеры числовых полей: «возраст», «стоимость», «общее расстояние в км», «количество заказов».
Очистка данных
Проверьте основные статистики и определите необходимость очистки данных. Удалите или замените NaN, устраните несогласованные значения (например, «1M+», «10k+», «1k+» → «1000000», «10000», «1000»). Проверьте корректность типов данных и формат чисел.
Overview
Проект должен отражать процесс исследования данных. Начните с общего представления: какие данные вы используете, какие поля есть в наборе данных. Постройте простые графики и выведите описательные статистики, чтобы показать общие закономерности.
More detailed overview
Исследуйте взаимосвязи между переменными. Если есть категориальные данные, рассмотрите различные категории по отдельности (например, медианная зарплата для разных уровней образования). Если несколько переменных могут быть связаны, визуализируйте их вместе (например, добавьте третью ось в виде цвета или размера маркера).
Проверка гипотез
Сформулируйте как минимум две гипотезы и проверьте их с помощью графиков или расчётов. Примеры:
- «Зависит ли зарплата от уровня образования?»
- «Автомобили с автоматической коробкой передач дороже машин с механической при одинаковом пробеге?»
Формальные статистические тесты не обязательны — достаточно наглядных визуальных и численных аргументов.
Преобразование данных
Добавьте не менее двух новых переменных. Примеры:
- показатель эффективности: продажи / зарплата
- доход с поправкой на инфляцию
- преобразование категориальных переменных («бакалавр» → 2, «магистр» → 3)
- преобразование единиц (мили → км, °C → °F и т.д.)
Пояснения
Каждый шаг сопровождайте текстом с объяснением: что делаете, зачем и какие выводы получили. Объясняйте видимые на графиках зависимости, не спекулируя о причинах.
Например: «На диаграмме рассеяния видно, что с ростом пробега цена автомобиля уменьшается».
В конце добавьте резюме проекта: о чём ваш dataset, какие зависимости и закономерности вы обнаружили, какие гипотезы подтвердились.