МОВС Сбор и разметка данных для МО (2022-23, 7 модуль)
Материал из Wiki - Факультет компьютерных наук
Версия от 07:08, 18 января 2023; SavelyProkhorov (обсуждение | вклад)
Содержание
О курсе
Занятия проводятся в Zoom по вторникам в 18:00
Контакты
Канал курса в TG: [channel link]
Чат курса в TG: [chat link]
Преподаватели: Смирнова Полина, Кошелев Сергей, Павличенко Никита, Куцев Роман
Ассистент | Контакты |
---|---|
Максим Лутан | @moai_monument |
Материалы курса
Ссылка на плейлист курса на YouTube: [YouTube-playlist]
Ссылка на GitHub с материалами курса: GitHub repository
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Семинар |
---|---|---|---|---|
1 | Введение. Работа с данными в МО. | 10.01.23 | Лекция (асинхронно) в записи | Без семинара |
2 [Запись семинара] | Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций. | 17.01.23 | Лекция (асинхронно) в записи | "Работа с платформой для сбора и разметки данных", Сергей Кошелев |
3 | Контроль качества данных: этапы и инструменты | 24.01.23 | Лекция (асинхронно) в записи | Семинар (асинхронно) в записи |
4 Запись семинара | Кейс-стади: работа с данными для CV | 31.01.23 | Лекция (асинхронно) в записи | "Автоматизация конвейера по сбору и разметке данных", Сергей Кошелев |
5 Запись семинара | Агрегация полученных результатов: категориальная и попарная разметка | 07.02.23 | Лекция (асинхронно) в записи | "Агрегация полученных результатов: категориальная и попарная разметка", Никита Павличенко |
6 Запись семинара | Агрегация полученных результатов: агрегация сложных ответов | 14.02.23 | Лекция (асинхронно) в записи | "Агрегация полученных результатов: агрегация сложных ответов", Никита Павличенко |
7 Запись семинара | Оптимизация процессов разметки: Human-in-the-loop и др. подходы | 21.02.23 | Лекция (асинхронно) в записи | "Human-in-the-loop и др. подходы к оптимизации процессов разметки", Роман Куцев |
8 | Кейс-стади: работа с данными для Яндекс.Переводчика | 28.02.23 | Лекция (асинхронно) в записи | Без семинара |
9 Запись семинара | Кейс-стади: работа с данными для Алисы | 07.03.23 | Лекция (асинхронно) в записи | "Презентация проектов командами", Полина Смирнова & Никита Павличенко |
Формула оценивания
Оценка = (ДЗ-1 (3 балла) + ДЗ-2 (3 балла) + ДЗ-3 (8 баллов) + ДЗ-4 (8 баллов) + ДЗ-5 (8 баллов) + Финальный проект (20 баллов)) / 5
Домашние задания
- Работа с платформой для сбора и разметки данных | Бюджет - $3
- Автоматизация процесса сбора и разметки данных | Бюджет - $3
- Контроль качества данных | Бюджет - $6
- Агрегация данных | Без бюджета
- Агрегация данных | Без бюджета
- Финальный проект (в группах по 3-4 человека) | Бюджет - $20 на команду
Литература
- Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
- Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.