МОВС Сбор и разметка данных для МО (2022-23, 7 модуль) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (add seminar 1 recording)
Строка 35: Строка 35:
 
| style="background:#eaecf0;" | '''3'''  || Контроль качества данных: этапы и инструменты || 24.01.23 || [https://disk.yandex.ru/i/ECg-3a19PO-Pbg Лекция (асинхронно) в записи] || [[ Семинар (асинхронно) в записи]]
 
| style="background:#eaecf0;" | '''3'''  || Контроль качества данных: этапы и инструменты || 24.01.23 || [https://disk.yandex.ru/i/ECg-3a19PO-Pbg Лекция (асинхронно) в записи] || [[ Семинар (асинхронно) в записи]]
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' [[ Запись семинара]] || '''Кейс-стади''': работа с данными для CV || 31.01.23 || [https://disk.yandex.ru/d/tAFr9q9wn-nerQ Лекция (асинхронно) в записи] || "Автоматизация конвейера по сбору и разметке данных", ''Сергей Кошелев''
+
| style="background:#eaecf0;" | '''4''' || '''Кейс-стади''': работа с данными для CV || 31.01.23 || [https://disk.yandex.ru/d/tAFr9q9wn-nerQ Лекция (асинхронно) в записи] || [[ Семинар (асинхронно) в записи]]
 
|-
 
|-
 
| style="background:#eaecf0;" | '''5''' [[ Запись семинара]] || Агрегация полученных результатов: категориальная и попарная разметка || 07.02.23 || [https://disk.yandex.ru/i/bM7nQEPa18tnhw Лекция (асинхронно) в записи] || "Агрегация полученных результатов: категориальная и попарная разметка", ''Никита Павличенко''
 
| style="background:#eaecf0;" | '''5''' [[ Запись семинара]] || Агрегация полученных результатов: категориальная и попарная разметка || 07.02.23 || [https://disk.yandex.ru/i/bM7nQEPa18tnhw Лекция (асинхронно) в записи] || "Агрегация полученных результатов: категориальная и попарная разметка", ''Никита Павличенко''
Строка 54: Строка 54:
  
 
== Домашние задания ==
 
== Домашние задания ==
# Работа с платформой для сбора и разметки данных | Бюджет - $3
+
Ссылка на курс в Энитаске: https://anytask.org/course/994
 +
 
 +
Инвайт: ''ETfetfz''
 +
 
 +
# Работа с платформой для сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 24.01.23 23:59 МСК'''
 
# Автоматизация процесса сбора и разметки данных | Бюджет - $3
 
# Автоматизация процесса сбора и разметки данных | Бюджет - $3
 
# Контроль качества данных | Бюджет - $6
 
# Контроль качества данных | Бюджет - $6

Версия 13:45, 6 февраля 2023

О курсе

Занятия проводятся в Zoom по вторникам в 18:00

Контакты

Канал курса в TG: [channel link]

Чат курса в TG: [chat link]

Преподаватели: Смирнова Полина, Кошелев Сергей, Павличенко Никита, Куцев Роман

Ассистент Контакты
Максим Лутан @moai_monument

Материалы курса

Ссылка на плейлист курса на YouTube: [YouTube-playlist]

Ссылка на GitHub с материалами курса: GitHub repository

Занятие Тема Дата Материалы для самоподготовки к семинарам Семинар
1 Введение. Работа с данными в МО. 10.01.23 Лекция (асинхронно) в записи Без семинара
2 [Запись семинара] Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций. 17.01.23 Лекция (асинхронно) в записи "Работа с платформой для сбора и разметки данных", Сергей Кошелев
3 Контроль качества данных: этапы и инструменты 24.01.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи
4 Кейс-стади: работа с данными для CV 31.01.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи
5 Запись семинара Агрегация полученных результатов: категориальная и попарная разметка 07.02.23 Лекция (асинхронно) в записи "Агрегация полученных результатов: категориальная и попарная разметка", Никита Павличенко
6 Запись семинара Агрегация полученных результатов: агрегация сложных ответов 14.02.23 Лекция (асинхронно) в записи "Агрегация полученных результатов: агрегация сложных ответов", Никита Павличенко
7 Запись семинара Оптимизация процессов разметки: Human-in-the-loop и др. подходы 21.02.23 Лекция (асинхронно) в записи "Human-in-the-loop и др. подходы к оптимизации процессов разметки", Роман Куцев
8 Кейс-стади: работа с данными для Яндекс.Переводчика 28.02.23 Лекция (асинхронно) в записи Без семинара
9 Запись семинара Кейс-стади: работа с данными для Алисы 07.03.23 Лекция (асинхронно) в записи "Презентация проектов командами", Полина Смирнова & Никита Павличенко

Формула оценивания

Оценка = (ДЗ-1 (3 балла) + ДЗ-2 (3 балла) + ДЗ-3 (8 баллов) + ДЗ-4 (8 баллов) + ДЗ-5 (8 баллов) + Финальный проект (20 баллов)) / 5

Домашние задания

Ссылка на курс в Энитаске: https://anytask.org/course/994

Инвайт: ETfetfz

  1. Работа с платформой для сбора и разметки данных | Бюджет - $3 | Дедлайн - 24.01.23 23:59 МСК
  2. Автоматизация процесса сбора и разметки данных | Бюджет - $3
  3. Контроль качества данных | Бюджет - $6
  4. Агрегация данных | Без бюджета
  5. Агрегация данных | Без бюджета
  • Финальный проект (в группах по 3-4 человека) | Бюджет - $20 на команду

Литература

  1. Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
  2. Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.