МОВС Сбор и разметка данных для МО (2022-23, 7 модуль) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
м (hw6) |
|||
(не показано 7 промежуточных версии этого же участника) | |||
Строка 33: | Строка 33: | ||
|- | |- | ||
− | | style="background:#eaecf0;" | '''3''' || Контроль качества данных: этапы и инструменты || 24.01.23 || [https://disk.yandex.ru/i/ECg-3a19PO-Pbg Лекция (асинхронно) в записи] || [ | + | | style="background:#eaecf0;" | '''3''' || Контроль качества данных: этапы и инструменты || 24.01.23 || [https://disk.yandex.ru/i/ECg-3a19PO-Pbg Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/C6qrfBiXNG4xtw Семинар (асинхронно) в записи] |
|- | |- | ||
− | | style="background:#eaecf0;" | '''4''' || '''Кейс-стади''': работа с данными для CV || 31.01.23 || [https://disk.yandex.ru/d/tAFr9q9wn-nerQ Лекция (асинхронно) в записи] || [ | + | | style="background:#eaecf0;" | '''4''' || '''Кейс-стади''': работа с данными для CV || 31.01.23 || [https://disk.yandex.ru/d/tAFr9q9wn-nerQ Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/fKMOBYVDA_lqtg Семинар (асинхронно) в записи] -- онлайн-занятие сорвалось |
|- | |- | ||
− | | style="background:#eaecf0;" | | + | | style="background:#eaecf0;" | Не состоялось || || 07.02.23 || |
|- | |- | ||
− | | style="background:#eaecf0;" | ''' | + | | style="background:#eaecf0;" | '''5''' || Агрегация полученных результатов: категориальная и попарная разметка || 14.02.23 || [https://disk.yandex.ru/i/bM7nQEPa18tnhw Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/1XTltKy5W9NhSA Семинар (асинхронно) в записи] -- никто не пришел на фан-встречу |
|- | |- | ||
− | | style="background:#eaecf0;" | ''' | + | | style="background:#eaecf0;" | '''6''' || Агрегация полученных результатов: агрегация сложных ответов|| 21.02.23 || [https://disk.yandex.ru/i/NvlZoh4J78h4VQ Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/Vycpsdo5Nva84A Семинар (асинхронно) в записи] -- снова никого не было :( |
|- | |- | ||
− | | style="background:#eaecf0;" | ''' | + | | style="background:#eaecf0;" | '''7''' [[ Запись семинара]] || Оптимизация процессов разметки: Human-in-the-loop и др. подходы || 28.02.23 || [https://disk.yandex.ru/i/utjAhMUZ7IFIuA Лекция (асинхронно) в записи] || "Human-in-the-loop и др. подходы к оптимизации процессов разметки", ''Роман Куцев'' |
|- | |- | ||
− | | style="background:#eaecf0;" | '''9''' [[ Запись семинара]] || '''Кейс-стади: ''' работа с данными для Алисы || | + | | style="background:#eaecf0;" | '''8''' || '''Кейс-стади: ''' работа с данными для Яндекс.Переводчика || 07.02.23 || [https://disk.yandex.ru/i/o7M714-8XioBDg Лекция (асинхронно) в записи] || Без семинара |
+ | |- | ||
+ | | style="background:#eaecf0;" | '''9''' [[ Запись семинара]] || '''Кейс-стади: ''' работа с данными для Алисы || 14.03.23 || [https://disk.yandex.ru/i/GG2_VBfP0Ex4 Лекция (асинхронно) в записи]|| "Презентация проектов командами", ''Полина Смирнова & Никита Павличенко'' | ||
|- | |- | ||
|} | |} | ||
Строка 51: | Строка 53: | ||
==Формула оценивания== | ==Формула оценивания== | ||
− | Оценка = <big>(</big>ДЗ-1<small> (3 балла)</small> + ДЗ-2<small> (3 балла)</small> + ДЗ-3<small> (8 баллов)</small> + ДЗ-4<small> (8 баллов)</small> + ДЗ-5<small> (8 баллов)</small> + | + | Оценка = <big>(</big>ДЗ-1<small> (3 балла)</small> + ДЗ-2<small> (3 балла)</small> + ДЗ-3<small> (8 баллов)</small> + ДЗ-4<small> (8 баллов)</small> + ДЗ-5<small> (8 баллов)</small> + ДЗ-6 <small> (20 баллов)</small><big>)</big> / 5 |
== Домашние задания == | == Домашние задания == | ||
Строка 59: | Строка 61: | ||
# Работа с платформой для сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 24.01.23 23:59 МСК''' | # Работа с платформой для сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 24.01.23 23:59 МСК''' | ||
− | # Автоматизация процесса сбора и разметки данных | Бюджет - $3 | + | # Автоматизация процесса сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 18.02.23 (Сб) 23:59''' |
− | # Контроль качества данных | Бюджет - $6 | + | # Контроль качества данных | Бюджет - $6 | '''Дедлайн - 21.02.23 (Вт) 23:59''' |
− | # Агрегация данных | Без бюджета | + | # Агрегация данных | Без бюджета | '''Дедлайн''' - <strike>28.02.23 (Вт)</strike> '''10.03.23 (Пт) 23:59''' |
− | # Агрегация данных | Без бюджета | + | # Агрегация данных | Без бюджета | '''Дедлайн - 16.03.23 (Пн) 23:59''' |
− | + | # Финальный самостоятельный мини-проект | Бюджет - $10 | '''Дедлайн - 24.03.23 (Пт) 23:59''' | |
− | + | ||
== Литература == | == Литература == | ||
# Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019 | # Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019 | ||
# Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022. | # Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022. |
Текущая версия на 21:24, 28 марта 2023
Содержание
О курсе
Занятия проводятся в Zoom по вторникам в 18:00
Контакты
Канал курса в TG: [channel link]
Чат курса в TG: [chat link]
Преподаватели: Смирнова Полина, Кошелев Сергей, Павличенко Никита, Куцев Роман
Ассистент | Контакты |
---|---|
Максим Лутан | @moai_monument |
Материалы курса
Ссылка на плейлист курса на YouTube: [YouTube-playlist]
Ссылка на GitHub с материалами курса: GitHub repository
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Семинар |
---|---|---|---|---|
1 | Введение. Работа с данными в МО. | 10.01.23 | Лекция (асинхронно) в записи | Без семинара |
2 [Запись семинара] | Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций. | 17.01.23 | Лекция (асинхронно) в записи | "Работа с платформой для сбора и разметки данных", Сергей Кошелев |
3 | Контроль качества данных: этапы и инструменты | 24.01.23 | Лекция (асинхронно) в записи | Семинар (асинхронно) в записи |
4 | Кейс-стади: работа с данными для CV | 31.01.23 | Лекция (асинхронно) в записи | Семинар (асинхронно) в записи -- онлайн-занятие сорвалось |
Не состоялось | 07.02.23 | |||
5 | Агрегация полученных результатов: категориальная и попарная разметка | 14.02.23 | Лекция (асинхронно) в записи | Семинар (асинхронно) в записи -- никто не пришел на фан-встречу |
6 | Агрегация полученных результатов: агрегация сложных ответов | 21.02.23 | Лекция (асинхронно) в записи | Семинар (асинхронно) в записи -- снова никого не было :( |
7 Запись семинара | Оптимизация процессов разметки: Human-in-the-loop и др. подходы | 28.02.23 | Лекция (асинхронно) в записи | "Human-in-the-loop и др. подходы к оптимизации процессов разметки", Роман Куцев |
8 | Кейс-стади: работа с данными для Яндекс.Переводчика | 07.02.23 | Лекция (асинхронно) в записи | Без семинара |
9 Запись семинара | Кейс-стади: работа с данными для Алисы | 14.03.23 | Лекция (асинхронно) в записи | "Презентация проектов командами", Полина Смирнова & Никита Павличенко |
Формула оценивания
Оценка = (ДЗ-1 (3 балла) + ДЗ-2 (3 балла) + ДЗ-3 (8 баллов) + ДЗ-4 (8 баллов) + ДЗ-5 (8 баллов) + ДЗ-6 (20 баллов)) / 5
Домашние задания
Ссылка на курс в Энитаске: https://anytask.org/course/994
Инвайт: ETfetfz
- Работа с платформой для сбора и разметки данных | Бюджет - $3 | Дедлайн - 24.01.23 23:59 МСК
- Автоматизация процесса сбора и разметки данных | Бюджет - $3 | Дедлайн - 18.02.23 (Сб) 23:59
- Контроль качества данных | Бюджет - $6 | Дедлайн - 21.02.23 (Вт) 23:59
- Агрегация данных | Без бюджета | Дедлайн -
28.02.23 (Вт)10.03.23 (Пт) 23:59 - Агрегация данных | Без бюджета | Дедлайн - 16.03.23 (Пн) 23:59
- Финальный самостоятельный мини-проект | Бюджет - $10 | Дедлайн - 24.03.23 (Пт) 23:59
Литература
- Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
- Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.