МОВС Сбор и разметка данных для МО (2022-23, 7 модуль) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(create page)
 
м (hw6)
 
(не показано 10 промежуточных версии этого же участника)
Строка 1: Строка 1:
 
==О курсе==
 
==О курсе==
  
Занятия проводятся в [ Zoom] '''по вторникам в 18:00'''
+
Занятия проводятся в [https://us06web.zoom.us/j/87122630330?pwd=OEcyUlNEQ3Z3QStIc1U4ejUvbVpvZz09 Zoom] '''по вторникам в 18:00'''
  
 
==Контакты==
 
==Контакты==
Строка 7: Строка 7:
 
Канал курса в TG: [[https://t.me/+02a_f6ahQZM1ZDc6 channel link]]
 
Канал курса в TG: [[https://t.me/+02a_f6ahQZM1ZDc6 channel link]]
  
Чат курса в TG: [[ chat link]]
+
Чат курса в TG: [[https://t.me/+2MVd5yfgTS0wNGM6 chat link]]
  
Преподаватель:  
+
Преподаватели: Смирнова Полина, Кошелев Сергей, Павличенко Никита, Куцев Роман
  
 
{| class="wikitable"
 
{| class="wikitable"
Строка 15: Строка 15:
 
! Ассистент !! Контакты  
 
! Ассистент !! Контакты  
 
|-
 
|-
| style="background:#eaecf0;" | ||  
+
| style="background:#eaecf0;" | Максим Лутан || [https://t.me/moai_monument @moai_monument]
|-
+
 
| style="background:#eaecf0;" |  ||
+
 
|}
 
|}
  
 
==Материалы курса==
 
==Материалы курса==
Ссылка на плейлист курса на YouTube: [[ YouTube-playlist]]
+
Ссылка на плейлист курса на YouTube: [[https://www.youtube.com/playlist?list=PLmA-1xX7IuzBgH9SMUAsmFRhP7iGuGHNG YouTube-playlist]]
  
 
Ссылка на GitHub с материалами курса: [[ GitHub repository]]
 
Ссылка на GitHub с материалами курса: [[ GitHub repository]]
Строка 27: Строка 26:
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
+
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Семинар
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Ноутбук]] Работа с данными в МО. Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций, автоматизация конвейера по сбору и разметке данных || 10.01.23 || ||  
+
| style="background:#eaecf0;" | '''1''' || Введение. Работа с данными в МО. || 10.01.23 || [https://disk.yandex.ru/d/98xnoHxYwIFB2A Лекция (асинхронно) в записи] || Без семинара
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] Контроль качества данных: этапы и инструменты || 17.01.23 || ||  
+
| style="background:#eaecf0;" | '''2''' [[https://youtu.be/BC1IT8joYYU Запись семинара]] || Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций. || 17.01.23 || [https://disk.yandex.ru/i/EgKst_tgRoQB-g Лекция (асинхронно) в записи] || "Работа с платформой для сбора и разметки данных", ''Сергей Кошелев''
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] Агрегация данных. Категориальная и попарная разметка || 24.01.23 || ||
+
 
 +
| style="background:#eaecf0;" | '''3''' || Контроль качества данных: этапы и инструменты || 24.01.23 || [https://disk.yandex.ru/i/ECg-3a19PO-Pbg Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/C6qrfBiXNG4xtw Семинар (асинхронно) в записи]
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] Оптимизация процессов разметки: Human-in-the-loop и др. подходы || 31.01.23 || ||  
+
| style="background:#eaecf0;" | '''4''' || '''Кейс-стади''': работа с данными для CV || 31.01.23 || [https://disk.yandex.ru/d/tAFr9q9wn-nerQ Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/fKMOBYVDA_lqtg Семинар (асинхронно) в записи] -- онлайн-занятие сорвалось
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] Кейс-стади: машинный перевод, компьютерное зрение и беспилотники, голосовые технологии|| 07.02.23 || ||  
+
| style="background:#eaecf0;" | Не состоялось || || 07.02.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] || 14.02.23 || ||  
+
| style="background:#eaecf0;" | '''5''' || Агрегация полученных результатов: категориальная и попарная разметка || 14.02.23 || [https://disk.yandex.ru/i/bM7nQEPa18tnhw Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/1XTltKy5W9NhSA Семинар (асинхронно) в записи] -- никто не пришел на фан-встречу
 
|-
 
|-
| style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] || 21.02.23 || ||  
+
| style="background:#eaecf0;" | '''6''' || Агрегация полученных результатов: агрегация сложных ответов|| 21.02.23 || [https://disk.yandex.ru/i/NvlZoh4J78h4VQ Лекция (асинхронно) в записи] || [https://disk.yandex.ru/i/Vycpsdo5Nva84A Семинар (асинхронно) в записи] -- снова никого не было :(
 
|-
 
|-
| style="background:#eaecf0;" | '''8''' [[ Запись]] || [[ Ноутбук]] || 28.02.23 || ||  
+
| style="background:#eaecf0;" | '''7''' [[ Запись семинара]] || Оптимизация процессов разметки: Human-in-the-loop и др. подходы || 28.02.23 || [https://disk.yandex.ru/i/utjAhMUZ7IFIuA Лекция (асинхронно) в записи] || "Human-in-the-loop и др. подходы к оптимизации процессов разметки", ''Роман Куцев''
 
|-
 
|-
| style="background:#eaecf0;" | '''9''' [[ Запись]] || [[ Ноутбук]] || 07.03.23 || ||  
+
| style="background:#eaecf0;" | '''8''' || '''Кейс-стади: ''' работа с данными для Яндекс.Переводчика || 07.02.23 || [https://disk.yandex.ru/i/o7M714-8XioBDg Лекция (асинхронно) в записи] || Без семинара
 +
|-
 +
| style="background:#eaecf0;" | '''9''' [[ Запись семинара]] || '''Кейс-стади: ''' работа с данными для Алисы || 14.03.23 || [https://disk.yandex.ru/i/GG2_VBfP0Ex4 Лекция (асинхронно) в записи]|| "Презентация проектов командами", ''Полина Смирнова & Никита Павличенко''
 
|-
 
|-
 
|}
 
|}
 
=== Записи консультаций ===
 
 
  
 
==Формула оценивания==
 
==Формула оценивания==
  
Оценка = <big>(</big>ДЗ-1<small> (3 балла)</small> + ДЗ-2<small> (3 балла)</small> + ДЗ-3<small> (8 баллов)</small> + ДЗ-4<small> (8 баллов)</small> + ДЗ-5<small> (8 баллов)</small> + Финальный проект <small> (20 баллов)</small><big>)</big> / 5
+
Оценка = <big>(</big>ДЗ-1<small> (3 балла)</small> + ДЗ-2<small> (3 балла)</small> + ДЗ-3<small> (8 баллов)</small> + ДЗ-4<small> (8 баллов)</small> + ДЗ-5<small> (8 баллов)</small> + ДЗ-6 <small> (20 баллов)</small><big>)</big> / 5
  
 
== Домашние задания ==
 
== Домашние задания ==
#  
+
Ссылка на курс в Энитаске: https://anytask.org/course/994
#  
+
 
#  
+
Инвайт: ''ETfetfz''
#  
+
 
#
+
# Работа с платформой для сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 24.01.23 23:59 МСК'''
 +
# Автоматизация процесса сбора и разметки данных | Бюджет - $3 | '''Дедлайн - 18.02.23 (Сб) 23:59'''
 +
# Контроль качества данных | Бюджет - $6 | '''Дедлайн - 21.02.23 (Вт) 23:59'''
 +
# Агрегация данных | Без бюджета | '''Дедлайн''' - <strike>28.02.23 (Вт)</strike> '''10.03.23 (Пт) 23:59'''
 +
# Агрегация данных | Без бюджета | '''Дедлайн - 16.03.23 (Пн) 23:59'''
 +
# Финальный самостоятельный мини-проект | Бюджет - $10 | '''Дедлайн - 24.03.23 (Пт) 23:59'''
  
 
== Литература ==
 
== Литература ==
 
# Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
 
# Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
 
# Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.
 
# Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.

Текущая версия на 21:24, 28 марта 2023

О курсе

Занятия проводятся в Zoom по вторникам в 18:00

Контакты

Канал курса в TG: [channel link]

Чат курса в TG: [chat link]

Преподаватели: Смирнова Полина, Кошелев Сергей, Павличенко Никита, Куцев Роман

Ассистент Контакты
Максим Лутан @moai_monument

Материалы курса

Ссылка на плейлист курса на YouTube: [YouTube-playlist]

Ссылка на GitHub с материалами курса: GitHub repository

Занятие Тема Дата Материалы для самоподготовки к семинарам Семинар
1 Введение. Работа с данными в МО. 10.01.23 Лекция (асинхронно) в записи Без семинара
2 [Запись семинара] Общая концепция краудсорсинга. Декомпозиция задачи, проектирование интерфейсов и инструкций. 17.01.23 Лекция (асинхронно) в записи "Работа с платформой для сбора и разметки данных", Сергей Кошелев
3 Контроль качества данных: этапы и инструменты 24.01.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи
4 Кейс-стади: работа с данными для CV 31.01.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи -- онлайн-занятие сорвалось
Не состоялось 07.02.23
5 Агрегация полученных результатов: категориальная и попарная разметка 14.02.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи -- никто не пришел на фан-встречу
6 Агрегация полученных результатов: агрегация сложных ответов 21.02.23 Лекция (асинхронно) в записи Семинар (асинхронно) в записи -- снова никого не было :(
7 Запись семинара Оптимизация процессов разметки: Human-in-the-loop и др. подходы 28.02.23 Лекция (асинхронно) в записи "Human-in-the-loop и др. подходы к оптимизации процессов разметки", Роман Куцев
8 Кейс-стади: работа с данными для Яндекс.Переводчика 07.02.23 Лекция (асинхронно) в записи Без семинара
9 Запись семинара Кейс-стади: работа с данными для Алисы 14.03.23 Лекция (асинхронно) в записи "Презентация проектов командами", Полина Смирнова & Никита Павличенко

Формула оценивания

Оценка = (ДЗ-1 (3 балла) + ДЗ-2 (3 балла) + ДЗ-3 (8 баллов) + ДЗ-4 (8 баллов) + ДЗ-5 (8 баллов) + ДЗ-6 (20 баллов)) / 5

Домашние задания

Ссылка на курс в Энитаске: https://anytask.org/course/994

Инвайт: ETfetfz

  1. Работа с платформой для сбора и разметки данных | Бюджет - $3 | Дедлайн - 24.01.23 23:59 МСК
  2. Автоматизация процесса сбора и разметки данных | Бюджет - $3 | Дедлайн - 18.02.23 (Сб) 23:59
  3. Контроль качества данных | Бюджет - $6 | Дедлайн - 21.02.23 (Вт) 23:59
  4. Агрегация данных | Без бюджета | Дедлайн - 28.02.23 (Вт) 10.03.23 (Пт) 23:59
  5. Агрегация данных | Без бюджета | Дедлайн - 16.03.23 (Пн) 23:59
  6. Финальный самостоятельный мини-проект | Бюджет - $10 | Дедлайн - 24.03.23 (Пт) 23:59

Литература

  1. Drutsa Alexey, Farafonova Viktoriya, Fedorova Valentina, Megorskaya Olga, Zerminova Evfrosiniya, Zhilinskaya Olga. Practice of Efficient Data Collection via Crowdsourcing at Large-Scale. 2019
  2. Ustalov Dmitry, Pavlichenko Nikita, Tseytlin Boris, Baidakova Daria; Drutsa Alexey. Web Engineering with Human-in-the-Loop. 2022.