Сбор и обработка данных с помощью краудсорсинга 20/21 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
Строка 55: Строка 55:
 
=== Лекции ===
 
=== Лекции ===
  
1. Введение и общая концепция краудсорсинга. [https://yadi.sk/d/GIUemjam95bJyg Слайды] [https://youtu.be/N7Pt0HMwdN4 Запись лекции]
+
# Введение и общая концепция краудсорсинга. [https://yadi.sk/d/GIUemjam95bJyg Слайды] [https://youtu.be/N7Pt0HMwdN4 Запись лекции]  
2. Основные компоненты краудсорсинга : инструкция и интерфейс
+
# Основные компоненты краудсорсинга : инструкция и интерфейс  
3. Основные компоненты краудсорсинга (II): Контроль качества
+
# Основные компоненты краудсорсинга (II): Контроль качества  
4. Классификация и, в отдельности, классификация изображений
+
# Классификация и, в отдельности, классификация изображений  
5. Агрегация  
+
# Агрегация
6. Динамическое перекрытие и прайсинг
+
# Динамическое перекрытие и прайсинг  
7. Краудсорсинг для компьютерного зрения: Беспилотники и стартап Neatsy
+
# Краудсорсинг для компьютерного зрения: Беспилотники и стартап Neatsy  
8. Генерация контента
+
# Генерация контента  
9. Попарное сравнение SbS  
+
# Попарное сравнение SbS
10. Пешеходные задания и Гео-аналитика
+
# Пешеходные задания и Гео-аналитика  
11. Аннотирование звучащей речи для Голосовых Технологий и Агрегация ответов в аннотировании аудиозаписей
+
# Аннотирование звучащей речи для Голосовых Технологий и Агрегация ответов в аннотировании аудиозаписей  
12. Тестирование и Заключение  
+
# Тестирование и Заключение  
  
 
=== Семинары ===
 
=== Семинары ===

Версия 13:06, 10 сентября 2020

О курсе

Курс по выбору для студентов 3 и 4 курса в 1-2 модулях.

Описание

В настоящее время практически любая содержательная задача по анализу данных или ML требует сбора размеченных данных, которые, как правило, нужны в большом количестве и требуют привлечения ручного труда. Работа с краудоявляется одним из востребованных и ключевых навыков, которыми необходимо уметь пользоваться специалистам по анализу данных, если они хотят расти и решать все более крупные и амбициозные задачи.

Краудсорсинг применяется не только на стадии анализа и при построении ML-моделей, но также в замкнутых производственных и продуктовых процессах (парадигма human-in-the-loop). Наиболее яркими продуктами Яндекса, в боевых процессах которых используется "крауд, являются: голосовой помощник Алиса, Поиск, Яндекс.Переводчик, Яндекс.Драйв, Яндекс.Справочник, Яндекс.Картинки и др.

Специалисты по краудсорсингу уже остро востребованы как на российском, так и на зарубежном рынке. Из нашего опыты выпускники нашего курса востребованы как в Яндексе, так и в других российских компаниях, таких как Ozon, Авито, Сбер. На международном рынке Google, Facebook, Huawei, Tesla, Amazon, Netflix, Microsoft тоже постоянно решают подобные задачи, требующие знаний методов краудсорсинга.

Наши преподаватели — специалисты из разных сервисов Яндекса, которые регулярно используют краудсорсинг для решения таких задач как определение релевантности поисковой выдачи, тестирования и распознавание речи или объектов на изображениях.

Результаты обучения на курсе

Студенты, прошедшие данный образовательный курс, будут обладать глубоким пониманием и систематизированной картиной технологий краудсорсинга, что должно повысить эффективность работы продуктовых процессов. Будет очень интересно!

Пререквизиты курса

Требуются базовые навыки программирования на Python и базовые знания html, js и css будут плюсами

Критерии оценивания

10 домашек, которые в сумме составляют 100 баллов

Каждая домашка проверяется семинаристом, который ведет соответсвующий семинар, и разбалловка каждого задания определяется семинаристом.

Отлично: 80-100

Хорошо: 60-79

Зачёт: 40-59

Дедлайн: ХХ дней(скоро объявим, около 2х недель)

- можно сдать ДЗ в течение недели после дедлайна, потеряв 3 балла.

- можно сдать по желанию ДЗ по истечении 1 недели после дедлайна с максимальной оценкой 5 баллов.

Лектор:

Лекции проходят онлайн по понедельникам на 6 паре (18:10 - 19:30)

Ссылка на конференцию:

Семинарист:

Семинары проходят онлайн по понедельникам на 5 паре (16:20 - 17:40)

Ссылка на конференцию:

Полезные ссылки

Телеграм-чат курса: https://t.me/crowd_course_2020

План курса

Лекции

  1. Введение и общая концепция краудсорсинга. Слайды Запись лекции
  2. Основные компоненты краудсорсинга : инструкция и интерфейс
  3. Основные компоненты краудсорсинга (II): Контроль качества
  4. Классификация и, в отдельности, классификация изображений
  5. Агрегация
  6. Динамическое перекрытие и прайсинг
  7. Краудсорсинг для компьютерного зрения: Беспилотники и стартап Neatsy
  8. Генерация контента
  9. Попарное сравнение SbS
  10. Пешеходные задания и Гео-аналитика
  11. Аннотирование звучащей речи для Голосовых Технологий и Агрегация ответов в аннотировании аудиозаписей
  12. Тестирование и Заключение

Семинары

Домашние задания

Домашнее задание 1


Выдается: Дедлайн:


Литература