Сбор и обработка данных с помощью краудсорсинга 20/21 — различия между версиями
Kris ros (обсуждение | вклад) |
|||
Строка 56: | Строка 56: | ||
1. Введение и общая концепция краудсорсинга. [https://yadi.sk/d/GIUemjam95bJyg Слайды] [https://youtu.be/N7Pt0HMwdN4 Запись лекции] | 1. Введение и общая концепция краудсорсинга. [https://yadi.sk/d/GIUemjam95bJyg Слайды] [https://youtu.be/N7Pt0HMwdN4 Запись лекции] | ||
+ | 2. Основные компоненты краудсорсинга : инструкция и интерфейс | ||
+ | 3. Основные компоненты краудсорсинга (II): Контроль качества | ||
+ | 4. Классификация и, в отдельности, классификация изображений | ||
+ | 5. Агрегация | ||
+ | 6. Динамическое перекрытие и прайсинг | ||
+ | 7. Краудсорсинг для компьютерного зрения: Беспилотники и стартап Neatsy | ||
+ | 8. Генерация контента | ||
+ | 9. Попарное сравнение SbS | ||
+ | 10. Пешеходные задания и Гео-аналитика | ||
+ | 11. Аннотирование звучащей речи для Голосовых Технологий и Агрегация ответов в аннотировании аудиозаписей | ||
+ | 12. Тестирование и Заключение | ||
=== Семинары === | === Семинары === |
Версия 13:05, 10 сентября 2020
Содержание
О курсе
Курс по выбору для студентов 3 и 4 курса в 1-2 модулях.
Описание
В настоящее время практически любая содержательная задача по анализу данных или ML требует сбора размеченных данных, которые, как правило, нужны в большом количестве и требуют привлечения ручного труда. Работа с краудоявляется одним из востребованных и ключевых навыков, которыми необходимо уметь пользоваться специалистам по анализу данных, если они хотят расти и решать все более крупные и амбициозные задачи.
Краудсорсинг применяется не только на стадии анализа и при построении ML-моделей, но также в замкнутых производственных и продуктовых процессах (парадигма human-in-the-loop). Наиболее яркими продуктами Яндекса, в боевых процессах которых используется "крауд, являются: голосовой помощник Алиса, Поиск, Яндекс.Переводчик, Яндекс.Драйв, Яндекс.Справочник, Яндекс.Картинки и др.
Специалисты по краудсорсингу уже остро востребованы как на российском, так и на зарубежном рынке. Из нашего опыты выпускники нашего курса востребованы как в Яндексе, так и в других российских компаниях, таких как Ozon, Авито, Сбер. На международном рынке Google, Facebook, Huawei, Tesla, Amazon, Netflix, Microsoft тоже постоянно решают подобные задачи, требующие знаний методов краудсорсинга.
Наши преподаватели — специалисты из разных сервисов Яндекса, которые регулярно используют краудсорсинг для решения таких задач как определение релевантности поисковой выдачи, тестирования и распознавание речи или объектов на изображениях.
Результаты обучения на курсе
Студенты, прошедшие данный образовательный курс, будут обладать глубоким пониманием и систематизированной картиной технологий краудсорсинга, что должно повысить эффективность работы продуктовых процессов. Будет очень интересно!
Пререквизиты курса
Требуются базовые навыки программирования на Python и базовые знания html, js и css будут плюсами
Критерии оценивания
10 домашек, которые в сумме составляют 100 баллов
Каждая домашка проверяется семинаристом, который ведет соответсвующий семинар, и разбалловка каждого задания определяется семинаристом.
Отлично: 80-100
Хорошо: 60-79
Зачёт: 40-59
Дедлайн: ХХ дней(скоро объявим, около 2х недель)
- можно сдать ДЗ в течение недели после дедлайна, потеряв 3 балла.
- можно сдать по желанию ДЗ по истечении 1 недели после дедлайна с максимальной оценкой 5 баллов.
Лектор:
Лекции проходят онлайн по понедельникам на 6 паре (18:10 - 19:30)
Ссылка на конференцию:
Семинарист:
Семинары проходят онлайн по понедельникам на 5 паре (16:20 - 17:40)
Ссылка на конференцию:
Полезные ссылки
Телеграм-чат курса: https://t.me/crowd_course_2020
План курса
Лекции
1. Введение и общая концепция краудсорсинга. Слайды Запись лекции 2. Основные компоненты краудсорсинга : инструкция и интерфейс 3. Основные компоненты краудсорсинга (II): Контроль качества 4. Классификация и, в отдельности, классификация изображений 5. Агрегация 6. Динамическое перекрытие и прайсинг 7. Краудсорсинг для компьютерного зрения: Беспилотники и стартап Neatsy 8. Генерация контента 9. Попарное сравнение SbS 10. Пешеходные задания и Гео-аналитика 11. Аннотирование звучащей речи для Голосовых Технологий и Агрегация ответов в аннотировании аудиозаписей 12. Тестирование и Заключение
Семинары
Домашние задания
Домашнее задание 1
Выдается:
Дедлайн: