Машинное обучение на больших данных 145

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Семинары

Azure, Spark (10.04)

Полезные ссылки

Vowpal Wabbit, Azure (03.04)

Задание на Vowpal Wabbit:

  • Скачайте данные, разберитесь с форматом, конвертируйте его в формат VW
  • Обучите линейную модель на обучающих данных, проверьте на тестовых
  • Обучите модель с логистической функцией потерь
  • (доп.) Обучите нелинейную модель и добейтесь с ее помощью более высокого качества

Данные для обучения, данные для тестирования, формат данных

По Azure:

  • На семинаре вы получили логин вида studentN и пароль к нему.
  • Залогиньтесь на portal.azure.com с логином studentN@zimovnovgmail.onmicrosoft.com . Там пока ничего делать не нужно.
  • Установите себе Azure CLI. Если его не получается установить, установите хотя бы генератор ssh-ключей: ssh-keygen для Unix или см. тут для Windows. На семинаре будем разбираться.
  • Установите какую-нибудь утилиту для ssh-подключений: ssh для Unix или, например, PuTTY для Windows.