ИИ и БД — различия между версиями
Renarde (обсуждение | вклад) |
Renarde (обсуждение | вклад) |
||
Строка 58: | Строка 58: | ||
# Дан график рассеяния точек зависимости роста от возраста, на нем проведены три линии. Выберите ту, которая в смысле метода наименьших квадратов является наиболее релевантной к приведенным данным. Объясните смысл метода наименьших квадратов. | # Дан график рассеяния точек зависимости роста от возраста, на нем проведены три линии. Выберите ту, которая в смысле метода наименьших квадратов является наиболее релевантной к приведенным данным. Объясните смысл метода наименьших квадратов. | ||
# Опишите, чем отличаются ошибки первого и второго рода. Рассчитайте accuracy по заданной матрице ошибок классификации | # Опишите, чем отличаются ошибки первого и второго рода. Рассчитайте accuracy по заданной матрице ошибок классификации | ||
+ | |||
+ | == Детальная инструкция по первому тесту == | ||
+ | |||
+ | Инструкция по прохождению теста | ||
+ | 1. При прохождении теста советуем использовать ноутбук с браузерами Google Chrome / Firefox / Safari. С мобильных платформ отображение теста может быть некорректным. | ||
+ | 2. Мы так же обратили внимание, что с внутренней сети ВШЭ иногда не работают картинки. Дабы не возникало проблем с их отображением, картинки отдельно выложены в wiki. | ||
+ | 3. Заходим на ссылку теста: https://onlinetestpad.com/t/917c9b358ee242a595e12c3ecc41ef05 | ||
+ | 4. Придумайте для себя кодовое слово (желательно - на русском языке, без дефисов и других символов). | ||
+ | 5. Отправляем со своего email свое кодовое слово на указанный на первой странице теста email с указанной темой. Важно - это достаточно сделать один раз. | ||
+ | 6. Проходим тест. На прохождение выдается 120 минут, в это время для данной вкладки браузера нельзя нажимать кнопки назад или обновить страницу - результаты не будут засчитаны. | ||
+ | 7. В финальном окне теста вводим в разделе "Введите свое имя" своей Email (тот же, что и в начале). Рядом появится галочка - нажмите ее. | ||
+ | 8. Очень не советуем списывать друг у друга или из интернета текстовые ответы - как вы знаете, с помощью анализа данных можно легко рассчитать расстояния между строками и проверить схожесть двух ответов. Для тех, у кого текстовые ответы будут совпадать слишком сильно, баллы за тест обратятся в 0. | ||
+ | 9. Вы можете проходить тест сколько угодно раз, но засчитывать для вашего Email мы будем только первые три результата по времени. Из них будет выбираться наилучший, и этот результат мы и будем считать финальной итоговой оценкой за данный тест. | ||
+ | |||
+ | == Картинки по первому тесту == | ||
+ | |||
+ | Выложены в виде .PDF - https://drive.google.com/open?id=1hV-FLzxgik4OZj71hsmjqoDDfkPsO4kk | ||
+ | |||
== Формирование оценок по дисциплине == | == Формирование оценок по дисциплине == |
Версия 11:52, 6 марта 2018
Страница курса "Искусственный интеллект и большие данные"
Содержание
Ссылки
- Telegram-канал: https://t.me/joinchat/AAAAAEqSqaGmihzF3ZnE4g
- Форум: https://groups.google.com/forum/#!forum/aibd-course-2018 (лучше писать в группу ФБ - ответ будет оперативнее)
- FB: https://facebook.com/groups/1983952831632009
- ПУД: https://www.hse.ru/edu/courses/206643947
- Книга "Статистика и котики": http://www.statcats.ru/2016/03/blog-post.html
- Опрос по качеству курса: https://goo.gl/forms/gJHOhjxs6fxSqzd82
Преподаватели и консультации
Консультации указаны на личных страницах.
Преподаватели:
- Мягких Павел Игоревич - https://www.hse.ru/org/persons/213956876
- Рыжиков Артем Сергеевич - https://www.hse.ru/org/persons/190912317
- Трусов Иван Алексеевич - https://www.hse.ru/staff/renarde
Ассистенты:
- Ященко Анастасия
- Бобровских Глеб
Материалы лекций
Сроки тестов и заданий
- Тест по темам лекций 1-5 (Машинное обучение) будет открыт 5 марта в 11:00 и закрыт 12 марта в 11:00. Примерный список вопросов будет вывешен на wiki в среду 28.02.
Справочная информация по 1 тесту
Структура теста:
- 15 вопросов с одним или несколькими вариантами ответа
- 3 открытых вопроса (ответ в 3-4 предложения)
- 2 вопроса по картинке и матрице ошибок классификации (ответ в 3-4 предложения)
Примеры вопросов 1 части:
- Установите последовательность преобразования сигнала в знание (лекция 2)
- Представлена генеральная совокупность автомобилей 3 цветов из 6 элементов (например,ЧЧККЖЖ, где Ч - черный, К - красный, Ж - желтый). Необходимо сделать такую выборку, которая репрезентативна по признаку цвета. Выберите репрезентативную выборку из вариантов - (ЧКК, ЧЖЖ, ЧКЖ)
- Выберите, каким методом необходимо решать следующие задачи (дан набор задач, для каждой необходимо выбрать между классификацией, регрессией и кластеризацией)
- Выберите качественные признаки из (и 4 варианта признаков)
- Выберите количественные признаки из (и 4 варианта признаков)
- Данные утверждения верны для матрицы объект-признак (даны утвержения, выберите верные)
- Дано уравнение линейной регрессии цены квартиры в зависимости от площади: price=20*square+10 (где price - цена, square - площадь). Рассчитайте цену квартиры при площади 30.
- Приведен пример дерева решений, дан вектор признаков на объекте. Укажите, каково будет предсказание дерева решений на данном объекте.
Примеры вопросов 2 части:
- В чем смысл метода kNN (k ближайших соседей) в задаче классификации? Почему не стоит выбирать K четным? Объясните суть метода и ответьте на вопрос (3-4 предложения).
- Можно ли оцифровать картинку? Если да, в какую математическую структуру ее можно преобразовать?
Примеры вопросов 3 части:
- Дан график рассеяния точек зависимости роста от возраста, на нем проведены три линии. Выберите ту, которая в смысле метода наименьших квадратов является наиболее релевантной к приведенным данным. Объясните смысл метода наименьших квадратов.
- Опишите, чем отличаются ошибки первого и второго рода. Рассчитайте accuracy по заданной матрице ошибок классификации
Детальная инструкция по первому тесту
Инструкция по прохождению теста 1. При прохождении теста советуем использовать ноутбук с браузерами Google Chrome / Firefox / Safari. С мобильных платформ отображение теста может быть некорректным. 2. Мы так же обратили внимание, что с внутренней сети ВШЭ иногда не работают картинки. Дабы не возникало проблем с их отображением, картинки отдельно выложены в wiki. 3. Заходим на ссылку теста: https://onlinetestpad.com/t/917c9b358ee242a595e12c3ecc41ef05 4. Придумайте для себя кодовое слово (желательно - на русском языке, без дефисов и других символов). 5. Отправляем со своего email свое кодовое слово на указанный на первой странице теста email с указанной темой. Важно - это достаточно сделать один раз. 6. Проходим тест. На прохождение выдается 120 минут, в это время для данной вкладки браузера нельзя нажимать кнопки назад или обновить страницу - результаты не будут засчитаны. 7. В финальном окне теста вводим в разделе "Введите свое имя" своей Email (тот же, что и в начале). Рядом появится галочка - нажмите ее. 8. Очень не советуем списывать друг у друга или из интернета текстовые ответы - как вы знаете, с помощью анализа данных можно легко рассчитать расстояния между строками и проверить схожесть двух ответов. Для тех, у кого текстовые ответы будут совпадать слишком сильно, баллы за тест обратятся в 0. 9. Вы можете проходить тест сколько угодно раз, но засчитывать для вашего Email мы будем только первые три результата по времени. Из них будет выбираться наилучший, и этот результат мы и будем считать финальной итоговой оценкой за данный тест.
Картинки по первому тесту
Выложены в виде .PDF - https://drive.google.com/open?id=1hV-FLzxgik4OZj71hsmjqoDDfkPsO4kk
Формирование оценок по дисциплине
Подведение итогов промежуточной аттестации по дисциплине проводится только на основании результатов текущего контроля без проведения аттестационного испытания в форме экзамена, т.е.:
О_рез = О_нак
Накопленная оценка по дисциплине рассчитывается по формуле:
O_нак = 0,6*O_тек + 0.4*O_итоговое эссе
Текущая оценка вычисляется как средняя арифметическая по всем промежуточным формам контроля: 2 онлайн-теста и эссе по storytelling. На выполнение промежуточных заданий студентам дается 7 календарных дней. Если задание выполнено позже указанного срока, студент получает минус балл за каждый день опоздания.
Итоговое задание выполняется не позднее, чем за неделю до начала сессии четвертого модуля. В случае невыполнения итогового задания в указанный срок, студент получает за него 0 баллов. Результирующая оценка по учебной дисциплине округляется к ближайшему целому. Оценки за курс выставляются в течение сессии четвертого модуля.