ОАБМД-2025 — различия между версиями
VeLKerr (обсуждение | вклад) (→Команда курса) |
VeLKerr (обсуждение | вклад) (→Команда курса) |
||
| Строка 3: | Строка 3: | ||
* Форма контроля: экзамен, выставляется по накопу. | * Форма контроля: экзамен, выставляется по накопу. | ||
== Команда курса == | == Команда курса == | ||
| − | * Преподаватель: Ивченко Олег | + | * Преподаватель: Ивченко Олег |
* Ассистенты: | * Ассистенты: | ||
** Павлов Дмитрий Александрович | ** Павлов Дмитрий Александрович | ||
Версия 14:55, 1 ноября 2025
Содержание
О курсе
- Курс "Обработка и анализ больших массивов данных" (Processing and analysis of large data sets) читается для студентов 2-го курса магистратуры ФКН ВШЭ в 1-2 модулях.
- Форма контроля: экзамен, выставляется по накопу.
Команда курса
- Преподаватель: Ивченко Олег
- Ассистенты:
- Павлов Дмитрий Александрович
- Струнова Анастасия Сергеевна
- Чавдарь Дмитрий
- Амбарян Рудольф Андраникович
- Наумов Владислав Олегович
- Стешенко Александр Владимирович
- Кочурова Ирина Дмитриевна
Важные ссылки
- План курса
- Чат курса
- Таблица с оценками
- Коды семинаров (доступ только после регистрации на gitlab.atp-fivt.org)
- Слайды презентаций
Формы контроля
Курс предполагает 3 формы контроля:
- Домашние задания: 9 баллов
- Тесты: 2 балла
- Бонусы: 1,5 балла
Итоговая оценка вычисляется по принципу MIN(ДЗ+Тесты+бонусы, 10).
Домашние задания
- Условия домашек (доступ только после регистрации на gitlab.atp-fivt.org)
- Инструкция по работе с тестирующей системой (доступ только после регистрации на gitlab.atp-fivt.org)
- Статус проверки домашек
На курсе 6 домашних заданий, из которых 2 блокирующие. Все ДЗ кроме последней сдаются в 2 этапа:
- Прохождение CI-тестов
- Code review
По каждой домашке существуют дедлайны. До дедлайна важно пройти 1й этап сдачи.
- После мягкого дедлайна оценка снижается на 50%.
- После жесткого дедлайна сдавать можно только блокирующие ДЗ с оценкой не выше 25%.
Тесты
Состоится 6 контрольных, которые будут проводиться с помощью Google форм, их можно заполнять с компьютера или телефона. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
| Название КР | Дата | Длительность |
|---|---|---|
| ОАБМД - 2025. HDFS & MapReduce | 19.10.2025 | 15 мин. |
| ОАБМД - 2025. SQL over BigData | 09.11.2025 | 15 мин. |
| ОАБМД - 2025. Spark | 23.11.2025 | 10 мин. |
| ОАБМД - 2025. Векторные часы | 30.11.2025 | 10 мин. |
| ОАБМД - 2025. Spark streaming, Kafka & NoSQL | 14.12.2025 | 20 мин. |
| ОАБМД - 2025. Финальный тест | 21.12.2025 | 15 мин. |
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 20.12.2025 во время последнего занятия. Помимо Google форм, на дописывании будет использована система прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. Желательно зарегистрироваться в системе прокторинга заранее если вы планируете идти на дописывание.
Бонусы
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1,5 баллов. Количество студентов, которым может быть начислен бонус, неограничено.
Список рекомендуемых материалов
Основная литература
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная литература
- Chuck Lam. Hadoop in Action. New York: Manning Publications co.
- Alex Holmes , "Hadoop in Practice"
- Martin Fowler, "NoSQL"
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
- Jonathan Leibiusky, "Getting Started with Storm"
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
- Lars George. HBase: The Definitive Guide. O’Reilly.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.