Msbdp 20
Содержание
О курсе
- Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
- Форма контроля: экзамен.
Важные ссылки
Лекции
Семинары
Инфраструктура
- Инструкция по работе с ШАДовским кластером
- Инструкция по работе с тестир. системой. Использовать начиная со 2й домашки
Формы контроля
Вся организационная информация содержится в 0й презентации (слайды 6, 7).
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
HDFS | 01.10, 08:00 | 01.10, 08:00 |
MapReduce | 21.10, 08:00 | 28.12, 08:00 |
Hive | 09.11, 08:00 | 16.11, 08:00 |
Spark | 01.12, 08:00 | 08.12, 08:00 |
RealTime & Kafka | 12.12, 08:00 | 19.12, 08:00 |
Cassandra | 26.12, 08:00 | 26.12, 08:00 |
Мини-контрольные
Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
Название события на http://exams.mipt.ru/ | Дата | Длительность |
---|---|---|
МИСОБОД. HDFS & MAPREDUCE | 28.10.2020 | 15 мин. |
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 16.12 во время семинаров.
Экзамен
Экзамен состоится 29.12 в 12:00.
- 45 минут
- 6 вопросов с развернутым ответом по всему курсу
- может добавить к вашей оценке максимум 2 балла
Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии "МиСОБОД. Экзамен" на сайте https://exams.mipt.ru.
Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить форму. Тем, у кого накоп 10, можно ничего не заполнять.
Преподаватели
- Ивченко Олег - основной преподаватель
- Жестов Анатолий - лектор по администрированию экосистемы BigData
- Лахвич Дмитрий - лектор по Spark и Spark Streaming
- Липовский Роман - лектор по NoSQL over BigData
- Ахтямов Павел - лектор и семинарист по HBase
Учебные ассистенты
- Цион Михаил
- Содиков Махмуд
- Воропаев Роберт
Список рекомендуемых материалов
Основная литература
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная литература
- Chuck Lam. Hadoop in Action. New York: Manning Publications co.
- Alex Holmes , "Hadoop in Practice"
- Martin Fowler, "NoSQL"
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
- Jonathan Leibiusky, "Getting Started with Storm"
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
- Lars George. HBase: The Definitive Guide. O’Reilly.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.