Msbdp 20
Материал из Wiki - Факультет компьютерных наук
Версия от 12:32, 28 ноября 2020; VeLKerr (обсуждение | вклад)
Содержание
О курсе
- Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
- Форма контроля: экзамен.
Важные ссылки
Лекции
Семинары
Инфраструктура
- Инструкция по работе с ШАДовским кластером
- Инструкция по работе с тестир. системой. Использовать начиная со 2й домашки
Формы контроля
Вся организационная информация содержится в 0й презентации (слайды 6, 7).
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
HDFS | 01.10, 08:00 | 01.10, 08:00 |
MapReduce | 21.10, 08:00 | 28.12, 08:00 |
Hive | 09.11, 08:00 | 16.11, 08:00 |
Spark | 30.11, 08:00 | 07.12, 08:00 |
RealTime & Kafka | 12.12, 08:00 | 19.12, 08:00 |
Мини-контрольные
Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
Название события на http://exams.mipt.ru/ | Дата | Длительность |
---|---|---|
МИСОБОД. HDFS & MAPREDUCE | 28.10.2020 | 15 мин. |
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 16.12 во время семинаров.
Преподаватели
- Ивченко Олег - основной преподаватель
- Жестов Анатолий - лектор по администрированию экосистемы BigData
- Лахвич Дмитрий - лектор по Spark и Spark Streaming
- Липовский Роман - лектор по NoSQL over BigData
- Ахтямов Павел - лектор и семинарист по HBase
Учебные ассистенты
- Цион Михаил
- Содиков Махмуд
- Воропаев Роберт
Список рекомендуемых материалов
Основная литература
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная литература
- Chuck Lam. Hadoop in Action. New York: Manning Publications co.
- Alex Holmes , "Hadoop in Practice"
- Martin Fowler, "NoSQL"
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
- Jonathan Leibiusky, "Getting Started with Storm"
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
- Lars George. HBase: The Definitive Guide. O’Reilly.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.