Msbdp 20

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

  • Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
  • Форма контроля: экзамен.

Важные ссылки

Лекции

Семинары

Статусы записей занятий

Инфраструктура

Формы контроля

Вся организационная информация содержится в 0й презентации (слайды 6, 7).

Дедлайны по домашкам

Домашка Мягкий deadline Жёсткий deadline
HDFS 01.10, 08:00 01.10, 08:00
MapReduce 21.10, 08:00 28.12, 08:00
Hive 09.11, 08:00 16.11, 08:00
Spark 01.12, 08:00 08.12, 08:00
RealTime & Kafka 12.12, 08:00 19.12, 08:00
Cassandra 26.12, 08:00 26.12, 08:00

Мини-контрольные

Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название события на http://exams.mipt.ru/ Дата Длительность
МИСОБОД. HDFS & MAPREDUCE 28.10.2020 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 16.12 во время семинаров.

Экзамен

Экзамен состоится 29.12 в 12:00.

  • 45 минут
  • 6 вопросов с развернутым ответом по всему курсу
  • может добавить к вашей оценке максимум 2 балла

Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии "МиСОБОД. Экзамен" на сайте https://exams.mipt.ru.

Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить форму. Тем, у кого накоп 10, можно ничего не заполнять.

Преподаватели

  • Ивченко Олег - основной преподаватель
  • Жестов Анатолий - лектор по администрированию экосистемы BigData
  • Лахвич Дмитрий - лектор по Spark и Spark Streaming
  • Липовский Роман - лектор по NoSQL over BigData
  • Ахтямов Павел - лектор и семинарист по HBase

Учебные ассистенты

  • Цион Михаил
  • Содиков Махмуд
  • Воропаев Роберт

Список рекомендуемых материалов

Основная литература

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная литература

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co.
  2. Alex Holmes , "Hadoop in Practice"
  3. Martin Fowler, "NoSQL"
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
  5. Jonathan Leibiusky, "Getting Started with Storm"
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
  11. Lars George. HBase: The Definitive Guide. O’Reilly.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.