Msbdp 21 minimal — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Мини-контрольные)
(Домашние задания)
 
(не показаны 3 промежуточные версии этого же участника)
Строка 28: Строка 28:
 
! Жёсткий deadline
 
! Жёсткий deadline
 
|-
 
|-
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 16.03, 23:59 || 23.03, 23:59
+
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 16.03, 23:59 || 24.03, 23:59
 
|-
 
|-
|[https://docs.google.com/document/d/14M5b-HVg_i3VxzhY72r9DMXYfr2urwR4kUa7hKLn9SU Spark] || 27.03, 23:59 || 27.03, 23:59
+
|[https://docs.google.com/document/d/14M5b-HVg_i3VxzhY72r9DMXYfr2urwR4kUa7hKLn9SU Spark] || 01.04, 23:59 || 01.04, 23:59
 
|}
 
|}
  
Строка 47: Строка 47:
 
| МИСОБОД. SQL over BigData || 25.03 || 15 мин.
 
| МИСОБОД. SQL over BigData || 25.03 || 15 мин.
 
|-
 
|-
| МИСОБОД. Kafka & NoSQL || 28.03 || 20 мин.
+
| МиСОБОД. Spark streaming, Kafka & NoSQL || 28.03 || 20 мин.
 
|}
 
|}
  

Текущая версия на 12:35, 28 марта 2022

О курсе

  • Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
  • Форма контроля: экзамен.

Важные ссылки

Лекции

Семинары

Инфраструктура

Формы контроля

Домашние задания

Дашборд проверки домашек. Обновляется раз в 10 минут. Штраф за сдачу после мягкого дедлайна 50%.

Домашка Мягкий deadline Жёсткий deadline
MapReduce 16.03, 23:59 24.03, 23:59
Spark 01.04, 23:59 01.04, 23:59

Мини-контрольные

Состоится 3 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название события на http://exams.mipt.ru/ Дата Длительность
МИСОБОД. HDFS & MAPREDUCE 11.03 15 мин.
МИСОБОД. SQL over BigData 25.03 15 мин.
МиСОБОД. Spark streaming, Kafka & NoSQL 28.03 20 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 28.03 во время семинара.

Преподаватели

  • Ивченко Олег - основной преподаватель
  • Лахвич Дмитрий - лектор по Spark и Spark Streaming
  • Липовский Роман - лектор по NoSQL over BigData

Учебные ассистенты

  • Прохоров Михаил

Список рекомендуемых материалов

Основная литература

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная литература

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co.
  2. Alex Holmes , "Hadoop in Practice"
  3. Martin Fowler, "NoSQL"
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
  5. Jonathan Leibiusky, "Getting Started with Storm"
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
  11. Lars George. HBase: The Definitive Guide. O’Reilly.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.