Msbdp 20 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Инфраструктура)
(Экзамен)
 
(не показано 16 промежуточных версии этого же участника)
Строка 14: Строка 14:
 
* [https://drive.google.com/drive/folders/1TeRisan8vezppMX7V0EMrKGKVrGn_bWi?usp=sharing Видео 176й группы]
 
* [https://drive.google.com/drive/folders/1TeRisan8vezppMX7V0EMrKGKVrGn_bWi?usp=sharing Видео 176й группы]
 
* [https://gitlab.com/VeLKerr/hse_bigdata/-/tree/master/practice Материалы семинаров]
 
* [https://gitlab.com/VeLKerr/hse_bigdata/-/tree/master/practice Материалы семинаров]
 +
 +
[https://docs.google.com/spreadsheets/d/1xDjs2tgKZegxntHN2TN2dZ9sqh84Oa24RvmsZAVmMG0/edit#gid=1845448601 Статусы записей занятий]
 
=== Инфраструктура ===
 
=== Инфраструктура ===
 
* [https://docs.google.com/document/d/125jtuQgFLmPRfq7yY2KUVA7VaQ9-sl04xKeM6KOTYTo/edit#heading=h.e0zwpk6y7jf1 Инструкция по работе с ШАДовским кластером]
 
* [https://docs.google.com/document/d/125jtuQgFLmPRfq7yY2KUVA7VaQ9-sl04xKeM6KOTYTo/edit#heading=h.e0zwpk6y7jf1 Инструкция по работе с ШАДовским кластером]
Строка 20: Строка 22:
 
== Формы контроля ==
 
== Формы контроля ==
 
Вся организационная информация содержится в [https://docs.google.com/presentation/d/1ESujpLr08ZWT-Pz9U7CfyJGwNjSsclKvRFj4lm5v4H4/edit#slide=id.g606c5c324e_2_0 0й презентации] (слайды 6, 7).
 
Вся организационная информация содержится в [https://docs.google.com/presentation/d/1ESujpLr08ZWT-Pz9U7CfyJGwNjSsclKvRFj4lm5v4H4/edit#slide=id.g606c5c324e_2_0 0й презентации] (слайды 6, 7).
==== Дедлайны по домашкам ====
+
=== Дедлайны по домашкам ===
 
{|  class="wikitable"
 
{|  class="wikitable"
 
|-  
 
|-  
Строка 31: Строка 33:
 
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 21.10, 08:00 || 28.12, 08:00
 
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 21.10, 08:00 || 28.12, 08:00
 
|-
 
|-
|[https://Hive Hive] || - || -  
+
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/03-hive.md Hive] || 09.11, 08:00 || 16.11, 08:00
 +
|-
 +
|[https://docs.google.com/document/d/14M5b-HVg_i3VxzhY72r9DMXYfr2urwR4kUa7hKLn9SU Spark] ||01.12, 08:00||08.12, 08:00
 +
|-
 +
|[https://docs.google.com/document/d/1KTbM64t2EPzzBUGiEer_n0WkT7-ET2HdJIaU8g4yuHw RealTime & Kafka] || 12.12, 08:00 || 19.12, 08:00
 +
|-
 +
|[https://docs.google.com/document/d/1DljtsrnhfQME3r06a5sywhOM4GUO0eSAyQQ1bO5sofc Cassandra] || 26.12, 08:00 || 26.12, 08:00
 
|}
 
|}
 +
 +
=== Мини-контрольные ===
 +
Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна [https://drive.google.com/file/d/1n0iR-IaPnT4EeEEUCksODQnjl34L8Xlc/view?usp=sharing инструкция пользователя].
 +
На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
 +
 +
{|  class="wikitable"
 +
|-
 +
! Название события на http://exams.mipt.ru/
 +
! Дата
 +
! Длительность
 +
|-
 +
| МИСОБОД. HDFS & MAPREDUCE || 28.10.2020 || 15 мин.
 +
|}
 +
 +
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/G2emB4VTpzNJspqGA '''форму на дописывание''']. Дописывание состоится 16.12 во время семинаров.
 +
 +
=== Экзамен ===
 +
Экзамен состоится 29.12 в 12:00.
 +
* 45 минут
 +
* 6 вопросов с развернутым ответом по всему курсу
 +
* может добавить к вашей оценке максимум 2 балла
 +
 +
Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии '''"МиСОБОД. Экзамен"''' на сайте https://exams.mipt.ru.
 +
 +
Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить '''[https://docs.google.com/forms/d/e/1FAIpQLSeYpjvh5sYa2FTLVqsZRjgWn_CUcnDx4Gup6vOWJtrIM8LisA/viewform?usp=sf_link форму]'''. Тем, у кого накоп 10, можно ничего не заполнять.
  
 
== Преподаватели ==
 
== Преподаватели ==
Строка 43: Строка 76:
 
* Цион Михаил
 
* Цион Михаил
 
* Содиков Махмуд
 
* Содиков Махмуд
 +
* Воропаев Роберт
 +
 
== Список рекомендуемых материалов ==
 
== Список рекомендуемых материалов ==
 
=== Основная литература ===
 
=== Основная литература ===

Текущая версия на 02:59, 29 декабря 2020

О курсе

  • Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
  • Форма контроля: экзамен.

Важные ссылки

Лекции

Семинары

Статусы записей занятий

Инфраструктура

Формы контроля

Вся организационная информация содержится в 0й презентации (слайды 6, 7).

Дедлайны по домашкам

Домашка Мягкий deadline Жёсткий deadline
HDFS 01.10, 08:00 01.10, 08:00
MapReduce 21.10, 08:00 28.12, 08:00
Hive 09.11, 08:00 16.11, 08:00
Spark 01.12, 08:00 08.12, 08:00
RealTime & Kafka 12.12, 08:00 19.12, 08:00
Cassandra 26.12, 08:00 26.12, 08:00

Мини-контрольные

Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название события на http://exams.mipt.ru/ Дата Длительность
МИСОБОД. HDFS & MAPREDUCE 28.10.2020 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 16.12 во время семинаров.

Экзамен

Экзамен состоится 29.12 в 12:00.

  • 45 минут
  • 6 вопросов с развернутым ответом по всему курсу
  • может добавить к вашей оценке максимум 2 балла

Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии "МиСОБОД. Экзамен" на сайте https://exams.mipt.ru.

Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить форму. Тем, у кого накоп 10, можно ничего не заполнять.

Преподаватели

  • Ивченко Олег - основной преподаватель
  • Жестов Анатолий - лектор по администрированию экосистемы BigData
  • Лахвич Дмитрий - лектор по Spark и Spark Streaming
  • Липовский Роман - лектор по NoSQL over BigData
  • Ахтямов Павел - лектор и семинарист по HBase

Учебные ассистенты

  • Цион Михаил
  • Содиков Махмуд
  • Воропаев Роберт

Список рекомендуемых материалов

Основная литература

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная литература

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co.
  2. Alex Holmes , "Hadoop in Practice"
  3. Martin Fowler, "NoSQL"
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
  5. Jonathan Leibiusky, "Getting Started with Storm"
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
  11. Lars George. HBase: The Definitive Guide. O’Reilly.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.