Msbdp 20 — различия между версиями
VeLKerr (обсуждение | вклад) (→Формы контроля) |
VeLKerr (обсуждение | вклад) (→Экзамен) |
||
(не показаны 23 промежуточные версии этого же участника) | |||
Строка 14: | Строка 14: | ||
* [https://drive.google.com/drive/folders/1TeRisan8vezppMX7V0EMrKGKVrGn_bWi?usp=sharing Видео 176й группы] | * [https://drive.google.com/drive/folders/1TeRisan8vezppMX7V0EMrKGKVrGn_bWi?usp=sharing Видео 176й группы] | ||
* [https://gitlab.com/VeLKerr/hse_bigdata/-/tree/master/practice Материалы семинаров] | * [https://gitlab.com/VeLKerr/hse_bigdata/-/tree/master/practice Материалы семинаров] | ||
+ | |||
+ | [https://docs.google.com/spreadsheets/d/1xDjs2tgKZegxntHN2TN2dZ9sqh84Oa24RvmsZAVmMG0/edit#gid=1845448601 Статусы записей занятий] | ||
+ | === Инфраструктура === | ||
+ | * [https://docs.google.com/document/d/125jtuQgFLmPRfq7yY2KUVA7VaQ9-sl04xKeM6KOTYTo/edit#heading=h.e0zwpk6y7jf1 Инструкция по работе с ШАДовским кластером] | ||
+ | * [https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/practice/00-bigjudge-guide.md Инструкция по работе с тестир. системой]. Использовать начиная со 2й домашки | ||
== Формы контроля == | == Формы контроля == | ||
− | Вся организационная информация содержится в [https://docs.google.com/presentation/d/1ESujpLr08ZWT-Pz9U7CfyJGwNjSsclKvRFj4lm5v4H4/edit#slide=id.g606c5c324e_2_0 0й презентации]. | + | Вся организационная информация содержится в [https://docs.google.com/presentation/d/1ESujpLr08ZWT-Pz9U7CfyJGwNjSsclKvRFj4lm5v4H4/edit#slide=id.g606c5c324e_2_0 0й презентации] (слайды 6, 7). |
+ | === Дедлайны по домашкам === | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Домашка | ||
+ | ! Мягкий deadline | ||
+ | ! Жёсткий deadline | ||
+ | |- | ||
+ | |[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/01-hdfs.md HDFS] || 01.10, 08:00 || 01.10, 08:00 | ||
+ | |- | ||
+ | |[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 21.10, 08:00 || 28.12, 08:00 | ||
+ | |- | ||
+ | |[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/03-hive.md Hive] || 09.11, 08:00 || 16.11, 08:00 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/14M5b-HVg_i3VxzhY72r9DMXYfr2urwR4kUa7hKLn9SU Spark] ||01.12, 08:00||08.12, 08:00 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1KTbM64t2EPzzBUGiEer_n0WkT7-ET2HdJIaU8g4yuHw RealTime & Kafka] || 12.12, 08:00 || 19.12, 08:00 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1DljtsrnhfQME3r06a5sywhOM4GUO0eSAyQQ1bO5sofc Cassandra] || 26.12, 08:00 || 26.12, 08:00 | ||
+ | |} | ||
+ | |||
+ | === Мини-контрольные === | ||
+ | Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна [https://drive.google.com/file/d/1n0iR-IaPnT4EeEEUCksODQnjl34L8Xlc/view?usp=sharing инструкция пользователя]. | ||
+ | На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется. | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Название события на http://exams.mipt.ru/ | ||
+ | ! Дата | ||
+ | ! Длительность | ||
+ | |- | ||
+ | | МИСОБОД. HDFS & MAPREDUCE || 28.10.2020 || 15 мин. | ||
+ | |} | ||
+ | |||
+ | В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/G2emB4VTpzNJspqGA '''форму на дописывание''']. Дописывание состоится 16.12 во время семинаров. | ||
+ | |||
+ | === Экзамен === | ||
+ | Экзамен состоится 29.12 в 12:00. | ||
+ | * 45 минут | ||
+ | * 6 вопросов с развернутым ответом по всему курсу | ||
+ | * может добавить к вашей оценке максимум 2 балла | ||
+ | |||
+ | Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии '''"МиСОБОД. Экзамен"''' на сайте https://exams.mipt.ru. | ||
+ | |||
+ | Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить '''[https://docs.google.com/forms/d/e/1FAIpQLSeYpjvh5sYa2FTLVqsZRjgWn_CUcnDx4Gup6vOWJtrIM8LisA/viewform?usp=sf_link форму]'''. Тем, у кого накоп 10, можно ничего не заполнять. | ||
== Преподаватели == | == Преподаватели == | ||
Строка 27: | Строка 76: | ||
* Цион Михаил | * Цион Михаил | ||
* Содиков Махмуд | * Содиков Махмуд | ||
+ | * Воропаев Роберт | ||
+ | |||
+ | == Список рекомендуемых материалов == | ||
+ | === Основная литература === | ||
+ | # Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015 | ||
+ | # Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis | ||
+ | # Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015. | ||
+ | === Дополнительная литература === | ||
+ | # Chuck Lam. Hadoop in Action. New York: Manning Publications co. | ||
+ | # Alex Holmes , "Hadoop in Practice" | ||
+ | # Martin Fowler, "NoSQL" | ||
+ | # Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks" | ||
+ | # Jonathan Leibiusky, "Getting Started with Storm" | ||
+ | # Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly. | ||
+ | # Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley. | ||
+ | # Spark Core Programming. TutorialsPoint, 2015. | ||
+ | # Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly. | ||
+ | # Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly. | ||
+ | # Lars George. HBase: The Definitive Guide. O’Reilly. | ||
+ | # Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly. |
Текущая версия на 02:59, 29 декабря 2020
Содержание
О курсе
- Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
- Форма контроля: экзамен.
Важные ссылки
Лекции
Семинары
Инфраструктура
- Инструкция по работе с ШАДовским кластером
- Инструкция по работе с тестир. системой. Использовать начиная со 2й домашки
Формы контроля
Вся организационная информация содержится в 0й презентации (слайды 6, 7).
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
HDFS | 01.10, 08:00 | 01.10, 08:00 |
MapReduce | 21.10, 08:00 | 28.12, 08:00 |
Hive | 09.11, 08:00 | 16.11, 08:00 |
Spark | 01.12, 08:00 | 08.12, 08:00 |
RealTime & Kafka | 12.12, 08:00 | 19.12, 08:00 |
Cassandra | 26.12, 08:00 | 26.12, 08:00 |
Мини-контрольные
Состоится 4 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
Название события на http://exams.mipt.ru/ | Дата | Длительность |
---|---|---|
МИСОБОД. HDFS & MAPREDUCE | 28.10.2020 | 15 мин. |
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 16.12 во время семинаров.
Экзамен
Экзамен состоится 29.12 в 12:00.
- 45 минут
- 6 вопросов с развернутым ответом по всему курсу
- может добавить к вашей оценке максимум 2 балла
Экзамен будет проводиться с помощью системы прокторинга МФТИ. Для доступа зарегистрируйтесь до начала экзамена в событии "МиСОБОД. Экзамен" на сайте https://exams.mipt.ru.
Если вы согласны с текущей оценкой и не планируете сдавать экзамен, нужно заполнить форму. Тем, у кого накоп 10, можно ничего не заполнять.
Преподаватели
- Ивченко Олег - основной преподаватель
- Жестов Анатолий - лектор по администрированию экосистемы BigData
- Лахвич Дмитрий - лектор по Spark и Spark Streaming
- Липовский Роман - лектор по NoSQL over BigData
- Ахтямов Павел - лектор и семинарист по HBase
Учебные ассистенты
- Цион Михаил
- Содиков Махмуд
- Воропаев Роберт
Список рекомендуемых материалов
Основная литература
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная литература
- Chuck Lam. Hadoop in Action. New York: Manning Publications co.
- Alex Holmes , "Hadoop in Practice"
- Martin Fowler, "NoSQL"
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
- Jonathan Leibiusky, "Getting Started with Storm"
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
- Lars George. HBase: The Definitive Guide. O’Reilly.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.