Msbdp 20 — различия между версиями
Материал из Wiki - Факультет компьютерных наук
VeLKerr (обсуждение | вклад) (→Инфраструктура) |
VeLKerr (обсуждение | вклад) (→Дедлайны по домашкам) |
||
Строка 31: | Строка 31: | ||
|[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 21.10, 08:00 || 28.12, 08:00 | |[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/02-mapreduce.md MapReduce] || 21.10, 08:00 || 28.12, 08:00 | ||
|- | |- | ||
− | |[https:// | + | |[https://gitlab.com/VeLKerr/hse_bigdata/-/blob/master/homeworks/03-hive.md Hive] || 09.11, 08:00 || 16.11, 08:00 |
|} | |} | ||
Версия 01:04, 26 октября 2020
Содержание
О курсе
- Курс читается для студентов 4-го курса ФКН ВШЭ в 1-2 модулях.
- Форма контроля: экзамен.
Важные ссылки
Лекции
Семинары
Инфраструктура
- Инструкция по работе с ШАДовским кластером
- Инструкция по работе с тестир. системой. Использовать начиная со 2й домашки
Формы контроля
Вся организационная информация содержится в 0й презентации (слайды 6, 7).
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
HDFS | 01.10, 08:00 | 01.10, 08:00 |
MapReduce | 21.10, 08:00 | 28.12, 08:00 |
Hive | 09.11, 08:00 | 16.11, 08:00 |
Преподаватели
- Ивченко Олег - основной преподаватель
- Жестов Анатолий - лектор по администрированию экосистемы BigData
- Лахвич Дмитрий - лектор по Spark и Spark Streaming
- Липовский Роман - лектор по NoSQL over BigData
- Ахтямов Павел - лектор и семинарист по HBase
Учебные ассистенты
- Цион Михаил
- Содиков Махмуд
Список рекомендуемых материалов
Основная литература
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная литература
- Chuck Lam. Hadoop in Action. New York: Manning Publications co.
- Alex Holmes , "Hadoop in Practice"
- Martin Fowler, "NoSQL"
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks"
- Jonathan Leibiusky, "Getting Started with Storm"
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly.
- Lars George. HBase: The Definitive Guide. O’Reilly.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly.