Обработка и анализ больших массивов данных (МОиВС, осень21, 2022) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (first upd. Sync with Github readme)
м (table bug fix)
Строка 20: Строка 20:
 
  ! Занятие !! Тема !! Дата !! Преподаватель !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
  ! Занятие !! Тема !! Дата !! Преподаватель !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' || Введение в распределенные системы. Bash & Docker || Анатолий Бардуков || 12.09.22 || ||  
+
| style="background:#eaecf0;" | '''1''' || Введение в распределенные системы. Bash & Docker || 12.09.22 || Анатолий Бардуков  ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' || SQL, NoSQL, MPP-format. Знакомство с видами БД, синтаксис запросов || Иван Свиридов || 16.09.22|| ||
+
| style="background:#eaecf0;" | '''2''' || SQL, NoSQL, MPP-format. Знакомство с видами БД, синтаксис запросов || 16.09.22 || Иван Свиридов|| ||
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' || Hadoop || Иван Свиридов || 30.09.22 || ||
+
| style="background:#eaecf0;" | '''3''' || Hadoop || 30.09.22 || Иван Свиридов || ||
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' || YARN package manager, HDFS, MapReduce || Анатолий Бардуков || 07.10.22 || ||
+
| style="background:#eaecf0;" | '''4''' || YARN package manager, HDFS, MapReduce || 07.10.22 || Анатолий Бардуков || ||
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' || Spark RDD || Мария Соозарь || 14.10.22 || ||
+
| style="background:#eaecf0;" | '''5''' || Spark RDD || 14.10.22 || Мария Соозарь || ||
 
|-
 
|-
| style="background:#eaecf0;" | '''6''' || Spark DataFrame + Spark SQL ||  || 21.10.22 || ||
+
| style="background:#eaecf0;" | '''6''' || Spark DataFrame + Spark SQL || 21.10.22 ||  || ||
 
|-
 
|-
 
|
 
|

Версия 14:00, 18 октября 2022

О курсе

Занятия проводятся в Zoom по пятницам в 19:00

Контакты

Канал курса в TG: channel link

Чат курса в TG: chat link

Преподаватели: Бардуков Анатолий (TG: @sindq), Свиридов Иван, Соозарь Мария

Материалы курса

Ссылка на плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzAcOe1hOaDW8Jj4mVaLOoDD

Ссылка на GitHub с материалами курса: [GitHub]

Занятие Тема Дата Преподаватель Материалы для самоподготовки к семинарам Дополнительные материалы
1 Введение в распределенные системы. Bash & Docker 12.09.22 Анатолий Бардуков
2 SQL, NoSQL, MPP-format. Знакомство с видами БД, синтаксис запросов 16.09.22 Иван Свиридов
3 Hadoop 30.09.22 Иван Свиридов
4 YARN package manager, HDFS, MapReduce 07.10.22 Анатолий Бардуков
5 Spark RDD 14.10.22 Мария Соозарь
6 Spark DataFrame + Spark SQL 21.10.22
7 Spark ML + handcrafted ML on Spark
8 MLOps (model -> Docker -> prod + balancer), MLFlow
9 Distributed Learning. Quantization, Distillation and Prunning
10 Approximate answer searching: LSH + HNSW
11 Streaming (Spark + Kafka)
12 Flink

Формула оценивания

min(10, 0.6 ДЗ + 0.4 проект + 0.3 бонусы)

Лист с оценками: https://docs.google.com/spreadsheets/d/158tztQ-jFFErWMk7k3INnSs8tjDTWP9j1SBE-uxFfMw/edit?usp=sharing

Домашние задания

Литература