Компьютерные сети 2 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 26: Строка 26:
 
* [https://docs.google.com/presentation/d/1KbDPmvUIaZUvpKnqDhYZkKgPZ_r8Q1eecwzi2fBVR8E/edit?usp=sharing Лекция 6]
 
* [https://docs.google.com/presentation/d/1KbDPmvUIaZUvpKnqDhYZkKgPZ_r8Q1eecwzi2fBVR8E/edit?usp=sharing Лекция 6]
 
* [https://docs.google.com/presentation/d/1_4Rn45tAEROq43zXQhwAWzU55Gjmb0QNlPSIoZfQ0M8/edit?usp=sharing Лекция 7]
 
* [https://docs.google.com/presentation/d/1_4Rn45tAEROq43zXQhwAWzU55Gjmb0QNlPSIoZfQ0M8/edit?usp=sharing Лекция 7]
 +
* [https://docs.google.com/presentation/d/1xaX0ZiE6uBH84hRwuR3fVoEBeHcbv-JaVQ41wbQ392k/edit?usp=sharing Лекция 8]
  
 
=== Практические задания ===
 
=== Практические задания ===

Версия 08:39, 6 июня 2017

Компьютерные сети

Продвинутый курс по компьютерным сетям для специальности РС.

План курса

  1. Современное состояние сети Интернет и актуальные технологические тренды. Веб как новый десктоп, мобильные клиенты, Интернет вещей.
  2. Модельный пример №1 – веб-приложение. Цепочка технологий, которые обеспечивают функционирование современного веба. От протоколов HTTP (HTTPS) вниз через DNS и TCP к канальной сети.
  3. (Две лекции) Принципы работы основных веб-технологий: протокола HTTP, мехнизма реализации сеансов cookies, набора технологий HTML 4 (объектная модель документа + CSS + язык javascript). Эволюция HTTP. Современная экосистема протоколов, обслуживающих веб. Протокол DNS. Перспективы – HTTP/2.
  4. Особенности функционирования веб-приложений в современной сетевой инфраструктуре, высоконагруженные приложения, поддержка на стороне механизмов операционных систем и инфраструктуры. Основы BGP маршрутизации, IP anycast, CDN.
  5. Защита соединения. Семейство протоколов SSL/TLS. Аутентификация пользователей в сетевых приложениях на примере веб-приложений. HTTP basic auth, digest, аутентификация по сертификатам. Способы представления и хранения парольной информации в нагруженных сервисах.
  6. Протокол TCP в деталях. Механизмы управления потоком и перегрузками – варианты протокола для различных условий канальной среды. Эволюция протокола, современные расширения, аппаратная поддержка – large segments, tcp offloading.
  7. Нагрузочное тестирование сетевых приложений на примере веб-приложения. Шаблоны настройки производительности сетевых приложений. Варианты архитектур приложений, разделение на фронтенд и бэкенд части, протоколы взаимодействия сервера с бэкендом (CGI/FastCGI/бинарные). Защита от атак «отказ в обслуживании».
  8. Два варианта реализации сетевого приложения – централизованный и распределенный. Обмен файлами, обмен мгновенными сообщениями, разделение контента между клиентами. P2P протоколы. BitTorrent. DHT. Системы мгновенного обмена сообщениями, сравниваем централизованные и распределенные (P2P) сети. Signal/OTR, TorChat. Типовые проблемы распределенных сетей и их решение.
  9. Обзорное введение в виртуализацию сетей, MPLS, Overlay сети – VPN, CDN, архитектура сетей в ЦОД и эволюция коммутационных протоколов, SDN. Заключение.

Материалы лекций

Лекционные материалы публикуются по мере продвижения по курсу.

Практические задания

Дедлайн по заданиям: задание 1 - 9 июня 2017 г., задание 2 - 12 июня 2017 г.

В рамках курса нужно написать два приложения, на которых исследовать поведение стека протоколов и сетевого стека операционной системы.

Задание 1: Динамическое веб-приложение

В первом задании нужно разработать асимметричное клиент-серверное приложение вида "много клиентов, один сервер" и побенчмаркать его в различных условиях. Код приложения вместе с бенчмарками и результатами тестов опубликовать на github.

  Описание задачи:

Вам нужно разработать веб-приложение со статической и динамической частью. Динамическая часть должна быть реализована с использованием базовых средств выбранного языка программирования и его стандартной библиотеки для реализации HTTP сервера (для python используйте flask). Приложение должно реализовывать регистрацию и аутентификацию пользователей внутри приложения (не средствами веб-сервера), для хранения пользовательских данных можно использовать файл на диске или любую СУБД. Работа с паролями - scrypt (PBKDF2) и sha256. Аутентифицированный пользователь получает доступ к трем функциям приложения: "быстрая" (поле ввода query к СУБД, POST запрос на приложение, передача query в СУБД, передача результата клиенту), "вычислительная" (факторизовать большое число), "медленная" (обратный ping - клиент через POST запрос отправляет команду серверу пропинговать клиента с параметрами для ping, использовать все поддерживаемые параметры ping, сервер по мере работы ping отправляет клиенту вывод, клиент отрисовывает динамически получаемые данные по мере прихода от сервера). Статическая часть содержит картинки и "большие" файлы (четыре файла по 50Мб). Два варианта раздачи статики - через код приложения и через веб-север (nginx или apache). Бенчмарк для приложения на основе yandex tank и динамического бота на phantomjs. На phantomjs реализовать основные сценарии работы с приложением: регистрация пользователя, логин, выполнение каждой из трех функций, логаут, удаление пользователя. Реализовать нагрузочный тест с тремя различными распределениями "пользовательской" активности:

  • Пользователи часто регистрируются и логинятся/выходят из приложения (нагрузка на систему аутентификации и работы с паролями).
  • Много пользователей одновременно приходят на одну из функций приложения (отдельно на "быструю", "вычислительную" и "медленную").
  • Много пользователей запрашивают статические ресурсы.
  Условия функционирования приложения:

Для тестирования приложения нужно создать две виртуальные машины - серверная и клиентская. На серверной машине нужно настроить DNS-сервер, который будет обслуживать домен (например, omg.test) с использованием приватного адресного пространства ваших виртуальных машин. Сервер и клиент должны разрешаться этим DNS сервером по символическим доменным именам в созданной зоне.

  • Приложение обслуживает клиентов непосредственно без участия веб-сервера.
  • Приложение обслуживает клиентов через веб-сервер nginx (как обратный прокси или через API uWSGI).
  • (опционально, бонус) Статику раздавать с файловой системы pingfs: https://github.com/yarrick/pingfs
  Результаты тестирования:

В каждом из вариантов нужно прогнать бенчмарк сервера в течение значительного времени (5-10 минут). По каждому прогону бенчмарка необходимо собирать следующие данные:

  • Пропускная способность приложения в количестве запросов в секунду (RPS)
  • Время отклика (latency)
  • Распределение кодов ответа и ошибок
  • Использование памяти на сервере
  • Использование CPU на сервере
  • Количество открытых файловых дескрипторов на сервере
  • Для действий регистрации пользователей и аутентификации - количество действий в секунду (отдельно для реализации с PBKDF2, отдельно с SHA256).

По собранным метрикам построить графики и написать аналитический отчет, в котором объяснить полученные результаты (как меняется RPS при разных условиях и почему, как себя ведёт стек операционной системы).

Задание 2: Распределенный P2P браузерный мессенджер

Нужно реализовать распределенный P2P чат поверх peerjs/WebRTC, который позволяет обмениваться сообщениями между пирами в чате и файлами. В библиотеке peerjs есть развернутый example пример чата, который можно взять за основу.

(простая часть):

  • взять готовый example чат, и реализовать поверх него распределенный алгоритм вычисления минимума из множества чисел
  • каждый "клиент" при запуске случайно выбирает целое число
  • между клиентами задана некоторая произвольная топология, т.е. каждый знает, кто у него является соседом, топологию можно задать статически в коде, но это не должен быть полносвязный граф
  • с помощью волнового алгоритма эха (Лекция или "Введение в распределенные алгоритмы", Жерар Тель, страница 206) посчитать минимум из этих чисел, передавая их между соседями в виде сообщений

(сложная часть, опциональная):

  • В чате должна храниться key-value таблица соответствия id - Name, Surname, email для участников чата, в виде distributed hash table (DHT), для этого нужно выбрать алгоритм DHT (Kademlia?)
  • Новые пиры должны подключаться с помощью bootstrap-процесса через известный id участника P2P чата, получать DHT-идентификатор, и хранить у себя часть общей DHT в соответствии с выбранным алгоритмом реализации DHT.
  • Сообщения в чате должны маршрутизироваться по-разному, в зависимости от префикса сообщения - если сообщение начинается с команды /msg DHT-id или какой-то из частей value (Name, Surname, email) через спецсимвол @, то отправлять его следует только тому пиру, который является адресатом (для этого надо уметь делать поиск по DHT). Обычные сообщения отправляются всем пирам.
  • Аналогично с отправкой файла - через команду /sendfile или без команды.

Общее

Для практических заданий рекомендуется использовать python и javascript, разрешено использовать любую другую комбинацию серверного и клиентского языков программирования (erlang + coffeescript, nodesj + js, go + actionscript, etc).

Рекомендованные фреймворки и библиотеки:

Для тестирования:

Оценки

Расчет оценки

Вклад в оценку:

  • Практические задания (2 штуки) - 80%, для зачета обязательно нужно выполнить все задания
  • Итоговый тест (как домашняя работа) - 20%

Литература

Основная литература:

  • Michał Zalewski. The Tangled Web: A Guide to Securing Modern Web Applications.
  • James F. Kurose and Keith W. Ross, Computer Networking: A Top-Down Approach, Addison-Wesley, 5th edition.
  • Douglas Comer. Internetworking with TCP/IP: Principles, protocols and architecture. Prentice Hall, 2006.
  • Æleen Frisch. Essential system administration. O’Reilly Media Inc., 2002.

Дополнительная литература:

Контакты

  • Почта: gamajun@gmail.com
  • Tg: @jamadharma