Базы данных 2/simpledb
Описание
Описание пока что может отличаться от реального кода (какие-то взаимодействия еще не дописаны), но концепция скорее всего менять не будет.
Есть Server (SocketServer), который может принять и обработать запрос (RequestHandler), затем отправить клиенту ответ. Запрос предварительно парсится на: управляюдище команды, DDL, DML.
Если управляющая команда, то запрос уходит в ControlManager (там можно завершить соединение с клиентом exit)
Если DDL, то запрос отправляется в SchemaManager (там можно запросить список отношений с колонками и индексами, а в будущем создавать и удалять их).
Если запрос DML, то отправляется в QueryManager, который парсит запрос (с помощью QueryParser) и возвращает QueryPlan (список операций, типы операций и отношения, над которыми нужно их делать). Пример операции: table1, full_scan, condition. Результат работы QueryParser QueryManager отправляет в BufferManager, в котором происходят все операции. Если BufferManager нужны данные, которых нет в оперативной памяти, он используя SchemaManager отправляет запросы в DiskManager, который возвращает блоки с диска. Получив блоки (и записи в них) в BufferManager, тот считывает записи оттуда с помощью Row и отправляет наверх к QueryParser, тот в свою очередь отправляет результаты назад к CommandManager, который интерпретирует их и выводит в виде строки пользователю.
При старте Server говорит SchemaManager, чтобы тот запустил свою инициализацию, по умолчанию это значит попросит BufferManager записать в оперативную мапять доступные схемы из файлов.
SchemaManager работает с Schema, который состоит из Column, у которых есть название, тип и размер.
Код
- Стартовый код расположен в git-репозитории: https://bitbucket.org/qs/simpledb
Задания
Задание 1
(Дедлайн будет установлен, когда часть стартового кода для этого задания будет полностью готов, но можно начинать делать)
Организовать работу BufferManager и DiskManager.
Описание взаимодействия
На данном этапе нужно реализовать подгрузку схемы отношения и взаимодействие менеджера памяти с диском.
Предлагается использовать следующую структуру файловой системы:
Корень базы --- table.data - файл со страницами с данными --- table.meta - файл со схемой отношения
Формат схемы отношений
Можно ограничиться читабельным форматом, например, перечислить через точку с запятой имя поля, тип и размер (если он есть):
id;int name;varchar;10 dt;datetime
Задания
1. BufferManager должен использовать свое адресное пространство при загрузке данных с диска (строить таблицу трансляции). Физический адрес - путь к файлу и смещение для перехода к нужному блоку.
2. Добавить команду добавления записей в таблицу. При этом расположение записей на блоке должно быть оптимальным для схемы.
Как только блок заполнен, его нужно сохранить на диск. Если блок изменен, то через несколько операций (или по таймеру) он также долже быть сохранен на диск.
Блок должен относиться к одному отношению. В блоке должны быть: ссылка на схему отношения, ссылка на следующий блок, бит переполнения (используется, если запись не поместилась в блок целиком)
Схема отношения должна содержать адрес файла, в котором находятся блоки с записями.