Базы данных 2/simpledb — различия между версиями
Ivsavin (обсуждение | вклад) |
Ivsavin (обсуждение | вклад) |
||
Строка 46: | Строка 46: | ||
name;varchar;10 | name;varchar;10 | ||
dt;datetime | dt;datetime | ||
+ | |||
+ | Можно также хранить тип в виде числа объявленного в Const. | ||
+ | |||
+ | Для данного задания точкой входа является BufferManager.executeQuery, который принимает queryPlan - список из операций (Операция определяется как отношение, тип операции (на данном этапе это full_scan) и предикат). | ||
+ | |||
+ | Адресацию в таблице трансляции в BufferManager можно сделать относительно просто воспринимаемой: в качестве ключа в bufferTable нужно указать имя файла данных и смешение относительно начала файла, например: | ||
+ | |||
+ | table1.data:32 | ||
+ | |||
+ | executeQuery запрашивает у SchemaManager файл с данными. Так как нужно выполнить операцию full_scan, то первоначальный адрес страницы, которую нужно загрузить в память будет table1.data:0, нужно проверить, загружена ли она в таблицу трансляции, и если нет, то с помощью DiskManager считать ее. | ||
+ | |||
+ | Также нужно, чтобы у страницы (Page) была ссылка на следующую страницу. | ||
===== Задания ===== | ===== Задания ===== |
Версия 10:14, 31 января 2017
Описание
Описание пока что может отличаться от реального кода (какие-то взаимодействия еще не дописаны), но концепция скорее всего менять не будет.
Есть Server (SocketServer), который может принять и обработать запрос (RequestHandler), затем отправить клиенту ответ. Запрос предварительно парсится на: управляюдище команды, DDL, DML.
Если управляющая команда, то запрос уходит в ControlManager (там можно завершить соединение с клиентом exit)
Если DDL, то запрос отправляется в SchemaManager (там можно запросить список отношений с колонками и индексами, а в будущем создавать и удалять их).
Если запрос DML, то отправляется в QueryManager, который парсит запрос (с помощью QueryParser) и возвращает QueryPlan (список операций, типы операций и отношения, над которыми нужно их делать). Пример операции: table1, full_scan, condition. Результат работы QueryParser QueryManager отправляет в BufferManager, в котором происходят все операции. Если BufferManager нужны данные, которых нет в оперативной памяти, он используя SchemaManager отправляет запросы в DiskManager, который возвращает блоки с диска. Получив блоки (и записи в них) в BufferManager, тот считывает записи оттуда с помощью Row и отправляет наверх к QueryParser, тот в свою очередь отправляет результаты назад к CommandManager, который интерпретирует их и выводит в виде строки пользователю.
При старте Server говорит SchemaManager, чтобы тот запустил свою инициализацию, по умолчанию это значит попросит BufferManager записать в оперативную мапять доступные схемы из файлов.
SchemaManager работает с Schema, который состоит из Column, у которых есть название, тип и размер.
Код
- Стартовый код расположен в git-репозитории: https://bitbucket.org/qs/simpledb
Задания
Задание 1
(Дедлайн будет установлен, когда часть стартового кода для этого задания будет полностью готов, но можно начинать делать)
Организовать работу BufferManager и DiskManager.
Описание взаимодействия
На данном этапе нужно реализовать подгрузку схемы отношения и взаимодействие менеджера памяти с диском.
Предлагается использовать следующую структуру файловой системы:
Корень базы --- table.data - файл со страницами с данными --- table.meta - файл со схемой отношения
Формат схемы отношений
Можно ограничиться читабельным форматом, например, перечислить через точку с запятой имя поля, тип и размер (если он есть):
id;int name;varchar;10 dt;datetime
Можно также хранить тип в виде числа объявленного в Const.
Для данного задания точкой входа является BufferManager.executeQuery, который принимает queryPlan - список из операций (Операция определяется как отношение, тип операции (на данном этапе это full_scan) и предикат).
Адресацию в таблице трансляции в BufferManager можно сделать относительно просто воспринимаемой: в качестве ключа в bufferTable нужно указать имя файла данных и смешение относительно начала файла, например:
table1.data:32
executeQuery запрашивает у SchemaManager файл с данными. Так как нужно выполнить операцию full_scan, то первоначальный адрес страницы, которую нужно загрузить в память будет table1.data:0, нужно проверить, загружена ли она в таблицу трансляции, и если нет, то с помощью DiskManager считать ее.
Также нужно, чтобы у страницы (Page) была ссылка на следующую страницу.
Задания
1. BufferManager должен использовать свое адресное пространство при загрузке данных с диска (строить таблицу трансляции). Физический адрес - путь к файлу и смещение для перехода к нужному блоку.
2. Добавить команду добавления записей в таблицу. При этом расположение записей на блоке должно быть оптимальным для схемы.
Как только блок заполнен, его нужно сохранить на диск. Если блок изменен, то через несколько операций (или по таймеру) он также долже быть сохранен на диск.
Блок должен относиться к одному отношению. В блоке должны быть: ссылка на схему отношения, ссылка на следующий блок, бит переполнения (используется, если запись не поместилась в блок целиком)
Схема отношения должна содержать адрес файла, в котором находятся блоки с записями.