Краткий обзор реляционных систем управления базами данных
Linux, MariaDB, mySQL | Комментировать запись
Реляционные базы данных уже давно используются в программировании. В своё время они обрели популярность благодаря простоте и удобству реляционной модели работы с данными.
Данная статья анализирует различия между наиболее популярными реляционными системами управления базами данных (СУБД): SQLite, MySQL и PostgreSQL.
Системы управления базами данных
Базы данных – это логически смоделированные хранилища различной информации (данных) всех видов. Каждая база данных SQL основана модели, которая предоставляет структуру для хранящихся в ней данных. Системы управления базами данных – это приложения (или библиотеки), которые управляют базами данных различных форм, размеров и видов.
Примечание: Чтобы узнать больше о СУБД, читайте статью SQL, NoSQL и другие модели баз данных.
Реляционные системы управления базами данных
Реляционные СУБД для работы с данными используют реляционную модель. Эта модель хранит любую информацию в таблицах в виде связанных записей с атрибутами.
Этот тип СУБД требует наличия структур-таблиц. Столбцы (атрибуты) такой таблицы содержат различные типы данных. Каждая запись БД воспринимается как строка в таблице, атрибуты которой представлены в виде столбцов.
Отношения и типы данных
Отношения можно рассматривать как математические наборы, содержащие ряд атрибутов, которые в совокупности представляют собой базы данных и хранимую в ней информацию.
Добавляя запись в таблицу, нужно распределить все её компоненты (атрибуты) по типам данных. Разные реляционные СУБД используют разные типы данных, и они не всегда взаимозаменяемы.
Подобные ограничения (как, например, с типами данных) типичны для реляционных СУБД, ведь, по сути, отношения между данными и строятся на основе ограничений.
Примечание: Базы данных NoSQL не имеют таких строгих ограничений, поскольку они не выстраивают таких отношений между данными. Чтобы узнать больше о NoSQL, читайте эту статью.
Популярные реляционные базы данных
В данной статье мы рассмотрим три наиболее важные и популярные СУБД с открытым исходным кодом.
- SQLite: встроенная мощная система управления базами данных.
- MySQL: самая популярная и широко распространённая БД.
- PostgreSQL: продвинутая SQL-совместимая объектная СУБД с открытым исходным кодом.
Примечание: Приложения с открытым исходным кодом почти всегда дают пользователям право на свободное использование и изменение кода. Ответвляя код, вы можете создать совершенно новое приложение. Одним из ответвлений MySQL, например, является MariaDB.
SQLite
SQLite – это производительная библиотека, которую можно встраивать в приложения. Полноценная БД на основе файлов SQLite предлагает широкий набор инструментов для обработки всех видов данных и накладывает намного меньше ограничений, чем другие реляционные базы данных.
Приложения, использующие SQLite, не взаимодействуют с помощью интерфейса (портов, сокетов), а отправляют прямые запросы в файл, в котором хранятся данные (например БД SQLite). Благодаря этому приложение SQLite очень быстрое и производительное.
Типы данных SQLite
- NULL: пустое значение.
- INTEGER: целочисленное значение (зависимо от объёма значение хранится в 1, 2, 3, 4, 6 или 8 байтах).
- REAL: число с плавающей точкой, хранится в виде 8-байтного IEEE.
- TEXT: текстовая строка, хранится в зашифрованном виде (UTF-8, UTF-16BE или UTF-16LE).
- BLOB: бинарные данные, хранятся в том виде, в котором были введены.
Примечание: Больше о типах данных SQLite можно узнать в официальной документации.
Преимущества SQLite
- Простое строение на основе файлов: вся база данных состоит всего из одного файла, что увеличивает её портативность.
- Стандарты: несмотря на простоту, система SQLite основана на SQL. Некоторые функции опущены (RIGHT OUTER JOIN или FOR EACH STATEMENT), однако вместо них добавлены другие.
- SQLite отлично подходит для разработки или тестирования. На этих этапах почти всегда необходимо простое, но масштабируемое решение.
Недостатки SQLite
- Нет управления пользователями. Более сложные СУБД поддерживают управление пользователями (их взаимосвязями, привилегиями и т.п.). Простая СУБД SQLite такой функции не предоставляет.
- Невозможно повысить производительность. Библиотека SQLite проста в настройке и в использовании. Однако она разработана таким образом, что не позволяет путём тонкой настройки получить дополнительную производительность. То есть сделать SQLite более производительной технически невозможно.
Когда лучше использовать SQLite
- Простые встроенные приложения, которым нужна портативность, например, однопользовательские локальные приложения, мобильные приложения, игры.
- Замена диска. Обычно приложения, которым необходимо читать или записывать файлы на диск, могут использовать SQLite для получения дополнительных функций.
- Тестирование.
Когда лучше не использовать SQLite
- Многопользовательские приложения. Если приложение построено таким образом, что большое количество клиентов одновременно использует одну БД, то в такое приложение лучше внедрить полнофункциональную реляционную СУБД (например, MySQL).
- Приложения, записывающие большое количество данных. операция записи является одним из ограничений SQLite. Эта СУБД позволяет выполнять только одну операцию записи за один момент времени, следовательно, она ограничивает пропускную способность.
MySQL
MySQL – самая популярная СУБД. Это многофункциональное открытое приложение, поддерживающее работу огромного количества сайтов. Система MySQL довольно проста в работе и может хранить большие массивы данных.
Примечание: Учитывая популярность MySQL, для этой системы было разработано большое количество сторонних приложений, инструментов и библиотек.
MySQL не реализует полный стандарт SQL. Несмотря на это, MySQL предлагает множество функциональных возможностей для пользователей: автономный сервер баз данных, взаимодействие с приложениями и сайтами и т.п.
Типы данных MySQL
- TINYINT: целое число в диапазоне от -128 до 127 (1 байт).
- SMALLINT: целое число от -32768 до 32767 (2 байта).
- MEDIUMINT: число от -8388608 до 8388608 (3 байта).
- INT или INTEGER: число в диапазоне от -2147683648 до 2147683648 (4 байта).
- BIGINT: число от -263 до 263-1 (8 байт).
- FLOAT: число с плавающей точкой (4 байта).
- DOUBLE, DOUBLE PRECISION, REAL: число с двойной точностью и плавающей точкой.
- DECIMAL, NUMERIC: величины повышенной точности.
- DATE: дата.
- DATETIME: дата и время.
- TIMESTAMP: временная метка.
- TIME: время в формате hh:mm:ss.
- YEAR: год (по умолчанию хранится в виде 4 цифр, но можно настроить и 2).
- CHAR: строка фиксированной длины.
- VARCHAR: строки переменных.
- TINYBLOB, TINYTEXT: Тип TEXT позволяет хранить текст, а BLOB – изображения, звук, электронные документы и т.п. Максимальная длина – 225 символов.
- BLOB, TEXT: большие объемы текста, максимум 65535 символов.
- MEDIUMBLOB, MEDIUMTEXT: аналогично предыдущему, но максимум до 16777215 символов.
- LONGBLOB, LONGTEXT: аналогично предыдущему, но максимум до 4294967295 символов.
- ENUM: принимает только одно из значений заданного множества.
- SET: принимает любой или все элементы из значений заданного множества.
Преимущества MySQL
- Простота в работе: MySQL очень просто установить и настроить. Сторонние инструменты, в том числе визуализаторы (интерфейсы) значительно упрощают работу с данными.
- Функциональность: MySQL поддерживает огромное количество функций SQL.
- Безопасность: MySQL предоставляет много встроенных продвинутых функций для защиты данных.
- Масштабируемость и производительность: MySQL может работать с большими объёмами данных.
Недостатки MySQL
- Ограничения: структура MySQL накладывает некоторые ограничения, из-за которых не смогут работать продвинутые приложения.
- Уязвимости: метод обработки данных, применяемый в MySQL, делает эту СУБД немного менее надёжной по сравнению с другими СУБД.
- Медленное развитие: хотя MySQL является продуктом с открытым исходным кодом, он очень медленно развивается. Однако тут следует заметить, что на MySQL основано несколько полноценных баз данных (например, MariaDB).
Когда использовать MySQL
- Распределенные операции: автономный сервер баз данных MySQL поддерживает множество операций и предоставляет несколько дополнительных функций.
- Высокая безопасность данных: MySQL предлагает высокую защиту данных.
- Веб-сайты и веб-приложения: несмотря на ограничения MySQL может поддерживать работу почти любого сайта и веб-приложения. Этот гибкий и масштабируемый инструмент прост в использовании.
- Пользовательские решения: MySQL можно подогнать под строгие требования сайта или приложения.
Когда лучше не использовать MySQL
- Конфликты с SQL: поскольку MySQL всё же полностью не реализует стандартов SQL, он не полностью совместим с SQL. Потому MySQL не всегда можно интегрировать с другой СУБД.
- Слабая поддержка параллелизма: несмотря на то, что MySQL хорошо выполняет операции чтения, одновременные операции чтения и записи могут вызвать проблемы.
- Отсутствие некоторых функций (например, полнотекстового поиска).
PostgreSQL
PostgreSQL – это продвинутая открытая объектно-ориентированная СУБД. PostgreSQL реализует SQL-стандарты ANSI/ISO.
В отличие от других СУБД, PostgreSQL поддерживает очень важные объектно-ориентированные и реляционные функции баз данных: надежные транзакции ACID (атомарность, согласованность, изолированность, долговечность) и т.п.
Основанная на надёжной технологии СУБД PostgreSQL может одновременно обрабатывать большое количество задач. Поддержка согласованности достигается без блокирования операций чтения благодаря MVCC.
Хотя СУБД PostgreSQL не так популярна, как MySQL, для неё тоже разработано большое количество дополнительных инструментов и библиотек, которые упрощают работу с данными и увеличивают производительность СУБД.
Типы данных PostgreSQL
- bigint: знаковое восьмибайтное целое число.
- bigserial: восьмибайтное целое число с автоинкрементом.
- bit [(n)]: битовая строка фиксированной длины.
- bit varying [(n)]: битовая строка с переменной длиной.
- boolean: логическое значение (true/false).
- box: четырёхугольник на плоскости.
- bytea: бинарные данные.
- character varying [(n)]: строка символов с переменной длиной.
- character [(n)]: строка символов с фиксированной длиной
- cidr: адрес сети IPv4 или IPv6.
- circle: круг на плоскости.
- date: дата (год, месяц, день).
- double precision: число с плавающей точкой двойной точности (8 байт).
- inet: адрес хоста IPv4 или IPv6.
- integer: знаковое четырёхбайтовое целое число.
- interval [fields] [(p)]: промежуток времени.
- line: бесконечная линия на плоскости.
- lseg: сегмент линии на плоскости.
- macaddr: MAC (Media Access Control) адрес.
- money: валюта.
- numeric [(p, s)]: точное числовое значение с выбранной точностью.
- path: геометрический путь на плоскости.
- point: геометрическая точка на плоскости.
- polygon: закрытый геометрический путь на плоскости (полигон)
- real: число с плавающей точкой одинарной точности (4 байта).
- smallint: знаковое двухбайтное целое число.
- serial: четырёхбайтное целое число с автоинкрементом.
- text: строка символов с переменной длиной.
- time [(p)] [without time zone]: время дня (без часового пояса).
- time [(p)] with time zone: время дня и часовой пояс.
- timestamp [(p)] [without time zone]: временная метка (дата и время) без часового пояса.
- timestamp [(p)] with time zone: временная метка с часовым поясом.
- tsquery: запрос текстового поиска.
- tsvector: документ текстового поиска.
- txid_snapshot: снапшот ID-транзакции уровня пользователя.
- uuid: универсальный уникальный идентификатор.
- xml: данные XML.
Преимущества PostgreSQL
- Система управления базами данных PostgreSQL открытая, SQL-совместимая, свободная.
- Активное сообщество PostgreSQL поможет найти решение любой проблемы, связанной с СУБД, в любое время суток.
- Поддержка сторонних инструментов: помимо встроенных продвинутых функций, PostgreSQL поддерживает множество открытых сторонних инструментов для проектирования, управления данными и т.п.
- Масштабируемость и расширяемость.
- Объектно-ориентированность.
Недостатки PostgreSQL
- Производительность: в некоторых ситуациях производительность PostgreSQL ниже, чем у MySQL.
- Невысокая популярность.
- В связи с вышеперечисленными недостатками не все хостинг-провайдеры поддерживают PostgreSQL.
Когда использовать PostgreSQL
- Если приложению необходима целостность данных.
- Для выполнения сложных пользовательских задач.
- Если в будущем приложению понадобится более надёжная платная БД, с PostgreSQL легче будет перейти.
- Для поддержки приложений со сложной структурой PostgreSQL предлагает специальный набор функций.
Когда лучше не использовать PostgreSQL
- Если приложению нужны быстрые операции чтения.
- Если приложению не нужна абсолютная целостность данных, ACID или сложная структура, PostgreSQL может стать слишком сложным решением.
- Репликация данных сложнее, чем в MySQL, потому в кластерах PostgreSQL лучше не использовать.