Информационное письмо
Образец оформления статьи
Анкета автора
29.02.2016

Выбор NoSQL СУБД для построения системы мониторинга ИТ инфраструктуры

Туйсузов Артём Владимирович
Магистрант Санкт-Петербургский государственный экономический университет, г. Санкт-Петербург, РФ
Аннотация: Рассмотрение современных технологий хранения больших объёмов данных. Обзор основных критериев выбора нереляционных СУБД. Применение метода анализа иерархий Т. Саати в СППР «Выбор» для получения наилучшей альтернативы.
Ключевые слова: информационные технологии, ИТ-инфраструктура, NoSQL, метод анализа иерархий
Электронная версия
Скачать (824.3 Kb)

Практически в любой современной организации ключевых фактором успеха является эффективное использование информационных технологий. Для выстраивания ИТ-стратегии в современных компаниях широко используется подход, рассматривающий информационные технологии как услуги, предоставляемые бизнесу. Одним из основных критериев успешного использования ИТ-ресурсов, в свою очередь, является эффективное построение и управление информационной инфраструктурой предприятия, для которой необходим постоянный и качественный мониторинг.

Поскольку узлы ИТ-инфраструктуры генерируют огромное количество данных, которые необходимо анализировать, одной из основных задач при построении системы мониторинга ИТ-инфраструктуры является выбор соответствующих методов и инструментов хранения данных. Задача осложняется разнообразием и слабой структурированностью необходимых данных. В данной статье предлагается рассмотреть различные современные технологии хранения данных (NoSQL) и сравнить их с использованием метода анализа иерархий (МАИ) американского ученого Томаса Саати. Данный метод является математическим инструментом системного подхода к сложным проблемам принятия решений и описан в его книге «Принятие решений. Метод анализа иерархий».

Наиболее распространёнными нереляционными типами хранилищ данных являются:

  • Хранилища «ключ-значение»
  • Хранилища семейств колонок
  • Документ-ориентированные СУБД

Хранилище ключ-значение

Тип хранилища ключ-значение является самым основным решением из семейства NoSQL. Этот тип БД работает с данными типа ключ-значение, например, как словарь. Здесь нет места ни структуре, ни связям. После подключения к серверу приложение может задать ключ и его значение, а в последствии получать эти данные по запросу.

Такие СУБД обычно используются для быстрого сохранения базовых данных, а иногда не таких уж и базовых, если подсчитать затраты процессора и памяти. Они, обычно, очень быстры, работоспособны или легко масштабируемы.

Хранилища семейств колонок

По сути это следующий шаг после СУБД типа ключ-значение. Несмотря на довольно сложную для понимания сущность, эти базы данных отлично работают просто создавая коллекции из одного или нескольких пар ключ-значение, которые в сумме соответствуют одной записи.

В отличии от привычных таблиц в реляционных моделях, эти СУБД не требует предварительного описания структуры данных. Каждая запись состоит из одного или нескольких столбцов содержащих данные, а каждый столбец разных записей может хранить разные типы данных.

В целом, хранилище семейств колонок это ни что иное как двумерный массив, где каждый ключ (запись) содержит одну или несколько пар ключ-значение привязанных к нему. Такая система позволяет хранить и использовать большие объемы неструктурированных данных.

Документ-ориентированные СУБД

Такие NoSQL СУБД являются одними из наиболее популярных на рынке сегодня. Они работают так же, как и предыдущие системы, но допускают гораздо большую вложенность и сложность структуры данных. Документы снимают ограничения вложенности первого и второго уровней типа ключ-значение в распределённых хранилищах. В целом, можно описать сколь угодно сложную структуру данных как документ и сохранить в такой БД.

Несмотря на довольно большой функционал и способность доступа к данным по одному ключу, такие СУБД имеют ряд своих проблем. Например, при доступе к одному документу, ответ будет содержать его целиком, даже если необходимо какое-то одно поле, что не может не сказаться на производительности.

Для сравнения вышеуказанных типов хранилищ были выбраны следующие основные критерии, основанные на важнейших требованиях, предъявляемых к системам хранения данных:

Производительность – критерий, основанный на скорости чтения и записи данных, поиска информации внутри хранилища и максимальным числом параллельных обращений к данным в многопользовательском режиме.

Масштабируемость – возможность увеличить вычислительную мощность системы (в частности, способности выполнять больше операций или транзакций за определенный период времени) за счет установки большего числа процессоров или их замены на более мощные.

Сложность – возможность хранения в системе сложных многоуровневых структур данных.

Гибкость – возможностьоперативного и простогодобавления новых данных, изменения существующей структуры, без последствий для дальнейшего использования.

Функциональность – дополнительные характеристики, позволяющие наиболее оптимально использовать СУБД, такие как возможные способы доступа к данным, наличие тех или иных интерфейсов подключения, встроенные агрегатные функции и т. д.

Для построения модели с использованием метода анализа иерархий существует множество различного программного обеспечения, как специализированного, так и общей направленности. В данной работе рассматривается система поддержки принятия решений (СППР) «Выбор».

С помощью данного программного обеспечения строится следующая иерархическая структура (рис. 1), включающая в себя 3 уровня: целей, критериев и альтернатив: 

Рисунок 1 - Иерархическая структура анализа

Рисунок 1 - Иерархическая структура анализа

Согласно шкале субъективных суждений, определяются приоритеты критериев, на основе которых строиться матрица парных сравнений критериев по отношению к цели (рис. 2):

Рисунок 2 - Матрица парных сравнений критериев

Рисунок 2 - Матрица парных сравнений критериев

Значение ОС = 0,097 считается приемлемым в соответствии с методологией Т. Саати, следовательно, коэффициенты попарных значений критериев подобраны верно.

На следующем этапе производится попарное сравнение альтернатив по каждому из критериев (рис. 3-7).

Рисунок 3 - Производительность

Рисунок 3 - Производительность

Рисунок 4 - Масштабируемость

Рисунок 4 - Масштабируемость

Рисунок 5 - Сложность

Рисунок 5 - Сложность

Рисунок 6 - Гибкость

Рисунок 6 - Гибкость

Рисунок 7 - Функциональность

Рисунок 7 - Функциональность

Итоговый результат отражает наиболее предпочтительный тип нереляционного хранилища с учётом комплексного их сравнения по каждому из критериев (рис. 8). 

Рисунок 8 - Диаграмма результатов

Рисунок 8 - Диаграмма результатов

 На основе проведённого анализа можно сделать вывод о том, что для решения поставленной задачи лучшим выбором будет размещение данных в документ-ориентированной СУБД.

Список литературы:

1. A Comparison Of NoSQL Database Management Systems And Models [электронный ресурс]. – Режим доступа: https://www.digitalocean.com/community/tutorials/a-comparison-of-nosql-database-management-systems-and-models. – (Дата обращения: 29.02.2016)

2. Олейник А. И., ИТ-инфрастуктура: учебно-методическое пособие. М.: ГУ ВШЭ. – 2013. 130 с.

3. Саати Т., Принятие решений. Метод анализа иерархий. М.: Радио и связь. – 1993. 278 с.