Сохранение базы данных - Database preservation

Сохранение базы данных обычно включает преобразование информации, хранящейся в база данных к форме, которая будет доступна в долгосрочной перспективе, как технологии изменяется без потери исходных характеристик (контекста, содержания, структуры, внешнего вида и поведения) данных.

Форматы сохранения

SIARD

Версия 1.0 формата программного независимого архивирования реляционных баз данных (SIARD) была разработана Швейцарским федеральным архивом в 2007 году. Он был разработан для архивирования реляционных баз данных в форме, независимой от производителя. Архив SIARD - это пакет файлов в формате ZIP, основанный на XML и SQL: 1999. Файл SIARD включает в себя как содержимое базы данных, так и обрабатываемые машиной структурные метаданные, в которых записывается структура таблиц базы данных и их взаимосвязи. ZIP-файл содержит XML-файл, описывающий структуру базы данных (metadata.xml), а также набор XML-файлов, по одному на таблицу, захватывающих содержимое таблицы. Архив SIARD может также содержать текстовые файлы и двоичные файлы, представляющие большие объекты базы данных (BLOB и CLOB). SIARD обеспечивает прямой доступ к отдельным таблицам с помощью инструментов ZIP. Архив SIARD не является оперативной базой данных, но поддерживает реинтеграцию заархивированной базы данных в другую систему управления реляционными базами данных (RDBMS), которая поддерживает SQL: 1999. Кроме того, SIARD поддерживает добавление описательных и контекстных метаданных, которые не записываются в самой базе данных, и встраивание файлов документации в архив.[1] SIARD версии 1.0 был омологирован как стандарт eCH-0165 в 2013 году.

Версия 2.0 формата хранения SIARD была спроектирована и разработана Швейцарскими федеральными архивами под эгидой проекта E-ARK.[2] Версия 2.0 основана на версии 1.0 и определяет формат, обратно совместимый с версией 1.0. Новые функции версии 2.0 включают:

  • Обновление поддержки SQL: 1999 до поддержки SQL: 2008
  • Поддержка всех типов SQL: 2008, в частности типов данных, определяемых пользователем (UDT)
  • Более явные правила проверки для определений типов данных с использованием регулярных выражений
  • Поддержка хранения больших объектов вне файла SIARD с использованием URI «file:»
  • Поддержка «deflate» как механизма сжатия.

DBML (язык разметки базы данных)

Схема XML была создана исследователем Хосе Карлосом Рамальо из Университета Минью для сбора табличной информации и данных из реляционной базы данных. Он был опубликован в 2007 году.[3]

Программного обеспечения

Набор инструментов для сохранения базы данных

Набор инструментов для сохранения баз данных (DBPTK) позволяет преобразовывать форматы баз данных, включая подключение к действующим системам, для сохранения баз данных в цифровом виде. Этот инструментарий позволяет преобразовывать действующие базы данных или базы данных с резервными копиями в форматы сохранения, такие как SIARD, формат на основе XML, созданный с целью сохранения базы данных. Этот инструментарий также позволяет преобразовывать форматы сохранения обратно в действующие системы, чтобы обеспечить полную функциональность баз данных. Например, он поддерживает специализированный экспорт в MySQL, оптимизированный для PhpMyAdmin, поэтому с базой данных можно полностью экспериментировать с использованием веб-интерфейса.

Этот инструментарий изначально был частью проекта RODA[4] а затем выпустили самостоятельно. Он получил дальнейшее развитие в проекте E-ARK вместе с новой версией формата сохранения SIARD.

Инструментарий использует модули ввода и вывода. Каждый модуль поддерживает чтение и / или запись в конкретный формат базы данных или действующую систему. Новые модули могут быть легко добавлены путем реализации нового интерфейса и добавления новых драйверов.[5]

Проекты сохранения базы данных

Исследовательские проекты в этой области включают:

Смотрите также

Рекомендации

  1. ^ "SIARD (Независимое программное обеспечение архивирования реляционных баз данных) Версия 1.0". 30 мая 2015 года.
  2. ^ «Проект E-ARK».
  3. ^ Хосе Карлос Рамальо, Мигель Феррейра, Луис Фариа и Руи Кастро (7 августа 2007 г.). «Сохранение реляционной базы данных посредством моделирования XML» (PDF). Экстремальные языки разметки. Получено 16 апреля, 2017.CS1 maint: использует параметр авторов (связь)
  4. ^ «Сообщество RODA - хранилище аутентичных цифровых объектов».
  5. ^ а б "db-preservation-toolkit от keep".
  6. ^ Хойшер, Стефан; Яерманн, Стефан; Келлер-Марксер, Питер; Моеле, Франк (2004). «Обеспечение подлинного долгосрочного архивного доступа к сложным реляционным данным». Труды PV-2004: Обеспечение долгосрочной сохранности и увеличение ценности научных и технических данных, 5-7 октября 2004 г.. С. 241–261. arXiv:cs / 0408054. Bibcode:2004cs ........ 8054H.
  7. ^ «RODA и Crib: сервис-ориентированный цифровой репозиторий» (PDF).
  8. ^ "Duurzaam beheer van digitaal archiefmateriaal - Национальный архив" (PDF).
  9. ^ "LOCKSS - Множество копий хранят вещи в безопасности". Стэндфордский Университет. Получено 16 апреля, 2017.