Постоянная перезапись
В своей недавней статье я рассуждал о совместимости носителей информации, форматов хранения данных, операционных систем и редакторов.
Помимо всего этого есть еще и физический износ носителей информации. Практика показывает, что через 5-10 лет из-за естественных повреждений дискеты размагничиваются, деформируются, на них появляются bad sectors. С CD/DVD/Blu-ray дисками ситуация аналогичная, HDD и SSD диски тоже не вечные.
Вернувшись после посещения Библиотеки Ватикана в РНБ, я задумался о том, что сохранённые в РНБ цифровые данные, скорее всего, через несколько лет будут безвозвратно утрачены. Для предотвращения подобной потери мной был организован процесс бесконечной перезаписи данных.
В РНБ был реестр дисков и других носителей, которые были получены библиотекой в разное время. Отсортировав этот список по дате, мы приступили к копированию самых старых файлов на современное хранилище данных. В какой-то момент мы осознали, что этот процесс является бесконечным – к тому моменту, как мы скопируем все данные, хранилище перестанет быть современным, и данные уже придётся копировать с него куда-то еще.
Таким образом, в РНБ был выстроен процесс, в результате которого самые старые данные перезаписываются на тот носитель информации, который считается современным на текущий момент времени. Происходит постоянная миграция данных, что гарантирует возможность чтения этих данных вне зависимости от совместимости носителей информации и используемой технологии.
Очевидно, что это не самый рациональный способ обеспечения сохранности информации, поэтому будучи директором БЕН РАН, я протащил через Минобрнауки и Российскую академию наук новое научное исследование, направленное на разработку, апробацию и внедрение технологической цепочки обработки информации, гарантирующей возможность использования накопленных знаний вне зависимости от эволюционной смены программно-аппаратных методов хранения и долговечности носителей информации.
Это научное исследование получило название «Совершенствование методов долгосрочного хранения научной информации как основа естественнонаучных знаний», оно рассчитано на период 2024-2028 годов.
Буду следить за научными публикациями коллег на эту тему!