Исследователи разработали файловую систему хранения данных на основе человеческой ДНК
Источник: (с)
Большинство ваших клеток содержат полный набор инструкций для создания всего человека – ДНК. Ученые много лет безуспешно работали над созданием технологии хранения, которая могла бы использовать невероятную плотность ДНК для данных других типов. Теперь команда из Microsoft Research и Вашингтонского университета разработала метод, который сделает ДНК жизнеспособным носителем информации.
Кодирующая последовательность ДНК описывается четырьмя парами оснований: цитозином, гуанином, аденином и тимином. Их обозначают буквами A, C, T и G, которые вы всегда видите в ДНК-последовательностях. В клетках основания формируют аминокислоты. Соберите аминокислоты вместе, и вы получите белок. Чтобы хранить что-то еще в ДНК, нужно разработать другую схему кодирования. И есть несколько способов сделать это. Реальная проблема заключается в том, как читать и извлекать данные.
Чтобы прочитать данные, которые вы закодировали в ДНК, вам нужно нарезать их на более короткие последовательности, так как нет возможности прочитать полную, неразрывную часть ДНК. Таким образом, системе хранения ДНК нужны маркеры, которые сообщают вам, где находится каждая последовательность. Работа Microsoft и Университета Вашингтона связана с добавлением произвольного доступа к хранилищу ДНК. Исследователи разработали новые маркеры последовательности, которые могут ориентироваться на определенные файлы, не обращаясь к ненужным файлам.
Ключ заключается в нахождении достаточной последовательности маркеров для всех файлов – команда исследователей нашла тысячи необходимых для этой операции маркеров. Это означает, что теперь можно упорядочить любую последовательность данных в ДНК. Если вы хотите сохранить больше файлов, чем у вас есть маркеров, вам просто нужно сохранить дополнительные отдельные пулы ДНК. Другим новаторским подходом к хранению в ДНК является использование операции сложения битов (XOR) в длинных строках одинаковых оснований. XOR позволяет формировать данные удобным способом для последующего чтения.
Microsoft Research и Вашингтонский университет фактически создали файловую систему ДНК, однако этот способ хранения данных медленнее и значительно сложнее в использовании, чем обычное электронное хранилище. Тем не менее, ДНК может быть ценной для архивирования с плотностями данных, измеряемыми в сотнях петабайт на грамм.