[Новости] Учёные смогли удвоить плотность записи данных на ДНК — более 400 тыс. Тбайт в одном грамме

  • Автор темы Аластар
  • Дата начала

За миллиарды лет эволюции биологической жизни на Земле в живых организмах выработался механизм записи для передачи генетической информации из одного поколения в последующие. Это формирование нитей ДНК в виде чередования пар комбинаций из четырёх азотистых оснований: аденина (A), гуанина (G), цитозина (C) и тимина (T). Четыре единицы кодирования лучше двух (0 и 1), но это не предел, сказали учёные и синтезировали ещё семь органических соединений.

Расширение «алфавита» для кодирования данных в ДНК с 4 до 11 символов позволит как минимум удвоить и без того невероятную ёмкость подобных методов хранения информации. Такой подход, кстати, также повысит скорость записи данных в последовательности ДНК, что сегодня считается серьёзным тормозом для работ в этом направлении. Также необходимо понимать, что современные методы секвенирования ДНК не смогут определять синтезированные азотистые основания. Для их чтения необходимы новые инструменты и реакции. Но это всё решаемые проблемы, уверены исследователи из Университета Иллинойса в Урбан-Шампейн.
Для расшифровки ДНК её нить проходит через нанопору в специально разработанном белке, который может обнаружить отдельные азотистые основания независимо от того, являются ли они естественными или синтетическими. Затем алгоритмы машинного обучения декодируют хранящуюся внутри информацию. Да, без ИИ в этом вопросе не обойтись, настолько сложные процессы кодирования и дешифровки. В будущем, по мере развития технологии, всё будет намного проще.


Сегодня с учётом использования для кодирования данных только четырёх базовых азотистых оснований в одном грамме ДНК может храниться до 215 Пбайт данных. Одиннадцать оснований удвоят эту плотность, и это не предел.

«Мы попробовали 77 различных комбинаций из 11 азотистых оснований, и наш метод смог отлично различить каждое из них, — сказал Чао Пан (Chao Pan), соавтор исследования. — Механизм глубокого обучения, используемый в нашем методе для идентификации различных нуклеотидов, является универсальным, что позволяет распространить наш подход на многие другие приложения».

Источник
 
❂A.l.a.s.t.a.r❂
Аластар

❂A.l.a.s.t.a.r❂

Местный копипастер

Сейчас тему просматривают (Всего: 0, Пользователей: 0, Гостей: 0)

Назад
Сверху Снизу