Дом Новости & Аналитика Нужна дополнительная память? попробуй днк

Нужна дополнительная память? попробуй днк

Оглавление:

Видео: Relax video | with gorgeous Arina and Nissan Skyline ECR33. (Ноябрь 2024)

Видео: Relax video | with gorgeous Arina and Nissan Skyline ECR33. (Ноябрь 2024)
Anonim

Инженеры успешно выдвигали больше хранилищ в меньшие пространства на протяжении десятилетий, но это не может продолжаться вечно. Следующий большой скачок в хранении данных может принять форму ДНК внутри всего органического вещества: ученые в лабораториях по всей стране экспериментируют с синтетической ДНК как средой хранения.

«Если вы посмотрите на то, куда движется электроника, кремниевые технологии, многие базовые технологии, которые мы используем для создания компьютеров сегодня, мы приближаемся к пределу почти во всех из них», - говорит Луис Энрике Сез, доцент кафедры компьютерных наук. и инженерия в университете Вашингтона. «ДНК очень плотная, она очень прочная, и для ее обслуживания требуется очень мало энергии, поэтому есть много преимуществ использования ДНК для хранения данных».

Сез сотрудничает с Карин Штраус, исследователем компьютерной архитектуры в Microsoft Research, в сотрудничестве двух организаций - проекта, связывающего информатику и биологию. Для команды из примерно 20 человек университет предоставляет молекулярных биологов, а Microsoft - компьютерных ученых.

Чтобы понять, как ДНК может быть использована для хранения, рассмотрим, что все компьютерные данные являются двоичными, или база-2. ДНК представляет собой основание-4, состоящее из аденина, цитозина, гуанина и тимина (сокращенно A, C, G и T). Первым шагом является преобразование информации base-2 в base-4, поэтому A соответствует 00, C-01, G-10 и T-11 (это немного упрощает, но позволяет понять идею).

Затем ученые используют машину, называемую синтезатор ДНК, для объединения четырех химических веществ в правильном порядке. Результат хранит информацию много раз как солеобразный кластер, меньший, чем кончик карандаша. Чтение этой информации обратно требует секвенсора ДНК.

Хотя это может звучать хрупко - как что-то, что может сдуться, когда дверь внезапно откроется, - ДНК - самый сильный носитель данных, который мы видели. Ученые успешно прочитали ДНК, которой сотни тысяч лет.

Секвенирование ДНК включает в себя удаление крошечного кусочка хранящегося материала, и процесс истощает этот образец. Следовательно, запись ДНК может быть прочитана конечное число раз. Это не проблема, поскольку в хранимом материале столько избыточных данных; это может быть взято снова и снова. Современные носители данных также имеют ограниченное количество циклов записи и чтения, прежде чем они выходят из строя, так что в этом нет ничего нового.

Как указывает Сез, ДНК никогда не устареет. Хотя у многих из нас в задней части ящика есть дискеты, которые мы больше не можем читать, это не будет судьбой ДНК. «Мы всегда будем заботиться о ДНК для наук о жизни и по состоянию здоровья, поэтому у вас всегда будет способ чтения информации, хранящейся в ДНК», - говорит Сез.

В июле 2016 года Microsoft и Вашингтонский университет успешно закодировали 200 МБ данных в виде ДНК, превысив предыдущий рекорд в 22 МБ. По словам Стросс, с помощью ДНК можно будет хранить 1 эксабайт данных - это 1 миллиард ГБ - в 1-дюймовом кубе.

«Мы оценили, сколько данных вы можете поместить в определенный объем», - говорит Стросс. «Мы попытались оценить объем, если бы сегодня решили архивировать весь доступный Интернет, то есть все, что не за паролем или какой-либо другой электронной стеной, и мы придумали размер большой обувной коробки».

Это звучит как отдаленное предложение, но Сез считает, что через десять лет мы увидим на рынке коммерческие системы хранения ДНК. Они не будут работать точно так же, как хранилища микропроцессоров, поскольку для ДНК требуется влажная химическая среда для создания, но они обеспечат огромную емкость и произвольный доступ с теми же скоростями, что и корпоративные ленточные системы.

Быстро развивающееся поле

ДНК существует уже миллиарды лет, но демонстрация ДНК как пригодной для использования технологии хранения началась в 1986 году, когда исследователь MIT Джо Дэвис закодировал простое двоичное изображение в 28 пар оснований ДНК.

Другим пионером в этой области является Джордж Черч, профессор генетики, который работает в Гарвардской медицинской школе с 1977 года и руководит собственной лабораторией с 1986 года. Черч заинтересован в снижении стоимости чтения и записи ДНК с 1970-х годов, полагая, что когда-нибудь они собираются вместе, чтобы создать практическое хранилище данных. Он начал интересоваться исследованиями ДНК около 2000 года и провел критические тесты на секвенирование и синтез в 2003 и 2004 годах. К 2012 году он смог объединить обе области и создать систему для кодирования данных. Он написал эту работу в влиятельной статье 2012 года в науке .

«До 2003 и 2004 годов секвенирование и синтез проводились в основном в капиллярах - или маленьких пробирках - где у вас было бы по одной пробирке на последовательность», - объясняет Черч. «Это было довольно ручное и не масштабируемое. Урок, который мы извлекли из микропроизводственной полупроводниковой промышленности, заключался в том, что вам нужно было придумать способ поместить их по существу в двухмерную плоскость, а затем уменьшить размер элемента. Ни один из них Методы, основанные на столбцах, были совместимы с этим, и поэтому в 2003 году мы показали, как можно распределять последовательности в двумерной плоскости, а затем отображать их с помощью флуоресцентного изображения, которое сейчас является доминирующим способом секвенирования. Затем в 2004 году мы показали, что Вы могли бы производить ДНК на плоскости, а затем соскользнуть с нее, и тогда она могла бы стать еще более компактной, так что плоскость была просто временным местом для их синтеза. Затем вы могли бы сжать их в трехмерный объект, который был в миллионы раз более компактный, чем обычное хранилище данных.

«Это были доказательства концептуальных упражнений в 2003 и 2004 годах. В 2012 году мы и другие усовершенствовали методы чтения и письма для ДНК, и я собрал их в один эксперимент, в котором я закодировал книгу, которую я только что записал, в ДНК, включая изображения, показывающие, что в основном все, что является цифровым, может быть закодировано ДНК ».

Хотя стоимость является существенным препятствием для хранения ДНК, Черч отмечает, что цена резко упала за то короткое время, что было проведено исследование. Стоимость чтения ДНК выросла примерно в 3 миллиона раз, а стоимость письма выросла в миллиард раз. Он может видеть, как оба улучшаются в миллион раз за меньшее время. Он также указывает, что стоимость копирования ДНК-материала практически бесплатна, как и стоимость длительного хранения. Для архивного хранения стоимость чтения данных не является большим препятствием, так как большая часть архивных материалов никогда не читается, а некоторые элементы читаются выборочно. Посмотрите на стоимость всей системы, советует он. Традиционные методы хранения движутся со скоростью закона Мура и скоро выйдут на плато. Но технология хранения ДНК движется быстрее, чем закон Мура, и не показывает никаких признаков плато.

Архивное и облачное хранилище - это то место, где Церковь видит, что хранилище данных ДНК внедряется первым. Он отмечает, что такие компании, как IBM, Microsoft и Technicolor, имеют собственные исследовательские и опытно-конструкторские группы. В 2015 году он сотрудничал с Technicolor, чтобы сохранить для ДНК « Путешествие на Луну» , классический фильм 1902 года, когда-то считавшийся утерянным. Теперь у Technicolor есть много копий ДНК, которые в совокупности не больше, чем пылинка.

У Черча есть лаборатория из 93 человек, которые работают над хранением ДНК и в настоящее время сосредоточены на двух целях. Во-первых, радикально улучшить скорость за цикл. Информация хранится в сотнях слоев, каждый толщиной с молекулу. Каждое добавление в настоящее время занимает три минуты, но Черч полагает, что это может быть уменьшено до менее чем миллисекунды. Это в 200 000 раз быстрее, отмечает он, и означает переход от органической химии к биохимии. Он также хочет изменить способ изготовления инструментов, используемых для чтения и письма, чтобы сделать их намного меньше. В настоящее время они размером с большие холодильники. Он хочет, чтобы это уменьшилось.

Встроенная избыточность и необходимость исправления ошибок

Одним из исследователей, на которого повлияла научная статья Черча в 2012 году, является профессор Олгика Миленкович из Университета Иллинойса, Урбана-Шампейн. В статье упоминается необходимость кодирования, что сразу же вызвало у нее интерес. Кодирование в исследовании хранилищ - это метод добавления избыточности к данным, избыточности, который впоследствии можно использовать для исправления ошибок, возникающих в процессе чтения и записи. Для примера, почему это важно, см. Две фотографии Гражданина Кейна здесь. Оба были закодированы в ДНК командой Миленковича и затем прочитаны. Угадайте, какой из них использовал избыточность.

Вы правы: левое изображение было закодировано с избыточностью, а правое - нет.

Простым способом добавления избыточности является повторение каждого символа определенное количество раз. Вместо того, чтобы писать 0, напишите это четыре раза. Это подход грубой силы - простой, но ужасно неэффективный. Работа Миленковича состоит в том, чтобы добиться того же исправления ошибок более сложным способом. Он включает в себя методы, называемые проверками четности или линейными конгруэнтными проверками, для обеспечения способов проверки данных.

«Все дело в основном в том, чтобы помочь вам исправить ошибки, если они появляются, или, что еще лучше, избежать ошибок, которые, как вы знаете, с большой вероятностью будут появляться», - говорит Миленкович. «Мы вводим контролируемую избыточность, чтобы избавиться от ошибок, и эта управляемая избыточность не в форме простого повторения, потому что это очень неэффективно».

Вот что привело Миленковича в эту область, но ее исследования сейчас направлены на снижение огромных затрат на синтез ДНК.

«Мой ученик Х. Табатабае Язди, который был очень активен в этой теме, и я очень старался придумать умный способ избежать синтеза ДНК. Синтезирование ДНК является абсолютно узким местом для этой технологии из-за высокой стоимости Миленкович говорит.

Хотя Миленкович опасается раскрывать слишком много информации о неопубликованных исследованиях, ее решение включает в себя «хитрые математические подходы» и касается времени, в котором размер интервала между битами информации имеет смысл.

«Если вы откажетесь от формальности, что вы хотите использовать ATGC для реального кодирования двоичных символов в определенном месте, вы можете придумать более умные и более эффективные средства хранения информации, потому что вам не нужно синтезировать цепочки снова и снова опять же, - объясняет Миленкович. «Вы можете синтезировать их один раз определенным образом, а затем повторно использовать эту синтезированную ДНК умным комбинаторным способом».

Благодаря своей работе Миленкович надеется снизить стоимость синтеза ДНК как минимум на три порядка. Этого все еще недостаточно, отмечает она, но это прогресс. Это также способствует линии исследований, которые она находит захватывающими.

«Честно говоря, очень интересно играть в Бога и кодировать свою собственную информацию в ДНК», - говорит Миленкович. «Это дает человеку ощущение волнения от того, что ты играешь с выбранной молекулой природы и заставляешь ее делать то, что ты хочешь хранить, кодировать и передавать информацию в будущее».

Обналичивание - любой день сейчас

Это не все сухие пыльные академические исследования с хранением ДНК. Helixworks, компания из Ирландии, уже пытается заработать на этом. У него есть продукт на Amazon - вроде.

«Мы запустили Amazon, чтобы вы могли получить 512 КБ цифровых данных, закодированных в ДНК», - объясняет Нимеш Пиннаманени, соучредитель компании. «Это что-то очень маленькое. Может быть, картина или стихотворение, что-то в этом роде».

Это необычная покупка, но это может быть идеальный знак любви для человека, у которого есть все, особенно если этот человек ученый:

«Я помню, как один клиент звонил нам. Он хотел подарить свою жену - они оба являются биотехнологами - он хотел подарить жену на годовщину их свадьбы. Он хотел поместить сообщение в ДНК и подарить ей ДНК», - вспоминает Пиннаманени. «Ей нужно было бы упорядочить ДНК, чтобы прочитать сообщение. Это довольно сложный способ послать любовное послание, но, может быть, это мило для биотехнологов, понимаете?»

Но Helixworks немного опередил себя, разместив свой продукт на Amazon в августе 2016 года, прежде чем он был готов выполнить заказы. Два человека приобрели компанию DNADrive за 199 долларов - 14-каратную золотую капсулу с кластером ДНК внутри - прежде чем Helixworks был вынужден исключить свой продукт. DNADrive по-прежнему на Amazon, но его нельзя купить.

Это не значит, что Helixworks окончен, просто слишком сильно. Это слишком далеко, чтобы остановиться сейчас. Компания начала свою деятельность в Университете Бурос в Швеции, где Пиннаманени (на фото выше, слева) и Сачин Чалапати (справа), другой соучредитель компании, получали степени магистра в области биотехнологии. Они собрали средства для исследований по хранению ДНК, продолжили свою работу по возвращении домой в Бангалор, Индия, и разработали подтверждение концепции.

Поиск дополнительных средств привел их к программе акселератора IndieBio, управляемой SOSV, начинающей венчурной фирмой в Сан-Франциско, штат Калифорния. Программа Helixworks была выбрана программой и выиграла 50 000 долларов наличными и возможность работать в лаборатории в графстве Корк, где она работала последние шесть месяцев. Программа включает в себя наставничество по продвижению продукта, который Helixworks будет использовать на этом фестивале South by Southwest в этом году, где он будет соревноваться на поле.

В то время как производство золотых капсул с ДНК может в конечном итоге стать выгодным побочным эффектом, Пиннаманени говорит, что будущее его компании - за компактные принтеры ДНК для дома и офиса, которые он разрабатывает сейчас. Он хочет сделать хранение ДНК простым и доступным для всех.

«Мы поняли, что вам нужно иметь что-то, что работает как картридж в принтере», - объясняет Пиннаманени. «У вас всего четыре цвета, и эти четыре цвета могут объединиться в любой возможный цвет, верно? Вот так работает ваш чернильный принтер. Мы выяснили, что нам нужно что-то подобное в нашей системе. Мы разработали картридж из 32 реактивов, могут быть объединены, чтобы сформировать любую возможную последовательность ДНК ".

В то время как другие лаборатории платят около $ 30000 каждый раз, когда им нужно синтезировать ДНК, операция, на выполнение которой уходят недели, Пиннаманени говорит, что его изобретение может значительно сократить затраты и время. Helixworks работает с Opentrons, компанией, которая производит автоматизированное лабораторное оборудование, для создания принтера. Это то, что он представит на SXSW.

«То, что мы будем демонстрировать на выставочной площадке, - это запись ДНК прямо на ваших глазах», - говорит Пиннаманени.

Компания пока не будет принимать никаких заказов. И это хорошо, потому что этот романтический биотехнолог все еще ждет своего юбилейного подарка.

Нужна дополнительная память? попробуй днк