Воодушевлённые наличием генераторов цифрового искусства, такими как DALL-E, биологи создают искусственный интеллект, который способен бороться с раком, гриппом и
Covid. В прошлом году весной лаборатория искусственного интеллекта под названием OpenAI представила технологию, позволяющую создавать цифровые изображения, просто описывая то, что предполагается увидеть. Названная DALL-E, технология породила целую волну подобных инструментов с такими названиями, как Midjourney и Stable Diffusion.
Обещая ускорить работу цифровых художников, это новое поколение искусственного интеллекта захватило воображение как общественности, так и экспертов — и угрожало создать новые уровни онлайн-дезинформации.
Социальные сети сейчас кишат удивительно концептуальными шокирующе детализированными, часто фотореалистичными изображениями, сгенерированными DALL-E и другими инструментами.
Вот несколько примеров таких изображений.
Фотография плюшевого мишки, катающегося на скейтборде на Таймс-сквер. Фото: twitter.com
Милый корги в доме, сделанном из суши. Фото: twitter.com
Джефлон Цукергейтс. Фото: twitter.com
Но когда некоторые учёные обратили внимание на эту технологию, то увидили нечто большее, чем просто способ создания поддельных фотографий. Они видят путь к новому лечению рака, новой вакцине против гриппа или новой таблетке, помогающей переваривать глютен. Используя многие из тех же методов, которые лежат в основе DALL-E и других генераторов высококачественных изображений, эти учёные создают чертежи новых белков — крошечных биологических механизмов, которые могут изменить поведение человеческого тела.
Тело человека естественным образом вырабатывает около 20 000 белков, которые отвечают за все процессы, от переваривания пищи до перемещения кислорода по кровотоку. Теперь исследователи работают над созданием белков, не встречающихся в природе, в надежде улучшить нашу способность бороться с болезнями и делать то, что организм не может делать сам по себе.
Дэвид Бейкер, директор Института белкового дизайна Вашингтонского университета, работает над созданием искусственных белков уже более 30 лет. К 2017 году он и его команда показали, что это возможно. Но они не ожидали, что появление новой ИИ технологии внезапно ускорило бы эту работу, сократив время, необходимое для создания новых чертежей, с нескольких лет до недель. «Нам нужны новые белки, которые могут решить современные проблемы, такие как рак и вирусные пандемии», — говорит доктор Бейкер. «Мы не можем ждать эволюции». И ещё он добавляет: «Теперь мы можем проектировать эти белки намного быстрее и с гораздо более высокими показателями успеха, а также создавать гораздо более сложные молекулы, которые могут помочь решить эти проблемы».
В прошлом году доктор Бейкер и его коллеги-исследователи опубликовали в журнале Science пару статей, описывающих, как различные ИИ методы могут ускорить дизайн белка. Но эти статьи уже затмил более новый, основанный на методах, используемых в таких инструментах, как DALL-E, и показывающий, как новые белки могут быть созданы с нуля, подобно цифровым фотографиям. «Одна из самых мощных особенностей этой технологии заключается в том, что, как и DALL-E, она делает то, что вы ей говорят», — сообщает Нейт Беннетт, один из исследователей, работающих в лаборатории Вашингтонского университета. «Из одной подсказки можно создать бесконечное количество дизайнов».
Фото: nytimes.com
Для генерации изображений DALL-E опирается на то, что исследователи искусственного интеллекта называют нейронной сетью — математической системой, грубо смоделированной на сети нейронов в мозгу. Это та же технология, которая распознает команды, которые человек произносите в свой смартфон, позволяет беспилотным автомобилям идентифицировать (и избегать) пешеходов и переводить языки в таких сервисах, как Skype. Нейронная сеть обучается навыкам, анализируя огромные объёмы цифровых данных. Например, определяя узоры на тысячах фотографий корги, она может научиться распознавать корги.
С помощью DALL-E исследователи построили нейронную сеть, которая искала шаблоны, анализируя миллионы цифровых изображений и текстовые подписи, которые описывали, что изображено на каждом из этих изображений.
Таким образом, она научилась распознавать связи между изображениями и словами. Когда исследователь описывает изображение для DALL-E, нейронная сеть генерирует набор ключевых признаков, которые может включать это изображение. Одной из особенностей может быть изгиб уха плюшевого мишки. Другой может быть линия на краю скейтборда. Затем вторая нейронная сеть, называемая моделью диффузии, генерирует пиксели, необходимые для реализации этих функций. Модель диффузии обучается на серии изображений, в которых шум — несовершенство — постепенно добавляется к фотографии, пока она не превратится в море случайных пикселей. Анализируя эти изображения, модель учится запускать этот процесс в обратном порядке. При передаче случайных пикселей, она удаляет шум, превращая эти пиксели в связное изображение. В Вашингтонском университете, других академических лабораториях и новых стартапах исследователи используют аналогичные методы в своих усилиях по созданию новых белков.
Белки начинаются как цепочки химических соединений, которые затем скручиваются и складываются в трёхмерные формы, определяющие их поведение. В последние годы лаборатории искусственного интеллекта, такие как DeepMind, принадлежащие Alphabet, той же материнской компании, что и Google, показали, что нейронные сети могут точно угадывать трёхмерную форму любого белка в организме, основываясь только на содержащихся в нём более мелких соединениях, — это огромный научный прогресс.
Теперь такие исследователи, как доктор Бейкер, делают ещё один шаг, используя эти системы для создания чертежей совершенно новых белков, не существующих в природе. Цель состоит в том, чтобы создать белки, которые принимают очень специфическую форму; определённая форма может служить определённой задаче, например, борьбе с вирусом, вызывающим Covid. Подобно тому, как DALL-E использует взаимосвязь между подписями и фотографиями, аналогичные системы могут использовать взаимосвязь между описанием того, что может делать белок, и формой, которую он принимает. Исследователи могут создать грубую схему белка, который им нужен, а затем модель диффузии может создать его трёхмерную форму.
«С DALL-E можно запросить изображение панды, поедающей побег бамбука», — говорит Намрата Ананд, бывший исследователь Стэнфордского университета, который также является предпринимателем и создаёт компанию в этой области исследований. «Точно так же белковые инженеры могут запросить белок, который связывается с другим определённым образом — или какое-то другое конструктивное ограничение — и генеративная модель может его построить».
Разница в том, что человеческий глаз может мгновенно оценить точность изображения DALL-E. Он не может сделать то же самое со структурой белка. После того, как технологии искусственного интеллекта создадут эти белковые чертежи, учёные всё ещё должны отправить их в лабораторию, где можно проводить эксперименты с реальными химическими соединениями, и убедиться, что они делают то, что должны делать. По этой причине некоторые эксперты говорят, что к новейшим технологиям искусственного интеллекта следует относиться скептически.
«Создание новой структуры — это просто игра», — сообщает Фрэнсис Арнольд, лауреат Нобелевской премии и профессор Калифорнийского технологического института, специализирующийся на белковой инженерии. «Что действительно важно, так это то, что на самом деле может сделать эта структура?»
Фото: nytimes.com
Но для многих исследователей эти новые методы не просто ускоряют создание новых белков-кандидатов для экспериментальной лаборатории. Они предоставляют способ изучения новых инноваций, которые исследователи ранее не могли исследовать самостоятельно. «Увлекательно не только то, что они креативны и исследуют неожиданные возможности, но и то, что они удовлетворяют определённые цели дизайна или ограничения», — говорит Цзюэ Ван, исследователь из Вашингтонского университета. «Это избавляет от необходимости проверять все возможные белки во Вселенной».
Часто машины с искусственным интеллектом разрабатываются для выполнения навыков, которые естественны для человека, таких как соединение изображений, написание текста или игра в настольные игры. Боты, создающие белок, поднимают более глубокие вопрос, например, как сказал доктор Ван: «Что могут делать машины, чего люди вообще не смогут?»