DALL-E 2 AI от OpenAI — плохая новость для некоторых художников


DALL-E 2 от OpenAI стал шоком для тех, кто думал, что искусственный интеллект никогда (или, по крайней мере, нескоро) начнёт проникать в сферу творчества. Но сможет ли DALL-E 2 заменить работу художников?

Как работает DALL-E 2?

DALL-E 2 настолько впечатляет, что кажется почти волшебством, но общие детали того, как он создаёт такие потрясающие, реалистичные изображения, не так уж сложно понять.


В DALL-E 2 есть два основных компонента. Первый — это GPT-3, который, возможно, является самым передовым алгоритмом машинного обучения естественного языка на сегодня. DALL-E 2 также использует другую модель OpenAI, известную как CLIP (Contrastive Language-Image Pre-training).

Смотрите также:

GPT-3 и CLIP позволяют компьютеру понимать и генерировать сложный естественный язык. Обучая нейронную сеть DALL-E миллиардам изображений и их описаниям на естественном языке из (в основном) Интернета, она изучает отношения между понятиями.

В некотором смысле DALL-E — это противоположность распространённой практике машинного обучения, когда вы предоставляете изображение, а ИИ пытается описать то, что он видит.

Вспомните печально известное приложение «Не хот-дог» из телешоу «Силиконовая долина». Разница здесь в том, что вместо того, чтобы спрашивать ИИ, является ли изображение хот-догом или нет, вы описываете хот-дог, и он создаёт совершенно оригинальное изображение хот-дога на основе всего, что он узнал о них.

Второй важной частью DALL-E является то, как он генерирует изображения. Он использует метод, известный как «диффузия». В частности, понимание описания изображения на человеческом языке, которое было создано, превращается в изображение с использованием модели OpenAI под названием GLIDE. GLIDE берет изображение, состоящее из случайно сгенерированного шума, а затем постепенно удаляет этот шум, пока он не совпадёт с изображением, как описано на естественном языке. Это чем-то напоминает скульптора, который начинает с куска мрамора и откалывает его, пока не останется только статуя.

Для гораздо более подробного технического и подробного описания DALL-E 2 под капотом мы искренне рекомендуем объяснение DALL-E 2 в блоге глубокого обучения AssemblyAI.

Почему DALL-E 2 настолько революционен

DALL-E 2 — далеко не первое программное обеспечение для машинного обучения, способное генерировать изображения. Было много предыдущих систем, и DALL-E 2 основывается на уроках, извлечённых из этих других проектов. Так почему же это время кажется переломным поворотным моментом?

Одна важная причина заключается в том, что изображения, которые делают DALL-E и DALL-E 2, эстетически приятны. Другие системы генерации изображений ИИ часто создают изображения, которые люди описывают как тревожные или похожие на что-то из сна. Это немного похоже на Зловещую долину, но для изобразительного искусства. DALL-E 2 создаёт изображения, за которыми явно стоит художественный взгляд или какое-то чувство эстетики.


Таким образом, изображения, которые создаёт DALL-E 2, сравнимы с изображениями, сделанными талантливыми художниками или фотографами, которые всю жизнь развивали своё эстетическое чувство. Нетрудно представить, что кто-то вроде этого смотрит на изображения, которые DALL-E 2 может выдать за считанные секунды, и чувствует, что они вот-вот станут неактуальными.

Система не только может создавать красивые изображения с высоким разрешением за считанные секунды из подсказок на естественном языке, но также может настраивать и редактировать эти изображения или предоставлять несколько вариантов существующего изображения — даже того, который предоставляет пользователь. Значит ли это, что художники должны упаковать свои мольберты и планшеты для рисования и вместо этого «учиться программировать»?

DALL-E 2 означает, что художники изменятся, а не исчезнут

OpenAI очень осторожно относилась к тому, чтобы просто представить миру свою технологию. Это разумно, поскольку здесь явно много возможностей для злоупотреблений. Тем не менее теперь, когда они показали, что это можно сделать, совсем не скоро коммерческие или независимые исследователи искусственного интеллекта воспроизведут то, что делает DALL-E, и сделают его доступным для всех. У крупных игроков в области машинного обучения также есть свои высокопроизводительные художники по искусственному интеллекту, такие как Google Imagen.

Поскольку ящик Пандоры не может быть закрыт, нам придётся признать, что мир изобразительного искусства изменится безвозвратно, но это не значит, что художники ушли в прошлое.

Один из способов взглянуть на это заключается в том, что подобная технология даёт возможность создавать искусство в руках любого. Акцент теперь смещается с технической способности создавать образы на способность точно описывать и повторять своё видение до тех пор, пока то, что вы видите на экране, не совпадёт с тем, что вы имели в виду. Другими словами, больше людей теперь будут иметь возможность выражать себя визуально, точно так же, как теперь больше людей смогут выполнять точные вычисления благодаря существованию калькуляторов.

Определённые типы художников могут больше не иметь жизнеспособных бизнес-моделей. Если вы зарабатываете на рисовании или составлении коллажей заказов за определённую плату, вам будет сложно конкурировать с программой, которая может создавать сотни изображений в час на основе описания клиента и практически мгновенно вносить изменения в эти изображения. Вместо этого вы можете использовать эти инструменты для реализации своего собственного видения, а затем продавать эти уникальные изображения, основываясь на своих чувствах.

Клиент всегда прав

Также важно помнить, что в конечном итоге эти изображения создаются для потребления человеком. У нас, людей, есть собственный набор ценностей, выходящий за рамки удобства и технического превосходства. В мире, где сгенерированное искусство изобилует и, следовательно, относительно дёшево и одноразово, всегда найдётся аудитория, желающая оценить (и купить) искусство, созданное руками человека, просто потому, что оно может быть относительной редкостью.

Другими словами, программное обеспечение, подобное DALL-E 2, может означать конец для художников, зарабатывающих на жизнь изготовлением произведений искусства на конвейере, но вряд ли это ослабит перспективы для художников, которым есть что сказать и у которых есть уникальная визуальная идентичность, с помощью которой можно говорить.


Добавить комментарий

Ваш адрес email не будет опубликован.

wp-puzzle.com logo