Как писать хорошие запросы для Stable Diffusion

Адирондак на закате осенью. С одним маленьким нюансом — это изображение является подделкой, созданной за 18,5 секунды:

Stable Diffusion, популярный генератор искусств на основе искусственного интеллекта, требует текстовых запросов для создания изображения. Иногда он делает потрясающую работу и генерирует именно то, что вы хотите, даже с расплывчатым запросом. В других случаях вы получаете результаты так себе. Вот несколько советов и приёмов для достижения идеальных результатов.

Как написать запрос для Stable Diffusion

Если вы когда-нибудь работали с генераторами изображений с искусственным интеллектом, такими как Stable Diffusion, DALL-E или MidJourney, вы заметили, что хорошо сформулированный запрос имеет решающее значение. Грамотно сформулированный запрос — это разница между превращением вашей идеи в отличный образ и получением какого-то чудовища из сверхъестественной долины со слишком большим количеством пальцев, уставившегося на вас.

С момента запуска Stable Diffusion в августе 2022 года люди пытались найти лучшие способы получения идеальных результатов, и в ближайшие годы они будут «ковать запросы» или «инженерно строить запросы». Это особенно вероятно, поскольку контрольные точки, информирующие о том, как Stable Diffusion генерирует изображения, будут получать периодические обновления. Идеальный запрос станет движущейся мишенью в обозримом будущем.

Смотрите также: Лучшие генераторы изображений AI, которые вы можете использовать прямо сейчас

Английский — международный язык и язык ИИ

Запросы к Stable Diffusion (и другим искусственным интеллектам для генерации изображений) нужно делать на английском языке. Тенденция в мире такова, что человек, не знающий английского языка, воспринимается как же, как 50 лет назад человек, не умеющий читать и писать на своём родном языке.

Тем не менее, если вы из тех, кто не знает английский язык, то используйте переводчик, например, https://translate.google.com/.

Будьте как можно более конкретными

Stable Diffusion имеет тенденцию раскрывать все свои таланты на определённых запросах, особенно по сравнению с чем-то вроде MidJourney. Вы должны сказать ему именно то, что вы хотите. Вот пример использования любимых животных в Интернете: милые кошки.

Запрос: “Cute Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Перевод: «Милый кот»

Хорошо, они довольно милые, за исключением, может быть, бедняги в верхней середине, который выглядит так, будто провёл слишком много времени, глядя в бездну. Но что, если вам нужны серые кошки, а не кошки разных цветов? Ну, это нужно указать. Вместо этого используйте «Милые серые кошки» в качестве запроса.

Запрос: Prompt: “Cute Grey Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Перевод: «Милый серый кот»

Теперь Stable Diffusion показывает только серых кошек. Вы можете продолжать добавлять описания того, что вы хотите, включая аксессуары для кошек на картинках.

Запрос: “Cute Grey Cat with blue eyes, wearing a bowtie”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Перевод: «Милый серый кот с голубыми глазами, в галстуке-бабочке»

Это относится ко всему, что вы хотите создать с помощью Stable Diffusion, включая пейзажи. Будьте описательными, и когда вы пробуете разные комбинации ключевых слов, мысленно отмечайте, как меняется изображение. Некоторые слова и фразы, как правило, сильнее искажают изображение, чем другие слова, поэтому вам может потребоваться соответствующим образом скорректировать подсказку.

Назовите конкретные художественные стили или средства

Потребность в конкретике не заканчивается, когда вы полностью описываете содержание изображения, которое хотите. Вы можете (и должны) также указать желаемый стиль. Для этого мы будем придерживаться нашей подсказки «Милый серый кот». Допустим, нам нужны милые серые коты, но мы также хотим, чтобы они выглядели так, как будто они написаны акриловыми красками. Первое, что вы должны попробовать, это добавить «акриловая живопись» в качестве следующего ключевого слова в запрос, чтобы он звучал так: «Милый серый кот, акриловая живопись».

Как правило, лучше всего начать с наименьшего количества ключевых слов, чтобы приблизиться к тому, что вы хотите, а затем добавить больше, чтобы получить эстетику, которую вы ищете.

Запрос: “Cute Grey Cat, acrylic painting”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Перевод: «Милый серый кот, акриловая живопись»

Стабильная диффузия распознает десятки различных стилей, от карандашных рисунков до глиняных моделей и 3D-рендеринга в Unreal Engine.

Запрос: “Cute Grey Cat, Unreal Engine rendering”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Перевод: «Милый серый кот, рендеринг Unreal Engine»

Эти примеры подсказок чрезвычайно просты, но вы можете использовать десятки ключевых слов для точной настройки результатов. Если вам нужны странные глиняные модели кур психоделического цвета в Walmart, вам нужно указать все эти термины.

Запрос: “bust of a chicken in a walmart, clay model, (psychedelic colors), melting, weird” Sampler = PLMS, CFG = 7, Sampling Steps = 150

Запрос: «бюст цыплёнка в магазине, глиняная модель, (психоделические цвета), плавление, странное»

Назовите конкретных художников для Stable Diffusion

Stable Diffusion способен не только эмулировать определённые стили или среды; он может даже имитировать конкретных исполнителей, если вы хотите это сделать. Этот пример использовал Пабло Пикассо.

Вы обязательно должны попробовать добавить «от (имя исполнителя)» в свои запросы, если вы ещё этого не сделали. Это имеет тенденцию приводить к драматическим результатам. Не бойтесь объединять художников, которые обычно не сочетаются друг с другом. Часто Stable Diffusion сочетает соответствующие стили захватывающим и непредсказуемым образом.

Совет. Если вы используете рекомендованную нами версию Stable Diffusion с графическим интерфейсом для Windows, справа от окна запроса есть кнопка «Переместить», которая случайным образом перебрасывает исполнителя в ваша запрос. Это отличный способ познакомиться с новыми стилями.

Вес ваших ключевых слов

Конечно, просто втиснув ключевые слова в приглашение, вы далеко не продвинетесь. Что произойдёт, если вы получите все правильные вещи в запросе, но они не будут должным образом пропорциональны?

Stable Diffusion поддерживает взвешивание ключевых слов запроса. Другими словами, вы можете сказать ему, что ему действительно нужно уделять внимание определённому ключевому слову (или ключевым словам) и уделять меньше внимания другим. Это удобно, если вы получаете результаты, которые вроде того, что вы ищете, но не совсем там.

Смотрите также: Как запустить Stable Diffusion на своём ПК для создания изображений AI

В версии Stable Diffusion для командной строки вы просто добавляете двоеточие, а затем десятичное число (от 0 до 1) к слову, которое хотите выделить. Десятичные числа представляют собой проценты, поэтому в сумме они должны давать 1.

Возвращаясь к нашему запросу «Симпатичный серый кот», давайте представим, что он правильно воспроизводил милых кошек, но не на многих выходных изображениях были серые кошки. Вместо этого вы можете изменить подсказку на «cute, grey cat:0.7», и он будет уделять больше внимания серому коту, а затем автоматически применит разницу к «милый». Вы также можете назначить вес каждому слову в подсказке вручную, если хотите более точного управления, например, «Cute:0.10, Grey Cat:0.60, Unreal Engine rendering:0.30».

Большинство графических интерфейсов, доступных для стабильной диффузии, обрабатывают взвешивание, не требуя ввода явных процентных значений. Обычно вы можете добавить круглые скобки вокруг термина в приглашении, чтобы подчеркнуть его, и квадратные скобки, чтобы уменьшить важность термина. Таким образом, предыдущее «cute, grey cat» может выглядеть как «[cute],((grey cat))».

Примечание. Вы можете использовать несколько круглых скобок, чтобы расставить акценты так, как вам нужно.

Найдите вдохновение в чужих запросах

Stable Diffusion и другие генераторы искусства с искусственным интеллектом пережили взрывной всплеск популярности. Вы можете найти такое искусство ИИ повсюду. Это означает, что в настоящее время в Интернете циркулирует по крайней мере несколько миллионов изображений, созданных пользователями, и в большинстве случаев люди приводят запрос, который они использовали для получения своих результатов.

Смотрите также: Галерия Stable Diffusion с удобным и быстрым поиском по готовым изображениям

Вот несколько ресурсов, которые помогут вам вдохновиться, если вы не уверены, что хотите создать:

Предупреждение: всё это потенциально NSFW.

  • Lexica — репозиторий изображений, сгенерированных с помощью Stable Diffusion и соответствующей подсказки. Доступен поиск по ключевому слову.
  • Stable Diffusion Artist Style Studies — неисчерпаемый список художников, которых может распознать Stable Diffusion, а также общие описания их художественного стиля. Существует система ранжирования, описывающая, насколько хорошо Stable Diffusion реагирует на имя исполнителя в запросе.
  • Stable Diffusion Modifier Studies — список модификаторов, которые можно использовать со Stable Diffusion, как и на странице исполнителя.
  • Список модификаторов AI Art — фотогалерея, демонстрирующая некоторые из самых сильных модификаторов, которые вы можете использовать в своих подсказках, и то, что они делают. Они отсортированы по типу модификатора.
  • 500 лучших художников, представленных в Stable Diffusion. Мы точно знаем, какие изображения были включены в обучающий набор Stable Diffusion, поэтому можно сказать, какие художники внесли наибольший вклад в обучение ИИ. Вообще говоря, чем больше артист был представлен в обучающих данных, тем лучше Stable Diffusion будет реагировать на его имя как на ключевое слово.
  • Stable Diffusion Subreddit — сабреддит Stable Diffusion имеет постоянный поток новых запросов и забавных открытий. Если вы ищете вдохновения или понимания, вы не ошибётесь.

Настройте другие важные параметры

Хороший запрос — самая сложная часть использования Stable Diffusion, но есть несколько других настроек, которые кардинально изменят результаты.

  • CFG: Определяет, насколько сильно Stable Diffusion следует вашей подсказке. Более высокие числа приводят к большему следованию подсказке, тогда как более низкие числа дают ИИ больше свободы. Попробуйте настроить это в первую очередь.
  • Sampling Method (Метод семплирования): как изображение очищается от шума до узнаваемых форм. Попробуйте несколько из них. Euler_a, k_LMS и PLMS кажутся популярными.
  • Sampling Steps (Шаги семплирования): количество раз, когда изображение будет семплировано, прежде чем вы получите окончательный результат. Иногда вы получаете хорошие результаты на 30 шагах, иногда вам нужно перейти на 50 или 80. Обычно после 150 шагов результаты уже не улучшаются. Начните с меньшего количества шагов и поднимайтесь выше.

Некоторые из наших любимых запросов стиля изображения

Это одни из наших любимых элементов запросов, поскольку они, как правило, работают очень надёжно. Просто добавьте один из них по вашему выбору плюс несколько модификаторов. Все остальные настройки Stable Diffusion остались такими же, как и в приведённых выше запросах.

Примечание: как правило, Stable Diffusion исключительно хорошо создаёт закаты и осенние листья.

(ТЕМА), 35mm, sharp

Выберите тему, и эта подсказка надёжно вернёт фотореалистичные изображения людей, животных и пейзажей.

Примечание. Этот пример запроса также включал «Золотой час», чтобы получить цвета заката.

Запрос: photograph of mount katahdin with a beautiful lake, 35mm, sharp, golden hour

Перевод: фотография горы Катадин с красивым озером, 35 мм, резкость, золотой час

(ТЕМА), low poly 3d render, vibrant pastel colors, tilt shift, film grain

Перевод: низкополигональная 3D-рендеринг, яркие пастельные тона, сдвиг наклона, зернистость плёнки

Введите ТЕМУ, и вы получите его в эстетике «Искусство ралли».

(ТЕМА), (ОПИСАНИЕ ОКРУЖЕНИЯ), cinematic, dramatic, composition, sunny sky, brutalist, hyper realistic, epic scale, sense of awe, hypermaximalist, insane level of details, artstation HQ

Перевод: кинематографичность, драматизм, композиция, солнечное небо, брутализм, гиперреалистичность, эпический масштаб, чувство благоговения, гипермаксимализм, безумный уровень детализации, artstation HQ

Просто введите ТЕМУ и описание окружающей среды, и этот запрос предоставит отличные изображения концепт-арта города с эффектом окружающей среды по вашему выбору. Вот пример использования Нью-Йорка в качестве темы и пыльной бури в качестве описания окружающей среды:

Запрос: new york city, dust storm, cinematic, dramatic, composition, sunny sky, brutalist, hyper realistic, epic scale, sense of awe, hypermaximalist, insane level of details, artstation HQ

Перевод: нью-йорк, пыльная буря, кинематографичность, драматизм, композиция, солнечное небо, бруталист, гиперреалистичность, эпический масштаб, благоговение, гипермаксимализм, безумный уровень детализации, artstation HQ

Кермит

Stable Diffusion даёт отличные результаты с Kermit. Попробуйте где угодно.

Почему именно так Stable Diffusion интерпретирует «Кермит в Мордоре» и кто этот красный злой Кермит, стоящий за нашим стойким героем? Без понятия.

Помните, не бойтесь удалять то, что, по вашему мнению, может быть ключевым термином из вашего запроса. Некоторые слова, такие как «великолепный», сильно влияют на то, как выглядит изображение, даже если оно не имеет точного значения. По мере того, как вы будете проводить больше времени со Stable Diffusion, вы почувствуете, как он реагирует на определённые слова, и быстро обнаружите, что написание хорошего запроса — это само по себе искусство.


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

wp-puzzle.com logo