Блог

Искусственный интеллект создает графику: как использовать популярные инструменты ИИ

В последнее время было много шума об использовании ИИ для создания графики. С появлением ряда веб-сайтов, предлагающих создание изображений, видео и аудио, маркетологам и графическим дизайнерам стало значительно проще создавать уникальный и никогда ранее не публиковавшийся контент. Наши личные фавориты — Midjourney и DALL-E 2. На самом деле стоит попробовать и последнее решение от Adobe. В этой статье мы покажем вам, как использовать 10 графических генераторов на базе ИИ!

Midjourney

Midjourney — это мощный бета-инструмент для создания графики. Для этого ему необходимо предоставить подсказки, которые могут принимать форму коротких входных данных на естественном языке или всего нескольких ключевых слов. Чтобы использовать его, вам нужно присоединиться к группе Midjourney Discord. Перейдите на их официальный сайт, чтобы получить инструкции о том, как получить доступ к каналу. По состоянию на апрель 2023 года у Midjourney более 13 миллионов пользователей, из которых более миллиона активных.
Бесплатная версия позволяет генерировать ответы до 25 запросов. Вы также можете приобрести платную версию, если хотите. Таким образом, вы можете использовать этот инструмент для создания любого количества изображений. Кроме того, вам предоставляется полный доступ к сообществу, включая доступ к закрытым каналам чата, что может ускорить процесс создания вашего контента.
Для генерации изображения, используйте функцию «/imagine» и следуйте подсказке. Бот сгенерирует ответ в течение 60 секунд, показав вам 4 примера изображений с низким разрешением на выбор. Позже вы можете добавить некоторые варианты обработки, чтобы улучшить детали в данном изображении или сделать разные его вариации. Конечный продукт будет иметь высокое качество и четкую детализацию.Для генерации изображения, используйте функцию «/imagine» и следуйте подсказке. Бот сгенерирует ответ в течение 60 секунд, показав вам 4 примера изображений с низким разрешением на выбор. Позже вы можете добавить некоторые варианты обработки, чтобы улучшить детали в данном изображении или сделать разные его вариации. Конечный продукт будет иметь высокое качество и четкую детализацию.
Давайте посмотрим на процесс создания изображений в Midjourney:
  • получаем начальную подсказку + используем функцию /image
  • выберите опцию расширенной детализации и выберите 3 пункт в качестве значения качества
  • генерируются варианты изображений
  • создается окончательный вариант изображения
Как видите, Midjourney — мощный и очень удобный инструмент.
Однако у него есть свои ограничения. Хотя у него нет проблем с созданием высококачественных и детализированных изображений, он явно испытывает трудности с обработкой некоторых важных элементов, на которые большинство художников часто обращают особое внимание, таких как пропорции, глаза и руки, и это лишь некоторые из них.
Еще этот инструмент не слишком хорош в дизайне — создание логотипов и торговых марок пока оставляет желать лучшего. Просто взгляните на скриншот ниже. Midjourney, похоже, нужно немного больше времени, чтобы лучше понять некоторые подсказки, не так ли?

Источник: пример изображения, запрашиваемого компанией Delante.

Что бы вы ни говорили, Midjourney определенно является одним из самых мощных и простых в использовании творческих инструментов, доступных сегодня на рынке.
Знаете ли вы, что Midjourney вызвала юридический спор задолго до того, как ChatGPT привлекла внимание общественности своими текстами, созданными искусственным интеллектом? Как это произошло? Midjourney использует машинное обучение для создания изображений. Это означает, что он «развивает свое мастерство», используя огромную коллекцию работ других художников, как живущих сегодня, так и тех, кто ушел в историю много лет назад.
Вот почему этот инструмент вызвал настоящий ажиотаж в творческом мире. Его функциональность широко бойкотировалась (см. скриншот ниже, сделанный с платформы ArtStation), что привело к коллективному иску художников.

Источник: ArtStation

О чем бойкот и иск? Речь идет об авторских правах. Художники и ремесленники требуют соблюдения правовых норм об использовании их произведений для обучения алгоритмов AI/ML. Они хотят иметь возможность давать разрешение на использование своей работы в качестве учебного материала по ИИ и получать за это адекватную компенсацию.
В ответ на негативное восприятие работ, созданных ИИ, творческие порталы, такие как ArtStation, ввели несколько защитных мер. Теперь художники, загружающие свои изображения и графику, могут добавлять теги, которые не позволяют ИИ использовать их работы в качестве учебного материала. На том же портале также добавлено требование помечать отправленные пользователями работы, созданные с использованием ИИ.

Вот что мы думаем…

Midjourney — отличный творческий инструмент, который может облегчить поиск вдохновения и автоматизировать повторяющиеся задачи, такие как рисование эскизов и создание черновиков. Вероятно, он найдет особое применение в компьютерных и карточных играх, иллюстрациях, анимации и концепт-арте. Он также, вероятно, найдет свое место среди менеджеров социальных сетей, графических дизайнеров и маркетологов.
В то же время юридическая ситуация Midjourney может указать направление, в котором пойдет общественное признание систем обучения и ИИ, а также их порожденных работ. Особое внимание следует уделить обновлению национального и международного права в этой сфере. Предлагаем следить за этим вопросом и быть в курсе решений правоохранительных органов.

DALL-E 2

DALL-E 2 — это система, разработанная OpenAI, которая создает изображения из текстовых описаний. Этот инструмент позволяет создавать уникальные изображения, комбинируя и смешивая различные концепции и стили, а также манипулировать существующими изображениями, добавляя или удаляя выбранные элементы, сохраняя при этом достоверный баланс света и тени. Кроме того, система предлагает возможность преобразовывать варианты существующего изображения.
После регистрации вы получаете 50 кредитов, которые можете использовать для создания изображений в течение первого месяца. Позже вы получаете 15 бесплатных кредитов каждый последующий месяц. Конечно, вы можете приобрести больше кредитов, если хотите.
DALL-E 2 анализирует изображения и их описания, доступные в Интернете, сравнивая их с введенным пользователем текстом. Вы можете использовать естественный язык для формулировки подсказок. Кроме того, вы можете расширить запрос, предоставив DALL-E 2 предпочтения стиля (например, реализм или импрессионизм). На основе этой информации система выдает четыре изображения, которые можно модифицировать по своему вкусу.
Кроме того, вы можете попросить DALL-E 2 сгенерировать варианты конкретного изображения:

Источник: пример изображений, сформированных пользователем.

Вот что мы думаем…

На данный момент мы бы не назвали этот инструмент идеальным. Формулировка подсказок не интуитивно понятна. Вам нужно приложить большие усилия, чтобы получить результат, близкий к тому, что вы ожидаете от инструмента. Кроме того, он часто выдает ошибки или результаты, далекие от исходного запроса.
По сравнению с Midjourney, DALL-E 2 менее интуитивно понятен и генерирует изображения более низкого качества. Тем не менее все же стоит использовать 50 бесплатных кредитов, чтобы изучить его возможности.

Новинка от Adobe: Adobe Firefly

Позвольте нам начать с того, что Adobe Firefly в настоящее время доступна в бета-версии. Подобно вышеупомянутым системам, Firefly также работает на основе запросов на естественном языке.
Инструмент, похоже, станет серьезным конкурентом Midjourney и DALL-E 2.
Предполагается, что Adobe Firefly поможет создателям:
  • создавать графику на основе загруженных в систему эскизов
  • адаптировать сгенерированные изображения по вкусу или потребностям создателя, что является огромным преимуществом перед конкурентами
  • изменять настроения импортированных фото или видео, включая погоду
  • создавать плакаты, баннеры и графику для социальных сетей
  • создавать изображения и графику из загруженной доски настроения
  • создавать эффекты для текста и букв, позволяющих вносить различные модификации в заданный шрифт
Adobe показала нам, что можно вручную изменять определенные элементы, а также настраивать стиль, освещение, композицию и обрезку. Также возможно изменить настроение изображения и даже выражение лица!
Кроме того, Adobe планирует расширить систему для обработки и создания 3D-графики.
Вам необходимо отправить запрос, чтобы получить доступ к бета-версии Adobe Firefly. Кроме того, вам необходимо иметь Adobe ID и быть старше 18 лет. Приглашения будут постепенно рассылаться тем, кто заинтересован в использовании творческой генеративной модели ИИ от Adobe.
Позже разработчики смогут использовать Firefly в коммерческих целях.
Еще одним преимуществом Firefly является система обучения. Он использует данные, доступные в Adobe Stock, произведения с открытой лицензией и картины, ставшие общественным достоянием (которые больше не защищены авторским правом). Интересно, что компания Adobe, как говорят, разрабатывает модель компенсации для создателей, чьи работы используются для обучения системы развития AI.
Работы, созданные с помощью Firefly, также будут включать тег Content Credentials, указывающий, что они были созданы с использованием ИИ. Кроме того, Adobe работает над введением тега «Не обучать», который позволит создателям отказаться от использования своих работ для обучения генеративных моделей.

Lensa

Приложение предназначено для создания графики (аватаров) на основе загруженных пользователем фотографий. Он доступен на Android и iOS. Несомненно, Ленса в последнее время приобрела огромную популярность. Изображения, созданные в этом приложении, заполонили каналы пользователей Вконтакте и Instagram и заменили обычные изображения профилей.
Однако рекомендуется использовать приложение с осторожностью, поскольку оно основано на Stable Diffusion, системе распознавания лиц. Также участились обвинения в сексуализации созданной графики, расизме и нарушении авторских прав художников путем использования изображений из Интернета для обучения алгоритмов без предварительного согласия и финансовой компенсации создателям оригинальных работ.
Это платное приложение, разработанное российской компанией Prisma Labs.

Stable Diffusion

Stable Diffusion имеет те же функции, что и DALL-E и Midjourney. Он позволяет своим пользователям создавать изображения с высоким разрешением, используя естественный язык в качестве подсказки. Графика генерируется всего за несколько секунд.
Что интересно, в Stable Diffusion явно отсутствуют этические гарантии. Это означает, что любой может использовать изображения известных личностей и знаменитостей для своей графики. Созданные образы доступны под лицензией CC0 1.0 Universal Public Domain Dedication с открытым исходным кодом.
Несмотря на впечатляющие возможности, графика, созданная Stable Diffusion, часто имеет серьезные недостатки. Вопиющие недостатки проявляются в основном через неудачные попытки изобразить глаза и руки. Кроме того, похоже, что система не справляется с обработкой более абстрактных понятий.

RemoveBG

RemoveBG — очень полезный инструмент, который поможет вам удалить фон с любой фотографии. Он работает эффективно и очень удобен для пользователя. Вам просто нужно загрузить фотографию или вставить ее URL, вот и все.
Качество изображений, генерируемых RemoveBG, либо хорошее, либо высокое. Доступные размеры — 596×418 px или 2048×1438 px (последний платный). Что интересно, этот инструмент можно интегрировать с Canva. Удаление фона выполнено довольно эффектно — у инструмента нет проблем с отделением отдельных прядей волос от фона, оставляя их острыми.
Вот RemoveBG в действии — взгляните на фото, на котором изображены два специалиста по поисковому маркетингу:

Veed.io

Veed.io — это простой в использовании инструмент для создания видео на основе искусственного интеллекта. Его широкий спектр функций поможет вам создавать захватывающие видео. Вы можете создать свой собственный видеоролик, используя стоковые кадры (без ограничений по длине) или импортировав свой собственный видеоконтент.
Вы можете настроить свое видео со звуком, голосом за кадром и текстом в различных стилях и конфигурациях.
Кроме того, вы можете контролировать скорость видео и синхронизацию субтитров. Благодаря удобному редактору Veed.io кажется очень ценным инструментом — вы можете попробовать использовать его для создания видео для Performance Max в Google Ads!

llElevenLabs

llElevenLabs — интересный инструмент, который действует как средство преобразования текста в речь для введенного пользователем текста. Возможности данной платформы довольно впечатляющие. Он очень хорошо работает только с английским вводом. К сожалению, с другими языками он может конфликтовать.

vidyo.ai

У вас есть длинное видео, которое вы хотели бы преобразовать в серию более коротких клипов для социальных сетей? Рассмотрите возможность использования Vidyo! Этот инструмент анализирует ваше видео и создает сокращенные версии, оптимизированные для Instagram, Вконтакте и других социальных сетей.

soundraw.io

Это инструмент для создания фоновой музыки, которую вы можете использовать в своих видеопроектах. Soundraw создает несколько вариаций, которые вы можете позже изменить в соответствии со своими потребностями или предпочтениями.

Beautiful.ai

Beautiful.ai — это инструмент, который помогает создавать профессионально выглядящие презентации и слайды. Это во многих отношениях упрощает вашу работу, например, предоставляя вам набор настраиваемых шаблонов.
Он также предлагает систему машинного обучения, доступную в рамках планов подписки для отдельных лиц, команд и предприятий.
Ниже приведен пример слайда, созданного Beautiful.ai:

Генераторы изображений AI: Итог

Как видите, существует множество инструментов графического дизайна на базе искусственного интеллекта, некоторые из которых даже доступны бесплатно. Стоит попробовать автоматизировать задачи и попытаться создать графику самостоятельно, так как это может сэкономить ваше время и деньги. При создании собственных изображений с помощью инструментов ИИ помните о юридических проблемах, о которых мы упоминали ранее. Кроме того, как и в случае с большинством технологических достижений, используйте их с умом!
Общие
Made on
Tilda