OpenAI представила модель преобразования текста в изображение в DALL-E 3

Компания OpenAI представила DALL-E 3, третью итерацию своей известной модели преобразования текста в изображение.

OpenAI представила модель преобразования текста в изображение в DALL-E 3

DALL-E 3 обещает значительные улучшения по сравнению со своими предшественниками и обеспечивает бесшовную интеграцию с ChatGPT.

Одной из отличительных особенностей DALL-E 3 является способность лучше понимать и интерпретировать намерения пользователя при столкновении с подробными и длинными подсказками:

«Женщина средних лет азиатского происхождения, ее темные волосы с серебристыми прядями, выглядит разбитой на осколки, причудливо вписанной в море разбитого фарфора. На фарфоре блестят узоры из брызг краски, гармонично сочетающей глянцевые и матовые голубые, зеленые,…»

Даже если пользователь не может точно сформулировать свое видение, ChatGPT может помочь ему составить исчерпывающую подсказку.

DALL-E 3 был разработан для создания элементов, с которыми его предшественники и другие генераторы искусственного интеллекта исторически не справлялись, например, для создания сложных изображений рук и включения текста в изображения.

В OpenAI также реализованы надежные меры безопасности, благодаря которым система искусственного интеллекта не генерирует откровенный или оскорбительный контент, определяя и игнорируя определенные ключевые слова в подсказках.

Помимо технических достижений, OpenAI предприняла шаги по снижению потенциальных юридических проблем.

В то время как текущая версия DALL-E может имитировать стили живых художников, в готовящейся к выпуску DALL-E 3 предусмотрена возможность отклонять запросы на копирование работ, защищенных авторским правом. Художники также будут иметь возможность предоставить свои оригинальные работы через специальную форму на сайте OpenAI, что позволит им в случае необходимости потребовать их удаления.

План OpenAI по внедрению DALL-E 3 предусматривает первоначальный выпуск для клиентов ChatGPT «Plus» и «Enterprise» в следующем месяце. Затем улучшенный генератор изображений станет доступен исследовательским лабораториям OpenAI и клиентам API в предстоящем осеннем сезоне.

Поскольку OpenAI продолжает расширять границы технологий искусственного интеллекта, DALL-E 3 представляет собой значительный шаг вперед в области генерации текста в изображение.

  • Другие новости