Популярные криптовалюты

BTC $78,008.67 +1.98%
ETH $2,389.18 +2.52%
SOL $88.24 +2.56%
XRP $1.45 +0.58%
CHIP $0.08125 +577.08%
ZEC $317.79 -0.15%
BNB $641.98 +0.63%

OpenAI представила «думающий» генератор изображений

OpenAI выпустила «размышляющий» генератор изображений ChatGPT Images 2.0 — «модель, способную решать сложные визуальные задачи и создавать точные работы».

Фирма OpenAI выпустила «размышляющий» генератор изображений ChatGPT Images 2.0 — «передовую модель, способную решать сложные визуальные задачи и создавать точные, готовые к использованию работы».

Introducing ChatGPT Images 2.0A state-of-the-art image model that can take on complex visual tasks and produce precise, immediately usable visuals, with sharper editing, richer layouts, and thinking-level intelligence.Video made with ChatGPT Images pic.twitter.com/3aWfXakrcR

— OpenAI (@OpenAI) April 21, 2026

В компании отметили «качественный скачок» в следовании инструкциям, точном расположении и соотношении объектов, а также в визуализации плотного текста.

Модель уверенно работает с несколькими языками и самостоятельно заполняет пробелы в запросе, опираясь на визуальный и общий контекст. В итоге пользователь получает нужный результат с меньшим числом уточнений.

Точность и контроль

ChatGPT Images 2.0 справляется со сложными концепциями и точно воплощает их визуально.

Модель следует инструкциям, сохраняет указанные детали и отображает мелкие элементы с разрешением до 2К.

Greater Precision and ControlChatGPT Images 2.0 can conceptualize more sophisticated images, and then actually bring that vision to life effectively. It’s able to follow instructions, preserve requested details, and render the fine-grained elements that often break image… pic.twitter.com/n29165pV9Q

— OpenAI (@OpenAI) April 21, 2026

Работа со стилями

ChatGPT Images 2.0 точнее передает характерные черты фотографий, кинематографических кадров, пиксельной графики, манги и других визуальных стилей. LLM обеспечивает высокую степень согласованности текстур, освещения, композиции и мелких деталей. 

Подобная точность может быть полезна при создании игровых прототипов, в разработке сторибордов, подготовке маркетинговых материалов и создании работ в определенном медиаформате или жанре.

Умеет думать

ChatGPT Images 2.0 — первая модель OpenAI для работы с изображениями, способная рассуждать перед генерацией.

В связке с ChatGPT модель умеет искать информацию в интернете в реальном времени, создавать несколько вариантов по одному промпту, перепроверять результаты и генерировать рабочие QR-коды.

«Это позволяет модели взять на себя большую часть тяжелой работы между идеей и изображением, особенно когда точность, актуальность информации, согласованность и визуальная целостность имеют первостепенное значение», — утверждают в OpenAI.

Модель поддерживает соотношения сторон от 3:1 по ширине до 1:3 по высоте. Она доступна пользователям ChatGPT и Codex.

Функция Images with thinking есть в тарифных планах ChatGPT Plus, Pro и Business.

Напомним, в апреле OpenAI открыла ограниченному числу пользователей доступ к новой ИИ-модели GPT-5.4-Cyber.

RSS 22.04.2026 1 223
Источник: https://forklog.com/news/ai/openai-predstavila-dumayushhij-generator-izobrazhenij