Новости о криптовалютах, нфт, метаверсах.

OpenAI обновила генератор изображений по текстовому описанию DALL-E

0

Некоммерческая организация OpenAI представил новую версию генератора изображений по текстовому описанию, создающего реалистичные картинки в более высоком разрешении и с меньшей задержкой, чем оригинал.

В DALL-E 2 пользователи могут выбирать и редактировать определенные области существующих изображений, добавлять или удалять элементы вместе с их тенями, создавать коллажи и вариации готовых рисунков.

Нейросеть генерирует картинки с разрешением 1024 пикселя — в четыре раза выше, чем у оригинальной модели.

Изображения, созданные DALL-E 2. Данные: OpenAI.

Сервис DALL-E (сочетание имен художника Сальвадора Дали и мультипликационного персонажа ВАЛЛ-И) основан на модели компьютерного зрения OpenAI CLIP, анонсированной в 2021 году.

«Оригинальная модель просто брала подход GPT-3 из языка и применяла его для создания изображения: мы помещали изображения в набор слов и научились предсказывать, что будет дальше», — рассказал исследователь OpenAI Прафулла Дхаривал.

На сегодня DALL-E 2 доступна тестировщикам, зарегистрировавшимся в листе ожидания. Пользователям недоступно создание непристойных и экстремистских изображений, а также материалов, связанных с «текущими геополитическими событиями».

Напомним, в январе инженер машинного обучения создал генератор покемонов на основе модели DALL-E.

В августе 2021 года энтузиаст разработал уменьшенную версию генератора рисунков из текстового описания от OpenAI.

Источник: Источник

Комментарии закрыты, но трэкбэки и Pingbacks открыты.