Нейросеть OpenAI научилась создавать и редактировать изображения по текстовому описанию

7 апреля

Инженеры компании OpenAI презентовали инновационную разработку, которую назвали DALL-E 2. Она представляет собой обновленную версию ИИ-системы на базе генеративно-состязательных сетей, которую рынок увидел в начале 2021 года. Техническая особенность системы заключается в том, что через нейросети она не только способна создавать оригинальные фотореалистичные изображения, но и редактировать их – изменять композиции, текстуру, оттенки, совмещать композиции, добавлять или убирать тени. И все это – через текстовое описание оператора.

Инновационная нейросеть произвела настоящий фурор. Инженеры DALL-E 2 продемонстрировали, как система, например, может интегрировать одно изображение в другое при совершенно чуждых друг другу концепциях. В результате ИИ формирует вполне правдоподобное изображение. Например, DALL-E 2 может нарисовать астронавта, который в глубинах космоса скачет на лошади, или кенгуру, который ловко забрасывает в корзину баскетбольный мяч. 

«Возможности наших новых алгоритмов искусственного интеллекта значительно расширились. Например, недавно они очень быстро и самостоятельно сгенерировали художественную картину, к которой предлагалось описание – “макроскопическая фотография большой семьи мышей, которая сидит у камина в шляпах”. Искусственный интеллект очень быстро нарисовал максимально правдоподобную картину. Второе задание для системы было нарисовать панду в косынке, которая в пустыне едет на скутере. Искусственный интеллект также справился с этой задачей», – рассказал старший вице-президент по исследованиям и продукту OpenAI Мира Мурати.

Он уточнил, для обучения нейросети DALL-E 2 понадобилась огромная база необработанных данных. При этом искусственный интеллект не только изучал каждое из изображений, но и определял взаимосвязи между текстом и изображениями, к которым прилагалось описание.

Источник фото: youtube.com

Читайте также