«Сбер» создал нейросеть для генерации картинок по описанию на русском языке

2 ноября

В кредитно-финансовой организации «Сбер» сообщили о реализации очередного успешного AI-проекта. Так, айтишникам финансового конгломерата удалось создать первую на планете нейронную сеть, способную генерировать изображение на основе текстового описания, предоставленного на русском языке. Проект получил название ruDALL-E.

В банке рассказали, инновационную нейросеть можно использовать при создании интерьерных композиций, векторных иллюстраций, оригинальных стоковых изображений. Кроме того, сеть способна самостоятельно генерировать рекламу, поддерживать сложные копирайтинговые проекты, а также выступать источником идей в промышленном и архитектурном дизайне. Пробная версия ruDALL-E уже доступна на интернет-портале проекта.

Несмотря на огромные возможности в генерировании оригинального художественного контента, нейросеть продолжает обучаться на текстах и картинках, что позволяет создавать по заданному описанию на русском языке неограниченное число уникальных изображений. На сегодняшний день, модель представлена в двух вариантах – ruDALL-E XL, который содержит 1,3 млрд параметров и ruDALL-E 12B с интегрированными 12 млрд параметров.

Как рассказали авторы проекта, формирование изображений нейросеть производит в три стадии. На первой стадии искусственный интеллект обрабатывает принятый текст и генерирует указанное число изображений. На второй стадии нейросеть фильтрует самый удачный контент, наиболее подходящий к исходному описанию. На третьей стадии машинный интеллект увеличивает изображение до того либо иного формата, с сохранением качества контента. Таким образом, под любые указанные характеристики искусственный интеллект способен предоставить неограниченное число уникальных изображений.

В «Сбере» отметили, ruDALL-E стал наиболее масштабным нейросетевым цифровым проектом не только в России, но и в странах СНГ. Обучение искусственного интеллекта потребовало 23 тыс. GPU-часов на массиве данных из 120 млн пар «текст – изображение».

Источник фото: phonoteka.org

Читайте также