ИИ генерирует (страшные) картинки по текстовым описаниям

Искусственный интеллект AttnGAN создает изображения по текстовому описанию. Получается пока не очень: в большинстве случаев получаются очень абстрактные изображения, но иногда по картинке можно (очень приблизительно) понять, что имелось ввиду. Вот это, например, изображение по запросу «красивая молодая женщина»:

а это — «кот» (мы пробовали несколько раз, и каждый раз алгоритм выдает что-то полосатое — возможно, учился на полосатых котах):

ИИ генерирует (страшные) картинки по текстовым описаниям

AttnGAN создали разработчики из Центра глубокого обучения Microsoft; описание алгоритма опубликовано в репозитории arXiv.org. Лучшие результаты получаются, когда запросы соответствуют тематике массива изображений, на которых обучали алгоритм — когда в него загрузили много изображений птиц, он стал сносно генерировать птиц, но когда алгоритм учится на массивах картинок более разнообразной тематики, он теряет сноровку.

ИИ генерирует (страшные) картинки по текстовым описаниям Tao Xu et al., 2018

Зато по‑прежнему неплохо разбирается во фруктах (запрос «банан и персик»):

ИИ генерирует (страшные) картинки по текстовым описаниям

Больше всего редакцию «Популярной механики» напугало изображение человека в красном, сгенерированное по запросу «Огонь иди со мной» — в статье не упоминается об обучении алгоритма на кадрах из «Твин Пикса»:

ИИ генерирует (страшные) картинки по текстовым описаниям

Поиграть с демо-версией ИИ можно тут — правда, понимает она только английский язык. Демо-версию разработал Кристобаль Валенсуэла из Нью-Йоркского университета, участник проекта Runway, цель которого — исследование творческих способностей искусственного интеллекта.

Источник

31.03	37-й IT talk »
17.11	MBLTdev #2 »
16.11	GeekWeek-2015 »