ИИ генерирует (страшные) картинки по текстовым описаниям

Искусственный интеллект AttnGAN создает изображения по текстовому описанию. Получается пока не очень: в большинстве случаев получаются очень абстрактные изображения, но иногда по картинке можно (очень приблизительно) понять, что имелось ввиду. Вот это, например, изображение по запросу «красивая молодая женщина»:
а это — «кот» (мы пробовали несколько раз, и каждый раз алгоритм выдает что-то полосатое — возможно, учился на полосатых котах):
AttnGAN создали разработчики из Центра глубокого обучения Microsoft; описание алгоритма опубликовано в репозитории arXiv.org. Лучшие результаты получаются, когда запросы соответствуют тематике массива изображений, на которых обучали алгоритм — когда в него загрузили много изображений птиц, он стал сносно генерировать птиц, но когда алгоритм учится на массивах картинок более разнообразной тематики, он теряет сноровку.
Tao Xu et al., 2018
Зато по‑прежнему неплохо разбирается во фруктах (запрос «банан и персик»):
Больше всего редакцию «Популярной механики» напугало изображение человека в красном, сгенерированное по запросу «Огонь иди со мной» — в статье не упоминается об обучении алгоритма на кадрах из «Твин Пикса»:
Поиграть с демо-версией ИИ можно тут — правда, понимает она только английский язык. Демо-версию разработал Кристобаль Валенсуэла из Нью-Йоркского университета, участник проекта Runway, цель которого — исследование творческих способностей искусственного интеллекта.
Читайте также
- Xiaomi представила маршрутизатор Redmi Router AX5400 с чипом Qualcomm
- Western Digital повысила цены на флеш-память NAND — это следствие загрязнения производства в январе
- 4 вида вооружения, которые отправили в Европу из-за Украины, но никогда не испытывали в деле
- Twitter позволит вешать ярлыки на ботов, чтобы люди могли отличать их от живых пользователей
- Найдена загадочная "невидимая" черная дыра: космическая аномалия
- Новая статья: Обзор игрового 4K-монитора ASUS TUF Gaming VG28UQL1A: лучше поздно, чем никогда