Microsoft научила чат-бота комментировать увиденное

Благодаря эмпатическому зрению чат-бот анализирует окружение через камеру смартфона и может описывать свои эмоции и впечатления

Microsoft представила в Японии прототип приложения для смартфона с чат-ботом Rinna, у которого более 7 млн пользователей. Благодаря эмпатическому зрению чат-бот анализирует окружение через камеру смартфона и может описывать свои эмоции и впечатления, давать советы, а не просто перечислять названия, формы и цвета объектов. К примеру, Rinna может прокомментировать новый галстук или уговорить съесть пирожное.

Уникальность модели эмпатического зрения в Rinna заключается в том, что, в отличие от других интеллектуальных моделей зрения, она дает оценку происходящему. Традиционные технологии машинного зрения обычно реагируют так: «Я вижу людей. Я вижу собаку. Я вижу машину». Rinna же может сказать: «Какая милая семья! Похоже, они весело проводят выходные. Ой, там машина! Осторожно!»

Используя технологии обработки естественного языка и синтеза речи, созданные учеными Microsoft Research, Rinna может вести с пользователем смартфона естественный диалог. Кроме того, он также обладает «полнодуплексным» режимом, который помогает предсказывать, что собеседник скажет дальше. Это позволяет чат-боту принимать решения о том, как и когда реагировать на фразы пользователя и уменьшает задержки между вопросом и ответом, которые обычно мешают естественному ходу беседы.

Ранее Microsoft встроила «полнодуплексный» режим в социального чат-бота XiaoIce, имеющего более 200 млн пользователей в Азии, а также научила его писать китайскую поэзию по изображениям, которые ему демонстрируют.