Российские ученые научили нейронную сеть распознавать речь
Разработка компании «ЦРТ-инновации» представляет собой технологию автоматического распознавания речевых команд, которую можно использовать для управления промышленными роботами. С ее помощью, например, можно будет голосовой командой выключить станок или поменять режим работы вентиляции в производственном помещении. Это не только повысит эффективность труда, но и снизит риск травматизма на производстве.
Современные промышленные роботы достигли совершенства на текущем этапе развития техники, но человеческую речь до сих пор не понимают
Технология распознавания речи от «ЦРТ-инновации» использует метод распознавания голосовых команд на основе акустических моделей, создаваемых с помощью глубоких нейронных сетей (Deep neural networks, DNN). В отличие от обычных технологий распознавания речи на базе гауссовых распределений, машинное обучение с применение нейронных сетей имеет намного большие надежность и точность распознавания.
Нейронная сеть адаптируется к конкретным людям и с каждым разом учится узнавать речевые команды все лучше и лучше. Особенностью является возможность надежного выделения голосовых команд на фоне сильного шума, поэтому новую технологию можно применять в заводских цехах, кабине строительной техники, автомобилях, в карьерах, шумных помещениях с большим количеством людей и других местах.
«Последние значительные успехи в распознавании речи связаны с применением в акустических моделях глубоких нейронных сетей, — цитирует сайт «Сколково» слова директора научно-исследовательского департамента ЦРТ Кирилла Левина. — Результаты проведенных компанией исследований показывают значительное преимущество технологии распознавания речи на базе глубоких нейронных сетей. Это преимущество наиболее ярко проявляется в условиях увеличения шума».
Коммуникация с машинами — серьезная проблема. Даже между собой люди общаются малоэффективным способом — речью. С точки зрения скорости и надежности передачи данных речь не является идеальным вариантом, особенно на фоне высокоскоростной передачи данных в двоичном коде по современной беспроводной или проводной связи. Тем не менее, с роботами мы не можем общаться даже с помощью голоса, не говоря уже о прямой передаче цифровых данных. До сих пор кнопки, мышь и клавиатура являются основным способом коммуникации с компьютером. Это сильно ограничивает развитие робототехники. Возможно, разработка российских специалистов поможет ускорить решение этой проблемы.