«Теком» работает над обнаружением ненормативной лексики в медиаконтенте

Решение, получившее название Profanity Finder, позволит автоматически находить и «запикивать» мат, а также другие запрещенные слова в видеофайлах.

Компания «Теком», разработчик программного обеспечения для рынков телерадиовещания и телекоммуникаций, представила решение Profanity Finder по обнаружению бранных слов в медиаконтенте. В основе работы программы лежит нейросеть, предварительно обученная на определенном языковом материале. В словарь для обучения вошли основные корни нецензурных слов из списка Роскомнадзора и образованные от них лексические единицы. В качестве результата проверки пользователь получает размеченный txt-файл с конкретными словами и соответствующими им таймкодами. Об этом CNews сообщили представители «Теком».

Также доступна расширенная версия отчета, в котором нецензурное слово дано вместе с речевым контекстом. Помимо обнаружения запрещенной лексики Profanity Finder может маскировать мат, заменяя его на звуковой сигнал.

На данный момент точность обнаружения слов из базового лексического набора с помощью Profanity Finder составляет 94%. Кроме предустановленного словаря в решении реализован пользовательский словарь. Данная функция позволяет добавлять актуальные для пользователя лексические единицы, которые необходимо детектировать дополнительно. 

Profanity Finder поддерживает проверку видеофайлов в форматах MP4, M4A, 3GP. Предусматривается дальнейшее увеличение числа доступных для анализа форматов контента. Решение от компании «Теком» анализирует видео на наличие запрещенных слов в три раза быстрее реального времени.  

С 2014 г. в России действует закон, запрещающий употребление мата при публичном исполнении произведений искусства, в том числе фильмов, театральных постановок, развлекательных шоу. Годом ранее такой же запрет коснулся средств массовой информации. За производство и распространение контента, содержащего нецензурную лексику, грозит административная ответственность. Продукция, выпущенная до вступления закона в силу, подлежит дополнительной проверке с целью удаления или маскировки мата.

***

Компания «Теком» – российский разработчик высокотехнологичного программного обеспечения в сфере телерадиовещания и телекоммуникаций. Компания специализируется на проектировании, создании и интеграции готовых ИТ-проектов, а также высокотехнологичных решений под индивидуальные запросы заказчиков. Среди собственных разработок «Текома»: системы мониторинга и управления сетями связи промышленного класса, системы файлового контроля, мониторинга качества телевещания, конвертации сетевых протоколов и анализа уровня громкости эфира.