Расшифровка аудиозаписей когда-то была ручным и довольно утомительным процессом. Врачи, журналисты и представители других профессий записывали свои заметки и разговоры на диктофон, а затем садились перед компьютером, включали запись и набирали текст. К счастью, в 2020 году есть множество сервисов для перевода аудиозаписи в текст — процесс перестал быть таким трудозатратным. Однако возникает вопрос: а насколько они безопасны?
Все-таки пользователи таких сервисов могут загружать для расшифровки голосовые записи конфиденциальных разговоров. Чтобы понять, насколько это безопасно, для начала нужно вникнуть в принцип работы этих программ.
Есть сервисы, использующие только человеческий труд (транскриберов), а есть те, которые комбинируют его и компьютерные алгоритмы. Но самые популярные сервисы транскрибации полностью управляются компьютером — они используют существующие модели искусственного интеллекта и машинного обучения для обработки (Google, Apple, Otter.ai и др.). Происходит преобразование аналоговых волн, создаваемых голосом, в цифровой вид, затем они разбиваются на небольшие (иногда длительностью до 0,001 секунды) сегменты и сопоставляют полученное с известными «фонемами» или элементами языка. Затем эти алгоритмы пытаются исследовать полученные сегменты в контексте других фонем и применять статистические модели и модели ИИ, которые в конечном итоге и формируют текст.
Однако за последнее время уже произошло несколько крупных скандалов, связанных с распознаванием голоса.
Пожалуй, одним из первых сервисов, подмочивших свою репутацию, стал SpinVox, который в нулевые годы предлагал превращение голосовой почты в SMS. В те времена это считалось технологическим прорывом. Компания быстро привлекла положительную прессу, клиентов и серьезные источники финансирования.
Однако без ведома клиентов их голосовые сообщения обрабатывались людьми, работающими в офисах компании в Пакистане, на Маврикии и в Южной Африке. Один инсайдер SpinVox утверждал, что только 2% голосовых сообщений обрабатывались машинами, а над остальными работало около 10 тыс. человек. Когда сотрудники пакистанского офиса SpinVox не получили зарплату, они начали отправлять сообщения прямо клиентам в знак протеста. В конце концов правда вышла наружу, и SpinVox потеряла большую часть клиентов.
А относительно недавно журналисты обнаружили серьезное нарушение, которое произошло в MEDantex, американском провайдере услуг по распознаванию голоса для медицинских работников. Произошла утечка данных (некоторые из них датированы 2007 годом), содержащих конфиденциальные медицинские записи. Файлы можно просто скачать с небезопасного портала в формате MS Word.
Услуги цифровой транскрибации тоже небезопасны. Выяснилось, что компании все равно могут привлекать людей-подрядчиков для контроля качества услуг. И да, они слушают ваши записи.
Подтверждает это находка журналистов, сделанная в прошлом году. Они выяснили, что подрядчики, нанятые Google, слушают разговоры между людьми и их умными колонками Google Home. Компания объяснила это желанием лучше угадывать просьбы пользователей, адресованные голосовым помощникам. Один инсайдер даже предоставил журналистам доступ к записям разговоров, многие из которых носили очень деликатный (а в некоторых случаях и интимный) характер. Сюрприз явно неприятный. Потом выяснилось, что Amazon, Apple и Microsoft делали аналогичные вещи.
Конечно, тогда и безопасность сервисов распознавания голоса тоже под вопросом. С одной стороны, недобросовестные игроки ушли с рынка, а те, кто остался, меньше всего хотят оказаться замешанными в скандале с конфиденциальностью данных. Тем не менее, все равно приходится полагаться исключительно на добросовестность третьей стороны, и это неприятно. Особенно если учитывать, что платформы на основе ИИ часто полагаются на сотрудников и сторонних подрядчиков для проведения проверок контроля качества. Хотя эти проверки охватывают лишь часть всех записей, всегда есть шанс, что кто-то будет слушать именно ваш разговор.
В целом, если ваш разговор носит глубоко личный характер или содержит коммерческую тайну, лучше включить запись, создать новый документ и расшифровать его старомодным способом.