Для короткого теста мы использовали отрывок из стихотворения Пушкина. В статье собраны сервисы, которые лучше всех справились с задачей преобразовать голос в текст. Также важным критерием отбора стало наличие бесплатных возможностей.
AQUA
Aqua — один из самых продвинутых ИИ-сервисов для преобразования голоса в текст. Для его использования понадобится приложение, доступное для Mac и ПК на Windows. После установки нужно пройти простую процедуру регистрации, например, с помощью Google-аккаунта.
У Aqua ограниченная бесплатная версия — до 1000 слов в месяц. Сервис не просто записывает ваши слова под диктовку, но и расставляет знаки препинания. Пожалуй, самое удобное в Aqua заключается в том, что текст можно печатать в любом удобном приложении, в любом поле. Достаточно поставить в нужную точку курсор, нажать правую клавишу Alt и начать говорить в микрофон. После того, как вы отпустите клавишу , диктовка закончится, а в выбранном поле появится готовый текст.
Приложение Aqua для Windows
Aqua поддерживает распознавание речи на почти 50 языках и подходит даже для диктовки программного кода. Из любопытного: в Aqua можно с помощью специального меню узнать, сколько минут вы сэкономили, заменив обычный ввод с клавиатуры на диктовку.
BotHub
BotHub — отечественная ИИ-платформа, где в одном месте собрали несколько самых популярных и продвинутых нейросетей для работы с текстом и изображениями и выполнения различных задач. Для начала работы с BotHub достаточно авторизоваться на платформе с помощью VK ID или Яндекс ID. Каждый пользователь получает 30 000 токенов, которые можно потратить на выполнение различных задач.
Для преобразования голоса в текст используется модель AssemblyAI-nano. Сообщение можно надиктовать или же загрузить готовый аудиофайл в удобном формате. Расшифровка происходит довольно быстро.
Веб-интерфейс BotHub
На небольшой отрывок из стихотворения Пушкина, который мы использовали для проверки всех сервисов, ушли считанные секунды и было потрачено 333 токена. Нейросеть расставляет знаки препинания и хорошо справляется с расшифровкой, но в такой базовой версии не умеет, например, разделять текст в диалоге на реплики, определять количество говорящих и так далее.
Teamlogs
Teamlogs — российский онлайн?сервис для автоматической транскрибации (преобразования речи в текст) аудио? и видеофайлов. Понимает русский и английский язык, автоматически разделяет реплики участников, поддерживает популярные форматы: MP3, WAV, MP4, MOV, AVI и другие.
Записать аудио непосредственно с помощью сервиса нельзя, можно только загрузить файл, в том числе из облачного хранилища. Сервис больше подходит для бизнеса, работы и учебы. Он справится с расшифровкой записей совещаний, интервью, лекций.
Интерфейс Teamlogs
Бесплатно можно преобразовать в текст аудио длительностью до 15 минут — этого как раз достаточно для того, чтобы понять подходит ли Teamlogs конкретно вам. Поскольку сервис отечественный, вы легко сможете приобрести платную версию — карты российских банков принимаются без проблем.
Wispr Flow AI
Wispr Flow преобразует речь в структурированный и отредактированный текст в реальном времени. Он, как и Aqua, работает во всех приложениях, где есть текстовое поле (почта, мессенджеры, редакторы кода, заметки и др.).
Для работы нужно скачать приложение для Mac или Windows или мобильную версию для iPhone, и пройти простую регистрацию. Базовый тариф (бесплатный) включает ограниченный лимит слов в неделю (2000 слов для Mac и Windows, 1000 слов — для iO).
Приложение Wispr Flow AI для Windows
Доступны базовые функции: голосовый ввод, авторедактирование, поддержка нескольких языков, персональный словарь. Как и в случае с Aqua, печатать можно в любом приложении. Достаточно поставить курсор в нужное место и нажать заранее установленную комбинацию клавиш, например, Ctrl+Win.
Wispr Flow умеет расставлять знаки препинания и разделять текст на строки, ориентируясь на интонацию говорящего, правда, с распознаванием русского иногда справляется чуть хуже, чем другие приложения.
TurboScribe AI
TurboScribe — онлайн?сервис для преобразования аудио? и видеофайлов в текст. Аудио можно как надиктовывать, так и загружать уже готовые файлы в различных форматах.
Сервис понимает почти 100 языков, включая английский русский и даже некоторые редкие языки. Бесплатный тариф позволяет работать с не более чем 3 файлами в день, каждый длительностью до 30 минут. Этого вполне достаточно для расшифровки сообщений, почтовых рассылок и прочих небольших текстов.
Интерфейс TurboScribe
Для использования TurboScribe не нужно скачивать дополнительные приложения, достаточно пройти быструю регистрацию на сайте. Готовый файл с транскрибированной речью можно скачать в удобном формате.
ruGPT
RuGPT — это онлайн-платформа на базе искусственного интеллекта, которая предлагает различные инструменты для работы с текстом, изображениями, аудио и видео, включая функцию преобразования аудио в текст. Надиктовать текст не получится, можно только загрузить готовый аудиофайл длительностью не более 30 минут и размером до 500 Мбайт. Правда, бесплатный тариф ограничивает пользователя больше — доступно распознавание аудио продолжительностью не дольше 5 минут.
Интерфейс ruGPT
RuGPT хорошо распознает русский язык и ему не страшны даже несколько устаревшие слова, к тому же он правильно расставляет знаки препинания. Готовый текст можно скопировать или скачать.
Если сервис понравится, то подписку можно легко расширить благодаря возможности оплаты российскими картами.
Shopot AI
Shopot AI — русскоязычная онлайн?платформа для транскрибации (расшифровки) аудио? и видеофайлов. Она не работает с диктовкой в режиме реального времени, для транскрибации используются только готовые файлы с аудио- и видеозаписями. Загружаете запись — получаете готовый текст с разбивкой по спикерам и тайм?кодами.
Бесплатный тариф включает до 30 минут расшифровки для тестирования сервиса. Сервис поддерживает транскрибацию более чем на 60 языках.
Помимо преобразования речи в текст Shopot AO умеет делать краткую выжимку из текста и составлять тезисы, что может быть полезно для длинных записей, например, каких-либо совещаний или лекции в университете.
Работа с аудио на платформе Shopot AI
Поскольку Shopot AI — отечественный сервис, с оплатой российскими банковскими картами не возникнет никаких проблем, если понадобится подключить дополнительные опции или приобрести расширенную подписку.
Dictation.io
Dictation.io работает в браузере Google Chrome. Сервис полностью бесплатный, он использует технологии Google Speech Recognition («Распознавание речи от Google»). Знаки препинания нужно расставлять самостоятельно после записи или же с помощью специальных голосовых команд. Преобразование происходит в режиме реального времени, действительно под диктовку.
Веб-интерфейс Dictation
Если вам нужен просто виртуальный блокнот для записи мыслей, то Dictation.io подойдет идеально.
Сервис поддерживает разные языки, например английский, испанский, французский, итальянский, португальский. Преобразованный текст хранится локально в браузере, но его легко можно скопировать в нужное приложение.
Speechtexter
Speechtexter — простой веб-сервис, который без проблем работает в разных браузерах, включая Chrome, Edge и Yandex. В его основе также лежит технология распознавания речи от Google.
В целом, Speechtexter — удобный инструмент для быстрого голосового ввода текста в браузере. Сервис абсолютно бесплатный, не требует ни установки каких-либо приложений, ни даже авторизации.
Speechtexter поддерживает большое количество языков, но самостоятельно определить язык не может. Перед тем как начать диктовку, убедитесь, что выбран верный язык, иначе Speechtexter не справится с распознаванием.
Веб-интерфейс Speechtexter
Кроме того, сервис не расставляет знаки препинания и иногда может ошибаться в чуть более редких словах. Он подходит для черновых записей, заметок, идей и текстов, где важна скорость, а не идеальная точность.
В таблице мы собрали все упомянутые в статье сервисы, расположив их по количеству возможностей для пользователя.
| Название | Платформы | Диктовка/готовые записи | Стоимость платной версии |
| BotHub | Веб | Диктовка и готовая запись | От 165 руб./мес. |
| TurboScribe AI | Веб | Диктовка и готовая запись | От 770 руб./мес. |
| Wispr Flow AI | Приложения для ПК (Mac, Windows) и iOS | Только диктовка в реальном времени | От 920 руб./мес. |
| Aqua | ПК (Mac, Windows) | Только диктовка в реальном времени | От 620 руб./мес. |
| Teamlogs | Веб | Готовая запись | От 6 руб./мин |
| ruGPT | Веб | Готовая запись | От 165 руб./мес. |
| Shopot AI | Веб | Готовая запись | От 390 руб./мес. |
| Speechtexter | Веб | Только диктовка в реальном времени | Бесплатно |
| Dictation.io | Веб, Google Chrome | Только диктовка в реальном времени | Бесплатно |


