Выбирай : Покупай : Используй

Вход для партнеров

Вход для продавцов

0

Как бесплатно преобразовать речь в текст: лучшие ИИ-сервисы

Ещё недавно расшифровка аудиозаписей требовала кропотливого ручного труда. Сегодня нейросети справляются с этой задачей за минуты и даже секунды. Кроме того, современные ИИ-сервисы умеют различать нескольких спикеров в диалоге, расставлять знаки препинания, добавлять тайм‑коды, формировать логическую структуру текста, работать с несколькими языками и так далее. Редакция ZOOM.CNews протестировала наиболее популярные ИИ-сервисы для транскрибации, которые позволяют преобразовать голос в текст бесплатно, и выбрала лучшие.
Содержание:
Как бесплатно преобразовать речь в текст: лучшие ИИ-сервисы
Как бесплатно преобразовать речь в текст: лучшие ИИ-сервисы
Версия для печати

Для короткого теста мы использовали отрывок из стихотворения Пушкина. В статье собраны сервисы, которые лучше всех справились с задачей преобразовать голос в текст. Также важным критерием отбора стало наличие бесплатных возможностей.

AQUA

Aqua — один из самых продвинутых ИИ-сервисов для преобразования голоса в текст. Для его использования понадобится приложение, доступное для Mac и ПК на Windows. После установки нужно пройти простую процедуру регистрации, например, с помощью Google-аккаунта

У Aqua ограниченная бесплатная версия — до 1000 слов в месяц. Сервис не просто записывает ваши слова под диктовку, но и расставляет знаки препинания. Пожалуй, самое удобное в Aqua заключается в том, что текст можно печатать в любом удобном приложении, в любом поле. Достаточно поставить в нужную точку курсор, нажать правую клавишу Alt и начать говорить в микрофон. После того, как вы отпустите клавишу , диктовка закончится, а в выбранном поле появится готовый текст.


Приложение Aqua для Windows

Aqua поддерживает распознавание речи на почти 50 языках и подходит даже для диктовки программного кода. Из любопытного: в Aqua можно с помощью специального меню узнать, сколько минут вы сэкономили, заменив обычный ввод с клавиатуры на диктовку.

BotHub

BotHub — отечественная ИИ-платформа, где в одном месте собрали несколько самых популярных и продвинутых нейросетей для работы с текстом и изображениями и выполнения различных задач. Для начала работы с BotHub достаточно авторизоваться на платформе с помощью VK ID или Яндекс ID. Каждый пользователь получает 30 000 токенов, которые можно потратить на выполнение различных задач. 

Для преобразования голоса в текст используется модель AssemblyAI-nano. Сообщение можно надиктовать или же загрузить готовый аудиофайл в удобном формате. Расшифровка происходит довольно быстро.


Веб-интерфейс BotHub

На небольшой отрывок из стихотворения Пушкина, который мы использовали для проверки всех сервисов, ушли считанные секунды и было потрачено 333 токена. Нейросеть расставляет знаки препинания и хорошо справляется с расшифровкой, но в такой базовой версии не умеет, например, разделять текст в диалоге на реплики, определять количество говорящих и так далее.

Teamlogs

Teamlogs — российский онлайн?сервис для автоматической транскрибации (преобразования речи в текст) аудио? и видеофайлов. Понимает русский и английский язык, автоматически разделяет реплики участников, поддерживает популярные форматы: MP3, WAV, MP4, MOV, AVI и другие. 

Записать аудио непосредственно с помощью сервиса нельзя, можно только загрузить файл, в том числе из облачного хранилища. Сервис больше подходит для бизнеса, работы и учебы. Он справится с расшифровкой записей совещаний, интервью, лекций.


Интерфейс Teamlogs

Бесплатно можно преобразовать в текст аудио длительностью до 15 минут — этого как раз достаточно для того, чтобы понять подходит ли Teamlogs конкретно вам. Поскольку сервис отечественный, вы легко сможете приобрести платную версию — карты российских банков принимаются без проблем.

Wispr Flow AI

Wispr Flow преобразует речь в структурированный и отредактированный текст в реальном времени. Он, как и Aqua, работает во всех приложениях, где есть текстовое поле (почта, мессенджеры, редакторы кода, заметки и др.). 

Для работы нужно скачать приложение для Mac или Windows или мобильную версию для iPhone, и пройти простую регистрацию. Базовый тариф (бесплатный) включает ограниченный лимит слов в неделю (2000 слов для Mac и Windows, 1000 слов — для iO). 


Приложение Wispr Flow AI для Windows

Доступны базовые функции: голосовый ввод, авторедактирование, поддержка нескольких языков, персональный словарь. Как и в случае с Aqua, печатать можно в любом приложении. Достаточно поставить курсор в нужное место и нажать заранее установленную комбинацию клавиш, например, Ctrl+Win. 

Wispr Flow умеет расставлять знаки препинания и разделять текст на строки, ориентируясь на интонацию говорящего, правда, с распознаванием русского иногда справляется чуть хуже, чем другие приложения.

TurboScribe AI

TurboScribe — онлайн?сервис для преобразования аудио? и видеофайлов в текст. Аудио можно как надиктовывать, так и загружать уже готовые файлы в различных форматах.

Сервис  понимает почти 100 языков, включая английский русский и даже некоторые редкие языки. Бесплатный тариф позволяет работать с не более чем 3 файлами в день, каждый длительностью до 30 минут. Этого вполне достаточно для расшифровки сообщений, почтовых рассылок и прочих небольших текстов.


Интерфейс TurboScribe

Для использования TurboScribe не нужно скачивать дополнительные приложения, достаточно пройти быструю регистрацию на сайте. Готовый файл с транскрибированной речью можно скачать в удобном формате.

ruGPT

RuGPT — это онлайн-платформа на базе искусственного интеллекта, которая предлагает различные инструменты для работы с текстом, изображениями, аудио и видео, включая функцию преобразования аудио в текст. Надиктовать текст не получится, можно только загрузить готовый аудиофайл длительностью не более 30 минут и размером до 500 Мбайт. Правда, бесплатный тариф ограничивает пользователя больше — доступно распознавание аудио продолжительностью не дольше 5 минут. 


Интерфейс ruGPT

RuGPT хорошо распознает русский язык и ему не страшны даже несколько устаревшие слова, к тому же он правильно расставляет знаки препинания. Готовый текст можно скопировать или скачать. 

Прохлада без монтажа: 7 мобильных кондиционеров с Wi-Fi

Если сервис понравится, то подписку можно легко расширить благодаря возможности оплаты российскими картами.

Shopot AI

Shopot AI — русскоязычная онлайн?платформа для транскрибации (расшифровки) аудио? и видеофайлов. Она не работает с диктовкой в режиме реального времени, для транскрибации используются только готовые файлы с аудио- и видеозаписями. Загружаете запись — получаете готовый текст с разбивкой по спикерам и тайм?кодами. 

Бесплатный тариф включает до 30 минут расшифровки для тестирования сервиса. Сервис поддерживает транскрибацию более чем на 60 языках. 

Помимо преобразования речи в текст Shopot AO умеет делать краткую выжимку из текста и составлять тезисы, что может быть полезно для длинных записей, например, каких-либо совещаний или лекции в университете.


Работа с аудио на платформе Shopot AI

Поскольку Shopot AI — отечественный сервис, с оплатой российскими банковскими картами не возникнет никаких проблем, если понадобится подключить дополнительные опции или приобрести расширенную подписку.

Dictation.io

Dictation.io работает в браузере Google Chrome. Сервис полностью бесплатный, он использует технологии Google Speech Recognition («Распознавание речи от Google»). Знаки препинания нужно расставлять самостоятельно после записи или же с помощью специальных голосовых команд. Преобразование происходит в режиме реального времени, действительно под диктовку.


Веб-интерфейс Dictation 

Если вам нужен просто виртуальный блокнот для записи мыслей, то Dictation.io подойдет идеально. 

Сервис поддерживает разные языки, например английский, испанский, французский, итальянский, португальский. Преобразованный текст хранится локально в браузере, но его легко можно скопировать в нужное приложение.

Speechtexter

Speechtexter — простой веб-сервис, который без проблем работает в разных браузерах, включая Chrome, Edge и Yandex. В его основе также лежит технология распознавания речи от Google

В целом, Speechtexter —  удобный инструмент для быстрого голосового ввода текста в браузере. Сервис абсолютно бесплатный, не требует ни установки каких-либо приложений, ни даже авторизации. 

Speechtexter поддерживает большое количество языков, но самостоятельно определить язык не может. Перед тем как начать диктовку, убедитесь, что выбран верный язык, иначе Speechtexter не справится с распознаванием.


Веб-интерфейс Speechtexter

Кроме того, сервис не расставляет знаки препинания и иногда может ошибаться в чуть более редких словах. Он подходит для черновых записей, заметок, идей и текстов, где важна скорость, а не идеальная точность.


В таблице мы собрали все упомянутые в статье сервисы, расположив их по количеству возможностей для пользователя.

Название Платформы Диктовка/готовые записи Стоимость платной версии
BotHub Веб Диктовка и готовая запись От 165 руб./мес.
TurboScribe AI Веб Диктовка и готовая запись От 770 руб./мес.
Wispr Flow AI Приложения для ПК (Mac, Windows) и iOS Только диктовка в реальном времени От 920 руб./мес.
Aqua ПК (Mac, Windows) Только диктовка в реальном времени От 620 руб./мес.
Teamlogs Веб Готовая запись От 6 руб./мин
ruGPT Веб Готовая запись От 165 руб./мес.
Shopot AI Веб Готовая запись От 390 руб./мес.
Speechtexter Веб Только диктовка в реальном времени Бесплатно
Dictation.io Веб, Google Chrome Только диктовка в реальном времени Бесплатно

Версия для печати