Перевод речи в текст — функция, о которой многие забывают, тогда как именно она позволяет «освободить руки» и не потерять важную информацию, а также перевести в текстовую версию аудио- и видеозаписи. У Google есть штатные инструменты именно для транскрибации (перевода устной речи в письменную). Вот краткая инструкция, как их использовать.
Да, существует ряд приложений, которые обеспечивают расшифровку записанного аудио с помощью ИИ, например Rev и Otter.ai. У них также есть дополнительные функции, такие как возможность одновременно слушать запись и искать места, требующие правок, или напрямую интегрироваться с такими приложениями как Zoom. Однако они платные. У Google есть несколько бесплатных вариантов, которые могут помочь, хотя они и имеют определенные ограничения.
Голосовой ввод Google Документов
Даже давние пользователи Документов Google могут не знать об инструменте голосового набора, который преобразует речь в текст (это очень удобно, если в данный момент вы не можете печатать). Но его также можно использовать в качестве инструмента для транскрибации любых видео- или аудиозаписей. Например, его можно запустить во время видеоконференции в прямом эфире, чтобы транскрибировать разговор в режиме live.
Чтобы использовать голосовой набор в качестве средства транскрипции, выполните следующее:
- откройте новый документ Google в браузере Chrome;
- выберите Инструменты/Голосовой ввод — сбоку появится значок микрофона;
- когда будете готовы начать запись, нажмите значок микрофона — он станет ярко-красным, и начнется расшифровка.
Функция, несомненно, удобная, но есть один нюанс. После того, как вы ее запустили, нельзя покинуть страницу документа — в этом случае расшифровка автоматически отключится. Например, если вы записываете конференцию в Zoom и хотите проверить электронную почту, то вы потеряете всю запись, пока не вернетесь к документу и снова не нажмете на микрофон.
Вдобавок ко всему, полученная транскрипция будет, скажем так, не совсем идеальна. Кроме того, забудьте о запятых, точках и других тонкостях — если вы хотите получить грамматически правильный документ, придется основательно отредактировать его позже.
Приложение «Прямая расшифровка» (Google Live Transcribe)
Голосовому вводу есть альтернатива. Google Live Transcribe (в русскоязычном Play Market называется «Прямая расшифровка») — это приложение для Android, которое транскрибирует звук на экран смартфона в режиме реального времени. Приложение крайне простое: вы устанавливаете его, загружаете, и оно сразу же начинает расшифровку. Изначально софт создавался как инструмент для слабослышащих людей.
Live Transcribe сохраняет текст в течение трех дней. Если он нужен вам в дальнейшем, то вы просто копируете и вставляете его в документ.
Отметим, что Live Transcribe обрабатывает аудиопоток значительно лучше, чем голосовой ввод, но речь должна быть четкой, громкой и внятной. Ну и, конечно же, над пунктуацией придется поработать позднее.
Если варианты с последующей доработкой текста вам не подходят, тогда обратите внимание на платные приложения.