Аудиосообщения лезут из всех щелей? Новомодное «средство» общения бесит не только вас. Прослушать минутный спич друга о том, как он провел ночь в ночном клубе — это ОК. Слушать технической задание по проекту на 10 минут — это не ОК. В телеграме уже давно есть инструмент для того, что бы не тратить своё время и, что важней, нервы. Слава ботам!
Для расшифровки аудиосообщений можно пользоваться ботом Voicy https://t.me/voicybot. Это бот, который переводит все голосовые сообщения и аудио файлы (.ogg, .flac, .wav, .mp3), которые получает, в текст. Используется только внутри телеги, но бот умеет переходить по внешним ссылкам (скачивать файлы и затем преобразовывать)
Начинаем работу командой /start
Выбираем язык:
Как запустить?
Чтобы бот начал конвертацию звука в текст — его необходимо добавить в приватный или групповой чат. «Старт» бота производится командой /files
Команда /eingine переключает движок распознавания речи — всего их встроено два wit.ai и Google Speech. Поэтому, если транскрипция какого-то движка будет сбоить — попробуйте другой (по опыту использования Google Speech с русской речью справляется лучше)
Если бот не может расшифровать сообщение:
Если бот может расшифровать:
Точность конкретно русского языка достаточно точная, но иногда бот неверно расшифровывает окончания слов.
Как вам статья?