Меню

Синхронизация голоса в текст



Пять способов как превратить голос в текст

Кто не мечтал отдать компьютеру диктофонную запись и через некоторое время получить готовый текст? Сегодня мы расскажем, как это сделать.

Способ первый: по старинке
Садимся за компьютер, одеваем наушники, включаем диктофонную запись. И начинаем расшифровывать, быстро-быстро стуча по клавишам. На сегодня это самый надежный способ. И самый медленный. Если собеседник говорит быстро или плохое качество записи, вам придется не раз перематывать диктофонную запись назад. В среднем вам придется потратить в два-три раза больше времени, чем длится запись, которую вы расшифровываете.

Совет: для прослушивания записи используйте аудиоплеер AIMP. В нем можно замедлить скорость воспроизведения через Менеджер звуковых эффектов. Голос при этом будет искажен, зато вам реже понадобится перемотка назад. Если же запись очень тихая и максимальная громкость не помогает, можно воспользоваться нормализацией записи (специальный способ увеличения громкости).

Способ второй: начитываем сами
Современные технологии распознавания речи продвинулись далеко. Но они еще не справляются с диктофонными записями, где присутствуют посторонние шумы, собеседника слышно тихо или плохо. Зато они хорошо распознают голос с микрофона. Воспользуемся этим.

Устанавливаем Яндекс.Диск 3.0 , вместо с ним установится утилита Заметки в Яндекс.Диске. Открываем ее и нажимаем на значок микрофона. Скажите несколько фраз. Текст распознается почти без ошибок. Из знаков препинания здесь только точки. Но и этого достаточно.

Теперь запускайте диктофонную запись в наушниках и одновременно начитывайте ее своим голосом в микрофон (можно использовать встроенный в наушники). Так вы получите вполне сносный к дальнейшей обработке текст. Разумеется, вы должны уметь быстро воспринимать чужую речь и превращать ее в свою.

Совет: можете также использовать другие сервисы, базирующиеся на разработках Google — GoogleSpeech , Speechpad или Speechlogger . Эти сайты нужно запускать в браузере Google Chrome.

Способ третий: грузим YouTube
Ютуб умеет автоматически создавать субтитры. Вы можете попробовать загрузить в сервис диктофонную запись и подождать, пока сформируются субтитры (т.е. распознается ваш текст). Процесс долгий и каким будет результат, вы узнаете не сразу. Поэтому этот способ мы не рекомендуем. Из плохой записи вы все равно не получите приличный результат.

Способ четвертый: полная автоматика
Если у вас хорошая диктофонная запись, где голос звучит ровно, ясно и четко, нет посторонних шумов, можно попробовать использовать вышеупомянутые программы распознавания речи. Но вначале схитрим: сделаем так , чтобы аудиозапись, воспроизводимая с компьютера, была автоматическая направлена на микрофон.

Для этого нам нужно зайти в настройки Windows. В панели Звуки заходим во вкладку Запись , где отключаем Микрофон и другие входы и включаем Стерео микшер . Если вы не видите этих устройств, попробуйте включить показ отключенных и отсоединенных устройств.

После этого включаем сервис рапознавания речи (например, от Яндекса) и включаем воспроизведение диктофонной записи. Практически сразу же начнется распознавание и перевод голоса в текст. В наушниках аудиозапись вы слышать не будете. Не переживайте, так и должно быть.

Если не получается, нужно скачать и установить виртуальное устройство VB-CABLE Virtual Audio Device ( скачать драйвер можно здесь ). Теперь в панели Звуки включаем CABLE Input и CABLE Output (в вкладках Воспроизведение и Запись) и отключаем все остальные включенные устройства.

Учтите, хороший результат вы можете получить только с качественной аудиозаписью. Вот что может получится с плохой — смотрите на скриншоте. Если что «масик мама» — это «массив маймо» (Massive MIMO).

Способ пятый: дождаться будущего
Пройдет еще несколько лет и проблема расшифровки аудиозаписей исчезнет. Искусственный интеллект научится отделять зерна от плевел (т.е. голос от шума), улучшится распознавание плохой речи. Надо только подождать.

Источник

7 способов перевести аудио в текст

Голосовой набор позволяет быстро отправить текстовое сообщение без использования клавиатуры. А благодаря распознаванию звуковых файлов, можно без проблем выполнить транскрибацию записанной на диктофон лекции или создать печатную версию видеоролика. В статье поговорим о методах перевода аудио в текст с помощью специализированных онлайн-сервисов, расширений браузера и ботов.

Speechpad.ru

Один из немногих русскоязычных ресурсов, представляющий пользователям возможность речевого ввода. С его помощью можно вводить текст, используя микрофон, аудиозапись или, вставив ссылку на YouTube-видео. Работа с микрофоном поддерживается в браузере Chrome. Пользователи мобильных телефонов могут загрузить приложение с Play Market или App Store.

Инструкция по работе с сервисом:

  • Перейти по ссылке. На странице дана подробная справка, описывающая различные функции и режимы работы, рекомендуем с ней ознакомиться перед началом процедуры.

  • Подключить микрофон к компьютеру, убедиться в его работоспособности.
  • Кликнуть по кнопке «Включить запись» в нижней части страницы и начать диктовать текст.

    Если требуется перевести текст из аудиозаписи или видео, необходимо нажать кнопку «+Транскрибацию». Выше поля с результатом отобразится графа для добавления ссылки или файла:

      1. В строке «Медиа тип» выбрать вариант предоставления материала. Для «YouTube video» потребуется указать не всю ссылку, а только ее окончание, которое идет после «https://www.youtube.com/watch?v=».

  • 2. Запустить воспроизведение добавленного файла или ролика с YouTube.
  • 3. Ниже кликнуть по кнопке «Включить запись».
  • В результирующем поле отобразится распознаваемый текст. По ходу его добавления можно вручную проставлять знаки препинания.
  • Расширение

    С помощью браузерного расширения будет решен вопрос, как перевести голосовое сообщение в текст на любом сайте. Так пользователь сможет надиктовывать поисковые запросы, отвечать голосом на электронные письма, писать сообщения на форумах и т.д.

    Чтобы установить расширение, необходимо запустить в системе браузер Google Chrome и перейти на страницу дополнения «Голосовой блокнот». Затем кликнуть по кнопке «Установить», подтвердить действие. Когда процесс завершится, можно начинать пользоваться утилитой:

    • Нажать правой кнопкой на любом поле для ввода текста.
    • В контекстном меню выбрать строку «SpeechPad».

  • Разрешить доступ к микрофону и начать говорить.
  • В ходе диктовки нужно проговаривать знаки препинания, иначе потом придется расставлять их вручную. Потребуется некоторое время, чтобы привыкнуть выполнять подобное действие.
  • Уровень распознавания будет зависеть от дикции человека. Следует произносить слова четко и достаточно громко, также немаловажную роль играет качество микрофона.

    Модуль интеграции с Windows, Linux, Mac

    Сервис «Speechpad» дополнительно предлагает пользователям программы для транскрибации аудио в текст. После интеграции модуля в выбранную операционную систему, станет доступен голосовой ввод для любых приложений (например, в Word).

    Последовательность действий в данном случае будет следующей:

    • Установить в браузер упомянутое выше расширение.
    • Скачать модуль интеграции на странице сервиса.
    • Выполнить регистрацию на сайте и произвести вход под своим логином.

    В кабинете пользователя активировать тестовый период (по его истечении 1 месяц использования услуги обойдется в 100 рублей).

    Вернуться на главную страницу сервиса и отметить флажком пункт «Интеграция с OS».

  • Кликнуть по кнопке «Включить запись».
  • Открыть на компьютере программу, в которую нужно добавить текст голосом и начать диктовку.
  • Dictation.io

    Сервис онлайн распознавания речи через микрофон. Посредством голоса можно расставлять параграфы, знаки пунктуации и даже смайлики. Dictation пригодится для написания электронных писем или заполнения документов в браузере.

    • Перейти на страницу транскрибации.
    • В правой части экрана нажать на три горизонтальные полоски, чтобы выбрать язык ввода. Поддерживается большое количество языковых направлений.

  • В левом нижнем углу кликнуть по кнопке «Start».
  • Начать диктовку текста.
  • Редактирование материала осуществляется путем встроенного редактора. Непосредственно со страницы можно выполнить сохранение текста, его публикацию, печать.
  • Сайт не предоставляет отдельных программ для перевода аудио в текст, поэтому работа осуществляется только на его страницах.

    Otter.ai

    Зарубежный сервис распознавания речи, в настоящее время поддерживает работу только с английским языком. Предоставляет около 600 минут распознавания аудиофайлов на месяц. Если потребуется больше, присутствует премиум-подписка.

    На сайте сохраняются все распознавания голосовых записей, обработка вновь добавленного файла выполняется достаточно быстро. В итоговых результатах сервис выделяет ключевые слова, обозначает отдельных собеседников (если на записи присутствует несколько голосов), выставляет параграфы. Со знаками препинания ситуация не лучше, чем на других сервисах – их придется расставлять самостоятельно.

    Cloud Speech-to-Text

    Мощный, но в то же время платный инструмент от разработчиков Google. В его работе используются технологии машинного обучения для распознавания коротких фраз и длительных аудиозаписей.

    Cloud Speech-to-Text предоставляет пользователям расшифровку аудиозаписей в текст путем применения моделей нейронной сети через простой к понимаю API. Сервис может использоваться для голосовых команд управления, транскрибации аудио и прочих задач.

    На стартовой странице сервиса можно провести распознавание с файла или микрофона без регистрации. Это позволит оценить качество его работы. Cloud Speech-to-Text умеет работать со 120 языками. Отрезок из аудиокниги на русском языке был транскрибирован практически идеально, исключение составили только несколько слов, которые было сложно разобрать даже человеческому уху.

    Сервис можно смело рекомендовать, если перевод голоса в текст требуется постоянно в ходе профессиональной деятельности или по работе. Попробовать полный функционал можно на бесплатной основе, предварительно согласившись с правилами и предоставив данные кредитной карты.

    Google Переводчик

    На странице онлайн переводчика от Google присутствует возможность голосового ввода текста. Это может стать альтернативным и в то же время бесплатным вариантом, если требуется надиктовать запись с микрофона. Для начала ввода достаточно нажать на соответствующий значок.

    Чуть более сложная задача стоит перед пользователем, если требуется выполнить перевод аудио в текст. Тем не менее зарубежные юзеры придумали решение – нужно установить специальный драйвер в систему и настроить вход микрофона на него. По итогу запущенный в плеере файл будет передаваться как голос, который поступает с микрофона. Это позволяет «обмануть» Google Переводчик и произвести транскрибацию с аудиофайла.

    Качество распознавания находится на высоте. Присутствует ограничение в 5 тыс. символов. По его достижению нужно приостанавливать воспроизведение и копировать текст в Word или другую программу.

    Читайте также:  Что такое синхронизация нпс

    Бот во ВКонтакте

    Перевести полученное ВКонтакте голосовое сообщение в текст поможет специальный бот. Им можно воспользоваться непосредственно на главной странице сообщества. Также присутствует возможность добавления в чат – тогда бот будет автоматически переводить все голосовые сообщения, присылаемые пользователями.

    Стоит заметить, что система работает только с записями ВК. Загруженные извне файлы не распознаются и не переводятся в текст.

    Бот в Telegram

    Чуть более функциональную онлайн-расшифровку аудио в текст предоставляет бот Voicy, расположенный в мессенджере Telegram. Он работает с голосовыми сообщениями и отдельно загруженными файлами. Качество распознавания находится на среднем уровне. Поддерживается смена «движка» на Google Speach, однако для этого потребуется предварительно оформить подписку в сервисе Cloud Speech-to-Text. По умолчанию используется бесплатная система Wit.ai.

    Инструкция по работе с ботом:

    • Перейти по ссылке для добавления чата в мессенджер.
    • Дать команду «/language» для выбора языка.

  • Если требует перевести файл, следует использовать команду «/files».
  • Далее остается только прикрепить аудиозапись, после чего бот сообщит о запуске процесса распознавания.
  • Для просмотра всех команд Voicy необходимо отправить ему сообщение с текстом «/help».

    Подведем итоги. Программа для преобразования голоса в текст на Виндовс присутствует только в сервисе Speechpad. Однако даже там основная часть данных берется с серверов. Прочие предложенные инструменты работают онлайн. Лучшим по качеству распознавания является Cloud Speech-to-Text. Бесплатная альтернатива представлена Google Переводчиком, где после установки специального драйвера получится проводить транскрибацию аудиофайлов.

    Источник

    Как преобразовать голос в текст на смартфоне?

    Бывают ситуации, когда нет возможности написать текстовую заметку или SMS-сообщение — мы стоим в очереди или едем в метро. В этом случае на помощь приходит инструмент для преобразования голоса в текст. Все, что нужно сделать — надиктовывать SMS-сообщение или текстовую заметку. Рассмотрим 3 лучших приложения, которые помогут быстро преобразовать голос в текст на Android-устройствах.

    GBoard

    GBoard — официальная клавиатура от компании Google. На многих Android-устройствах клавиатура установлена по умолчанию. Если нет — ее можно бесплатно загрузить в Google Play.

    В первую очередь, клавиатура предназначена для удобного и быстрого ввода текста. Несмотря на это, в программе есть инструмент, который преобразует голос в текстовую заметку. Для этого используется транскрипция: клавиатура GBoard синхронизируется с микрофоном на смартфоне или гарнитуре и превращает речь в текст.

    Клавиатура мультиязычная, поэтому диктовать текст можно на русском, английском или испанском языках. Главное условие — четкое проговаривание каждого слова, чтобы в тексте не было ошибок с написанием. Диктовать текст можно в любом приложении, где есть ввод текста.

    Evernote

    Evernote — популярное приложение, которое используется для создания текстовых заметок. Программа подходит для ведения личного дневника и планирования дел. К текстовым заметкам можно прикрепить дополнительные файлы: видеоролики, фотографии и стикеры.

    В приложении Evernote есть инструмент для преобразования голоса в текст. Утилита синхронизируется с микрофоном на смартфоне или наушниках, после чего нужно надиктовывать текст — он будет записываться в формате текста. Сама диктовка происходит через клавиатуру и кнопку голосового набора.

    Некоторые слова могут преобразоваться с ошибками, потому что инструмент для захвата голоса не смог распознать речь. Чтобы избежать этой проблемы, старайтесь четко и громко проговаривать каждое слово. Также программа поддерживает возможность создания аудиозаметок — это аналог диктофона . Вместо текста в содержании записи будет аудиофайл, который можно воспроизвести и прослушать в формате подкаста.

    Голосовой блокнот (Voice Writer)

    Voice Writer — удобное приложение, которое конвертирует голос в текст. Для начала работы с утилитой нужно выбрать язык: программа поддерживает много вариантов. Далее нужно нажать кнопку записи и надиктовать текст. Внизу приложения есть панель с базовыми знаками препинания. Также можно в любой момент воспользоваться обычной клавиатурой.

    Источник

    Компьютерная грамотность с Надеждой

    Заполняем пробелы – расширяем горизонты!

    Перевод речи в текст: топ-5 программ

    Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

    Что такое транскрибация

    Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.

    Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.

    Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.

    Перевод речи в текст вручную или с помощью специальной программы полезен

    • студентам для перевода записанных аудио- или видео-лекций в текст,
    • блогерам, ведущим сайты и блоги,
    • писателям, журналистам для написания книг и текстов,
    • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
    • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
    • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
    • другие варианты.

    О проблемах автоматического перевода речи в текст

    Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

    Речь у всех людей разная:

    • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
    • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
    • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

    В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

    В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.

    В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.

    Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

    1 Сайт speechpad.ru

    Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

    Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

    Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

    Рис. 3. Сервис speechpad

    Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

    Список видео-уроков по работе с speechpad:

    Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

    Видео «Транскрибирование аудио»

    Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

    2 Сервис dictation.io

    Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

    Рис. 4. Сервис dictation.io

    1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

    Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

    Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

    Подробнее о том, как работать с этим онлайн-сервисом показываю и рассказываю в видео:

    3 RealSpeaker

    Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

    Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

    Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

    В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, с 2018 года такой возможности нет. Вероятно для того, чтобы транскрибированный файл был недоступен всем пользователям для скачивания, необходимо наличие галочки напротив “Сделать файл неудачным в течение 24 часов”.

    На сайте есть онлайн-чат. Кнопка, чтобы начать чат, находится в правом нижнем углу сайта.

    4 Speechnotes

    Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

    Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества. Есть платная премиум-версия.

    Читайте также:  Синхронизация цикла с сурмамой

    5 Dragon Dictation

    Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

    Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

    Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.

    Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы.

    Только так можно будет получить безукоризненный текст без ошибок.

    Расшифровка аудио и видео в текст на биржах фриланса

    Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.

    Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ – задание на транскрибацию.

    Для своего заказа на бирже можно выбрать исполнителя – человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.

    Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.

    Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.

    Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.

    Две биржи фриланса

    Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:

    Рис. 5. (кликните для увеличения)

    Биржа фриланса weblancer.net

    Другая биржа, где можно заказать расшифровку аудио/видеозаписей – freelance.ru

    Биржа фриланса freelance.ru

    Статья впервые была опубликована 5 июля 2017 г.,
    обновлена 31 августа 2019 г.

    Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
    Уже более 3.000 подписчиков

    Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.

    Добавить комментарий Отменить ответ

    Комментарии: 41 к “Перевод речи в текст: топ-5 программ”

    У меня ни один не работает, то браузер не тот, то деньги плати.

    В Телеграме есть совершенно бесплатный бот для распознавания речи:
    t.me/voicybot
    Удобен он тем, что в него можно диктовать и с телефона, и с ноута, и с планшета. И текст остаётся в вашем аккаунте Телеграма, а не в каких-то онлайн-сервисах и программах. Распознаёт трёхминутную диктовку за считанные секунды.

    Я пользуюсь онлайн сервисом zvukogram.com/speech/ Без регистрации и бесплатно. Мужской и женский голоса. Сразу вставил текст и ждешь. Зависит от объема текста. Как правило очень быстро, чай не успеете попить. Можно сначала прослушать, а потом скачать. Погрешностей не было ни разу.

    zvukogram.com/speech/ – это озвучка готового текста. А в моей статье речь идет о прямо противоположном действии – о том, чтобы РЕЧЬ перевести в текст, то есть нужно получить текст, а НЕ озвучить готовый текст.

    Я так и не понял, как аудио в текст перевести через speechpad.

    Нашёл другой сервис – scribe.team
    Очень похож на realspeaker, только в 2 раза дешевле и все загруженные файлы сохраняются в ЛК.
    Просят 4 рубля за минуту.

    Добрый день! очень много слышала о программе, хочу попробовать.

    Крутая программа для перевода текста в речь есть вот здесь textvrech.ru/

    Оффлайн Лучше Всех .

    Надежда, благодарю за быстрый ответ.
    Работаю в Google Chrom.
    Всё по-прежнему, как описала ранее.
    Попробую освоить Speechpad.
    ps: интерфейс у сервиса dictation у меня открывается не такой, как здесь в статье на рис.4.
    В т.ч. и по Вашей ссылке.
    🙏

    Добавлю вдогонку.
    Открываю закладку условно левой кнопкой (тачпад на ноутбуке) – не работает сервис.
    Если же правой и далее “открыть ссылку в новой вкладке”, – работает.
    Но, перейдя на “команды”, чтобы их посмотреть, и, вернувшись, снова получаю неработающий сервис.

    Здравствуйте, Вера. Я попробовала сейчас в браузере Google Chrome открыть сервис dictation. Команды на английском языке, все работает нормально. Попробуйте через другой браузер открыть сервис dictation, лучше через Google Chrome, возможно, что все будет хорошо.
    Сейчас появились еще проблемы с сайтами из-за наших интернет-провайдеров, которые выполняют предписания правительства. Например, в Одноклассники я не могла зайти несколько дней, была какая-то странная блокировка, потом все вдруг стало работать нормально.

    Здравствуйте, Надежда.
    Спасибо за полезную информацию.
    Полдня потратила на сервис dictation, переходя на него по ссылкам из других источников и вводя с клавиатуры в поисковой строке. Всё заканчивалось мимолётным появлением на виртуальном листе фраз моей речи, после чего оставалось чистое белое поле.
    Последнее, что я сделала, уже без надежды, нажала правой кнопкой мыши на вашу ссылку, а затем “Открыть в новой вкладке”: окно такое же, язык- русский, но команды для управления на английском (например, вместо “начало” – “start” и т.д.).
    И, о-о-о, чудо! Желанные буковки чёрным по белому побежали и остались!
    Попробовала вставить адрес сайта, скопировав вашу ссылку в поисковую строку, – неудача. Снова лишь мгновенное появление фраз и их испарение.
    В чём дело, понять не могу.
    Пока сохранила “удачную” страницу в закладках и открываю оттуда.
    ps: пока мучалась, хотела написать вопрос разработчикам, и при заполнении данных попросили в анкете проставить ответ, есть ли у меня ключи лицензионного соглашения. Я не стала продолжать. В интерфейсе сервиса нигде об этом ничего не говорится. Может, он стал платным?

    Предлагаю в копилку программ-говорилок программу
    “РЕЧКА” для синтеза речи и создания аудиокниг.
    В программе используется синтезатор от компании Яндекс SpeechKit TTS, обладающий восхитительным качеством и несколькими мужскими и женскими голосами. Требование работы программы – подключенный интернет.

    Сайт программы: //rechka.onlinewebshop.net

    Ну уж если люди берут 7 рублей за минуту. То имейте ввиду на апворке можно найти объявления которые обещают час речи перевести в текст за 500 рублей.

    Час речи – это 60 минут. Если 60 минут умножить на 7 рублей, получим 420 рублей. Получается, что это дешевле, чем перевод часа речи за 500 руб.

    Спасибо за статью, все чётко и ясно, смогла выбрать для себя подходящий вариант.

    Надежда Фон Неймана вы задели зря именно его идеи ныне ловят преступников и “пеступников” в Китае и БигДата jчень егко выхoдит боком человеку …. На сколько я знаю компы с 1976 распознавание звука решено до 1980 года..Когда тактовая частоtа пентиума ушла за 5 Мгц это в быту .. Спец программы работали на СМ1300 ,ПДП-11 и СМ 420 + ЕС1030 уже к 1960-1980 …. к вам в гражданку они попали через Гуглооо с 2010 года – вычитать цифирьки умеете со школы . Заметьте НИ ОДНА ПИПИПИПИ программа не работает в Автономе без ОН-лаина …тем более бесплатно (бес заплатил уже) … в 1993 хороший алгоритм распознавания продавался за 30.000-50.000 франков за 1 копию ! Кто вам подарит 10 долларов ныне ?

    Здравствуйте Надежда. Моё имя Андрей, мне через несколько лет будет 60.
    Пытаюсь учиться новому на вебинарах, жизнь заставляет повышать квалификацию. Можете ли Вы подсказать программу для перевода речи лектора
    в текст, учился я давно и приучен к работе с книгой ( текстом ).На слух запоминается крайне мало, в большинстве случаев прослушивать повторно и бесплатно невозможно по разным причинам.Лекторы- это мужчины и женщины разных возрастов. Говорят с разной скоростью. С уважением.

    Здравствуйте, Андрей Львович. Программы для перевода речи в текст, которые мне известны, приведены в этой статье, к которой Вы оставили свой комментарий. Я не думаю, что эти программы подойдут Вам для автоматической записи и перевода речи в текст на вебинарах. Более того, вряд ли есть такие универсальные программы, которые в состоянии распознать любую человеческую речь и сразу перевести ее в текст.
    Все-таки некоторый выход есть. Вы можете записывать на диктофон вебинары. Диктофон сейчас есть на любом смартфоне. Если Вам нужно, то потом со смартфона аудио-файлы можно переносить на компьютер “по проводу” от зарядного устройства, подробнее: https://www.compgramotnost.ru/android/kak-peredat-fajly-s-androida-na-kompyuter

    Вариант с диктофоном Вам подходит, если вебинары Вы слушаете “вживую” или онлайн, через интернет.
    Также можно использовать аудио-программы для записи звука. Этот вариант особенно подойдет, если вебинары Вы слушаете через интернет, на компьютере.
    Кроме того, когда слушаете вебинары, рекомендую взять бумагу и ручку и записывать туда основные моменты. Это помогает сконцентрироваться при прослушивании, а также удобно после вебинара пробежать глазами по своим записям, тогда многие вещи, сказанные на вебинаре, автоматически всплывают в голове. Рекомендую, кроме записи звука, этот вариант также использовать.

    отвратные сервисы!на одноп оплатила перевод речи в текст. ТАКАЯ АХИНЕЯ ПОЛУЧИЛАСЬ!так еще и постоянно пропадал текст, пришлось в поддержку писать…ужас. не советую!

    Читайте также:  Синхронизация mac и macbook

    Да,у меня тоже самое. Опплевался

    Прям сейчас пробую сервис: dictation.io/.
    Транскрибирует-то хорошо, но в обратном порядке! Например, “мама мыла раму”, транскрибирует “раму мыла мама”. Что делать, не пойму((

    Есть хороший сервис для этих целей – upsaleslab.ru.
    В нем можно легко сгенерировать озвучку любого текста, и сразу же наложить на видео. Более 25 голосов на 20 языков мира – на любой вкус, рекомендую!

    А есть такие программы которые могут сразу сгенерировать в битрикс24

    Учу немецкий. Ваша программа помогла при транскрибации немецких аудиофайлов с использованием виртуального кабеля. Спасибо большое! Удачи!

    Надежда, что по Вашему возможно сделать, если сохранённые архивы впоследствии невозможно открыть + периодически-обусловлено, возникают блокировки интернет-соединений и срабатываний – на уровне изменений функций системных файлов и переферийных “Алиса”-устройств (; как чайник, ничего не могу противопоставить, а IT-спецы отказываются комментировать …). Спасибо, заранее, за профессиональный ответ. Дмитрий Мадьянов.

    Дмитрий, важные архивы желательно хранить не в облаках и не в локальных сетях, а на внешних жестких дисках или на флешках. Тогда сисадмины не смогут вмешиваться в процесс архивации или восстановления. Если же архив уже хранится в сети или в облаке, в сисадмины не дают к нему доступ или блокируют длительные соединения, то лучше всего попробовать «достучаться» до архива из другой сети Интернет, подключившись на время к другому провайдеру Интернета. Правда, обойти защиту, установленную сисадминами, обычно непросто. Лучше всего найти с сисадминами «общий язык», и просто уговорить их помочь Вам – поверьте, это самый простой и результативный путь.

    Чтобы подключиться, надо самому что-то делать. Попробуйте сначала голосовой поиск на компьютере. Для этого откройте браузер Гугл Хром или Яндекс.Браузер и нажмите там на значок микрофона, подробнее https://www.compgramotnost.ru/kak-rabotaet-pk/golosovoj-poisk-na-kompyutere-cherez-gugl-hrom-ili-yandeks-brauzer#GoogleChrome

    Если у Вас не компьютер, а смартфон тоже попробуйте сначала с голосового поиска на телефоне, подробнее: https://www.compgramotnost.ru/android/perevod-rechi-v-tekst-android#Android

    Если с голосовым поиском получится, можно будет переходить к программе на ПК или к приложению на смартфоне для перевода речи в текст.

    RealSpeaker – генератор бреда. Заплатил 100 руб. за транскрибацию 15 минут интервью. На выходе получил набор бессмысленных слов. Вот фрагмент:

    ровно час проговорили телефон достопримечательности заправки КПД процесса w3hc брага для кальвадоса брага из фильма Разумное брага для кальвадоса сидра сейчас я думал что это просто как Криштиану Пусть кроме крепости таких никаких различных Нет это уже не сижу поэтому, будто Брат за брата выдаст это случилось такое достаточно средств и всё сухой я беру всё чтобы вернула эту песню что хочется в свой напиток самый приятный для употребления внутрь Попробовать там перекашивает лицо не перекопана просто.

    Машинные технологии переводы не идеальны. Многое зависит от дикции говорящего, а также от качества записи. В случае наличия проблем с дикцией или с записью, лучше обращаться на биржи фриланса типа воркзилла, где “вручную” будет сделана транскрибация текста (перевод речи в текст). На бирже оплата списывается с аккаунта заказчика после того, как заказчик примет работу.
    Вы можете обратиться к Виктору Озерову, разработчику RealSpeaker по вопросу возврата денег.

    Андрей, речь – это всегда индивидуально. Многое зависит от внешних параметров типа – на сколько далеко диктор от микрофона, качество звука, на сколько диктор чисто произносит голос, многоголосие и так далее. Вы можете зайти в медиа – https://realspeaker.net/media и почитать результаты других распознанных файлов. В большинстве случаев качество просто отменное.
    Также у нашего продукта есть политика возврата. Если не понравился результат внизу слева сайта есть иконка для обратной связи – там лишь надо написать, что качество не устраивает – в таком случае мы возвращаем деньги – для нас принципиально важно, чтобы клиент был доволен и приходил к нам снова и снова.

    1 RealSpeaker-воспользовался сервисом деньги ушли перевода нет звука в текст, тех поддержка контакты -отсутствуют в соц сетях тишина вопрос “. ” что за фигня и не “кидалово” ли этот сервис?
    2 Вы его рекомендуете вопрос насколько ваш портал надёжный источник?

    Если проскроллить страницу
    realspeaker.me/ru
    вниз, то там полным-полно контактов: ВКонтакте, Фейсбук, Ютуб, Твиттер, Телеграм, электронная почта, телефон.
    Я почитала отзывы ВКонтакте за 9 февраля, там есть и возврат денег. Виктор Осетров, один из разработчиков сервиса, живет во Франции, судя по номеру его телефона, а там сдвиг по времени, и если Вы писали, то надо подождать ответ. Техподдержку оказывает сам разработчик сервиса.

    Что касается моей статьи, она написана в июле 2017 года, когда там была возможность бесплатно попробовать, как работает на сайте бесплатный онлайн-сервис по транскрибации речи в текст. Оказывается, что в феврале 2018 года разработчик изменил политику предоставления услуг, там теперь бесплатного нет. И сейчас проводится платная транскрибация предварительно загруженного файла. В статье я отредактировала информацию про этот сервис.

    Станислав! Извините если мы немного задержали обработку медиа файла. Надежда правильно отметила, у нас есть небольшая разница во времени – я живу во Франции и бывает сложно оперативно отвечать ночью. Так как приходиться запускать файлы в обработку иногда вручную. Так как не всегда срабатывает автоматика. Также если не устраивает качество распознавания – делаем возврат.

    До середины февраля наш сервис был полностью бесплатным. Сейчас мы в пробном порядке добавили монетизацию – стоимость 7 руб за минуту. Также добавляем личный кабинет. Так как файлы находятся в общем доступе и удаляются автоматически в течение 24 часа. Если Вам нужно, чтобы никто не видел Ваш файл внизу страницы есть чат для обратной связи – напишите туда и мы сделаем Ваш файл приватным.

    Если что, мы всегда рады помочь.
    С уважением,
    Виктор Осетров

    Какие непонятливые (были в том числе) эти программисты!… Ведь: НАПИСАНИЕ ПРОГРАММ ЧЕЛОВЕКОМ ЛИШЬ ЗНАЮЩИМ ЯЗЫКИ ПРОГРАММИРОВАНИЯ- перестанет быть обязательным, если создать в памяти компьютеров всего-лишь словарь различных коротких предложений слов, написанных на русском или (и) других языках человеческого общения, каждое из которых представляет собой определённую команду обращённую к компьютеру, для её выполнения им, и переводится им легко, так как в этом словаре каждая из этих команд- словесных предложений, имеют чёткий перевод в нём при помощи языка программирования, в виде определённого алгоритма действий (либо комплекса взаимосвязанных друг с другом множества таковых алгоритмов), которые компьютер и исполняет как адресованные к нему человеком команды! Допустим, например: человек не знающий азов компьютерного программирования, говорит компьютеру, при помощи клавиатуры компьютера печатая предложение: хочу создать свою собственную игру! Компьютер переводит это предложение (дабы иногда и в базе таковых словарных данных интернета, он способен будет мгновенно в таком же как у него словаре, но более глобальном, отыскать правильный перевод этого, и любого словесного предложения, на свой язык состоящий из системы алгоритмов), и в памяти своего ПО, либо опять в интернете, находит правильное действия для себя выполняемое им в качестве ответа на это словесное предложение человека, которое заключается в его первом вначале вопросе адресованном к этому человеку, которым он переспросит человека, дабы устранить этим случайную ошибку: вы хотите создать свою собственную игру?, а после того, как человек ответит ему: Да!, он задаст уже второй ему вопрос, такой: какую вы хотите создать игру, на какую тему она должна быть? И Т.Д., И Т.П. таким образом компьютеру человек и сможет подробно рассказать любую информацию в предложениях словесных, которые компьютер полностью будет понимать, в том числе будет он понимать соответственно и то, какие персонажи должны быть в этой игре, и какое у них должно быть в ней поведение!… Подобным образом, и любые другие программы и действия компьютер будет мочь совершать по просьбе к нему адресованной человеком. Желаю вам счастья.

    Вы употребили немало интересных терминов в Вашем обращении. Позвольте и мне применить более сложную терминологию, чтобы пояснить Вам свою позицию по поднятой теме.
    Собачки, кошечки и другие домашние животные тоже понимают отдельные слова и команды человеческой речи. И выполняют их с заданной точностью. А в цирке можно увидеть «чудеса» и покруче.
    С компьютерами то же самое. Да, речь они уже «понимают», отдельные команды выполняют, искусственный интеллект вышел из лабораторий и используется на практике. Но до того момента, когда компьютер начнет «мыслить», а именно это Вы и предлагаете, должно пройти еще немало времени.
    Математически доказано, а математика наука точная, что фон-Неймановская архитектура компьютеров позволяет создавать языки только с ограниченными контекстными условиями. То есть, компьютеру (с современной архитектурой) не под силу наши человеческие контекстно связанные языки (когда значения слов и выражений практически всегда зависит от контекста, в котором они употребляются).
    С помощью языков с ограниченными контекстными условиям нельзя смоделировать систему, работающую на контекстно связанном языке, так как ограниченные контекстные условия – это на порядок ниже по уровню развития, чем контекстная связанность.

    Говоря более простым языком, современные компьютеры с фон-Неймановской архитектурой никогда не смогут научиться понимать человеческую речь настолько, чтобы стать полноправным собеседником и делать все то, что подразумевается нашей контекстно связанной речью. Это невозможно технически, и доказано математически.
    Но идут разработки компьютеров с другой архитектурой, что-то типа нейронных сетей, близких по своему устройству к человеческому мозгу. Вот там, пожалуй, и произойдет прорыв. Осталось немного подождать!

    Вы все утверждаете что программ распознающих человеческую речь не существует и это типа очень сложно! Хорошо, а как же тогда существует Бот “Алиса” которая уже более двух лет говорит с человеком.

    Источник