Диктовка текста с помощью программы распознавания речи
Исправлять ошибки во время диктовки можно несколькими способами. Вы можете сказать «Correct that» (исправить это), чтобы исправить последнюю фразу. Чтобы исправить одно слово, произнесите команду «Correct», а затем это слово. Если слово повторяется несколько раз, то все случаи его употребления будут выделены, и можно выбрать тот, который нужно исправить. Вы также можете добавлять слова, которые часто распознаются неправильно, с помощью словаря распознавания.
Использование диалогового окна «Панель вариантов»
-
Откройте программу «Распознавание речи», нажав кнопку «Пуск», нажав «Все программы», затем «Аксессуары», «Удобство доступа» и «Распознавание речи Windows».
-
Скажите «Start listening» (начать прослушивание) или нажмите кнопку Микрофон, чтобы включить режим прослушивания.
-
Выполните одно из следующих действий:
-
-
Чтобы исправить последнюю произнесенную фразу, скажите «Correct that».
-
Чтобы исправить одно слово, произнесите команду «Correct», а затем это слово.
-
-
Назовите номер, указанный рядом с нужным элементом в диалоговом окне Панель вариантов, а затем скажите «ОК».
Примечание: Чтобы изменить выбор, в диалоговом окне Панель вариантов скажите «Spell» (правописание) и номер нужного элемента, а затем скажите «ОК».
Использование словаря распознавания
-
Откройте программу «Распознавание речи», нажав кнопку «Пуск», нажав «Все программы», затем «Аксессуары», «Удобство доступа» и «Распознавание речи Windows».
-
Скажите «Start listening» (начать прослушивание) или нажмите кнопку Микрофон, чтобы включить режим прослушивания.
-
Скажите «Open Speech Dictionary» (открыть словарь распознавания).
-
Выполните одно из следующих действий.
-
-
Чтобы добавить слово в словарь, выберите или произнесите команду Add a new word (Добавить слово) и следуйте указаниям мастера.
-
Чтобы запретить диктовку определенного слова, выберите или произнесите команду Prevent a word from being dictated (Запретить диктовку этого слова) и следуйте указаниям мастера.
-
Чтобы исправить или удалить слово, которое уже включено в словарь, выберите или произнесите команду Change existing words (Изменить имеющиеся слова), а затем следуйте указаниям мастера.
-
Примечание: Распознавание речи доступно только на английском, испанском, китайском (упрощенное и традиционное письмо), немецком, французском и японском языках.
Как использовать голосовой набор в Windows 10
Обновление Windows 10 Fall Creators делает голосовой набор намного проще в использовании. Теперь вы можете сразу начать диктовать, нажав клавишу Windows + H на клавиатуре. Вам не нужно заходить в панель управления и сначала устанавливать что-то.
Старая утилита распознавания речи по-прежнему доступна через панель управления. В ней появились некоторые дополнительные функции, которые вы не найдете в новом инструменте набора, например, возможность навигации по вашему компьютеру с помощью голосовых команд. Но большинство людей предпочтут новый инструмент для более простого голосового набора.
Как начать диктовать
Чтобы начать диктовать из любого места в Windows, выберите текстовое поле и затем нажмите Windows + H на клавиатуре. Появится панель с надписью «Прослушивание».
Вы также можете начать диктовать, нажав кнопку микрофона на сенсорной клавиатуре. Фактически, нажатие Windows + H просто вызывает мини-версию сенсорной клавиатуры.
Как диктовать текст и добавлять знаки препинания
Просто начните говорить после нажатия Windows + H или нажатия кнопки микрофона. Пока отображается «Прослушивание …», Windows будет слушать ваш голос. Для этого вам понадобится микрофон, подключенный к компьютеру, но микрофоны, встроенные в современные ноутбуки, должны работать нормально.
Пока виден текст «Прослушивание …», а значок микрофона синий, то, что вы говорите в микрофон, будет отображаться как текст в приложении, в который помещается текстовый курсор.
Через пять секунд или когда вы произнесете «прекратить диктовать» вслух, значок микрофона снова станет черным, «Прослушивание …» исчезнет, и ваш компьютер перестанет слушать ваш голос. Windows также прекратит прослушивание после того, как вы начнете вводить что-то с клавиатуры. Вы услышите быстрый звуковой сигнал, когда Windows 10 начнет или перестанет слушать ваш голос.
Чтобы снова начать диктовать, нажмите Windows + H или щелкните значок микрофона.
Говорить простые фразы может быть хорошо для записи некоторых быстрых заметок или выполнения веб-поиска, но, вероятно, это будет плохо для написания документа или электронной почты. Это потому, что диктовка автоматически не вводит знаки препинания. Вы должны проговаривать пунктуацию, которую хотите использовать.
Просто скажите вслух такие вещи, как «точка», «запятая», «восклицательный знак», «открыть кавычки» и «закрыть кавычки».
Некоторые, но не все голосовые команды, которые работают с распознаванием речи, также работают с голосовой диктовкой. Например, вы можете сказать «нажмите« назад », чтобы вставить символ обратного пробела,« выберите [слово] », чтобы выбрать конкретное слово,« удалить это », чтобы удалить выбранное вами« отчистить выбор», чтобы очистить выделение и «Начать после слова [слова или фразы]», чтобы поместить курсор сразу после окончания определенного слова или фразы. Windows предложит вам многие из этих голосовых команд с помощью подсказок, отображаемых на панели набора.
Голосовые команды не всегда надежны
К сожалению, мы обнаружили, что многие из этих голосовых команд еще не работают как надо. Функция диктовки понимала слова, которые мы говорили, но часто просто добавляла слова «удалить это», а не обрабатывала их как команду, например. Мы видели эту же проблему, о которой сообщают другие веб-сайты, которые протестировали эту функцию. Хотя базовое распознавание голоса работает очень хорошо, ненадежность голосовых команд означает, что это еще не так сильно, как платное программное обеспечение, например Dragon NaturallySpeaking.
Отсутствие надежных голосовых команд для редактирования – настоящая проблема, так как вам придется редактировать текст с помощью клавиатуры. И, когда вы начнете печатать, Windows перестанет слушать ваш голос. Вам нужно будет нажимать Windows + H каждый раз после того, как вы используете клавиатуру, чтобы возобновить разговор. Это довольно неудобно, если вам часто нужно редактировать текст с помощью клавиатуры.
В отличие от старой функции распознавания речи, похоже, не существует способа вручную настроить функцию голосового набора.
Хотя эта функция является частью Windows 10, она довольно новая. Как и во многих частях Windows 10, эта функция кажется незавершенной. Microsoft, надеюсь, улучшит её, сделав более надежной и гибкой в будущих обновлениях.
Перевод статьи: “How to Use Voice Dictation on Windows 10“
Набор текста голосом. Ввод в компьютер голосовой информации. Голосовой ввод текста в ворд
Здравствуйте, уважаемые читатели. Сегодня я подробно расскажу про технические настройки и нюансы речевого набора текста голосом на компьютере. Как вы знаете способ, который я предложил в своём бесплатном видеокурсе « » — является мобильным и не требует наличие компьютера и платных программ. По многочисленным письмам можно судить, что курс очень понравился. Но также есть много вопросов, — А как набирать тексты голосом на компьютере? Причём из писем я понимаю, что интересен не, только способ набора текста голосом на компьютере, но и перевод аудио в текст.
Конечно, в комментариях и письмах я отвечал и рекомендовал единственный, на мой взгляд, подходящий для этого онлайн сервис «Блокнот для речевого ввода ». И теперь я уже получаю письма с просьбой рассказать о технических настройках компьютера (микрофона и звуковой карты) и как аудио перевести в текст.
В общем, секрет работы с данным сервисом очень прост, — у вас должен быть хороший, чувствительный микрофон. Иначе, качество распознания очень сильно хромает. Но и на этот случай есть выход.
1. Набор текста через микрофон.
2. Набор текста через виртуальный аудио кабель.
Прежде чем приступить к набору текста голосом при помощи голосового блокнота, нужно сделать кое какие настройки браузера Google Chrome. На данный момент, только в этом браузере доступна возможность набирать текст голосом. Нам понадобится установить два дополнительных расширения.
Как набрать текст голосом в голосовом блокноте
Для первого способа, дополнительных настроек делать не надо. Всё готово к набору текста голосом через голосовой блокнот.
Переходим на главную страницу блокнота, выставляем нужные параметры, и можно диктовать текст голосом. Иконка микрофона используется для ввода отдельных фраз или предложений. Для непрерывного ввода текста используйте кнопку «Включить запись».
Примечание:
при первой попытке набрать текст голосом в верхней части браузера появится предупреждение с запросом на доступ к микрофону. Вам нужно нажать на кнопку «Разрешить».
Как заполнять любые поля и формы голосом в браузере Google Chrome
С помощью установленного ранее расширения «Голосовой ввод текста» Вам доступна функция заполнения любых полей в браузере. Например, в регистрационной форме или оставляя комментарий.
Для того чтобы заполнить отдельное поле в форме, — нажмите правую кнопку мышки в данном поле и в контекстно-зависимом меню выберите пункт «SpeechPad».
Разрешите доступ к микрофону и диктуйте текст.
А если вам нужно надиктовать несколько предложение, к примеру, комментарий или сообщение на форуме, нужно выполнить следующие действия.
Нажать правую кнопку мышки рядом с полем для ввода и выбрать в контекстно-зависимом меню все тот же пункт «SpeechPad». Но на этот раз откроется новое окно и включится запись. Диктуйте текст, а затем используя буфер обмена перенесите текст в нужную форму.
Комбинация клавиш для работы с буфером обмена:
Ctrl+A – выделить текст
Ctrl+C – скопировать в буфер обмена
Ctrl+V – вставить из буфера обмена
Вот так вот без особых хитрых настроек, при наличии доступа в Интернет можно вводить текст голосом на компьютере. Качество распознания будет зависеть от микрофона и Вашей дикции.
А теперь разберём возможность перевода аудио в текст. Этот метод называется – транскрибация. Данный сервис позволяет переводить аудио в текст из звуковых и видео файлов. И опять же упор делается на хороший микрофон.
Но в технических характеристиках микрофонов я не разбирался, и говорить какой хороший а какой нет, не стану. Скажу лишь, что у меня был обычный настольный микрофон Genius и он меня устраивал. Ещё вчера я начал подготовку к данной статье с использование этого микрофона, ошибок при распознании голоса было не много. За ночь, наш домашний питомец (кот) совершил диверсию и перегрыз провод микрофона. Не подумайте, что только микрофона, — нет, не только.
И для продолжения подготовки к статье я воспользовался наушниками с микрофоном. И должен сказать, это просто земля и небо. Микрофон на наушниках, — это просто труба. Толи от старости, толи он такой убогий и был, ну это просто убийца нервных клеток. Так, что делайте выводы.
Ну, да ладно, давайте переходить в к выполнению поставленной задачи.
Как преобразовать аудио в текст
Способ №1
Данный способ, не требует ни каких настроек. Принцип заключается в следующем. Вы воспроизводите звуковой файл или видео, звук идёт через колонки, а микрофон захватывает звук из колонок. Вы также можете включить запись на диктофоне или смартфоне, и микрофон будет захватывать звук с этих устройств.
Сервис предоставляет возможность захвата аудио из видео YouTube, видео файлов и аудио файлов. Видео и аудио файлы при этом могут быть расположены как в интернете, так и на Вашем компьютере.
Для начала, рассмотрим пример открытия видео с YouTube. Для этого потребуется ID данного видео. Этот ID нужно вставить в поле «URL медиа файла для проигрывания» и нажать кнопку «Обновить».
Такой уникальный ID есть у каждого видео на YouTube. Увидеть его можно в адресной строке браузера.
Теперь рассмотрим пример с открытием файла на вашем компьютере.
Сначала указываете тип файла, аудио или видео. Затем нажимаете на кнопку «Выберите файл» и выберите файл на компьютере. Выбрав файл, нажимаете кнопку «Открыть».
Следующим этапом располагаете, микрофон рядом с колонками вашего компьютера или скажем диктофоном или смартфоном, и включаете запись.
Способ №2
Данный способ позволяет исключить микрофон из цепочки преобразования аудио в текст. Звук будет напрямую передаваться из проигрывателя в голосовой блокнот. И уже не важно, какой у вас микрофон.
Но для этого потребуется отдельная программа — Virtual Audio Cable . Данная программа создаёт виртуальный аудио кабель и передаёт аудиопоток между приложениями. Программа эта платная, стоит от 25$ до 50$. Но можно воспользоваться бесплатной версией. В бесплатной версии есть ограничение на количество виртуальных кабелей. Можно создать только 3 кабеля. А ещё женский голос постоянно напоминает, что это бесплатная версия если использовать аудиорепитер. Но скажу вам честно, можно обойтись и без него. Зато пробная версия не ограничена по времени. В видеоуроке я покажу, в чем хитрость.
Итак, для начала скачиваем программу «Виртуальный аудио кабель», ссылка выше.
После того, как вы скачаете архивный файл на компьютер, его нужно распаковаться. Для этого можно воспользоваться архиватором или простым копирование файлов из архива в новую папку.
Установка программы VAC
Установка стандартная и не потребует от вас дополнительных знаний и умений. Просто следуйте указаниям мастера установки.
Теперь Вы ни звука не услышите из ваших колонок, зато весь звук через виртуальный аудио кабель будет передаваться в голосовой блокнот. То, что нам и нужно.
Примечание:
если вы всё же захотите слышать звук, тогда следует перейти в папку, куда вы распаковали архив программы и запустить аудиорепитер. Указав в качестве устройства ввода виртуальный кабель, а в качестве устройства вывода колонки.
На этом все технические моменты набора текста голосом на компьютере, с помощью голосового блокнота, раскрыты. Если, что то рассказал не понятно, пишите в комментариях, постараюсь дополнить и помочь советом. А ещё, если писать статьи на сайт, самостоятельно вы не можете по какой-то причине, то можно на бирже. Сегодня так поступают многие владельцы сайтов, доверяя дело профессионалам.
Всем желаю удачи.
Друзья, мы продолжаем детальный обзор отдельных новшеств, которыми Windows 10 обзавелась после внедрения крупного обновления Fall Creators Update. И в этой статье хотелось бы уделить внимание обновлённой сенсорной клавиатуре операционной системы. Она была кардинально переработана и пополнилась новыми функциями. Обновлённая сенсорная клавиатура поддерживает режим Swype – когда при наборе текста можно скользить, т.е. проводить пальцем или стилусом, не отрывая его от клавиатуры. Как это давно уже можно делать на мобильных устройствах. Сенсорная клавиатура Windows 10 также пополнилась функцией голосового ввода текста. Если говорить о десктопах и ноутбуках, добавление такой возможности — это, по сути, единственное полезное новшество Fall Creators Update в этой части функционала системы. Однако со штатным голосовым вводом данных не всё так однозначно.
Возможность проговаривать текст в микрофон вместо ручного набора символов на клавиатуре в среде Windows 10 предусмотрена только для английского языка. Microsoft обещает в будущем добавить и другие языки распознавания, однако пока что имеем только то, что имеем. Это, конечно, серьёзное ограничение, и, соответственно, этой функцией смогут воспользоваться только те, кто хорошо знает английский и работает с набором текста на этом языке в серьёзных масштабах. Тем не менее функция интересная, рассмотрим, как её задействовать.
На панели задач Windows вызываем контекстное меню и галочкой отмечаем опцию «Показывать кнопку сенсорной клавиатуры».
Сенсорная клавиатура теперь будет постоянно отображаться в системном трее, откуда её можно запустить в любой момент. При переключении раскладки на английскую на клавиатуре появится значок в виде микрофона. Для диктовки необходимо открыть любое поле ввода текста (любой установленный в системе текстовый редактор, любую программную форму, любую веб-форму в окне браузера). Ну и, собственно, начать говорить в микрофон.
Важный момент: набор текста голосом будет возможен только тогда, когда в системе не отключены речевые службы. Это можно проверить в приложении «Параметры», зайдя в раздел «Конфиденциальность». Во вкладке «Речь, рукописный ввод и ввод текста» должна отображаться кнопка отключения речевых служб. Соответственно, это значит, что в текущий момент службы включены.
В противном случае будет отображаться кнопка включения речевых служб. И её, следовательно, необходимо включить.
Одно время мне приходилось печатать до 50 тыс. символов текста в день! Конечно, это не могло не провоцировать на поиски специальных программных движков для ввода текста голосом.
Буквально пару лет назад это было практически невозможно, так как все подобные программы работали на западе и были заточены, соответственно, под английский язык.
На данный момент времени ситуация изменилась в лучшую сторону. Теперь любой копирайтер может существенно упростить свои повседневные задачи.
Естественно, не все так просто. Честно признаться, я сам немного использовал описываемый сервис, но потом решил от него отказаться, так как мне показалась данная разработка еще сыроватой. Хотя опять же, если сравнивать с тем, что было, например, в 2012 году – это просто чудо!
Сервис для голосового набора текста
Итак, речь идет о сервисе speechpad.ru
. Перейдя на этот сайт, вы увидите внизу окошко по типу стандартного блокнота. В данном случае — это голосовой блокнот. Здесь будет отображаться текст, введенный голосом.
Перед тем, как приступить к тестированию голосового движка, необходимо убедиться, что Ваш микрофон правильно подключен к компьютеру. Если с этим проблем нет, то можно нажимать клавишу «Включить запись»:
В поле №1 выводится текст, который Вы сказали за последние несколько секунд. Пока ваше предложение находится там, оно обрабатывается голосовым движком и распознает слова.
Затем всё надиктованное переносится во второе поле, где его уже можно отредактировать стандартными средствами — клавиатурой и мышкой.
Друзья, как я выше сказал, сервис не является таблеткой от клавиатурного ввода вообще. В принципе это и не мудрено! Ведь в случае появления идеально распознающего голос движка, востребованность копирайтеров и наборщиков текста сильно снизится и вообще это произведет настоящий фурор в интернет маркетинге.
Во всяком случае, я так думаю. Но вернемся к нашему голосовому блокноту и обещанным советам.
- Не спешите и четко (ОЧЕНЬ четко!) выговаривайте каждое слово.
- Если вы видите, что в первом поле предложение слегка зависло – не торопитесь надиктовать сверху лишний текст, так как бывают случаи, когда программа просто отрубается. Приходится заново включать запись и вновь начитывать испорченное предложение.
- Отрегулируйте микрофон так, чтобы он не фиксировал Ваше дыхание, так как это негативно влияет на запись текста и его распознавание.
- Редактируйте текст ручками прямо во втором поле, сразу после успешной записи одного предложения. Выключать запись при этом не нужно, но следите за тем, чтобы слишком долгая пауза автоматически не выбила запись. Я пробовал начитывать всю статью (конечно, не все распознавалось, и было достаточно ошибок) а потом сразу все редактировать в программе Word. Практика показала, что этот метод не эффективный. Лучше это делать на лету.
Со знаками препинания проблем не должно быть. Чтобы поставить запятую, не спеша и размеренно скажите в нужном месте «ЗАПЯТАЯ», или «ТОЧКА», или «ВОСКЛИЦАТЕЛЬНЫЙ ЗНАК». В этом плане все работает отлично и мне не приходилось почти ничего изменять в ручном режиме.
Дополнительные возможности голосового ввода
Кроме стандартных возможностей онлайн сервиса, вы можете установить дополнительное расширение в Chrome для того, чтобы использовать голосовые команды в любом поле.
Более того, разработчику удалось создать интеграционный модуль для операционной системы Windows. С его помощью можно управлять различными программами и функциями Виндовс одним лишь голосом.
Скачать и первое, и второе приложение можно на том же сайте в этом абзаце:
Подробную инструкцию в этом направлении я не привожу, так как мне лично это не интересно, да и на сайте все подробно расписано. Кому это необходимо – смогут все установить самостоятельно.
Если Вам понравится сервис, то Вы сможете зарегистрироваться и много чего настроить на сайте под себя.
Голосовой ввод текста в редакторе Word – очень удобный и продвинутый инструмент. Но о нём знают не многие. Это не удивительно, поскольку технология была запущена относительно недавно: 27 июня 2017 года на официальном сайте Microsoft появилась новость, в которой они сообщили о новой возможности.
По умолчанию эта функция в программе «Ворд» отсутствует и никакие обновления не помогут. Для этой цели нужно использовать сторонний сервис .
Данное дополнение позволяет вводить текст при помощи голоса более чем на 20 языках. Более того, оно может переводить слова в режиме онлайн на 60 различных языков. И самое главное – этот сервис полностью бесплатный.
Для того чтобы в вашем офисе появилась возможность надиктовки, нужно выполнить следующие шаги.
- Откройте официальную страницу разработчиков. Нажмите на ссылку «Download for Office 32-bit» или на «For Office 64-bit click here».
Для того чтобы определить разрядность своей системы и скачать правильную версию программы, нажмите на горячие клавиши Win
+Pause/Break
.
- Нажмите на кнопку «Сохранить».
- Запустите скачанный файл.
- Нажмите на кнопку «Next».
- Соглашаемся с лицензионным соглашением и кликаем на «Next».
- Затем на кнопку «Install».
- После небольшого ожидания завершаем установку нажатием на «Finish».
- Запускаем редактор Word и переходим на вкладку «Dictation».
- Если вы не собираетесь переводить текст, то в обоих полях выберите русский язык.
- Убедитесь, что у вас подключен микрофон и он работает. Сделайте правый клик по иконке со звуком.
- Выберите пункт «Записывающие устройства».
- Скажите что-нибудь в микрофон. При этом шкала должна загореться. Если ничего не происходит – это плохо. Значит, устройство выключено или не работает.
- Убедитесь, что именно этот микрофон указан по умолчанию. В противном случае набор текста будет невозможен.
Задать устройство по умолчанию можно при помощи контекстного меню (нужно сделать правый клик по выбранному пункту).
- Если всё хорошо, то нажмите на кнопку «OK».
- Возвращаемся в редактор «Ворд». Для того чтобы начать набирать текст при помощи голосовых команд, нужно всего лишь кликнуть на иконку «Start».
- Попробуем сказать что-нибудь.
- Всё работает отлично. Согласитесь, так печатать текст намного удобнее и проще. А самое главное – это очень быстро. Для остановки записи нужно нажать на кнопку «Stop».
Запись автоматически отключается, если вы длительное время не обращались к вордовскому документу (находились в другом приложении) или молчали.
Системные требования
Для того чтобы использовать это дополнение, и забыть, что такое «писать от руки», необходимо чтобы на компьютере был установлен «Net Framework 4.5» или новее. Если данное ПО у вас отсутствует или вы не можете это определить (факт установки на ПК), нужно будет выполнить следующие действия.
- Перейдите на официальный сайт Microsoft. Как только вы откроете эту страницу, нужно будет нажать на ссылку скачать.
- После этого вам предложат установить дополнительные обновления.
- Нажмите на кнопку «Отказаться».
- Запустите скаченный файл.
- Далее возможны два варианта: сообщение о том, что Net Framework уже установлен или стартовая страница установки.
- В данном случае мы видим, что кнопка «Продолжить» не активна. И при этом нам говорят, что на этом компьютере всё в порядке.
В противном случае нужно будет просто нажать на кнопку «Продолжить» и дождаться окончания процесса установки.
Заключение
В данной статье мы рассказали, как активировать речевой ввод текста в программе Microsoft Word. Если у вас что-то не получилось, возможно, ваша операционная система не соответствует требованиям или же вы неправильно подключили микрофон.
Обратите внимание на то, что качество записи текста зависит от того, насколько четко и внятно вы будете произносить слова.
Видеоинструкция
Если у вас всё равно не получается набрать текст при помощи голосового ввода, попробуйте посмотреть этот видеоролик. Возможно, дополнительные советы вам помогут устранить свои проблемы.
Статьи и Лайфхаки
Далеко не каждый пользователь в курсе, что существует голосовой набор на андроид, как включить
эту функцию тоже представляют себе не все. А ведь если посмотреть , перечень выпущенных моделей, становится ясно, что практически каждое современное устройство оснащено ею. Расскажем, как начать применять голосовой набор, используя стандартные варианты, предложенные системой, или же сторонние приложения.
Базовый ввод голосовых команд предполагает диктовку текста своему мобильному устройству без использования клавиш. Чтобы иметь возможность использовать данную функцию, необходимо проделать несколько простых и последовательных действий. Начнём с того, что поместим курсор в любое поле для ввода текста. Нам будет предложено использование клавиатуры Android. Находим рисунок микрофона и нажимаем на него. Перед нами появится панель для голосового ввода, где будут несколько важных элементов, включая список языков, голосовой индикатор и клавишу «Готово», на английском «Done» (переводит в обычный текстовый режим).
По умолчанию на одном из рабочих столов нашего смартфона установлен виджет поиска Google, где также есть иконка с изображением микрофона. Путём нажатия на неё мы сможем активировать функцию голосового набора.
Как управлять этой функцией? Следует знать о том, что красная рамка, находящаяся вокруг рисунка микрофона, меняет свою толщину в зависимости от того, насколько громким является наш голос. По мере обработки команд они будут появляться в виде слов в поле.
Добавим, что функция работает только при активном подключении к Интернету. Язык ввода выбирается в специальном поле («Select dictation language» > «Add languages», то есть «Добавить языки»). Теперь можно пользоваться голосовым набором без каких-либо проблем.
Теперь мы имеем представление о том, что такое голосовой набор на андроид, как включить его и как им пользоваться. Однако следует знать, что активировать эту функцию можно теми же путями, : т. е. не только встроенными средствами системы, но и при помощи сторонних программ.
Неплохой программой является Voice Button. Её можно найти и загрузить из Play Market. Это хорошее приложение для голосового управления всей домашней техникой. Оно построено на основе базового модуля сотового аппарата Android, а также модуля Arduino.
После самого первого запуска приложения переходим в «Настройки» («Settings»), после чего выбираем «Пожалуйста, нажимайте и говорите» («Please click and tell»). Откроется окно с изображением микрофона. Произносимые нами голосовые команды будут появляться в верхнем поле. Чтобы сохранить какую-либо команду и привязать её к определённой кнопке, стоит нажать на эту кнопку с надписью «Изменить голосовую команду №» («Change Voice command №»). Текст команды будет отображаться в скобках.
Ещё одной хорошей программой является Cyberon Voice Commander. Она отличается высокой степенью точности. Приложение позволяет совершать исходящие звонки, запускать другие программы и т.д. Функция голосового набора сопряжена с беспроводной Bluetooth гарнитурой.
Недостатком этого приложения является то, что оно предлагается на платной основе. Его цена составляет $5,99.
Голосовой набор текста на компьютере
Программ, которые могут преобразовать голос в текст, существует не так уж и много. Но для некоторых людей они могут стать незаменимыми помощниками. Например, Вы – блогер, и много печатаете каждый день, или Вам нужно сделать электронный вариант книги, а может, Вы просто медленно набираете на клавиатуре.
В общем, какая бы не была причина, надиктовывать текст голосом, который будет тут же преобразовываться в печатный текст, гораздо проще, чем набирать его с клавиатуры. Поэтому в этой статье я расскажу Вам, какие существуют способы, чтобы преобразовать голос в текст.
Голосовой блокнот
Это бесплатное приложение разработанное компанией Google Chrome. Соответственно работает оно только в этом браузере, который, для использования блокнота, лучше обновить до последней версии.
Для установки голосового блокнота зайдите в меню браузера Chrome и выберите там «Настройки».
В настройках перейдите на вкладку «Расширения» и кликните по ссылке «Интернет-магазин Chrome».
Теперь в строке поиска наберите «Голосовой блокнот».
И в разделе «Приложения» кликните в соответствующей строке на кнопку «Установить». Появится информационное окошко, в котором подтвердите установку приложения.
Найдите установленное приложение в «Сервисах» и откройте его кликом мышки.
На сайте Вы можете ознакомиться с основными возможностями блокнота для речевого ввода. Нажав на черную стрелочку вверху названия, можно убрать информацию для ознакомления. Блокнот отлично распознает голос, если говорить четко, расставляет знаки пунктуации и заглавные буквы.
Выберите язык из выпадающего списка, нажмите кнопочку «Включить запись» и начните диктовать текст.
Еще одно интересное приложение для браузера Google Chrome – это Войснот II. Найдите его в Интернет-магазине Chrome, как было описано выше, и установите.
Работать с ним очень легко. Выберите язык ввода текста, затем надиктуйте его, выделите, скопируйте и вставьте в нужный документ.
SpeechPad
SpeechPad – расширение для Google Chrome, которое позволит выполнять голосовой набор текста в необходимые поля на веб страницах.
Для его установки перейдите: «Меню браузера» – «Настройки» – вкладка «Расширения» – ссылка «Интернет-магазин Chrome». В строке поиска введите «speechpad».
Дальше в разделе «Расширения» выберите «Голосовой ввод текста – SpeechPad» и нажмите напротив него «Установить». В всплывающем окне подтвердите установку расширения.
Теперь, например, нажмите в строке поиска Google правой кнопкой мыши и выберите пункт «SpeechPad».
Подождите, пока поле для ввода текста подсветится розовым цветом, и говорите текст.
Пользоваться расширением SpeechPad можно на любом сайте и в любой социальной сети.
Теперь Вы сможете набирать текст с помощью голосового набора прямо на веб страницах в Интернете, или надиктовывать текст в приложение, а затем с легкостью копировать его и вставлять в необходимый документ.
Оценить статью:
Загрузка…
Поделиться новостью в соцсетях
Об авторе: Олег Каминский
Вебмастер. Высшее образование по специальности «Защита информации». Создатель портала comp-profi.com. Автор большинства статей и уроков компьютерной грамотности
Как вводить текст голосом при помощи микрофона? Блокнот для речевого набора текста.
15 Июнь 2014
6615
60
Здравствуйте, уважаемые читатели моего блога!
В этой статье я хотел бы рассказать вам об одном замечательном сервисе, который поможет вам сократить свое время на набирание различных текстов, написание постов и т.д. Речь пойдет о блокноте речевого ввода который предназначен для ввода текста голосом при помощи обычного микрофона. Используя сервис о котором я вам расскажу, вы сможете реально сократить время набора текстов на своем компьютере или ноутбуке.
Кроме того, если вы напишете различные видео и аудио подкасты для своего блога и своего бизнеса, сервис поможет вам лучше развивать свою речь, потому что, диктуя текст вы будете тренировать свою речь и со временем научитесь более ровному и качественному произношению.
Эту статью я набирал именно при помощи этого инструмента, я просто диктовал системе через микрофон свои мысли, и в результате получил данную статью. С первого раза мне, конечно, было не привычно, я допускал немало ошибок и потратил довольно много времени.
Но я думаю, что регулярные тренировки помогут исправить все недостатки.
Кроме простого ввода текста, данный сервис позволяет переводить звук аудио или видео подкастов печатный текст, это так называемая, транскрибация (процесс, в ходе которого аудио- или видеофайлы переводятся в текстовой формат). Сам я пробовал перевести свои видео, но у меня не особо это получилось. Возможно я сам допустил какие-либо ошибки или просто слишком быстро говорил в роликах, ну, возможно у вас это получится лучше чем у меня, попробуйте. 🙂
Кстати, сервис работает только в браузере Google Chrome! Так как здесь используется голосовой движок от Google и он доступен только через интернет!
И так, инструмент находится по адресу https://speechpad.ru. Для того чтобы в полной мере воспользоваться данным сервисом желательно в нем зарегистрироваться, тем более что этот процесс несложный. Можно также войти на сервис при через аккаунт на Яндексе.
На сайте речевого блокнота есть все, необходимые для работы, инструкции и даже видеоуроки, которые помогут вам разобраться со всеми возможностями сервиса и научат вас ими пользоваться. Есть также блог, в котором представлены уроки и последние новости об различных изменениях в интерфейсе и возможностях блокнота. Перед началом работы с речевым блокнотом, я рекомендую вам ознакомиться с материалами, которые нужны именно вам.
Для ввода текста я использовал свой микрофон «Audio-Technica AT2020USB», но, думаю, что подойдет и более простой микрофон, главное, чтобы он более менее качественно передавал речь, тогда ошибок будет значительно меньше.
После того, как вы ознакомитесь с основной информацией, можно сразу приступать к работе. Для речевого ввода текста необходимо включить микрофон и перейти к соответствующему интерфейсу.
После нажатия кнопки «Включить запись» сервис потребует разрешения на использование микрофона (это происходить только один раз при первом использовании).
Далее просто диктуйте свой текст и обращайте внимание на активность кнопки записи. Помимо обычных слов блокнот понимает различные знаки, (например, запятая, точка, восклицательный знак) и также их вводит.
В speechpad.ru имеется одноименное расширение для браузера Google Chrome.
Установив это расширение у вас будет возможность вводить текст при помощи микрофона в различные поля на сайтах, например, в поисковой строке Яндекса, в комментариях блога и т.п. Для использования этого расширения нужно его установить, нажать правую кнопку мыши в нужном поле для ввода и в появившемся меню выбрать пункт «SpeechPad».
В целом, сервис мне понравился, распознание голоса и ввод текста происходит довольно качественно. При использовании нормального микрофона и небольших тренировках можно добиться неплохих результатов и значительно сократить свое время на набор текста.
На этом у меня все. Надеюсь, что мой пост был вам полезен.
С уважением, Александр Бобрин
Поделись с друзьями:
Обратите внимание:
Похожие статьи
Как я пробовал написать статью голосовым вводом, и что из этого получилось
Смартфоны уже давно стали чем-то большим, чем просто телефоны. Мы каждый день используем наш гаджет для переписки с друзьями, просмотра видеороликов на YouTube, общения в Telegram, и при этом сегодня телефон для многих может стать заменой полноценного компьютера. Я не шучу, на своем примере я готов показать, как нейронные сети от Google способны за меня писать статью. До недавнего времени я скептически относился к голосовому вводу, который встроен в клавиатуру gBoard, однако я решил попробовать и крайне удивился тому, насколько качественно клавиатура способна распознавать мою речь. В данном материале мы рассмотрим, как же компании удалось создать настолько качественное распознавание речи, и как при этом данная функция может помочь нам в работе.
Как я написал статью голосовым вводом
Всё это время я писал статьи с помощью своего ноутбука или PC. Мне всегда выражать свои мысли с помощью голоса было легче, чем с помощью пальцев рук. Это делает процесс выражения мыслей более естественным, более плавным (good flow) и более быстрым. Ввод с помощью клавиатуры очень часто приводил к ситуациям, когда я терял ход мыслей. Уже сейчас я готов опубликовать вторую статью продиктованную своему телефону, ну и мне не обязательно при этом обладать быстрой слепой десятипальцевой печатью (хочу отметить, что печатаю я неплохо). Возможность написания материала голосом вызывает у меня ощущение радости от того, насколько сильно продвинулись технологии вперёд. Если раньше я мог писать материал за час-два своего времени, сейчас мне удается уменьшить эти показатели в 2 раза просто потому, что выражение мыслей голосом происходит быстрее, чем с помощью набора текста.
Я изучил, как работает голосовой ввод gBoard и, по правде говоря, был удивлён. Ранее компания использовала достаточно старые способы распознавания речи, они были основаны на модели Gaussian Mixture Model. Данная модель использовалась в течение 30 лет. Однако всё изменилось в 2012 году, когда начали становиться популярными нейронные сети. Конечно, они существовали и раньше, однако именно с 2012 года начался новый этап в развитии. Стали использоваться глубокие нейронные сети, рекуррентные и другие. И именно последний тип нейронных сетей лежит в основе технологии распознавания голоса. В настоящее время Google использует архитектуру нейронных сетей Recurrent Neural Network Transducers (RNN-T) для распознавания речи. А уже сейчас обладатели смартфонов Pixel могут использовать голосовой ввод gBoard без Интернета. Этого удалось добиться несколько этапами оптимизации, одним из которых стала финальная компрессия, благодаря чему размер изначальной модели с 2 гигабайт сократился до 80 мегабайт. Предлагаю обсудить это в Телеграм.
Читайте также: Почему стоит присмотреться к Google Pixel 1
В традиционных системах распознавания речи существуют несколько компонентов: модель, которая разбивает аудио на части длинной в 10 миллисекунд — их называют фонемами, модель произношения, которая соединяет фонемы вместе, образуя слова, а также языковая модель, которая предлагает пользователю готовые фразы. В ранних системах данные компоненты работали независимо друг от друга. Примерно в 2014 году исследователи начали фокусироваться на тренировке общей нейронной сети, чтобы на вход подать один аудиофайл, а на выходе получить готовое предложение. Такой sequence-to-sequence способ позволил сделать распознавание более точным, однако он работал лишь после полного ввода предложения. Между тем существовала технология CTC, она позволила уменьшить задержку в распознавании, на тот момент это стало серьезным шагом на пути к созданию рекуррентных нейронных сетей с преобразователями RNN-T. С этого момента стало возможным точное распознавание в момент непосредственного ввода речи.
Recurrent Neural Network Transducers
Какие выводы можно сделать из всего этого? Безусловно, уже сейчас можно использовать голосовой ввод для точного распознавания русского текста, и раньше так хорошо он не работал. Пока, к сожалению, нейросеть не способна понимать, где ставить пунктуационные символы, однако само распознавание достаточно точное, что внушает надежду на то, что в будущем нам предложат еще больше возможностей. Не исключаю, что уже в ближайшие два года Google адаптирует свою новую нейросеть для работы с русским языком в оффлайн-режиме. Пока же мы будем довольствоваться тем, что имеем.
Делитесь мнением в комментариях с помощью языкового ввода.
По материалам Google
совместная работа и голосовой набор текста
Google: Что он слышит, то он пишет
- Google Документы, или гугл-доксы, нужны мне, прежде всего, для удаленных совместных проектов.
- Google Документы позволяют одновременно смотреть в «один экран» находясь физически на разных континентах. Общаясь «голосом» через мессенджеры или через комментарии в документе, можно уточнять позиции проекта, согласовывать правки.
- Сервис голосового набора текста в Google-документах, когда надиктованный голосом текст преобразуется «буквы» позволяет быстро написать новый текст, что может быть важно в условиях жесткого цейтнота, или когда сидеть за компьютером физически тяжело.
- Все функции Google-документов, в том числе и голосовой набор текста бесплатны, доступны с компьютера, планшетов, смартфона, как IOS и Android.
Рисунок: Sean T. Collins |
«Кроме самых коротких заметок, он все диктовал в речепис».
«1984», Джордж Оруэлл, 1948
Распознавание и преобразование речи в текст онлайн умеют специальные программы и предложения. таких приложений транскрибации текста я протестировала много, но не пользовалась, пока мне не показали Google Документы.
Гугл хорошо распознает речь, понимает все знаки препинания, заменят числительные на цифры, и даже сам транскрибирует слово «Google» на английский.
Google Документы избавляют от необходимости сохранять множество копий на компьютере и позволяют всегда держаться актуальной версии общего документа.
«Инструкцией по применению» Google-документов я уже делилась. Она живет в сети, в свободном доступе, я часто отправляю не неё ссылки своим новым партнерам.
Google Документы и голосовой набор: компьютер, планшет, смартфон (iPhone, Android)
Когда я начала работать в Google Docs-ах, я открыла для себя много преимуществ перед обычным редактором текстов.
Мы редко пишем только на компьютерах, которых у многих, как минимум, два — рабочий и домашний, а еще есть планшеты и смартфоны. Конечно, есть электронная почта и флэшки, но Google Docs-ы намного удобней.
Мой опыт: у меня Google Документы есть на всех девайсах, и один и тот же документ я могу открыть на любом из них — компьютере, планшете, смартфоне, — и внести изменения. О смартфонах: много лет у меня были айфоны, сейчас — андроид. На скриншоте слева — экран моего смартфона. У айфона значок микрофона расположен иначе.
Но есть у гугла еще одно преимущество: он хорошо распознает речь. Я пробовала много «диктовалок», поскольку вопрос быстрого набора текста для меня очень актуален.
Ввод текста при помощи голоса есть в версии Google-документов для ‘больших’ компьютеров, а также для мобильных устройств. Сейчас у меня смарфон Андроид, а планшет — ios. Голосовой набор теста возможен со всех устройств.
Для совместной работы телефон-компьютер (планшет-компьютер) нужно войти в свой аккаунт с двух устройств. Сделать это нужно один раз, дальше все документы открываются по умолчанию.
Мой любимый способ голосового набора теста в Google-документах:
- Открыть документ на Google-диске на компьютере, к которому в качестве монитора подключен большой телевизор. (Российское телевидение я не смотрю уже много лет).
- Этот же документ я открываю на телефоне (или iPad) и начинаю диктовать текст.
- Правильность набора проверяю на большом мониторе (телевизоре).
Практический совет:
- Войдите на Google-диск,
- Откройте или создайте «Новый документ».
- Зайдите в меню в раздел «Инструменты», выберите «Голосовой ввод». Проверьте язык — по умолчанию стоит английский. Если голосовой ввод идет со смартфона, то нужно кликнуть на значок «микрофон» на клавиатуре. «Микрофон» есть и на клавиатуре новых iPad.
- Диктуйте текст. Google запишет.
«Пойти лекцию почитать, может и сам что-то пойму» — часто шутят спикеры. Когда я сажусь за компьютер писать статью, сразу включаются два моих «лучших Я» — прокрастинатор и перфекционист. Первый шепчет в ухо — «пойдем чайку попьем и подумаем еще», второй бурчит в другое ухо — «все плохо-плохо-плохо, ну кто так пишет?» Когда я вхожу в аудиторию, они оба умолкают, и в момент высокой концентрации за несколько минут можно получить готовую статью, над которой корпела не одну ночь. Главное, не забыть во время спичдрайва включить диктофон.
После этого написание статьи — дело техники, причем, в буквальном смысле слова.
- Если запись достаточно качественная — можно просто направить источник звука на микрофон и «курить бамбук», наблюдая за набором текста, который потом нужно будет только отредактировать и отформатировать.
- Если в записи много шума, слушаем ее через наушники (с телефона или компьютера) и в микрофон (iPad, смартфон) диктуем.
Когда нужен диктофон или «диктовалка» для голосового ввода текста?
В 2007 году я работала над книгой. «Курортологию для всех» уже нужно было сдавать на верстку, а я все никак не могла написать введение. Были исписаны горы «утренних страниц», но текст не шел, а муза где-то заблудилась. Они догнали меня на дороге. Многие знают, что при движении нам часто приходят правильные мысли. Я бежала домой, чтобы быстро записать «пойманный» текст. Сегодня я бы просто достала смартфон, открыла Google-Документы, и надиктовала текст. Можно сделать и по-другому — записать текст на диктофон, чтобы потом перевести в текстовый формат.
Очень многие статьи, которые «не пишутся», приходят утром или среди ночи. Раньше я держала рядом с кроватью и на кухне блокноты для записи, но уже давно просто включаю диктофон и успеваю записать точнее и быстрее. Потом открываю Google Документы и очень быстро перевожу запись речи с диктофона в текстовый формат.
«Железнодорожный роман». Доминик Пинон |
Посмотрите фильм «Железнодорожный роман», точнее «Вокзальный роман» в буквальном переводе с французского — триллер режиссера Клода Лелуша. Герой Доминика Пинона «литературный негр» и пишет очередной литературный шедевр по заказу известной писательницы (Фанни Ардан), у которой работает якобы секретарем, но мечтает написать собственный роман. Он постоянно делает записи на диктофон, как писал Джордж Оруэлл еще в 1948 году, — все диктует в речепис (speakwrite).
Дружно меняем любимое выражение всех пишущих:
— «Пишите, Шура, пишите»
на новое
— «Будьте добры, помедленнее, Google записывает».
Голосовой блокнот или голосовой набор в Google Документах?
Рабочий браузер на всех моих компьютерах — Google Chrome. Для него создано специальное расширение: speechpad.ru, которое обеспечивает голосовой набор, в том числе и в соцсетях.
Speechpad позволяет вводить текст, используя микрофон, а также переводить речь из аудио и видео в печатный текст. У меня это приложение установлено, но я им пользуюсь реже, чем голосовым набором в Google-Документах.
«Winston glanced across the hall. In the corresponding cubicle on the other side a small, precise-looking, dark-chinned man named Tillotson was working steadily away, with a folded newspaper on his knee and his mouth very close to the mouthpiece of the speakwrite. He had the air of trying to keep what he was saying a secret between himself and the telescreen*. He looked up, and his spectacles darted a hostile flash in Winston’s direction».
«Уинстон взглянул на стеклянную кабину по ту сторону коридора. Маленький, аккуратный, с синим подбородком человек по фамилии Тиллотсон усердно трудился там, держа на коленях сложенную газету и приникнув к микрофону речеписа. Вид у него был такой, будто он хочет, чтобы все сказанное осталось между ними двоими – между ним и речеписом*. Он поднял голову, и его очки враждебно сверкнули Уинстону».
”1984”, Джордж Оруэлл, 1948
*Телекран (англ. Telescreen; также переводится как телескрин или монитор) — вымышленное устройство, представленное в романе Джорджа Оруэлла «1984» и его экранизациях.
PS. Этот текст написан на восьмой день марафона #текстдрайв, главным условием которого было каждый день написать новый текст и опубликовать в соцсети. Так появились новые посты в блоге:
Как заразить ребенка любовью к чтению? Совет бабушки взрослого внука
Управлять здоровьем, как автомобилем
О пользе чтения: чтение одной главы в день продлевает жизнь на 12 лет.
Я дописала главы неопубликованной книги, которую задумала еще двадцать лет назад. Новые публикации появились и в блоге Pro kurort: история рекламы курортов, лесные ванны или синрин-йоку. Наконец-то дописала две статьи в рубрике «курортное кино»: про французский курорт для худеющих и про лечение Франклина Д. Рузвельта на американском курорте, про то, как в теплых водах закалялся характер президента и зарождалась реабилитационная медицина.
Но пока я была на форуме «Здравница» в Кисловодске, времени для #текстдрайва оставалось не больше часа. Вчера мой пост про Народные ванны в Пятигорске ушел в сеть за одну минуту до полуночи, та-дам, и карета не успела превратиться в тыкву.
Этот текст я набирала вручную на борту самолета. Когда я выйду из зоны турбулентности и войду в зон Интернета, я открою Google Документы, переговорю магическое слово «Google» и он старательно транскрибирует все их по-английски. Останется только только одно действие «copy and paste» в социальную сеть.
Похожие сообщения в рубриках:
Лучшее программное обеспечение для преобразования текста в текст на 2021 год: 8 лучших вариантов
В этом руководстве мы тестируем и рассматриваем лучших вариантов программного обеспечения преобразования речи в текст , как бесплатных, так и платных.
Вы часами сидите за компьютером, пишете и редактируете документы? Если да, то вы понимаете, насколько физически сложен набор текста. Я помню, как впервые почувствовал резкую боль в запястьях.
Мне было так страшно, что у меня развился синдром запястного канала.Я немедленно начал искать способы сохранить свои запястья, зная, что, если я не умею печатать, я не смогу выполнять свою работу. Вот где я обнаружил программу преобразования речи в текст .
Программы преобразования речи в текст великолепны, потому что они используют программы искусственного интеллекта для преобразования ваших произнесенных слов в текст. Затем эта программа преобразует его в текст для вас, отображая на экране.
Помимо ускорения работы, вы также можете предотвратить развитие проблем с запястьем, включая синдром запястного канала.
Доступно множество программ. В этом руководстве мы пытаемся протестировать некоторые из лучших доступных вариантов программного обеспечения для преобразования речи в текст.
Рекомендуется
Дракон в любом месте
Dragon предлагает преобразование речи профессионального уровня в текст с точностью почти 95%. Доступно на iOS и Android.
Мы зарабатываем комиссию, если вы совершаете покупку, без каких-либо дополнительных затрат для вас.
Критерии тестирования
Я протестировал каждое из этих приложений преобразования речи в текст в этом обзоре подробно. Я взял абзац текста из газеты The Irish Times и прочитал его в каждом приложении. Я использовал набор из Apple Airpods Pro и iPhone 7, а также iMac. Я также нанял стороннего писателя-фрилансера, который широко диктует статьи для фрилансеров, чтобы он поделился своим опытом.
Первоначальный текст гласит:
Промежуточный анализ комитета Европейского агентства по лекарственным средствам (EMA) определил, что серьезные побочные эффекты редких тромбов могут возникнуть у 1 из 100 000 вакцинированных людей, говорится в заявлении регулирующего органа.
Прежде чем мы перейдем к выбору программного обеспечения, запомните эти советы, чтобы обеспечить более высокую точность:
- Используйте качественную гарнитуру ( Apple Airpods работают хорошо)
- Говорите медленными полными предложениями
- Диктуйте в тихой обстановке
- Избегайте редактирования и диктовки одновременно
1. Дракон Anywhere
Это лучшая программа преобразования речи в текст для диктовка на мобильных устройствах .Это также лучший выбор для пользователей Mac .
Стоимость: 14,99 $ в месяц
Эта программа имеет отличные возможности распознавания речи
Если вам нужна программа dictation для мобильного устройства , рассмотрите вариант Dragon Anywhere , доступный через Nuance .
Эта программа имеет отличные возможности распознавания речи, аналогичные таковым в настольной версии. Несмотря на то, что произнесенных слов могут отображаться на экране с задержкой, это приложение работает быстро, быстро и точно.Вы также можете легко обмениваться документами с помощью облачных сервисов, включая Dropbox .
Вот результат Dragon Anywhere для моего теста (ошибки выделены жирным шрифтом):
Промежуточный анализ комитета Европейского агентства по лекарствам определил, что серьезные побочные эффекты их тромбов могут возникнуть у 1/100 000 вакцинированных людей, говорится в заявлении регулирующего органа.
В настоящее время я регулярно использую Dragon Anywhere через свой iPhone 11, поскольку он точный, портативный и быстрый.Это мой рекомендуемый выбор для писателей и пользователей Mac , которые серьезно относятся к dictation .
Плюсы
- Хорошо работает на мобильных устройствах
- Исключительная функциональность по сравнению с другими приложениями для диктовки
- Хорошо работает настольная программа Dragon (если вы используете Windows)
Минусы
- Дорогое обслуживание по подписке
- Задержка появления на экране разговорного текста
- Редактирование надиктованного текста — проблема
2.Распознавание речи Windows
Это лучшая бесплатная программа преобразования речи в текст для Windows 10 и более поздних версий.
Стоимость: Бесплатно
Документы улучшаются по мере того, как программа изучает ваш словарный запас и манеру речи
Если вам нужно бесплатное программное обеспечение для преобразования речи в текст для Windows , писатель-фрилансер, с которым я работал над этим обзором, рекомендует Windows 10 Speech Recognition.
Эта программа доступна на настольной ОС Microsoft .Он имеет надежные возможности распознавания голоса, включенные в операционную систему , даже если он не называется Cortana .
Это не всегда точная программа, особенно по сравнению с Dragon , но это не будет стоить вам дополнительных денег. Кроме того, документы улучшаются по мере того, как программа изучает ваш словарный запас и манеру речи.
Вот результаты (ошибки выделены жирным шрифтом)
Промежуточный анализ жалости европейского агентства Edison определяет , что серьезные побочные эффекты редкого сгустка , вероятно, возникнут у 1/10000 сломанных человек, говорится в заявлении регулятора.
Плюсы
- Бесплатно
- Интегрируется с вашей существующей операционной системой
- Становится более точным, поскольку он изучает ваш голос
Минусы
- Не так точно по сравнению с другими вариантами
- Может зависнуть, если вы говорить слишком быстро
3. Braina Pro
Это лучшее программное обеспечение для преобразования речи в текст для использования в качестве виртуального помощника .
Стоимость: 49 $ в год
Вы также можете указать этому виртуальному помощнику запускать компьютер для файлов.
Braina Pro — это программа распознавания речи , которая обрабатывает диктовку , но также действует как виртуальный помощник для вашего ПК.Он поддерживает транскрипцию через сторонние программы и не только English , но и десятки других языков.
Вы также можете указать этому виртуальному помощнику запускать компьютер для файлов, просматривать Интернет или устанавливать будильники. Он даже может прочитать для вас книгу или воспроизвести файл MP3 с помощью настраиваемых команд. Вот результаты, жирным шрифтом выделены ошибки:
Промежуточный анализ, проведенный комитетом Европейского агентства Medicineregency , определил, что побочные эффекты редких тромбов sirius могут возникать у 1 из 100000 вакцинированных людей, говорится в заявлении регулятора.
Pros
- Обрабатывает диктовку на разных языках
- Ищет ваш компьютер, Интернет и даже воспроизводит музыкальные файлы
- Поддерживает и Android-приложение для удаленного управления вашим ПК
Cons
- Служба подписки может быть дорого
- Работает только онлайн
4. Голосовой набор Google Docs
Хороший выбор, если вы используете приложения Android или хотите расшифровать текст на ходу.
Стоимость: Бесплатно
Это чувствительная программа диктовка , которая может даже уловить ваш голос, если вы находитесь на другом конце комнаты.
Если вам нужна программа для распознавания голоса , которую можно использовать бесплатно, рассмотрите возможность голосового набора из Google Docs. Все, что вам нужно сделать, это открыть документ Google через браузер Google Chrome , включить микрофон и начать говорить.
Это чувствительная программа диктовка , которая может даже уловить ваш голос, если вы находитесь на другом конце комнаты.Конечно, это означает, что если есть фоновый шум , это может испортить вашу диктовку . Это отличный способ впервые опробовать программу real-time dictation .
Вот результат моего теста в Google Docs (ошибки выделены жирным шрифтом):
Промежуточный анализ , проведенный комитетом Европейского агентства по лекарственным средствам emea, определяет , что серьезные побочные эффекты — это редкие группы крови, которые могут возникнуть за один час вакцинированных людей регулирующий орган сообщил в заявлении
Плюсы
- Бесплатно и широко доступны
- Короткая кривая обучения
- Реагирующая
Минусы
- Время от времени фоновый шум мешает работе программы
- Программное обеспечение тормозит, если говорить слишком быстро
5.Speechnotes
Это хороший вариант в Интернете, если вы не хотите создавать учетную запись или оформлять подписку.
Стоимость: Бесплатно
Вы также можете диктовать знаки препинания и форматирование с помощью голосовых команд
Speechnotes — еще одна программа dictation , которая проста в использовании. Одна из особенностей этой программы заключается в том, что вам не нужно создавать учетную запись для ее использования.
Вам просто нужно открыть приложение, нажать на микрофон и начать.Это приложение работает на том же программном обеспечении, что и технология распознавания голоса Google.
Вы также можете диктовать знаки препинания и форматирование с помощью голосовых команд и . Наконец, вы также можете добавить приветствия, подписи и имена с помощью настраиваемых клавиш, которые вы настроили на клавиатуре.
Вот результат моего теста (ошибки выделены жирным шрифтом):
Анализ , проведенный комитетом европейского агентства по лекарственным средствам emea, определяет , что серьезные побочные эффекты — это редкие группы крови, которые могут возникнуть за один час вакцинированных людей регулирующий орган сказал в заявлении .
Плюсы
- Вам не нужно создавать учетную запись
- Мобильное приложение интуитивно понятно
- Программа бесплатна для использования
Минусы
- Мобильное приложение iOS для Mac или Apple недоступно продукты, такие как iPhone
- . Для доступа к TK
необходимо приобрести дополнительные функции.
6. Dragon Professional Individual
Это лучший выбор для предприятий, использующих компьютеры Windows .
Стоимость: 500 $
Компания, стоящая за этим, также предлагает различные версии для медицинских и юридических компаний с особыми потребностями.
Если вам нужна программа dictation для вашего бизнеса, рассмотрите вариант Dragon Professional. Когда мне нужно быстро набрать записи на работе, Dragon Professional неоценим.
Я могу говорить со скоростью 150 слов в минуту легко и почти с полной точностью, даже если я использую отраслевой жаргон.Я также могу легко импортировать индивидуальные списки слов.
Гибкий и мощный инструмент Dragon Professional значительно сокращает время, которое я трачу на просмотр записей. Компания, стоящая за ним, также предлагает различные версии для медицинских и юридических компаний с особыми потребностями.
Я использовал старую версию этого инструмента в течение нескольких лет на моем компьютере Mac . Результаты тестирования были аналогичны Dragon Anywhere , что неудивительно, учитывая, что они работают по той же технологии.
К сожалению, старые версии содержат ошибки и ненадежны на Mac. Более того, разработчики больше не поддерживают его для Mac. Microsoft недавно приобрела Nuance за 19,7 миллиарда долларов. Неясно, будут ли они поддерживать новую версию Mac (подозреваю, маловероятно).
Вот , результат для моего теста (ошибки выделены жирным шрифтом):
Промежуточный анализ, проведенный комитетом Европейского агентства по лекарствам , определил, что серьезные побочные эффекты их тромбов могут возникнуть у 1/100 000 вакцинированных людей, говорится в заявлении регулятора.
Профи
- Мощный и точный
- Хорошо справляется с отраслевым жаргоном
- Одна из самых быстрых доступных программ диктовки
- Может управлять вашим компьютером тоже
Минусы
- Одна из самых дорогих доступных программ
- Требуется время, чтобы выучить свой голос, что снижает точность
- Больше не поддерживается на Mac
7.
Apple Dictation или Siri
Apple Mac и Пользователи iOS могут диктовать текст бесплатно с помощью Siri .
Стоимость : бесплатно
Эта программа также имеет функцию преобразования голоса в текст , которая управляет командами на компьютере Mac .
Этот вариант подходит для коротких сеансов диктовки через устройство iOS или Mac. На iOS Siri обрабатывает 30-40 секунд за раз. Это делает его идеальным для записи заметок или отправки коротких текстов.
Эта программа также имеет функцию преобразования голоса в текст , которая управляет командами на компьютере Mac . Однако он не работает для , диктуя больших фрагментов контента.
Вот результат Siri (ошибки выделены жирным шрифтом):
Промежуточный анализ комитета Европейского агентства по лекарствам термин заключается в том, что серьезные побочные эффекты возникают там, где часы могут появиться у одного и у 100000 вакцинированных людей.
Плюсы
- Сетевые и автономные функции
- Хорошо работает для заметок
- Совместимо с устройствами iOS
Минусы
- Не приложение для диктовки для длинных предметов
- Обрабатывает 40 секунд за раз
- Сравнительно неточно для Dragon
8. Otter.AI
Otter хорошо работает, если вы хотите расшифровывать телефонных звонков, встреч и интервью.
Стоимость: Бесплатно / от 8,33 $ в месяц.
Вы также можете добавить заметки докладчика, аудиофайлов , изображения и видеофайлы в расшифровку стенограммы
Otter.ai — это инструмент для расшифровки речей и разговоров, который работает онлайн и через мобильное приложение. Вы можете взять его с собой на деловую встречу, чтобы быстро записать то, что было сказано. Вы также можете добавить заметки докладчика, аудиофайлы, изображения и видеофайлы в стенограмму после собрания.
Otter имеет бесплатную версию, которая имеет 600 минут транскрипции раз в месяц.У него также есть несколько премиальных планов в зависимости от ваших потребностей. Это хороший выбор для , записывающего встреч и интервью, хотя не ожидайте 100% точности. Тем не менее, он хорошо показал себя с моим тестом.
Вот результаты:
Промежуточный анализ комитета Европейского агентства по лекарственным средствам FMEA определяет, что серьезных побочных эффекта редких тромбов могут возникнуть у одного из 100000 вакцинированных людей, говорится в заявлении регулирующего органа . .
Плюсы
- Бесплатная опция
- Встроенные возможности совместной работы в команде
- Субтитры в реальном времени
- Превосходная точность
Минусы
- Ограниченное количество минут в бесплатной версии
- Не предназначено для писателей
- Нет настольной версии
Почему нам можно доверять
Я написал и опубликовал десятки статей для газет, журналов и интернет-изданий, включая Forbes и Lifehacker.Я также писатель бестселлеров и опытный журналист.
Программа преобразования речи в текст составляет ключевую часть моего рабочего процесса для научной литературы. Я регулярно делаю наброски статей, а затем диктую первые черновики, используя некоторые опции программного обеспечения в этом руководстве.
Последнее слово: лучшее программное обеспечение для преобразования текста в текст
Я рекомендую вам выбрать Dragon Anywhere и Otter.ai. Цена и точность должны соответствовать потребностям большинства писателей и тех, кто нуждается в диктовке.
При выборе программного обеспечения для преобразования речи в текст для проекта или работы учитывайте свою операционную систему, бюджет и то, используете ли вы настольный компьютер или мобильное устройство. Также неплохо подумать о том, что вы диктуете. Например, Otter.ai хорошо подходит для встреч и подкастов, тогда как Dragon идеально подходит для статей.
Помните, что требуется время, чтобы адаптироваться к написанию через речи в текст . Однако награда велика. Вы быстро увеличите ежедневное количество слов и убережете свои запястья от чрезмерных травм.Помните, всегда проверяйте и редактируйте свою работу перед отправкой, чтобы исправить диктант ошибок!
Рекомендуется
Дракон в любом месте
Dragon предлагает преобразование речи профессионального уровня в текст с точностью почти 95%. Доступно на iOS и Android.
Мы зарабатываем комиссию, если вы совершаете покупку, без каких-либо дополнительных затрат для вас.
Часто задаваемые вопросы о программе Best Speech To Text
Точны ли программы преобразования
речи в текст ?
Большинство программ преобразования речи в текст относительно точны. Многие программы становятся более точными по мере их использования, потому что они учат ваш голос. Некоторые программы предложат вам исправить неясные вопросы диктант , чтобы ускорить этот процесс обучения.
Как работает программа для распознавания голоса?
Программа распознавания голоса
распознает вашу речь и использует искусственный интеллект для преобразования ее в напечатанные слова.Многие программы также используют голосовые команды для обработки требований к форматированию и пунктуации.
Программы диктовки дорогие?
Они не обязательно должны быть дорогими. Несмотря на то, что лучшие программы могут потребовать значительных вложений, доступны бесплатные варианты. Возможно, вы захотите опробовать эти бесплатные варианты, прежде чем точно определите, за какие функции вы готовы платить.
Нужен ли Dragon NaturallySpeaking Интернет?
После активации программного обеспечения вы можете диктовать в автономном режиме.
Может ли Dragon NaturallySpeaking записывать аудиофайлы?
Вы можете загрузить личный аудиофайл или аудиофайл из социальных сетей в Dragon NaturallySpeaking, и он расшифрует его. Возможно, вам придется очистить результат.
Сколько стоит программное обеспечение Dragon Speech To Text?
Dragon стоит от 59 до 300 долларов. Это зависит от того, какую версию вы покупаете.
Какое программное обеспечение для диктовки лучше всего подходит для Mac?
Если у вас ограниченный бюджет, сначала используйте встроенное программное обеспечение для диктовки, пока вы не научитесь диктовать.После этого ваш лучший выбор — Dragon Anywhere, который можно использовать на устройстве iOS или Android. Вы также можете использовать Rev.
Какое приложение для диктовки лучше всего для писателей?
Dragon Naturally Speaking — хорошее приложение для диктовки для писателей, так как вы можете научить его распознавать имена персонажей и необычные слова. Rev — популярная альтернатива транскрипции.
Какое программное обеспечение для распознавания голоса самое лучшее?
Продукты
Dragon регулярно возглавляют список лучших программ для распознавания голоса благодаря своим надежным функциям, обучающим материалам и интеграции в большинство операционных систем.Однако лучшим программным обеспечением для ваших нужд будет то, которое соответствует вашему бюджету и имеет функции, необходимые для вашей работы.
Ресурсы для голосовых диктовок
Присоединяйтесь к более чем 15 000 писателей сегодня
Получите БЕСПЛАТНО книгу с подсказками и узнайте, как зарабатывать больше денег на своем письме.
Успех! Теперь проверьте свою электронную почту, чтобы получить подсказки.
Как использовать распознавание речи и диктовать текст в Windows 10
Знаете ли вы, что вы можете разговаривать с Windows, чтобы вводить команды, открывать приложения, диктовать текст и выполнять другие задачи?
Вы можете сделать это в Windows 10 через Кортану, но вы также можете общаться с Windows 10 и предыдущими версиями Windows, используя встроенное распознавание речи.Или продиктуйте текст в Windows 10 Fall Creators Update или более поздней версии.
Научив Windows понимать звук вашего голоса, вы можете поговорить с ОС, чтобы она отвечала на ваши команды. Функция распознавания речи может быть особенно полезной для людей с ограниченными возможностями, которые не могут пользоваться клавиатурой или мышью. Но он доступен для всех, кто хотел бы вместо этого попробовать поговорить с Windows. Эта функция даже служит справочным руководством, чтобы вы знали, какие команды и другие задачи вы можете бросить в Windows с помощью голоса.
Более поздние версии Windows 10 также предлагают функцию диктовки, которую вы можете использовать для создания документов, электронных писем и других файлов с помощью звука вашего голоса. Когда диктовка активна, вы можете диктовать текст, а также знаки препинания, специальные символы и движения курсора.
Давайте посмотрим, как использовать распознавание речи и диктовку в Windows.
Объявление
Диктовка триггера
Откройте приложение, в котором вы хотите надиктовать текст, например Блокнот, WordPad, Microsoft Word или программу электронной почты.Пока вы используете Windows 10 Fall Creators Update или более позднюю версию, вы можете активировать диктовку, нажав клавишу Windows + H. Если вы не включили речевые службы, в настройках появится всплывающее окно с указанием сделать это.
Включить речевые службы
Щелкните всплывающее окно или перейдите к Настройки> Конфиденциальность> Речь, рукописный ввод и ввод . Оказавшись там, нажмите «Включить речевые службы и варианты набора текста». Всплывающее окно сообщит вам, что Microsoft собирает эти данные для улучшения своих продуктов.Если вас устраивает, нажмите Включить.
Включите функцию диктовки
Включив речевые службы, еще раз нажмите клавиши Windows + H. Появится окно диктовки, готовое к прослушиванию.
Команды выдачи
Начни говорить. Windows достаточно умен, чтобы автоматически обрабатывать определенные задачи, например вводить первое слово предложения с заглавной буквы.
Диктовка знаков препинания и форматирование
Вы также можете вводить команды, чтобы диктовать знаки препинания и начинать новый абзац.
Исправление ошибок
Что делать, если вы или программа диктовки ошиблись? Просто отмените это.Скажите «Отменить», и последнее слово, фраза или предложение будут удалены.
Запуск и остановка диктовки
Обратите внимание: если вы перестанете говорить на несколько секунд, диктовка перестанет слушать. Вы также можете приостановить диктовку самостоятельно, сказав «прекратить диктовку» или щелкнув значок микрофона. Чтобы разбудить его, просто нажмите на значок микрофона на панели диктовки.
Редактирование под диктовку
Теперь предположим, что вы закончили свой документ или сообщение и вам нужно отредактировать текст, чтобы исправить ошибки и изменить определенные слова.Вы можете редактировать с помощью голоса, хотя этот процесс более сложен, чем использование надежной мыши и клавиатуры. Но если вы знаете правильные фразы, вы можете попробовать.
Вот команды редактирования, которые вы можете диктовать в соответствии с Microsoft:
Для этого: | Скажите это: |
---|---|
Очистить выделение | Очистить выделение; отмените выбор этого |
Удалить последний результат диктовки или текущий выделенный текст | Удалить это; отметьте, что |
Удалить блок текста, например текущее слово | Удалить [слово] |
Переместить курсор к первому символу после указанного слова или фразы | Перейти после этого; двигаться после [слова]; перейти в конец [абзаца]; переместите в конец этого |
Переместите курсор в конец блока текста | Перейти после слова; двигаться после [слова]; перейти к концу; перейти в конец [абзаца] |
Переместить курсор назад на единицу текста | Вернуться к предыдущему слову; перейти к предыдущему абзацу |
Переместить курсор к первому символу перед указанным словом или фразой | Перейти к началу [слова] |
Переместить курсор в начало блока текста | Перейти до этого; перейти к началу этого слова |
Переместить курсор вперед к следующему блоку текста | Перейти к следующему слову; перейти к следующему абзацу |
Переместить курсор в конец текстового блока | Переместиться в конец [слово]; перейти в конец абзаца |
Введите одну из следующих клавиш: Tab, Enter, End, Home, Page up, Page down, Backspace, Delete | Нажмите Enter; нажмите Backspace |
Выберите конкретное слово или фразу | Выберите [слово] |
Выберите последний результат диктовки | Выберите этот |
Выберите блок текста | Выберите следующие три слова; выберите два предыдущих абзаца. |
Включить и выключить режим проверки орфографии | Начать проверку орфографии; прекратить написание |
Активировать распознавание речи
Чтобы использовать распознавание речи, откройте панель управления в Windows 7, 8.1 или 10 и дважды щелкните Распознавание речи.
Начать распознавание речи
Появится окно «Распознавание речи» со ссылками на эту функцию. Щелкните первую ссылку «Начать распознавание речи». Первый экран для настройки распознавания речи объясняет, что делает эта функция и как она работает. Нажмите кнопку «Далее.
Выберите микрофон
На следующем экране спрашивается, какой тип микрофона вы используете — гарнитуру, настольный компьютер или другой.Выберите правильный вариант и нажмите Далее. На следующем экране прочтите информацию о правильном размещении микрофона и нажмите Далее.
Читай вслух
На следующем экране прочитайте предложение вслух, чтобы убедиться, что функция распознавания речи улавливает звук и громкость вашего голоса. Затем нажмите «Далее». Если ваш голос определен правильно, на следующем экране будет указано, что микрофон настроен и готов к использованию. Нажмите кнопку «Далее.
Обзорный документ
На следующем экране спрашивается, хотите ли вы, чтобы функция распознавания речи проверяла документы и сообщения электронной почты в вашем поисковом индексе Windows.Это помогает функции лучше понимать слова, которые вы обычно используете. Если вас это устраивает, нажмите «Включить проверку документа». Если вас беспокоят вопросы конфиденциальности, нажмите «Отключить проверку документа». Нажмите кнопку «Далее.
Режим активации
На следующем экране режима активации выберите первый вариант «Использовать ручной режим активации», если вы хотите отключить распознавание речи, когда закончите с ним, и готовы нажать кнопку микрофона на экране, чтобы перезапустить его.В противном случае выберите второй вариант «Использовать режим голосовой активации», чтобы перевести распознавание речи в спящий режим, когда вы закончите с ним, и скажите «Начать прослушивание», чтобы разбудить его. Нажмите кнопку «Далее.
На следующем экране вы можете просмотреть справочный лист, в котором перечислены все команды, которые вы можете вводить с помощью голоса. Нажмите кнопку «Просмотреть справочный лист», чтобы открыть и прочитать веб-страницу со всеми голосовыми командами. Затем вернитесь к настройке распознавания речи и нажмите Далее.
Запустить при запуске
На следующем экране выберите, хотите ли вы, чтобы функция распознавания речи автоматически загружалась при каждом запуске Windows.Нажмите кнопку «Далее.
На следующем экране вы можете выбрать запуск учебного пособия, чтобы изучить и попрактиковаться в командах, которые вы можете вводить с помощью голоса. Нажмите кнопку «Начать обучение», чтобы запустить это, или нажмите кнопку «Пропустить обучение», чтобы пропустить эту часть.
Если вы выбрали запуск учебного пособия, появится интерактивная веб-страница с видеороликами и инструкциями по использованию распознавания речи в Windows. Панель управления распознаванием речи также появляется в верхней части экрана.
Настроить и контролировать
Теперь вы можете начать разговаривать со своим компьютером.Вы также можете настроить и контролировать распознавание речи. В окне «Распознавание речи» на панели управления щелкните ссылку «Дополнительные параметры речи», чтобы настроить функции распознавания речи и преобразования текста в речь.
Особенности и опции
Наконец, вы можете щелкнуть правой кнопкой мыши кнопку микрофона на панели управления распознаванием речи в верхней части экрана. Во всплывающем меню вы можете получить доступ к различным функциям и настроить различные параметры.
Этот информационный бюллетень может содержать рекламу, предложения или партнерские ссылки.Подписка на информационный бюллетень означает ваше согласие с нашими Условиями использования и Политикой конфиденциальности. Вы можете отказаться от подписки на информационные бюллетени в любое время.
Как использовать преобразование речи в текст в Word для написания и редактирования
- В Microsoft Word можно использовать преобразование речи в текст с помощью функции «Диктовать».
- С функцией Microsoft Word «Диктовать» вы можете писать, используя микрофон и свой собственный голос.
- При использовании диктовки вы можете сказать «новая строка», чтобы создать новый абзац, и добавить знаки препинания, просто произнеся знаки препинания вслух.
- Если вас не устраивает встроенная в Word функция преобразования речи в текст, вы можете использовать стороннюю программу, например Dragon Home.
- Посетите техническую библиотеку Business Insider, чтобы узнать больше.
Идет загрузка.
Хотя набор текста, безусловно, является наиболее распространенным способом создания и редактирования документов в Microsoft Word, вы не ограничены использованием клавиатуры.
Word поддерживает преобразование речи в текст, что позволяет диктовать свой текст с помощью распознавания голоса.
Преобразование текста в Word удобно и удивительно точно, и может помочь любому, у кого есть проблемы с набором текста на обычной клавиатуре.
Преобразование речи в текст в Microsoft Word можно использовать одинаково как на Mac, так и на ПК.
Ознакомьтесь с продуктами, упомянутыми в этой статье:
Apple Macbook Pro (от 1299 долларов США.00 в Apple)
Acer Chromebook 15 (от 179,99 долларов в Walmart)
Как использовать преобразование речи в текст в Word с помощью Dictate
Убедитесь, что к вашему компьютеру подключен микрофон. Он может быть встроенным, как в ноутбуке, или отдельным микрофоном, который вы подключаете к USB-разъему или аудиоразъему.
Неважно, какой тип микрофона вы используете, хотя лучше всего использовать гарнитуру, поскольку ей не нужно будет конкурировать с таким большим фоновым шумом, как встроенный микрофон.
1. В Microsoft Word убедитесь, что вы находитесь на вкладке «Главная» вверху экрана, а затем нажмите «Диктовать».
Нажмите «Диктовать», чтобы запустить функцию преобразования речи в текст Word.Дэйв Джонсон / Business Insider
2. Вы должны услышать звуковой сигнал, и кнопка диктовки изменится и загорится красный индикатор записи. Теперь он слушает вашу диктовку.
Вы знаете, что Word слушает, когда кнопка «Диктовать» горит красным светом.Дэйв Джонсон / Business Insider
3. Говорите четко, и Word должен транскрибировать все, что вы говорите в текущем документе. Произносите знаки препинания вслух. Вы также можете сказать «Новая строка», что будет иметь тот же эффект, что и нажатие клавиши Enter или Return на клавиатуре.
4. Когда вы закончите диктовку, нажмите «Диктовать» второй раз или выключите функцию голосом, сказав: «Отключите функцию диктовки.«
Вы все еще можете печатать с клавиатуры, пока включен диктант, но если вы нажмете кнопку вне Word или переключитесь на другую программу, диктовка отключится.
Хотите изменить язык? Вы можете щелкнуть стрелку вниз на Диктовке , чтобы выбрать, на каком из девяти или около того языков вы хотите говорить. Вы также можете увидеть дополнительные «Языки предварительного просмотра», которые все еще находятся в стадии бета-тестирования и могут иметь более низкую точность.
Откройте раскрывающееся меню кнопки «Диктовать», чтобы увидеть выбранные вами языки.Дэйв Джонсон / Business Insider
Альтернативы преобразования речи в текст
Вы не ограничены в использовании функции диктовки, встроенной в Word. Хотя они и не так популярны, как когда-то, есть несколько доступных коммерческих приложений для преобразования речи в текст, которые можно использовать с Word.
Самый популярный из них, Dragon Home, выполняет тот же тип распознавания голоса, что и Word’s Dictate, но также позволяет управлять Word, форматировать текст и вносить изменения в текст с помощью голоса.Он работает практически с любой программой, не только с Word.
10 лучших инструментов преобразования речи в текст для ускорения процесса написания
Написание — одна из самых распространенных задач, которые мы выполняем в нашей профессиональной карьере.Пишем ли мы сообщение в блоге, отвечаем на электронное письмо, отправляем информационный бюллетень или даже пишем роман, написание — это медленный процесс. Даже те, кто быстро печатает, обычно говорят быстрее, чем печатают. К счастью, вы можете ускорить процесс написания, используя программное обеспечение преобразования речи в текст.
Многие считают, что программное обеспечение помогает им заглушить свой внутренний редактор, чтобы они могли сосредоточиться на написании сейчас и редактировании позже. Программное обеспечение для преобразования речи в текст также отлично подходит для тех, кто испытывает трудности с использованием рук, страдает дислексией и т. Д.
В этой статье мы рассмотрим 10 лучших инструментов преобразования речи в текст, чтобы ускорить процесс написания. Эти приложения имеют высокий уровень точности, обычно около 90% или выше. Цены варьируются от бесплатных до сотен долларов, поэтому здесь должно быть что-то на любой вкус и кошелек. Приложения расположены в произвольном порядке.
Подпишитесь на наш канал Youtube
1. Google Docs Voice to Text
Google Docs Voice to Text работает с браузерами Chrome при использовании Google Docs или Google Slides.Он доступен на многих языках. Вы можете добавить знаки препинания, произнеся название знаков препинания, которые хотите использовать. Он также имеет голосовые команды для выбора, форматирования, редактирования, добавления таблиц, перемещения по документам, остановки или запуска, открытия справки и специальных возможностей. Он включает файл справки с инструкциями и всеми командами.
Цена: бесплатно | Дополнительная информация
2. Windows Диктовка
Windows Dictation встроена в Windows 10. Я набрал эту строку под диктовку Windows 10.Вы должны инициализировать его, открыть и выбрать значок микрофона, но затем он набирает то, что вы говорите, в месте нахождения вашего курсора. Он работает с документами, социальными сетями, электронной почтой и т. Д. Я поместил курсор в адресную строку и сказал: «Google dot com, enter», и меня перевели в Google. Придется потратить еще немного времени и выучить команды. Файл справки включает список команд и инструкций по вводу знаков препинания, цифр, символов и букв. Он доступен только на английском языке.
Цена: бесплатно | Дополнительная информация
3.Яблочный диктант
Apple Dictation встроен в Mac, но его необходимо включить и активировать. Siri может сделать это за вас (просто скажите «включить диктовку»). Он имеет несколько языков и диалектов. Он имеет расширенный режим, который работает без подключения к Интернету. Файл справки включает инструкции по пунктуации, символам и форматированию. Он будет печатать везде, где вы поместите курсор, поэтому отлично подходит для текстовых редакторов. Он также адаптируется к вашему акценту.
Цена: бесплатно | Дополнительная информация
4.Дракон Профессиональный Индивидуальный
Dragon — наверное, самое известное имя в программном обеспечении преобразования речи в текст. Dragon Professional Individual был разработан специально для делового и профессионального письма. Он синхронизируется с мобильным приложением Dragon Anywhere. Делает диктовку и транскрипцию. Он имеет глубокое обучение, поэтому он может адаптироваться к вашему голосу и окружающей среде. Он настраивается и включает голосовые команды, редактирование и совместим со многими приложениями. Он работает с Windows 7-10, но для Mac доступны версии Dragon.Есть также домашняя версия за полцены.
Стоимость: 300 долларов | Дополнительная информация
5. Брайна
Braina — это приложение для личного и офисного использования, которое доступно как в бесплатной, так и в профессиональной версии. Версия Pro Braina включает функцию преобразования речи в текст, а также множество других функций для управления компьютером с помощью голоса из любой точки дома или через сеть Wi-Fi. Включает более 100 языков. Он преобразует голос в текст с любым веб-сайтом или приложением, таким как Word, Блокнот и т. Д., и включает команды диктовки. Он доступен для Windows.
Цена: 49 долларов | Дополнительная информация
6. Speechnotes
Speechnotes — это онлайн-блокнот, который записывает диктовку. Он также прочитает ваше письмо. Работает только с Google Chrome. Он включает в себя пунктуацию и форматирование. Он автоматически сохраняет вашу работу, когда вы идете. Вы можете хранить его в папках, загружать, отправлять по электронной почте, сохранять как документ Word или текстовый файл, загружать на свой Google Диск и копировать в буфер обмена.Он работает с 10 разными языками. У него также есть премиальное расширение для Google Chrome, которое добавляет несколько простых функций, таких как подсчет слов и кнопку быстрого доступа на панель Chrome.
Цена: бесплатно | Дополнительная информация
7. Диктант
Диктовка — это онлайн-приложение, работающее с Google Chrome. Он хранит текст в вашем браузере, поэтому ничего не загружается ни на один веб-сайт. Он записывает запись в текстовом редакторе и включает некоторые параметры форматирования текста.Он работает со многими языками. Вы можете копировать, сохранять как обычный текст, публиковать, твитнуть, воспроизводить текст как речь, отправлять по электронной почте и распечатывать свой текст. Он включает команды для смайлов, специальных символов, знаков препинания, кавычек и скобок. В нем также есть список фраз для выполнения определенных команд.
Цена: бесплатно | Дополнительная информация
8. Speech Texter
Speech Texter — это онлайн-приложение для Chrome, которое включает множество параметров форматирования. В нем есть собственный словарь с короткими командами для ввода данных, таких как знаки препинания, номера телефонов, адреса и т. Д., и вы можете добавлять свои собственные команды. Он поддерживает более 60 языков с точностью 90% для большинства языков и 95% для английского. Вы можете загрузить свой файл в виде текста или документа Word или распечатать его.
Цена: бесплатно | Дополнительная информация
9. Голосовой палец
Voice Finger позволяет вам управлять вашим ПК с Windows голосом и включает функцию диктовки. Откройте документ в любом редакторе, включите диктовку и начните говорить. Это по умолчанию отключает клавиатуру и мышь, но вы можете снова включить их с помощью голосовых команд.Вы можете управлять настройками и настраивать их под свой голос.
Цена: 10 долларов | Дополнительная информация
10. Электронная речь
e-Speaking — это приложение для Windows, которое позволяет управлять компьютером с помощью 100 встроенных голосовых команд. Его функция преобразования речи в текст позволяет вам писать в любом текстовом редакторе с 26 командами для диктовки, навигации, редактирования текста, добавления форматирования и добавления знаков препинания, чисел, символов и т. Д. Он включает в себя список команд, и вы можете добавлять свои собственные или редактируйте их и тренируйте слова, чтобы программа лучше реагировала на ваш голос.
Цена: $ 14 | Дополнительная информация
Конечные мысли
Вот наш взгляд на 10 лучших инструментов преобразования речи в текст, которые ускорят процесс написания. Некоторые работают в вашем браузере и предоставляют простой редактор, в то время как другие работают в вашей операционной системе и позволяют писать с помощью вашего любимого текстового редактора.
Пишете ли вы сообщение в блоге или следующий большой роман, если вы заинтересованы в ускорении процесса написания с помощью инструментов преобразования речи в текст, то вы обязательно найдете то, что вам нужно, в этом списке.
Мы хотим услышать от вас. Использовали ли вы какие-либо инструменты преобразования речи в текст из этого списка? Дайте нам знать, что вы думаете о них, в комментариях.
Рекомендуемое изображение через Bplanet / shutterstock.com
Распознавание голоса
— Обзор
1. Как управлять компьютером с помощью голоса?
Распознавание голоса встроено в большинство устройств, где его поддерживает оборудование, поэтому телефоны и планшеты более высокого класса будут иметь хорошие микрофоны, которые будут поддерживать голосовой ввод.Точно так же компьютеры часто бывают со встроенными камерами, микрофонами и динамиками. Распознавание голоса может стать альтернативой печати на клавиатуре. В простейшем случае он обеспечивает быстрый способ письма на компьютере, планшете или смартфоне. Пользователь говорит в внешний микрофон, гарнитуру или встроенный микрофон, и его слова отображаются на экране в виде текста. Это может быть текстовая строка поисковой системы, приложение чата или обмена сообщениями, электронное письмо или документ. Как правило, если вы используете распознавание голоса в компьютерной системе, вы получите лучшее качество от использования внешнего
. Некоторые системы и программы имеют распознавание голоса, которое можно настроить не только для ввода текста.Его можно использовать для управления устройствами. Простые голосовые команды при правильной настройке могут запускать и выключать компьютер, а также открывать и запускать различные программы и приложения. Это очень важно для людей с ограниченными физическими возможностями, которые могут использовать свои устройства независимо, просто используя голосовые команды. Если распознавание голоса можно настроить и у него есть настройки, его можно использовать для выполнения таких команд, как
- Форматирование текста и его сохранение
- Печать и отправка документов
- Не только написание, но и отправка электронной почты
- Просмотр веб-страниц и заполнение форм
Довольно мощные программы распознавания голоса теперь встроены в новые компьютеры, планшеты и смартфоны.Но для получения высокого уровня контроля и функциональности может потребоваться оплатить специализированное программное обеспечение в зависимости от системы или устройства.
2. Кому может помочь программа для распознавания голоса?
Распознавание голоса предлагает значительные преимущества широкому кругу потенциальных пользователей. Совершенно очевидно, что это чрезвычайно полезно для людей с ограниченными физическими возможностями, которым трудно, болезненно или невозможно печатать. Кроме того, это может помочь снизить риск получения травмы от повторяющихся деформаций (RSI) или более эффективно управлять любым таким заболеванием верхних конечностей.
Программы распознавания голоса также могут принести большую пользу людям с дислексией, которым в противном случае было бы сложно правильно писать и / или правильно строить предложения.
В более общем плане, распознавание голоса может помочь упростить мобильную работу, а также предложить потенциальные преимущества в производительности для тех, кто не очень хорошо умеет печатать. Фактически, большинство людей могут говорить намного быстрее, чем они могут печатать правильно — в то время как «свободные руки» вычисления также предлагают дополнительные возможности для многозадачности.
3. Какие преимущества получают работодатели?
Надлежащее использование программного обеспечения для распознавания голоса может помочь работодателям выполнить свою юридическую «обязанность проявлять осторожность», чтобы обеспечить здоровье, безопасность и благополучие своих сотрудников. Работодатели должны принимать меры для сведения к минимуму риска заболевания или травмы своих сотрудников, в том числе, например, с помощью RSI. Программное обеспечение для распознавания голоса помогает предотвратить усталость и травмы, предлагая удобную и эргономичную альтернативу клавиатуре и мыши.
Работодатели, которые не выполняют свои установленные законом обязанности в отношении здоровья и безопасности, могут быть привлечены к рассмотрению в суде по трудовым спорам.Они также могут быть уязвимы для жалоб на дискриминацию в соответствии с Законом о равенстве, если они не сделают «разумные поправки» для своих сотрудников-инвалидов. Использование распознавания голоса — это очень простая и экономичная корректировка, которую работодатель может внести, чтобы предоставить сотруднику-инвалиду равный доступ ко всему, что связано с его работой и сохранением своей работы в качестве сотрудника без инвалидности.
Помимо опасений по поводу здоровья и безопасности или дискриминации, работодатели должны учитывать потенциальный прирост эффективности и производительности, который может быть достигнут за счет более широкого распространения распознавания голоса, особенно для сотрудников, работающих «в дороге».’
4. Как работает программа распознавания голоса?
Программы распознавания голоса анализируют звуки и преобразуют их в текст. Программа использует обширный словарный запас и знание того, как говорят по-английски, чтобы определить, что, скорее всего, сказал говорящий. В некоторые программы можно добавить специальный словарь или часто используемые слова, такие как имена, путем предоставления ему документов, списков слов или использования дополнительных модулей 3 rd .
Запись вашего голоса
Программа распознавания голоса улавливает и преобразует речь через микрофон.Некоторые компьютеры оснащены встроенными микрофонами, но большинство специализированных программ распознавания голоса также включают микрофонную гарнитуру. Он может быть подключен к компьютеру либо через разъем звуковой карты, либо через USB (или подобное) соединение.
Также можно использовать подходящий портативный цифровой диктофон для диктовки записей — что может быть особенно полезно при мобильной работе. Некоторые приложения для распознавания голоса могут транскрибировать записи из ряда форматов (включая wav, mp3 и wma).
Регистрация
Голос и фразы у всех немного различаются, поэтому наиболее эффективная программа использует простой одноразовый процесс, называемый «зачислением». Это займет всего минуту и просто включает чтение короткого текста из нескольких строк. Однако не все программное обеспечение для распознавания использует регистрацию, но может потребовать от пользователя указать, есть ли у него акцент, и выбрать какой из них.
5. Что можно делать с помощью программного обеспечения для распознавания голоса?
Диктовка и исправление
Во время разговора люди часто колеблются, бормочут или невнятно произносят слова.Один из ключевых навыков использования программного обеспечения для распознавания голоса — это научиться четко говорить, чтобы компьютер или устройство могли распознавать, что говорится. Это может помочь спланировать, что сказать, а затем говорить целыми фразами или предложениями. Программное обеспечение для распознавания голоса может неправильно понимать некоторые произносимые слова и вставлять похожие по звучанию слова, поэтому может быть важно внимательно прочитать корректуру.
Несмотря на то, что программное обеспечение для распознавания голоса постоянно совершенствуется, частота ошибок все еще может быть довольно высокой.Если исправления вносятся с помощью программного обеспечения для распознавания голоса либо голосом, либо путем набора текста, оно может адаптироваться и учиться, так что, надеюсь, та же ошибка больше не повторится. При тщательной диктовке, исправлениях и настойчивости можно достичь очень высокого уровня точности.
Преобразование текста в речь
Некоторые приложения, в том числе Dragon Professional, , обеспечивают преобразование текста в речь (для прослушивания созданного текстового файла), а также воспроизведение звука речи (это означает, что два можно сравнить с тем, что на самом деле было сказано, с текстом, сгенерированным программным обеспечением).
Функция преобразования текста в речь особенно полезна для людей с нарушением зрения (которым трудно или невозможно прочитать любой текстовый файл) и для всех, кто страдает дислексией.
6. Какое программное обеспечение для распознавания голоса доступно?
Распознавание речи Windows
Microsoft Windows имеет встроенную программу распознавания голоса под названием Speech Recognition . В Windows 10 это позволяет пользователям управлять компьютером с помощью голосовых команд. Его можно настроить и использовать для таких вещей, как навигация, открытие и закрытие приложений и диктовка текста.Доступ к нему осуществляется через панель управления и «Удобство доступа». Microsoft рекомендует микрофоны для гарнитуры или массивы микрофонов. Это требует, чтобы пользователи прошли регистрацию. Кто угодно может использовать эту функцию. Он был разработан, чтобы помочь людям с ограниченными возможностями, которые не могут пользоваться мышью или клавиатурой.
www.windowscentral.com/how-set-speech-recognition-windows-10
Диктовка на Mac
Компьютеры Apple Mac под управлением OS X Mountain Lion, Mavericks или Yosemite также предоставляют бесплатное встроенное программное обеспечение для диктовки.Доступ к нему можно получить через панель «Диктовка и речь» в Системных настройках.
В более поздних версиях ОС El Capitaine (11) Sierra и High Sierra 12/13) Mojave (14) Диктовку можно настроить с помощью системных настроек, клавиатуры и опции для диктовки. Расширенная диктовка позволяет пользователю работать в автономном режиме.
В MacOS Sierra можно попросить Siri «включить диктовку». Это не то же самое, что встроенное программное обеспечение для диктовки, но Siri может создавать короткие текстовые сообщения и сообщения электронной почты.
В ОС после включения Mavericks «Расширенная диктовка» обеспечивает непрерывное распознавание речи и автономную обработку. Впоследствии Йосемити представил множество новых команд редактирования и форматирования. и возможность создавать дополнительные команды под диктовку. Все команды форматирования присутствуют в Мохаве.
support.apple.com/en-gb/HT202584
Google Speech Recognition
Google Speech Recognition использует другую архитектуру нейронной сети, которая была полностью перестроена.Это бесплатно, и Google продолжает работать над ним. Он не требует регистрации и считается «независимым от докладчика». Распознавание речи доступно на устройствах Android, в приложениях Google, таких как Keep, и в документах Google с помощью надстройки Speech Sound writer. Это не то же самое, что Google Ассистент.
Имеются некоторые ограниченные настройки и команды форматирования, а скорость распознавания высока в зависимости от качества оборудования и фонового шума.
cloud.google.com/text-to-speech/
efv-solutions.com / Speech-распознавание-звук-писатель-for-google-docs /
Dragon Individual Professional
Произведенный Nuance, Dragon Professional Individual — это лидирующее на рынке программное обеспечение для распознавания голоса для компьютеров Microsoft Windows. Nuance выпускает версию для мобильных устройств под названием Dragon Anywhere, доступную по подписке. Версия программного обеспечения и версия приложения несовместимы.
Nuance объявила в пресс-релизе от 22.10.2018, что они прекратили выпуск Dragon и любого программного обеспечения для распознавания голоса для Mac и больше не будут предоставлять обновления для них после этой даты.Пользователи Mac могут использовать программное обеспечение только с помощью учебного лагеря или виртуальной машины, такой как рабочий стол Parallels, и им также потребуется лицензия для операционной системы Windows.
Nuance утверждает, что их распознавание голоса Dragon работает в три раза быстрее, чем набор текста, и обеспечивает точность 99%.
Дракон в Windows можно настраивать. Его можно использовать в различных языковых версиях и с плагинами для предоставления специальных словарей, таких как медицинские, юридические, географические и инженерные.
Его можно использовать для надиктовки текста, его форматирования и исправления, а также для навигации по компьютеру, управления рабочими процессами и выполнения большинства функций. Существуют нативные приложения, в которых можно использовать все его функции. Есть около 3 и сторонних приложений, где это не работает.
Предлагаемые дополнительные функции важны для рабочего места и включают возможность:
- создавать электронные таблицы и презентации с использованием Excel и PowerPoint
- Предлагать транскрипцию из записей
- создавать собственные команды и сценарии для вставки часто используемого текста и автоматизировать повторяющиеся задачи.
Для получения дополнительной информации и приобретения программного обеспечения Dragon посетите сайт www.nuance.co.uk/dragon/index.htm
7. Что насчет планшетов и смартфонов?
Интеллектуальные персональные помощники — важная функция всех современных планшетов и смартфонов. Они используют технологию распознавания голоса и пользовательский интерфейс на естественном языке для предоставления ряда услуг. Некоторые из самых популярных персональных помощников включают:
- Siri — для устройств iOS (iPad и iPhone)
- Google Now — для устройств iOS, интегрированных в браузер для Android и Chromebook.
- Cortana — для устройств Windows.
- Alexa -Amazon Echo
Эти личные помощники предлагают аналогичные функции для решения повседневных задач — отвечать на голосовые команды и запросы для предоставления информации и ответов на запросы (через онлайн-источники), отправлять сообщения и электронные письма, совершать телефонные звонки, делать заметки, планировать встречи и слушать музыку.
8. Насколько важно обучение?
Обучение действительно полезно для пользователей, чтобы понять все преимущества работы с программами распознавания голоса.Чтобы получить максимальную отдачу от обучения, может быть полезно распределить его на несколько недель, что даст пользователю достаточную возможность практиковать новые навыки и закрепить полученные знания между формальными сеансами коучинга.
Обучение будет наиболее эффективным, если оно будет ориентировано на конкретные потребности человека с упором на его конкретные задачи и проблемы. Специальные словари можно получить с помощью плагинов или предоставив программе доступ к электронной почте и документам.
Широкий спектр частных и общественных организаций предлагает услуги компьютерного обучения.Информационный бюллетень AbilityNet на сайте Техническая помощь и учебные ресурсы содержит контактные данные многих организаций, которые проводят обучение и поддержку в области ИКТ для людей с ограниченными возможностями.
Apple предоставляет учебные пособия и рекомендации по настройке диктовки на Mac support.apple.com/en-gb/HT202584
Windows предоставляет учебные пособия по распознаванию голоса
support.microsoft.com/en-gb/help/17208/windows -10-use-распознавание речи
Nuance предоставляет обширные учебные материалы и поддержку для своих продуктов Dragon на сайте www.nuance.co.uk/support/dragon-naturallyspeaking/index.htm
Множество бесплатных учебных ресурсов также доступно в Интернете, в том числе на YouTube.
9. Полезные контакты
Программа преобразования текста в речь
Три очень хороших программы чтения с экрана (доступные как для ПК, так и для Mac), которые стоит рассмотреть:
Все эти программы по умеренной цене, с бесплатной версией NaturalReader также доступен.
Голосовой палец | Windows 10 | Полное автоматическое управление компьютером | Не предназначено для служб транскрипции | |
Dragon Home | Windows 7, 8.1, 10 | Возможность программирования пользовательских фраз для часто используемых команд | Требуется практика, чтобы привыкнуть к командам и их использованию | |
IBM Watson Speech to Text | Требуется API | Быстро и очень точно Простота использования Облачная версия | Проблемы с распознаванием и диктовкой нескольких голосов | |
Braina | Windows XP до 10, приложение работает на Android и iOS | Хороший многоцелевой инструмент | Дополнительные задачи- ориентирован, чем полезен для транскрипции длинного текста | |
Otter.ai | Android, iOS, Chrome, Safari, Firefox | Интегрируется с Zoom для расшифровки видеовстреч и расшифровки нескольких динамиков | Ограничения по времени для ежемесячного использования (максимум 600 минут аудиозаписи) | |
Расшифровка | Google Chrome на Windows, macOS и Linux | Распознает несколько языков с точной транскрипцией | На основе браузера, поэтому для использования требуется подключение к Интернету. приложения | Требуется тщательная корректура и программа обучения времени для понимания отраслевого языка |
Verbit | Требуется API | Рентабельность по сравнению с другими решениями с хорошим обслуживанием клиентов | Получение окончательной копии с исправлением ошибок может занять несколько дней текст результаты | |
Speechm atics | Windows | Способность понимать множество английских диалектов и акцентов | Имеет проблемы с пониманием бормотанной речи, что делает ее менее эффективной для людей с дефектами речи | |
Speechnotes | Браузер Chrome | На основе браузера, поэтому нет ничего интересного установить | Задержки в распознавании и транскрипции голоса для тех, кто быстро говорит | |
Голосовой ввод в Google Документах | Браузер Chrome | Хорошо работает с распознаванием голосов на фоне фонового шума | Требуется редактирование для добавления знаков препинания после расшифровки документа | |
SpeechTexter | Браузер Chrome | Поддерживает 60 языков | Пунктуация требует редактирования после расшифровки документа | |
Temi | Chrome, Safari | Принимает несколько типов файлов для загрузки предварительно записанных аудиофайлов, а также имеет как мобильное приложение 90 750 | Не работает с пониманием акцентов или отличием голосов от фонового шума | |
Gboard | Android | Включает функцию языкового перевода и снижает необходимость использования клавиатуры на сенсорном экране | Отложенная транскрипция и часто возникают проблемы с пониманием сленга или разговорные выражения | |
Just Press Record | iOS | Работает с Apple Watch и прост в использовании для записи заметок на ходу | Функции преобразования речи в текст не всегда точны, и пунктуация должна быть продиктована | |
SpeechTexter | Android | Подходит для быстрых заметок самому себе с помощью механизма преобразования голоса в текст от Google | Имеет тенденцию к сбою, а реклама может быть навязчивой | |
Голосовые заметки | Android | Работает быстро для записи идей и заметок с помощью интуитивно понятного интерфейса | Останавливает запись через короткое время часто задерживается при разговоре | |
ListNote Преобразование речи в текст | Android | Заметки, защищенные паролем для защиты важных документов с надежным распознаванием голоса | Рекламные объявления могут отвлекать и время от времени давать сбои |
Как управлять компьютером с Windows 10 с помощью голоса
В первые дни распознавания голоса вам повезло, что вы узнали половину своих слов, даже если вы говорили медленно, как робот.В наши дни на каждом смартфоне есть какой-то голосовой помощник, который может быстро делать за вас заметки или выполнять такие задачи, как открытие приложений.
Однако, если у вас есть компьютер с Windows 10, вы также можете управлять Windows 10 с помощью голоса. Это больше, чем просто крутая функция. Это может стать настоящим стимулом для повышения производительности, а для людей с ограниченными возможностями — эффективным способом взять под контроль свой компьютер.
Контроль против диктовки
Вы хотите управлять Windows 10 с помощью голоса или просто хотите, чтобы он записывал то, что вы говорите? Голосовое управление — это функция, отличная от диктовки, и некоторые пользователи часто путают эти две концепции.Если все, что вам нужно, это просто говорить, а компьютер записывает то, что вы говорите, вам не нужно прилагать все усилия, чтобы настроить распознавание речи.
Например, в Google Docs есть отличная функция голосового диктовки, которая использует возможности облака для преобразования вашей речи в текст. Если вы пользователь macOS, вы даже можете использовать встроенную систему Apple.
Эта статья о голосовом управлении, а не о диктовке голоса. Другими словами, мы хотим использовать Windows и выполнять общие задачи без использования клавиатуры или мыши.
Выбор правильного микрофона
Если вы хотите управлять Windows 10 с помощью голоса, вам нужно дать компьютеру возможность слышать вас. Если вы используете ноутбук или настольную веб-камеру, у вас уже есть базовый микрофон под рукой, но он не всегда подходит для распознавания голоса.
Поскольку у вас уже есть эти микрофоны, не помешает попробовать голосовое управление с ними, но микрофон лучшего класса, несомненно, улучшит ситуацию.Здесь мы используем микрофон Samson Go.
Указывает Windows, какой микрофон использовать
Прежде чем вы сможете отдавать приказы своему компьютеру, вам необходимо указать, какой микрофон он должен использовать. Поскольку Windows поддерживает несколько микрофонов одновременно, иногда она может выбрать один из них по умолчанию, который не является оптимальным для голосового управления.
Подключив микрофон (если это внешний микрофон), довольно легко выбрать его в качестве активного записывающего устройства.Просто щелкните правой кнопкой мыши значок динамика на панели задач.
Затем нажмите Открыть настройки звука .
В появившемся окне в раскрывающемся списке в разделе «Вход» выберите микрофон, который должна использовать система.
Настройка распознавания речи
Чтобы запустить процесс активации распознавания речи на компьютере с Windows 10, откройте меню «Пуск» и введите Распознавание речи . Затем откройте его.
В появившемся новом окне щелкните Начать распознавание речи .Вы можете получить всплывающее окно с предупреждением о том, что распознавание речи оптимизировано для говорящих на английском языке в США. Просто нажмите ОК, чтобы закрыть это.
Затем вы увидите этот мастер, который проведет вас через процесс установки.
Затем вам нужно выбрать, какой тип микрофона вы используете. Мы используем микрофон Samson Go, который устанавливается на рабочем столе (или прикрепляется к экрану), поэтому мы выберем настольный микрофон .
На следующем экране вы узнаете, как настроить микрофон.Он отличается для каждого типа микрофона, поэтому мы не будем показывать это здесь.
Теперь прочтите образец текста, который поможет Windows откалибровать ваш микрофон.
Если компьютер вас понимает достаточно хорошо, вы можете нажать «Далее».
Теперь вы увидите параметр, позволяющий Windows читать ваши документы, чтобы получить представление о вашем словарном запасе и выражениях. Вам решать, хотите ли вы это сделать. Если у вас есть документы с нерелевантным содержанием или у вас есть проблемы с конфиденциальностью, не стесняйтесь отключать это.
Хорошо, мы почти закончили. Теперь все, что вам нужно сделать, это выбрать режим активации.
По сути, вам нужно решить, хотите ли вы, чтобы распознавание речи включалось путем произнесения ключевого слова, что означает, что он всегда слушает, или с помощью сочетания клавиш.
Теперь у вас есть возможность распечатать справочную карточку с общими командами.
Честно говоря, большинству людей это не понадобится, так как вы всегда можете найти команды, когда вам нужно, но если вы готовите компьютер для пользователя с ограниченными возможностями или менее технически подкованного пользователя, это удобно, чтобы распечатать и разместить возле компьютера для справки.
Наконец, после выбора, запускать ли распознавание речи при запуске, вам предоставляется возможность пройти обучение. Если нет, то стоит! Для тех, кто прошел через руководство, просто пропустите его.
Когда работает распознавание речи, вы увидите это на экране.
Активируйте распознавание речи, используя выбранный вами метод активации, хотя Windows Key + Ctrl все равно будет работать как переключатель. В качестве теста просто произнесите Start Menu с включенным индикатором прослушивания.Меню «Пуск» должно появиться немедленно. Обратитесь к официальной справочной карточке для получения дополнительных команд.
Что теперь?
После завершения базовой настройки вы почти готовы управлять своим компьютером, используя только свой голос. Однако вы можете захотеть больше обучить Windows, чтобы распознавание голоса стало более точным. Приложение для обучения вы найдете в настройках распознавания речи, которые вы впервые использовали для настройки распознавания голоса.
Чем больше образцов голоса будет в WIndows, тем лучше будет работать система.При этом, если вы получаете много пропущенных или неправильно услышанных команд, потратьте несколько минут на то, чтобы обучить свою систему распознавания голоса.
Кортана и сторонние компоненты
Приятно, что Windows 10 поставляется со встроенным приложением для распознавания речи для управления Windows 10 с помощью голоса, но есть ли лучшая альтернатива? Правда в том, что управление речью на настольных компьютерах — довольно нишевая область. Его часто относят к специальным возможностям. Так что сторонних вариантов не так уж и много.
Интересно, что в Windows 10 есть полностью отдельная система голосовой активации в виде Кортаны. В качестве голосового помощника Кортана не предназначена для голосовой замены клавиатуры и мыши, но между этими двумя системами есть много общего. Посмотрите, на что способна Кортана, возможно, она лучше подходит для ваших конкретных нужд, чем универсальная система распознавания речи.
Что касается голосового управления от сторонних производителей, то здесь мало чего интересного.Самым популярным на данный момент является приложение «Распознавание речи дракона» от Nuance.
Добавить комментарий