Распознавание речи: размышления о его сильных и слабых сторонах

Должен признаться, что я давно не пользовался никаким распознаванием речи(speech recognition) , когда меня попросили пройти обучение. Последний раз, когда я пробовал распознавание речи(speech recognition) , это было с Dragon Dictate , который был новым, когда Windows 98 также была новой. Давным-давно, в компьютерные годы!

Я был счастлив заняться этой темой, потому что мне было очень интересно посмотреть, как улучшилось распознавание речи. И мальчик, он улучшился! Даже базовое встроенное приложение, подобное этому, работало на удивление хорошо «прямо из коробки». В этой заключительной статье о распознавании речи(Speech Recognition) я хотел бы рассказать о том, что я узнал, заново познакомившись с чудесами распознавания речи(speech recognition) , и о том, что я буду делать дальше.

Еще не готов к «Звездному пути»

Я уверен, что многие из нас видели, как экипаж космического корабля « Энтерпрайз(Starship Enterprise) » произносил "Computer!"и получить немедленный ответ. У нас пока нет компьютеров Звездного Флота(Starfleet) , но, начиная с Windows Vista и заканчивая Windows 7 , у нас есть компьютеры, которые слушают нас и реагируют на то, что мы им говорим, — и отвечают нам, если «Что это было?» ("What was that?")считается ответом.

Распознавание речи

У меня действительно были проблемы, когда я впервые попытался использовать распознавание речи(Speech Recognition) , и устранение неполадок было не особенно простым. Файлы справки не всегда достаточно полезны. Мне удалось найти ответы на веб- сайте (web site)Microsoft и на множестве интернет-форумов без особого труда. Вот как я узнал, что забыл, что моя веб-камера (сидящая прямо передо мной поверх моего монитора и прямо в соответствии с тем, как я говорю) также имела активный микрофон и добавляла путаницы. Как только я это исправил, с тех пор все стало довольно гладко.

Я даже пытался говорить с разными акцентами ( например, с британским акцентом BBC и американским жлобом(BBC British and American redneck) ) и смог получить достаточно хорошее признание, учитывая различия в стандартном американском произношении. Конечно, говоря: "Friends, Romans, countrymen, lend me your ears!"в то время как мои самые лучшие впечатления от Хелен Миррен и Джеффа Фоксворти(Helen Mirren and Jeff Foxworthy) заставили меня слишком много смеяться, чтобы получить абсолютно точные результаты.

Распознавание языка

Распознавание речи(Speech Recognition) можно использовать с разными языками, и я подумал, что могу попробовать его с моим ограниченным, американским(American) акцентом, испанским(Spanish) , немецким и французским(German and French) , но, к сожалению, вы не можете использовать другие языки, если ваша операционная система(operating system) также не поддерживает этот язык. Вы можете изменить язык своей операционной системы(operating system) , установив другой языковой пакет(language pack) от Microsoft , но сделать это можно только в том случае, если вы используете Windows 7 Ultimate или Windows 7 Enterprise.

Распознавание речи

Распознавание речи(Speech Recognition) доступно для английского ( США(US English) ), английского ( Великобритания(UK English) ), французского(French) , испанского(Spanish) , немецкого(German) , японского(Japanese) , китайского ( традиционное письмо) и китайского (упрощенное письмо(Traditional Chinese and Simplified Chinese) ) и будет найдено в версиях Windows 7 для этих языков (всех версиях). Мне было жаль, что я не смог попробовать это. Я понятия не имею, что будет с Windows 8 , но я думаю, что возможность установки других языковых пакетов была бы хорошим дополнением к аналогам Windows 8 для (Windows 8)Windows 7 Professional и выше.

Что хорошо работает

Как я уже упоминал, распознавание речи(Speech Recognition) лучше всего работает с другим программным обеспечением Microsoft(Microsoft software) . Пока я экспериментировал с продуктами Microsoft , я был очень успешен (хотя, как и следовало ожидать, использование Microsoft Office Excel было ограниченным и сложным). С другим программным обеспечением это было ударом или промахом. Я мог довольно хорошо пользоваться браузером Google Chrome (определенно не так хорошо, как (Google Chrome)Internet Explorer ) и моей почтовой программой (antique software)Eudora , которая к настоящему времени уже устарела. Стоит поэкспериментировать с вашим любимым программным обеспечением, чтобы увидеть, на что вы способны. Команда «показать числа» была особенно полезна при выборе элементов и команд.

Я также обнаружил, что не потребовалось много времени, чтобы точность распознавания заметно улучшилась. Я дважды прошел тренировочные упражнения, и после этого распознавание было почти на 100 % correct . Я стал говорить немного быстрее и делать меньше пауз, чтобы программа не отставала. Мне очень понравилось смотреть, как мой голос транслируется в слова на экране. Мой ранний опыт работы с программным обеспечением для распознавания речи(speech recognition software) был далеко не таким приятным.

Распознавание речи

Что плохо работает

Как я уже упоминал, некоторые программы просто несовместимы с распознаванием речи(Speech Recognition) . Я даже не мог открыть Adobe Reader или версию TweetDeck для (TweetDeck)Adobe AIR . Я обнаружил, что не могу войти в свою учетную запись Google(Google account) с помощью Internet Explorer , чтобы попробовать Google Docs — похоже, не было возможности произнести или написать мой пароль по буквам. Я подозреваю, что это проблема безопасности(security issue) , не позволяющая произносить пароли вслух там, где их может услышать кто-то другой, но это раздражало.

Я мог открыть iTunes и выбрать песню для воспроизведения, но не мог заставить ее играть. Я мог открыть Scrivener (мой любимый текстовый процессор), но «Показать числа»("Show numbers") не накладывал числа ни на что, что я хотел использовать. Я не проводил каких-либо серьезных экспериментов с моим любимым программным обеспечением — это лишь некоторые из тех, которые я пробовал. Всем, кто хочет использовать распознавание речи(Speech Recognition) , было бы полезно протестировать программы, с которыми они хотят его использовать, чтобы убедиться, что они будут совместимы.

Дополнительные ссылки и ресурсы

Если вы еще не видели предыдущие статьи, вы можете найти их здесь:

  • Работа с распознаванием речи(Speech Recognition) : установка и настройка(Setup and Configuration)
  • Работа с распознаванием речи(Speech Recognition) : команды, диктовка текста и просмотр (Dictating Text & Browsing)веб(Web) - страниц
  • Устранение распространенных проблем с распознаванием речи(Common Speech Recognition Problems)

Как ни странно, почти невозможно найти какую-либо информацию о распознавании речи(Speech Recognition) на веб-сайте (web site)Microsoft Answers , не щелкнув ссылку из поиска Google или Bing(Google or Bing search) . Мне вообще не удалось получить ответы, введя в поле поиска (search box)«Распознавание речи»("Speech Recognition") , хотя на форумах есть несколько вопросов по этому поводу. Воспользуйтесь этой ссылкой, чтобы получить справку по распознаванию речи(Speech Recognition) на веб-сайте Windows: результаты поиска по распознаванию речи(Speech Recognition search results) .

Вот краткая статья в Википедии(Wikipedia article) , в которой рассказывается об истории распознавания речи(speech recognition) в Microsoft : Распознавание речи Windows(Windows Speech Recognition) .

Вот запись в блоге(blog entry) , в которой изложены мысли автора о сравнении распознавания речи(Speech Recognition) с Dragon Naturally Speaking : Dragon NaturallySpeaking по сравнению с распознаванием голоса в Windows 7(Dragon NaturallySpeaking Versus Windows 7 Voice Recognition) .

Завершение

Мне очень понравилось работать с распознаванием речи(Speech Recognition) , и я восхищался улучшениями, которые были сделаны с течением времени. Этого, безусловно, будет достаточно для повседневного использования(everyday use) , особенно с продуктами Microsoft .

Буду ли я продолжать использовать распознавание речи(Speech Recognition) ? Да, когда я могу. На данный момент мне не нужно ничего более сложного. Это стоило того времени, которое потребовалось, чтобы обучить его и научиться правильно его использовать.



About the author

Я инженер-программист с более чем 10-летним опытом работы в индустрии Xbox. Я специализируюсь на разработке игр и тестировании безопасности. Я также являюсь опытным обозревателем и работал над проектами для некоторых из самых известных игровых компаний, включая Ubisoft, Microsoft и Sony. В свободное время я люблю играть в видеоигры и смотреть сериалы.



Related posts