Математическое обеспечение систем и устройств с речевым вводом информации

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Разработана структура системы автоматического распознавания речи, основанная на бионическом принципе и использующая сегментно-целостный анализ произнесения с учетом просодических характеристик. Система учитывает: наличие параллельных путей анализа речевого сообщениявзаимодействие этих путей на любом этапе распознавания — обработку речевого сообщения не только «снизувверх», но и «сверху — вниз… Читать ещё >

Содержание

ГЛАВА I. Проблема организации речевого ввода в диалоговых системах
- 1. 1. Общее состояние проблемы
- 1. 2. Современные системы автоматического распознавания речи и особенности их эксплуатации
- 1. 3. Основные принципы построения систем автоматического распознавания речи
- 1. 4. Анализ известных методов построения матобеспечения распознающих систем
- 1. 5. Принципы построения тестов для проверки и диагностики систем и устройств распознавания речи

Математическое обеспечение систем и устройств с речевым вводом информации (реферат, курсовая, диплом, контрольная)

Разработка систем автоматического распознавания и синтеза речи является в настоящее время одним из основных направлений развития средств автоматизации. Такие системы позволяют повысить эффективность технического обслуживания различных систем в народном хозяйстве и допустить широкий круг пользователей, не обладающих специальной подготовкой, к эксплуатации сложных технических комплексов, в частности, вычислительных машин.

Диапазон потенциального практического использования устройств, воспринимающих речевые команды и выдающих информацию или управляющие сигналы голосом, необычайно широк [бЗ, 59, 66, 74, 105, 130] .

Широта возможных практических применений таких устройств определяется рядом специфических свойств речевого способа передачи информации Ы :

— речь является для человека естественным способом обмена информацией, не требует специального обучения, относительно устойчива к изменению психофизиологического состояния оператора ;

— речевой обмен информацией и речевое управление оставляют свободными глаза и руки, которые зачастую оказываются перегруженными в процессе практической деятельности ;

— речевой обмен информацией и речевое управление возможны в условиях пониженной (или нулевой) освещенности и при физических перегрузках ;

— для речевого управления и обмена информацией возможно использование стандартных каналов связи и стандартного периферийного оборудования.

Кроме того, системы распознавания речи могут работать от голоса конкретного пользователя («санкционированный» доступ к органам управления), а также от речи, генерируемой в условиях искусственнои дыхательной среды (например, «гелиевая речь»).

С перечисленных выше позиций разработка практических устройств распознавания речевых сигналов, включающая в себя математическое и программное обеспечение всех блоков этих устройств, является актуальной задачей, важной как с научной, так и с прикладной точек зрения.

Несмотря на очевидные преимущества систем автоматического распознавания речи и многолетние исследования в этой области, достигнутые успехи пока недостаточны. Связано это с чрезвычайной сложностью структуры речевого сигнала. Во-первых, элементы речевого потока весьма изменчивы, что определяется индивидуальными особенностями говорящего, его психофизиологическим состоянием, контекстом и просто мгновенно сложившейся артикуляторно-акустической ситуацией. Во-вторых, при общении человека с человеком речь включена в широкий неречевой контекст и чаще всего предполагает контрольный ответ (диалог). Система же автоматического распознавания речи имеет дело только с этим сообщением и редуцированность сигнала становится труднопреодолимой [24] .

Наиболее широкое развитие и применение нашли способы автоматического распознавания речи, основанные на использовании точных математических методов при сравнении входных и эталонных реализаций, которые рассматривают речевой сигнал, ке учитывая его биологическую природу, выражающуюся в неопределенности описания и многовариантности сигнала, отражающего не только смысл сказанного, но и эмоции говорящего, его индивидуальность и т. д. Это делает системы, основанные на отношении к речевому сигналу, несущему одно смысловое содержание, очень зависящими от диктора и условий, в которых он находится при произнесении высказывания. Большинство современных реальных промышленных систем не учитывают природу речи из-за трудностей ее моделирования. В отличие от более общего математического направления исследований в настоящей работе предлагается бионический подход, базирующийся на изучении основных закономерностей речевосприятия. Такой подход позволяет создавать системы, наиболее полно учитывающие способности человеческого мышления к восприятию реальных речевых сигналов.

Системы автоматического распознавания речи — это в первую очередь программные системы, которые должны работать в реальных условиях (в акустических шумах помещения, с множеством дикторов, не являющихся профессиональными пользователями вычислительных машин и т. д.). Реальные условия накладывают свои требования на системы речевого ввода и на их математическое обеспечение. Кроме того, современные системы распознавания должны быть экономичными с точки зрения памяти и вычислительных ресурсов. Вследствие этого актуальной проблемой построения таких систем является выбор модели распознавания, для которой развивается матобеспечение, связанной с выбором алгоритмов отдельных этапов дешифрации речи.

Цель данной работы — разработать специализированное программное обеспечение для систем и устройств с речевым вводом информации, обеспечивающим работу этих устройств в условиях акустических помех и искажений, характерных для практических задач. Ставилась задача совместить достоинства бионической модели процесса восприятия речи человеком и модели, на которой основываются большинство современных практических систем распознавания речи, не обладающих достаточной для применения в реальной практике устойчивостью.

Для решения этих задач было необходимо:

— определить архитектуру системы распознавания речевого сигнала, реализующей бионический подход к распознаванию речевого сообщения ;

— проанализировать старые и разработать новые методики и алгоритмы анализа и распознавания речи (включая оптимизацию признаков первичного описания) ;

— разработать математическое и программное обеспечение систем и устройств, работающих в реальных условиях ;

— экспериментально проверить работу предложенных алгоритмов и программ.

В диссертации, посвященной разработке специализированного матобеспечения речевого ввода информации, рассматриваются следующие вопросы:

— исследуется общая структура блоков речевого ввода в диалоговых системах ;

— анализируются методы и алгоритмы первичной обработки речи и методики автоматического распознавания речевых сигналов ;

— формулируются принципы построения тестов для проверки и диагностики систем и устройств распознавания речи ;

— предлагается бионический подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными статистическими методами обработки речевого сигнала учитывает основные принципы восприятия речи человеком ;

— разрабатывается матобеспечение для систем автоматического распознавания речи, основанной на бионическом принципе ;

— оптимизируется система различительных признаков речевого сигнала ;

— выбираются оптимальные параметры алгоритма нелинейного сравнения входной речевой реализации и эталонных произнесений ;

— разрабатывается специализированное матобеспечение для систем распознавания речевых образов, ориентированных на произвольного диктора ;

— предлагается модель системы автоматического распознавания изолированных слов на ЭВМ типа ЕС, основанная на бионическом принципе, позволяющая проводить сквозные эксперименты по выбору оптимальных параметров распознающей системы;

— проведена проверка работы системы в шумах ;

— предлагается матобеспечение для автоматического телефонного номеронабирателя, работающего с голоса произвольного диктора ;

— разрабатывается специализированное матобеспечение для обработки искаженных гелиевой средой сигналов для осуществления связи с акванавтами ;

— разрабатывается матобеспечение для диалоговой системы анализа речевых сигналов.

Общая методика проведения исследований в данной работе направлена на поиск оптимальных алгоритмов отдельных блоков матобеспечения речевого ввода и предусматривает:

— использование результатов биологических, психологических, психолингвистических исследований процесса восприятия речи человеком ;

— использование статистических методов обработки информации ;

— использование спектральных методов для анализа речевого сигнала ;

— использование метода динамического программирования для решения задач распознавания речевых образов;

— применение методов кластерного анализа для формирования эталонных реализаций речевых сигналов ;

— использование методов теории алгоритмов и организации банков данных для представления знаний в памяти ЭВМ.

Научная новизна работы заключается:

— в разработке и программной реализации новых алгоритмов анализа и распознавания речевых сигналов для систем, работающих в сложных условиях ;

— в оптимизации параметрического представления речевых сигналов для систем с речевым вводом информации ;

— в выборе оптимального варианта процедуры нелинейной деформации масштаба времени при сравнении распознаваемого и эталонного речевых сигналов методом динамического программирования ;

— в разработке специализированного математического и программного обеспечения для систем автоматического телефонного номеронабирателя, работающего от голоса произвольного диктора;

— в разработке матобеспечения для системы связи с акванавтами, находящимися в гелиево-кислородной дыхательной среде ;

— в разработке математического и программного обеспечения диалоговой системы анализа акустических сигналов с речевым запросом информации ;

— в формировании тестов для проверки и диагностики систем автоматического распознавания речи с целью исследования их применимости в сложных условиях.

Практическая ценность работы, подтвержденная актами использования результатов диссертации, определяется тем, что разработанные методики, алгоритмы и программы используются в конкретных системах и устройствах автоматического распознавания речи и в отдельных узлах таких систем, работающих, как правило, в сложных условиях (в шумах производственного помещения, в гелиевой среде, в телефонном канале).

Диссертация состоит из введения, четырех глав и заключения.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ.

В работе получены следующие основные результаты:

— предложен подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными методами анализа речевого сигнала учитывает некоторые принципы восприятия речи человеком;

— разработана структура системы автоматического распознавания речи, основанная на бионическом принципе и использующая сегментно-целостный анализ произнесения с учетом просодических характеристик. Система учитывает: наличие параллельных путей анализа речевого сообщениявзаимодействие этих путей на любом этапе распознавания — обработку речевого сообщения не только «снизувверх», но и «сверху — вниз», т. е. возможность генерации системой гипотезы о классе входного сигнала и сравнении гипотезы с входным сигналом ;

— разработано математическое и программное обеспечение для основных блоков этой системы ;

— сформулированы основные принципы построения тестов для проверки и диагностики систем автоматического распознавания речи и разработан вариант конкретного теста ;

— исследованы и выбраны оптимальные параметры анализа и обработки речевого сигнала в системах распознавания речи ;

— разработано специализированное матобеспечение для системы распознавания, ориентированное на голосовой набор номера телефона и работающей с произвольным диктором, которое при тестировании на 30 дикторах обеспечило надежность распознавания семизначного номера телефона>96 $;

— разработано матобеспечение для автоматического распознавания слов, произносимых в нестандартных атмосферах с надежностыо"-92 $ ;

— разработано матобеспечение автоматического речевого ввода информации для использования в диалоговой системе анализа сигналов: словарный запас рабочего языка — 176 слов, максимальный коэффициент ветвления — 37. Акустический анализ речевого сообщения в системе обеспечивает 97 $ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

Полученные в работе результаты позволяют сделать следующие выводы:

1. Использование речевого ввода в системах и устройствах — одно из эффективных средств развития автоматизации производственных процессов.

2. Предложенная в работе архитектура системы автоматического распознавания речевого сообщения позволяет решать задачи речевого ввода информации в системы и устройства более эффективно: с большей надежностью и с минимальными затратами по времени принятия решения.

3. Сформулированные принципы построения тестового материала и требования к тестам для систем APP. позволят разработать целую систему тестов для проверки и диагностики рече-распознающих систем. Предложенный конкретный вариант теста используется в настоящее время во многих организациях.

Предложенная архитектура системы АРР и разработанное матобеспечение отдельных блоков могут использоваться при решении разнообразных практических задач.

5. Проведенная оптимизация информативных признаков речевого сигнала позволила выделить надежную и удобную в практическом использовании и аппаратурной реализации систему параметров, обеспечивающую точность распознавания изолированных слов на словаре из 80 слов, близкую к 100 $.

6. Выбранный алгоритм нелинейного по времени сравнения эталонной и входной реализаций речевого сигнала обеспечивает на выбранном первичном описании высокую надежность распознающей системы.

7. Разработанная модель системы АРР на ЭВМ ЕС 1033, основанная на бионическом подходе к процессу распознавания речевого сообщения и использующая сегментно-целостный анализ произнесения с включением просодических характеристик, позволяет проводить сквозные эксперименты со сменными блоками выделения признаков и сменными блоками принятия решения и обучения системы и используется для дальнейших речевых исследований.

Заключение

1. Разработанное матобеспечение для модели неадаптивного микропроцессорного устройства распознавания, ориентированное на голосовой набор номера телефона, обеспечивает надежность распознавания семизначного номера телефона > 96 $.

2. Разработано матобеспечение для распознавания слов, произносимых в нестандартных атмосферах. Точность распознавания для 15 слов составила в среднем 92 $, в то время как слуховая разборчивость <30 $.

3. Разработано матобеспечение автоматического речевого запроса для использования в диалоговой системе анализа сигналов. Словарь — 176 слов, максимальный коэффициент ветвления -37. Акустический анализ речевого сообщения в системе обеспечивает 97 $ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

— 157 ;

Показать весь текст

Список литературы

Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП.- Киев-Одесса, 1982, с. 556.
Альдефельд Б., Рабинер Л. Р., Розенберг Э. Э., Уилтон Д. Г. Автоматическая справочно-поисковая система, основанная на распознавании изолированных слов. В сб.: ТИИЭР, 1980, т.68, № II, с.7−25.
Амирезашвили Н.З., Чикоидзе Г. Б. Анализ данных в речевых командах. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.500−502.
Беллман Р. Динамическое программирование. М., ИЛ, i960, 400 с.
Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М., Наука, 1969, 183 с.
Бондарко Л.В., Загоруйко Н. Г., Кожевников В. А., Молчанов А. П., Чистович Л. А. Модель восприятия речи человеком.- Новосибирск, 1968, 48 с.
Брановицкий В.И., Довгялло A.B. Диалог человека и ЭВМ: основные понятия и определения. В сб.: Управляющие системы и машины. — Киевт 1978, К 4, с.28−35.
Васильев A.B., Кринов С. Н., Савельев В. П., Цемель Г. И., Чижков В. М. Распознавание чисел от нуля до 100. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI.- Ереван, 1980, с.269−273.'
Великовский А.Е. Современные устройства распознавания речи. Обзор В сб.: Радиоэлектроника за рубежом, 1983, № 23, с.1−31.
Величко Б.М., Загоруйко Н. Г. Автоматическое распознавание ограниченного набора устных команд. В сб.: Вычислительные системы. — Новосибирск, 1969, вып.36, с.101−110.
Величко В.М., Загоруйко Н. Г. Распознавание больших словарей. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 8-го Всесоюзного семинара АРСО-УШ. -Львов, 1974, с.9−13.
Величко В.М., Загоруйко Н. Г. Система распознавания речевых команд. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.173−176.
Винцюк Т.К. О математических моделях речевого сигнала, используемых в распознавании речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.34−38.
Винцюк Т.К. Перспективы практического использования систем речевого диалога. 'Гам же, с.38−40.
Винцюк Т.К., Гринчук В. М., Калмыков В. Г. Автоматизированное рабочее место (АРМ) конструктора, использующее систему речевого диалога СРД «Речь-Г1. Там же, с.512−516.
Винцюк Т.К., Куляс А. И., Людовик Е. К., Шинкаж А. Г. Эксперименты с кооперативной системой распознавания речи. -Там же, с.298−300.
Винцюк Т.К., Лобанов Б. М., Шинкаж А. Г. Система распознавания речи и система устного диалога СРД «Речь-I» на основе микро-ЭВМ. Там же, с.516−521.
Винцюк Т.К., Шинкаж А. Г. Распознавание 1000 слов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с. 180.
Галунов В.И., Акустическая коммуникация, речь и передача смысловой информации. В сб.: Звуковая коммуникация, эхолокация и слух. — Д., ЛГУ, 1980, с.22−37.
Галунов В.И. Бионическая модель системы распознавания речи. В сб.: Исследование моделей речеобразования и речевосприятия. — Л., 1981, с.36−52.
Галунов В.И. Язык и системы автоматического понимания речи. В сб.: Восприятие языкового значения. — Калининград, Калининградский государственный университет, 1980, с.10−21.
Галунов В.И., Гарбарук В. И. Факторный анализ спектрального представления речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 13-го Всесоюзного семинара АРС0-ХШ. — Новосибирск, 1984, с.66−67.
Галунов В.И., Орлова М. И. Архитектура диалоговой системы, построенной на основе модели восприятия речи человеком. -Там же, с.16−18.
Галунов В.И., Орлова 14.И., Шнейдер В. К1. Экспериментальные исследования системы автоматического распознавания слитной речи. Тезисы докладов IX Всесоюзной акустической конференции. М., 1977, с.65−66.
Галунов В.И., Коваль С. Л., Тампель И. Б., Проблемы акустической теории речеобразования. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. — М., АН СССР, 1981, с.60−75.
Галунов В.И., Орлова М. И., Ягунова H.H. Использование метода динамического программирования при распознавании речевых образов. В сб.: Техника средств связи, серия ТПС, вып, 3(2). М., 1981, с.114−122.
Галунов В.К., Сомин Н. В., Тарасов А. И., Трунин-Донской Б.Н., Якушенков Г. Л. Спектральные методы выделения основного тона. В сб.: Вопросы кибернетики. — М., Наука, 1976, с.28−38.
Галунов В.И., Орлова М. И., Щукин В. Г. Разработка тестов для систем автоматического распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.305−307.
Гельфанд С.А. Слух. Введение в психологическую и физиологическую акустику. М., Медицина, 1984, 350 с.
Григорян П.А., Григорян H.A., Лазарян Л. М. Сегментация речевых сигналов. В кн.: Автоматическое распознавание речевых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. — Ереван, 1980, с.95−101.
Демков М.Г. Об унификации методики испытаний устройств распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.472−474.
Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. М., Мир, 1972, 288 с.
Дюран Б., Оделл П. Кластерный анализ. Пер. с англ. Деми-денко. М., Статистика, 1977, 128 с.
Емельянов В.Н., Трунин-Донекой В.Н. Современное состояние отечественных разработок в области автоматического распознавания и синтеза речи. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. — М-, 1. АН СССР, 1981, с.3−17.
Занченко Ю.А. Система распознавания ограниченного набора слов в условиях сильного внешнего шума. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. — Тбилиси, 1978, с.205−207.
Зиновьева Н.В., Захаров J1.M., Ампилова Б. В. Методика чтения «слепых» сонограмм. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.351−354.
Кельманов A.B. Экспериментальное исследование 18 систем первичного описания речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. — Ереван, 1980, с.112−113.
Кельманов A.B. О выборе числа и границ спектральных полос при распознавании речевых сигналов. Там же, с.313−315.
Кельманов A.B. Сравнительное исследование двух алгоритмов динамического программирования. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев-Одесса, 1982, с.474−476.
Коваль С Л — Речевая связь при глубоководных погружениях. -В сб.: Техника средств связи, серия ТИС. — М., вып.9, 1976, с.88−112.
Кольцова A.A. Расширение библиотеки процедур системы ГРАФ*. В сб.: Техническая кибернетика, № 5. — М., 1978.
Копейкин А.Б. Исследование структур и вычислительных процессов в системе ввода устных команд, построенных с использованием микро-ЭВМ. Автореферат.. кандидата технических наук. М., 1980, 22 с.
Кринов С.Н., Цемель Г. И. Сегментация речевых сигналов.
В сб.: Речевое общение в автоматизированных системах. М., Наука, 1975.
Кулагин М.В., Пажитнов А. Л. Ввод и обработка акустического сигнала на микро-ЭВМ «Электроника-бО». В кн.: Автоматическое распознавание слуховых образов. Тезисы докладови сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев1. Одесса, 1982, с.180−181.
Лебедев Б.Г. Кривые маскировки в распознавании речевых сигналов. 3 кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ц-го Всесоюзного семинара АРС0-Х1. — Ереван, 1980, с.381−382.
Лебосс Б. Промышленность осваивает системы синтеза и распознавания речи. Электроника, 1980, № 12, с.79−89.
Мазур В.Н., Марчук Д. С., Сапелюк Б. М. Элементы речевого управления в подсистеме АСУП на базе мини-ЗВМ. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. -Ереван, 1980, с.336−332.
Макхол Дж. Линейное предсказание. Обзор. В сб.: ТИИЭР, № 4, т.63, 1975, с.20−44.
Маркел Дж.Д., Грей А. Х. Линейное предсказание речи. Пер. с англ. М., Связь, 1980, 308 с.
Мартин Т. Практическое применение речевого ввода в вычислительную машину. В сб.: ТИИЭР, № 4, т.64, 1976, с.80−95.
Методы автоматического распознавания речи. В 2-х книгах, под редакцией У.Ли. Пер. с англ. М., Мир, 1983, 716 с.
Мясников Л.Л. Объективное распознавание звуков речи. дТг, 1943, К 3, с.12−25.
Нефф р. Внедрение систем распознавания речи в Японии. -Электроника. -, ь, Мир, 1982, т.5, № 3, с.89−91.
Орлова М.И. Бионическая модель системы автоматического распознавания речи. В сб.: Техника средств связи, серия ТПС, вып.12(45), — М., 1979, с.108−112.
Орлова М.И. Модель распознавания речевых образов, построенная на бионическом принципе. В кн.: Модели речевого процесса в норме и патологии. Тезисы докладов Всесоюзного симпозиума. Гродно, 1979, с. 24.
Паташюс Ю.В. Система распознавания слов на базе ЭВМ «Злект-роника-60». В кн.: «Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.324−326.
Петров Г. М., Аврин С. Б., Копейкин А. Б., Малыгина Т. М., Москаленко Г. В. Система ввода речевых сигналов для ЭВМ. -Там же, с.280−283.
Плотников В.Н., Суханов В. А., Кузнецов C.B., Белинский A.B. Индивидуальный канал речевого диалогового управления.
В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.539−542.
Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов симпозиума. -Ji., 1983, 43 с.
Рабинер JI., Гоулд Б. Теория и применение цифровой обработки сигналов. Пер. с англ. т., Мир, 1978, 848 с.
Рабинер Ji., Шафер Р. Цифровая обработка речевых сигналов. Пер. с англ. М., Радио и связь, 1981, 496 с.
Редди Д.Р. Машинное распознавание речи. Обзор. В сб.: ТИИЭР, I 4, т.64, 1976, с.95−130.
Речевая связь с машинами. Тематический выпуск. Сб. ТИИЭР, № 4, т.64, 1976, 182 с.
Рамишвили Г. С., Сердюков В. Д. Комплексная система автоматического распознавания речевых сигналов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. — Тбилиси, 1978, с.229−231.
Сапожков М.А., Михайлов В. Г. Бокодерная связь. Ц., Радио и связь, 1983, 248 с.
Серединский А., Ванде-Кирков В.А., Буздалина И. А., Окунев И. В., Орлова М. И., Солонина А. И. Применение рекурентных сплайнов для обработки видео- и речевых сигналов. -Электросвязь. 1982, № с, с.60−64.
Система распознавания связной речи фирмы NEC. Зарубежная радиоэлектроника, № 4, 1980, с.108−120.
Слуцкер Г. С. Нелинейный метод анализа речевых сигналов. -В кн.: Труды НИИРадио, 1968, № 2, с.28−34.
Спрингер С., Дейч Г. Левый мозг, правый мозг. М., Мир, 1983, 256 с.
СомиН Н. В. Пакет прикладных программ для исследованияречевых сигналов. В кн.: Анализ и распознавание речевых сигналов на ЭВМ. — М., ВЦ АН СССР, 1975, с. 3−19.
Сомин Н.В. Разработка пакета прикладных программ для анализа акустических сигналов и его применение к задачам исследования речи. Диссертация.. кандидата физико-математических наук. М., ВЦ АН СССР, 1973, 154 с.
Сомин Н.В., Трунин-Донской В.Н. Применение логических методов для выделения основного тона в условиях помех. Отчет лаборатории технической кибернетики ВЦ АН СССР. М., 1973, с. 27.
Трунин-Донской В. Н. Дискретная обработка речевых сигналов. М., ВЦ АН СССР, 1978, 52 с.
Трунин-Донской В. Н. Современное состояние проблемы автоматического распознавания и синтеза речи. В сб.: Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов. — JI., 1983, с.5−9.
Форш Б.Н. Разработка метода автоматического выделения основного тона с повышенной разрешающей способностью. -В сб.: Техника средств связи, серия ТПС, вып.1(34). -М., 1979, с.91−94.
Фланаган Д.Л. Анализ, синтез и восприятие речи. М., Связь, 1968, 392 с.
Фролов Г. Д. Эксперимент по распознаванию речевых образов.-Программирование. М., 1976, К 2, с. 94.
Фу К. С. Лингвистический подход к распознаванию образов. -В кн.: Классификация и кластер. Пер. с англ. под ред. Журавлева К. И. М., Мир, 1980, 389 с.
Цемель Г. И. Опознавание речевых сигналов. М., Наука, 1971, 148 с.
Чабан М.Е. О динамике основных фонемных тембров гласных, содержащихся в спектральных описаниях слогов типа ГСГ. -В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. Ереван, 1980, с.7−9.
Чучупал В.Я. Реализация метода вычитания спектров для повышения качества и разборчивости речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. — Киев-Одесса, 1982, с.155−158.
Чымбаев А.Ж. Предварительная сегментация и маркировка слитной речи. М., ВЦ АН СССР, 1979, 23 с.
Шафер Р., Рабинер Р. Цифровое представление речевых сигналов. В сб.: ТИИЭР, 1975, т.63, }Ь 4, с.141−159.
Ackroyd M.H. Isolated Word Recognition Using the Weighted Levenshtein Distance.-IEEE Trans. ASSP, 1980, v.28,N2,pp.243−244.
Baker J.K. The Dragon System. An Overview.-IEEE Trans. ASSP, 1975, v.23,pp.24−29.
Beek B., Neuberg E.P., Hodge D. C, An Assessment of the Technology of Automatic Speech Recognition for Military Applications.-IEEE Trans. ASSP, 1977, v.24,N4, pp.310−322.. .
Bell O.G., Fujisaki H., Heinz J.M., Stevens K.N., House A.S. Reduction of Speech Spectra by Analysis by Synthesis Techniques.-JASA, 1961, v.33,N12,pp.1725−1736.
Brown M.K., Rabiner L.R. An Adaptive «Ordered, Graph Search Technique for Dynamic Time Warping for Isolated Word Recognition.-IEEE Trans. ASSP, 1982, v.30,N4,1. PP.535−544.
Chiba S., Watari M. and Watanabe. A Speaker-independent Word Recognition System.-Speech Acoustics Society of Japan, S 76−25,1976,pp.995−999.
Cohen J.R."Segmenting Speech Using Dynamic Programming.-JASA, 1981, v.69,N5,pp.1430−1438.
Cose Earl E., Wu F.B. An Evaluation of Some Feature Selection Techniques.-Joint «Workshop Pattern Recognition and Artif.Intell., New Iork, 1976, pp.58−65.
Das S.K. Some Experiments in Discrete Utterance Recognition. -Pro c. IEEE ICASSP, 1980, pp.178−181.
Dautrich B.A., Rabiner L.R. On the Erfects of Varying Filter Bank Parameters on Isolated Word Recognition.-IEEE Trans. ASSP, 1983, v.31,N4,pp.793−806.
De Delara Gertrudis Kurz, Guzman Justino. Perceived Probabilities.-Progr.Cybern.and Syst.Res.Vd.L., Washington, 1975, PP.253−263.
Ganvain J.L., Mariani I., Li J.S. On the Use of Time Compression FOr Word Based Recognition.-Proc. IEEE ICASSP, Boston, 1983, v.3,pp.1029−1032.
Grady M.W. Advances Speech Technology the Natural Man/Machine Interface.-Proc.Int.Conf.Cybern, and Soc. San Francisco, Calif., 1975, pp.296−299.
ICASSP-83 (Proceedings).-IEEE International Conference on Acoustics, Speech and Signal Proccesing, Boston, 1983, vol.1,2,3., 1459p.
Itakura F. Minimum P^ecication Residual Principle Applied to Speech Recognition.-IEEE Trans. ASSP, 1975, v. 23, N1,pp.67−72.
Jelinek F. Continuous Speech Recognition by Statistical Methods.-Proc. IEEE, 1976, N4,pp.532−556.
Klatt D.H. Review of the ARPA. Speech Understanding Project.-JASA, 1977, v.62,N6,pp.1345−1366.
Kuhn M.H., Tomaschewski H., Nev H, East Nonlinear Time Alignment for Isolated Word Recognition.-Proc. IEEE ICASSP, 1981, pp.736−740.
Lea VV.A., Medress M.E., Skinner T.E. A Prosodically Guided Speech Understanding System.-IEEE Trans. ASSP, 1975, V.23,pp.30−38.
Lea W.A. What Cause Speech Recognizers to Make
Mi stakes?-Proc. IEEE ICASSP, 1982, Paris, pLo .1023−1041.123» Lesser V.R. et all. Organization of the Hearsay-II Speech Understanding System,-IEEE Trans. ASSP, 1975, v.23,PP.11−24.
Levinson S.E., Rabiner L.R.Rosenberg A.E. and Wilpon J. G, Interactive Clustering Techniques for Selecting Speaker Independent Reference Templates for Isolated Word Recognition.-IEEE Trans. ASSP, 1979, v.27,N2,pp.82−89.
Lowerre B.T. The Harpy Speech Recognition System.-SIGART Newslett, 1976, N60,p.23.
Mayers C.S."Levinson S.E. Connected Word Recognition Using a Syntax-Directed Dynamic Programming Temporal Alignment Procedure.-Proc. IEEE ICASSP, 1981, pp.956−959.
Mayers C.S., Rabiner L.R. A Level Building Dynamic Time Warping Algorithm for Connected Word Recognition.- IEEE Trans. ASSP, 1981, v.29,N2,pp.284−301.
Moore R.K., Russel M.J."Tolinson M.J. The Discriminative Network: A Mechanism for Focusing Recognition in Whole-Word Pattern Mathing,-Proc. IEEE ICASSP, Boston, 1983, v.3,pp.1041−1044.
Noll A.M. Short-time Spectrum and «cepstrum». Techniques for Vocal-Pitch Detection.-JASA, 1964, v.36,N2,pp.238−243.
Rabiner L.R., Levinson S.E., Rosenberg A.E. and Wilpon J.G. Speaker Independent Recognition of Isolated Word Using Clustering Techniques.-IEEE Trans. ASSP, 1979, v.27,pp.336−349.
Rabiner L.R., Wilpon J.G. A Two-Pass Pattern-Recognition Approach to Isolated Word Recognition.-The Bell System Technical Journal, May-June, 1981, pp.739−765.
Rabiner L.R., WilPon J.G. Considerations in Applying Clustering Techniques to Speaker Independent Word Recognition.-Proc.IEEE ICASSP, Washington, 1979, PP.578−582.
Rabiner L.R., Wilpon J.G. Isolated Word Recognition Using A Two-Pass Pattern Recognition Approach.-Proc. IEEE ICASSP, 1981, pp.724−727.
Rabiner L.R., Wilpon J.G. Speaker Independent Isolated Word Recognition for a Moderated Size (54 word) Vocabulary.- Proc. IEEE ASSP, 1979, v.27,pp.583−587.
Reddy D.R., Vicens P. S. A Procedure for the Segmentation of Connected Speech.-J.Audio Eng.Soc., 1968, v.16, N4, pp.38−46.
Rosenberg A.E. and Schmidt C.E. Automatic Recognition of Spoken Spelled Names for Obtaining Directory listing.-Bell Syst.Tech.J., 1979, v.58,N8,pp.1797−1823.
Russel M.J., Moore R.K., Tomltnson M.J. Some Techniques Incorporating Local Timescale Variability Information into a Dynamic Time-Warping Algorithm for Automatic Speech Recognition,-Proc. IEEE IGASSP, 1983, pp.10J7−1040.
Sakai T., Nakagawa S. Continuous Speech Understanding System LITHA.N.-Tech .Report. «Dept.Information Science, Kyoto Univ., Kyoto, Japan, 1975.
Sakoe H. and Chiba S. A Dynamic Programming Approach to Continuous Speech Recognition.- 7 International Congress on Acoustics, Budapest, 1971, pp.65−68.
Sakoe H., Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition.-IEEE Trans.1. ASSP, 1978, v.36,pp.43−49.
Schmidt-Neelsen A. Indelligibility of VCV Segments Excized from connected Speech.-JASA, 1983, v.74,N3, pp.726−738.
Segalowitz S., Gruber F. Lauguage Development and Neurological Theory.-NV Academic Press, 1977.
Seneff S., Klatt D., Zue V. Design Consideration. for Optimizing the Intelligibility of DFT-based. Piched-excited, Critical band Spectrum Speech. Analisis/resynthesis System.-JASA, 1981, v.69,N1, pp.17 .
Sumbur M.R., Rabiner L.R. A Speaker Independent Digit-Recognition System.-BSTJ, 1975,54,1,pp.81−102.
Soudhi M. New Methods of Pitch Extraction.-IEEE Trans, of Audio and Electroacoustics, 1968, v.16,N2.
Stevens K.N. Constrains Imposed by the Auditory System on the Properties Used to Classify Speech Sounds s Data From Phonoligy"Acoustics and Psychoa-coustics."The Cognituve Representation of Speech», ed Mayers, e.a., Amsterdam, 1981, pp.61−74.
Kawaguchi Eyi. A Simulation of a Recognition System for Connected Speech Sounds Using Linguistic Information. -Trans. Inst. Electron and Commun.Eng.Jap., 1973, N9,513−520.
Tappert C.C., Das S.K. Memory and Time Inprovements in a Dynamic Programming Algoritm for Matching Speech Patt erns.-Proc.IEEE ICASSP, 1978, pp.583−586.
Velichko V.M., Zagoruilco N.G. Automatic Recognition of 200-words.-Int.J.Man-Machine Studies, 1970, v.2, pp.223−234.
Walker Donald E. Speech Understanding Through Syntacsis and Semantic Analysis.-IEEE Trans.Comput., 1976, v.25,N4,pp.432−439.
Walker D.E. The SRI Speech Understanding System.-IEEE Trans. ASSP, 1975, N5,pp.387−416.
Watanade Akira, Sakai Hisao J.Inst.Telev.Eng.Jap., 1975, v.29,N11,pp.850−859.
Wolf Z. Speech Recognition and Understanding.- In Commun. and Cybern., 1976, v.10.pp.167−203.
White G.M., Dynamic Programming, the Viterbi Algorithm and Low Cost Speech Recognition.-Proc. IilEE ICASSP, 1978, Oklahoma, v.r.pp.729−731.
White G.M., Neely R.B. Speech Recognition Experiments with Linear Predication, Band Pass Filtering and Dynamic Programming. -IEEE Trans .ASSP, 1976, v.24, pp .183−188.
J.G, Wilpon, L.R.Rabiner and A. Bergh Speaker-Independent Isolated Word Recognition Using a 129-Word Airline Vocabulary.-JASA, 1982, v.72pp.390−396.
Yau S.S., Chang S.C. A Direct Method for Cluster Analysis.-Pattern Recogn., 1975, v.7,N4,pp.215−224.
Zelinski R., Class E. A Learning Procedure for Speaker-Dependen Word Recognition Systems Based on Sequental Processing of Inpu Tokens.-Proc.IEEE ICASSP, 1983, Boston, pp.1053 -10⁶.

Заполнить форму текущей работой