Способы фильтрации акустических сигналов

Тип работы:
Курсовая
Предмет:
Физика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Способы фильтрации акустических сообщений

Содержание

Введение

1. Способы преобразования звука.

1.1 Фильтры нижних частот.

1.2 Фильтры верхних частот.

1.3 Полосовые фильтры.

1.4 Заграждающие полосовые фильтры.

2. Применение преобразования Фурье в цифровой обработке звука

2.1 Ряд Фурье

2.2 Метод корреляций

2.3 Дискретное преобразование Фурье

2.4 Свойства дискретного преобразования Фурье

2.5 Свойства амплитуды и фазы

2.6 Алгоритм дискретного преобразования Фурье

2. 7 Быстрое преобразование Фурье

3. Фильтрация случайных сигналов

3. 1 Сохранение природы сигнала.

3. 2 Математическое ожидание.

3. 3 Корреляционные соотношения.

4. Медианная фильтрация одномерных сигналов.

5. Применение вейвлет-анализа для определения границ речи в зашумленном сигнале.

Заключение

Список использованных источников

Введение

В наше время преобразование звука играет важную роль в развитии информационных систем. К преобразованию звука прибегают в основном с целью изменения каких-то характеристик звука. Кроме того, на основе описанных в данной работе преобразований базируются механизмы создания различных звуковых эффектов, а также способы очистки звука от нежелательных шумов, изменения тембра и тому подобное.

Регистрация, анализ и обработка аудиоинформации являются одним из важнейших факторов при проведении мероприятий по организации информационной безопасности. При этом зачастую возникает необходимость обработки аудио сигнала с целью повышения его качества и разборчивости.

При проведении слухового контроля или получении магнитофонных записей речевого сигнала в реальных условиях на этот сигнал воздействуют различные помехи, которые снижают качество полезного (речевого) сигнала, в том числе и его разборчивость, вплоть до срыва связи. Задача снижения уровня помех с целью восстановления смысла сообщения для ряда практических ситуаций крайне актуальна. В данной работе описывается дискретное преобразование Фурье применительно к теории цифровой обработки звука, его свойства и алгоритм возможной реализации. Все математические выкладки приведены без доказательств, которые могут быть найдены в соответствующих пособиях по математическому анализу. Медианные фильтры достаточно часто применяются на практике как средство предварительной обработки цифровых данных. Медианные фильтры при оптимально выбранной темпертуре могут, например, сохранять без искажений резкие границы объектов, эффективно подавляя некоррелированные или слабо коррелированные помехи и малоразмерные детали. Это свойство позволяет применять медианную фильтрацию для устранения аномальных значений в массивах данных, уменьшения выбросов и импульсных помех. Особенно эффективным медианный фильтр оказывается при очистке сигналов от импульсных шумов при обработке изображений, акустических сигналов, передаче кодовых сигналов и т. п. Однако детальные исследования свойств медианных фильтров как средства фильтрации сигналов различного типа являются довольно редкими.

В работе также предложена методика определения границ речи в звуковом сигнале, содержащем шум, на окснове Вейвлет-анализа. Одним из этапов этой процедуры является классификация фреймов входного сигнала, основанная на энергетических характеристиках Вейвлет-спектра и позволяющая учитывать акустические характеристики широких фонетических классов звуков речи. Подобный подход дает возможность определить границы речи при наличии высокоамплитудных помех, провести сегментацию речевого сигнала и повысить эффективность дальнейшего распознавания. Одним из важных направлений исследований в области искусственного интеллекта является разработка интеллектуальных систем образного восприятия речевой информации, среди которых значительную роль играют системы распознавания речи. Проблемы, возникающие при распознавании речевого сигнала, связаны с его вариативностью, шумом окружающей среды и звукозаписывающего оборудования, поэтому качество распознавания существенно зависит от предварительной обработки сигнала.

Одним из этапов предварительной обработки речевого сигнала является определение границ речи. В настоящее время компьютерная математика нашла реальное применение в ряде измерительных приборов и систем и, прежде все

го, в цифровых осциллографах и анализаторах спектра. В этой работе описаны современные методы Фурье- и Вейвлет- анализа сигналов, исследуемых с помощью этих при боров и высказаны соображения о путях их развития.

Моей целью в данной работе являлось описать способы обработки акустических сигналов, выделить основные идеи и разобрать каждый из них.

Для достижения данной цели в курсовой работе, ставятся следующие задачи:

· Описать виды фильтров, применяемых для фильтрации звука

· Исследовать преобразования Фурье в цифровой обработке звука

· Рассмотреть фильтрацию случайных сигналов

· Разобрать Вейвлет-анализ для его применения в цифровой обработке сигнала

Способы фильтрации акустических сигналов

Метод

Описание

Использование фильтров

Существует четыре основных типа фильтров: фильтры нижних частот, фильтры верхних частот, полосно-пропускающие фильтры, полосно-запирающие фильтры. Так же для фильтрации сигналов используют медианную фильтрацию. Фильтр нижних частот является схемой, которая без изменений передает сигналы нижних частот, а на высоких частотах обеспечивает затухание сигналов и запаздывание их по фазе относительно входных сигналов

Используя логарифмическое представление, можно перейти от нижних частот к верхним, зеркально отобразив АЧХ коэффициента передачи относительно частоты среза.

Применяют взвешенно-медианные фильтры, если желательно придать больший вес центральным точкам.

Итерационные медианные фильтры выполняются последовательным повторением медианной фильтрации.

При использовании итерационных фильтров можно изменять апертуру фильтра при каждом шаге итерации.

Применение преобразования Фурье

Дискретное преобразование Фурье раскладывает исследуемый сигнал по базисным функциям синуса и косинуса. Они являются аналогами двух взаимно перпендикулярных колебаний, так как по фазе смещены друг относительно друга на 90 градусов.

Применение цифровых фильтров, построенных на основе преобразования Фурье в некоторых случаях может искажать сигнал. Этим ограничивается область применения таких фильтров.

Применение вейвлет-анализа

1. Способы преобразования звука

Амплитудные преобразования. Выполняются над амплитудой сигнала. Такую процедуру можно проделать двумя способами: либо умножая амплитуду сигнала на некоторое фиксированное число, в результате чего получится одинаковое изменение интенсивности сигнала на всей его протяженности, то есть усиление или ослабление, либо изменяя амплитуду сигнала по какому-то закону, то есть умножая амплитуду сигнала на модулирующую функцию [1]. Последний процесс называется амплитудной модуляцией.

Спектральные (частотные) преобразования. Такие преобразования выполняются над частотными составляющими звука. Фактически сигнал представляется рядом Фурье, то есть раскладывается на простейшие синусоидальные колебания различных частот и амплитуд. Затем производится обработка необходимых частотных составляющих (например, фильтрация) и обратная свертка. В отличие от амплитудных преобразований, эта процедура значительно более сложная в исполнении, так как сам процесс разложения звука на простейшие синусоидальные колебания очень трудоемок.

Отдельно необходимо обсудить фильтрацию звука, так как она тоже является одним из способов преобразования звука. Зачем может понадобиться фильтрация? К фильтрации прибегают в случаях, когда необходимо ограничить или изменить спектр звукового сигнала в каком-то определенном частотном диапазоне. Путем фильтрации звука, можно избавиться, например, от нежелательных шумов или помех, подавить определенные частотные полосы. Существует и еще один немаловажный аспект применения фильтрации. Часто устройства, с помощью которых производится запись и преобразования звуковых сигналов, имеют нелинейную зависимость амплитуды от частоты сигнала. Это означает, что при записи одни частотные составляющие звука могут быть завышены, а другие занижены. Фильтрация позволяет нормализовать частотные составляющие в необходимом диапазоне.

Таким образом, фильтрацию сигналов можно в целом классифицировать следующим образом: фильтрация, в результате которой происходит усиление или ослабление отдельных частотных составляющих спектра; полное подавление частотных составляющих в определенной полосе частот.
Фильтры характеризуются с помощью амплитудно-частотной характеристики (АЧХ). Эта характеристика представляет собой график зависимости коэффициента передачи K (f) (амплитуды) от частоты f. То есть на таком графике можно увидеть, в какой полосе частот сигнал будет передаваться без изменений, и в какой полосе частот сигнал будет ослаблен или не пропущен совсем.

Существует четыре основных типа фильтров:

фильтры нижних частот ФНЧ. Типичная АЧХ таких фильтров выглядит след. Образом (рисунок 1):

Рисунок 1- Типичная АЧХ ФНЧ

фильтры верхних частот ФВЧ. Типичная АЧХ таких фильтров выглядит след. образом (рисунок 2):

Рисунок 2- Типичная АЧХ ФВЧ

полосно-пропускающие фильтры. Типичная АЧХ таких фильтров выглядит след. образом (рисунок 3):

Рисунок 3- Типичная АЧХ ППФ

полосно-запирающие фильтры. Типичная АЧХ таких фильтров выглядит след. образом (рисунок 4):

Рисунок 4- Типичная АЧХ ПЗФ

1.1 Фильтры нижних частот

Фильтр нижних частот является схемой, которая без изменений передает сигналы нижних частот, а на высоких частотах обеспечивает затухание сигналов и запаздывание их по фазе относительно входных сигналов [2].

Пассивные фильтры нижних частот первого порядка

На рисунке 5 изображена схема простого RС-фильтра нижних частот первого порядка. Коэффициент передачи в комплексном виде может быть выражен формулой:

Рисунок 5- схема простого RС-фильтра ФНЧ

(1)

Отсюда получим формулы для АЧХ и ФЧХ

, (2)

Активные фильтры нижних частот первого порядка

Простой фильтр, изображенный на рисунке 6, обладает недостатком: свойства фильтра зависят от нагрузки. Для устранения этого недостатка фильтр необходимо дополнить преобразователем полного сопротивления.

Схема фильтра с преобразователем полного сопротивления показана на рисунке 6 Коэффициент передачи постоянного сигнала может быть задан выбором значений резисторов R2 и R3.

(3)

Для упрощения схемы ФНЧ можно использовать RC- цепь для обратной связи операционного усилителя. Подобный фильтр показан на рисунок 7

Рисунок 6- простой фильтр

Рисунок 7- фильтр с RC-цепью

Передаточная функция фильтра (рисунок 7) имеет вид

(4)

преобразование звук цифровой сигнал

Для расчета фильтра необходимо задать частоту среза fСР (щСР), коэффициент передачи постоянного сигнала К0 (для схемы на рисунке 7 он должен быть задан со знаком минус) и емкость конденсатора С1.

Пассивный фильтр нижних частот второго порядка

запишем в общем виде передаточную функцию ФНЧ второго порядка

(5)

Такая передаточная функция не может быть реализована с помощью пассивных RC-цепей. Подобный фильтр может быть реализован с применением индуктивностей.

На рисунке 8 показана схема пассивного ФНЧ второго порядка.

Рисунок 8- схема пассивного ФНЧ второго порядка

Рассчитать фильтр можно, воспользовавшись формулами

(6) и (7)

Подобные фильтры неудобны для реализации из-за слишком большой индуктивности. Заданную передаточную функцию можно реализовать с помогщью операционного усилителя с соответствующими RC — цепями, что позволяет исключить индуктивности.

Активные ФНЧ второго порядка

Примером активного ФНЧ второго порядка является фильтр со сложной отрицательной обратной связью, схема которого показана на рисунке 9

Рисунок 9- фильтр со сложной отрицательной обратной связью

Для расчета фильтра можно записать

,

(8)

ФНЧ третьего и более высоких порядков

Для реализации ФНЧ более высокого порядка, чем второй, можно последовательно соединить фильтры первого и второго порядка. В этом случае характеристики звеньев фильтра перемножаются. Однако, чтобы результат перемножения частотных характеристик звеньев фильтра соответствовал желаемому типу фильтра, необходимо задавать соответствующие коэффициенты звеньев фильтра.

На рисунке 10 приведен пример реализации ФНЧ Бесселя третьего порядка.

Рисунок 10- фильтр реализации ФНЧ Бесселя третьего порядка

1.2 Фильтры верхних частот

Используя логарифмическое представление, можно перейти от нижних частот к верхним, зеркально отобразив АЧХ коэффициента передачи относительно частоты среза, т. е. заменив Щ на 1/Щ или P на 1/P [3]. При этом частота среза остается неизменной, а К0 переходит К?. При этом получим

(9)

Пассивные ФВЧ первого порядка

Схема простого пассивного ФВЧ первого порядка приведена на рисунке 11 ФВЧ передает без изменения сигналы высоких частот, а на низких частотах обеспечивает затухание сигналов и опережение их по фазе относительно входных сигналов. Коэффициент передачи в комплексной форме может быть записан в виде

(10)

Рисунок 11- Схема простого пассивного ФВЧ первого порядка

Отсюда находим выражения для АЧХ, ФЧХ и частоты среза

;; (11)

Активные ФВЧ первого порядка

Пример схемы активного ФВЧ первого порядка представлен на рисунке 12

Рисунок 12- схема активного ФВЧ первого порядка

Передаточная функция данного фильтра имеет вид

(12)

Пассивные и активные ФВЧ второго порядка.

Передаточная функция ФВЧ второго порядка имеет вид

(13)

Для реализации пассивного ФВЧ второго порядка достаточно в схеме рисунок 13 поменять местами конденсатор и RL цепь.

Рисунок 13- схема пассивного ФВЧ второго порядка

1.3 Полосовые фильтры

Путем замены переменной Р в передаточной функции ФНЧ на переменную (1/ДЩ)(P+1/P) можно получить АЧХ полосового фильтра. В результате этого преобразования АЧХ фильтра нижних частот в диапазоне 0? Щ? 1 переходит в правую часть полосы пропускания полосового фильтра (1? Щ? ЩMAX) [4].

Левая часть полосы пропускания является зеркальным отображением в логарифмическом масштабе правой части относительно средней частоты полосового фильтра Щ = 1 (рисунок 14). При этом ЩMIN = 1/ ЩMAX. Вычисление нормированных частот среза полосового фильтра, на которых его коэффициент передачи уменьшается на 3 дБ, может быть осуществлено из

(14)

формулы которая получается при

и

Рисунок 14- полосовой фильтр

Полосовой фильтр второго порядка

Передаточная функция ПФ второго порядка имеет вид

(15)

Основными характеристиками такого фильтра являются коэффициент передачи КР на резонансной частоте (КР = К0) и добротность Q.

(16)

(17)

Получим выражения для АЧХ и ФЧХ полосового фильтра второго порядка

(18)

Пассивный полосовой фильтр второго порядка

На рисунке 15 показана схема пассивного LRC — фильтра. Передаточная функция равна

. (19)

Рисунок 15 — схема пассивного LRC — фильтра

Активные полосовые фильтры

Для реализации пассивного полосового фильтра с низкой резонансной частотой требуется большая индуктивность. Для схемной реализации можно использовать операционный усилитель с частотно-зависимой обратной RC — связью. Пример П Ф со сложной отрицательной обратной связью показан на рисунке 16

Рисунок 16- ПФ со сложной отрицательной обратной связью

Приняв С1 = С2 = С получим передаточную функцию в виде

(20)

1.4 Заграждающие полосовые фильтры

АЧХ заграждающего фильтра может быть получена из частотной характеристики ФНЧ путем замены переменной Р выражением ДЩ/(P+1/P). Здесь Д Щ = 1/Q нормированная полоса частот. Q = fP/(fMAX — fMIN) = fP/Дf, где Дf — полоса частот, на краях которой коэффициент передачи падает на 3 дБ (Q — добротность подавления сигнала) [5].
Как и в случае полосовых фильтров при преобразовании порядок фильтра удваивается. Так при преобразовании передаточной функции ФНЧ первого порядка получим заграждающий фильтр второго порядка с передаточной функцией

(21)

Отсюда получим выражения для АЧХ и ФЧХ фильтра.

; (22)

Пассивные заграждающие полосовые фильтры

Пример пассивного заграждающего фильтра приведен на рисунке 17

Рисунок 17- пассивного заграждающего фильтра

Передаточная функция такого фильтра имеет вид

(23)

Резонансная частота находится как

(24)

2. Применение преобразования Фурье в цифровой обработке звука

2.1 Ряд Фурье

Рядом фурье называется бесконечная математическая последовательность, состоящая из коэффициентов при функциях синуса и косинуса вида [6]:

(26)

2.2 Метод корреляций

Метод корреляций позволяет определить тесноту линейной зависимости между исследуемой и базисной функциями. Это легче понять на примере. Пусть имеется импульсная радиолокационная станция. Для обнаружения цели эта станция формирует короткий высокочастотный радиоимпульс, огибающая которого имеет прямоугольную форму. Этот импульс излучается в пространство и отражается от цели. Так как в однородной среде электромагнитные волны распространяются с постоянной скоростью, близкой к скорости света в вакууме, то зная время, через которое отражённый от цели импульс поступил в приёмник радиолокационной станции, можно определить расстояние до цели.

Однако здесь возникает следующая проблема: так как только часть импульса отражается от цели и поступает обратно в приёмник, а также в приёмник поступают некоторые помехи и сам приёмник имеет некоторый коэффициент шума, результирующий импульс будет несколько размыт на фоне помех и шумов. Возникает вопрос, как определить какая часть графика, представленного на рис. будет представлять отражённый импульс? Воспользуемся следующим методом: возьмём за основу функцию, которая на некотором интервале будет иметь скачок, представляющий собой идеальный отражённый импульс (при отсутствии помех и ослаблений). Далее будем в каждой точке перемножать эту базисную функцию на функцию, формируемую приёмником, а затем проинтегрируем полученную функцию. Таким образом, это преобразование позволяет определить насколько велико значение базисной функции в исследуемой. Если исследуемая функция в каждой своей точке равна базисной, то интеграл функции, полученной в результате этого преобразования будет иметь максимальное значение. Если исследуемая функция ни как не отражает базисную, то результат будет равен 0. В промежуточных вариантах значения интеграла результирующей функции будут отражать то, насколько точно исследуемая функция соответствует базисной. Это и есть метод корреляций. Вернёмся к определению расстояния до цели. Теперь будем формировать новую базисную функцию, интервал скачка которой будем смещать вправо по оси абсцисс. Как только этот интервал будет соответствовать интервалу функции, соответствующему отражённому импульсу, значение интеграла результирующей функции будет максимальным. Таким образом может решаться задача об определении расстояния до цели.

2.3 Дискретное преобразование Фурье

В дискретном преобразовании Фурье исследуемая функция является периодической имеет конечный период повторения, и является дискретной. Фактически, дискретное преобразование Фурье позволяет представить дискретную функцию в виде конечного числа частот с определёнными значениями амплитуды и фазы (раскладывает функцию в её спектр). Это основывается на том, что по следствию из теоремы Котельникова в дискретном сигнале период, соответствующий наивысшей представимой частоте соответствует двум периодам дискретизации. Для определения амплитуд и фаз частотных составляющих сигнала, в дискретном преобразовании Фурье используется корреляция с базисными функциями синуса и косинуса. Спектр частот в дискретном преобразовании Фурье определяется из амплитуд синусов и косинусов, с частотами повторения в исследуемой выборке от 0 до N/2 раз, где N — количество элементов выборки. Преобразование Фурье раскладывает дискретизированный сигнал из N выборок на N/2 + 1 синусных и N/2 + 1 косинусных составляющих. Почему именно синусных и косинусных? Не только потому, что это следует из формулы ряда Фурье. Установлено, что результат сложения двух взаимно перпендикулярных колебаний с одинаковыми частотами, но разными амплитудами даёт колебание с той же частотой, но с другой амплитудой и фазой. Поэтому можно сказать, что дискретное преобразование Фурье раскладывает исследуемый сигнал по базисным функциям синуса и косинуса. Они являются аналогами двух взаимно перпендикулярных колебаний, так как по фазе смещены друг относительно друга на 90 градусов. Все вышеприведённые размышления приводят к следующим формулам дискретного преобразования Фурье:

(27) (28)

Эти формулы описывают прямое преобразование Фурье. ReX[x] - массив, содержащий значения косинусоидальных составляющих. ImX[x] - массив, содержащий значения синусоидальных составляющих. Такие обозначения введены в силу комплексного представления непрерывного преобразования Фурье (см. выше). При этом действительной части соответствуют косинусы, а мнимой — синусы. Это не должно вводить Вас в заблуждение — элементы этих массивов являются действительными числами и коэффициенты при синусах и косинусах являются действительными числами. Также, исследуемая функция является функцией действительного переменного. Комплексная форма преобразования Фурье может вводится для удобства записи двух интегралов — для косинуса и синуса. Массивы Re[x] и Im[x] составляют так называемый частотный домен (frequency domain), в то время как исходная выборка называется временным доменом (time domain).

2.4 Свойства дискретного преобразования Фурье

По приведённым выше формулам производится разложение исследуемого сигнала в его спектр. Выясним теперь свойства преобразования Фурье. Допустим, требуется произвести обратное преобразование — из частотных составляющих сформировать исходный сигнал. Для этого справедливы приведённые ниже формулы:

(29)

Коэффициенты ReX[k] и ImX[k] определяются по следующим формулам:

(30)

Такой процесс преобразования называется синтезом или обратным преобразованием Фурье. Заметим, что формулы обратного преобразования аналогичны формулам прямого преобразования, только теперь подынтегральной функцией являются коэффициенты при синусах и косинусах. Это свойство является очень важным и называется двойственностью преобразования Фурье. Свойство двойственности позволяет объяснить следующий факт: единичный импульс во временном домене (единичное значение одной выборки при нулевых значениях остальных) соответствует синусоиде и косинусоиде в частотном домене и наоборот (рис.). Во втором случае всё понятно — имеется один коэффициент при синусе или косинусе — это значит, что исходный сигнал (выборка) содержит составляющую одной частоты синусоидальной или косинусоидальной формы. Первый же случай может быть объяснён на основе двойственности преобразования Фурье. Описанный факт используется при построении алгоритма быстрого преобразования Фурье. Дело в том, что приведённые выше формулы для прямого и обратного преобразований имеют временную сложности реализующих их алгоритмов порядка O (n2). Таким образом, при больших объёмах выборки, не удаётся за реальное время произвести преобразование Фурье. Для этой цели в середине 60-х годов был разработан алгоритм быстрого преобразования Фурье, который описывается в конце статьи.

2.5 Свойства амплитуды и фазы

Как уже было сказано, дискретное преобразование Фурье раскладывает исследуемый сигнал (выборку) на синусоидальные и косинусоидальные составляющие. В то же время, хотелось бы получить значения амплитуд и фаз частотных составляющих сигнала. Для перевода пары соответствующих коэффициентов при синусе и косинусе в амплитуду и фазу частотной составляющей справедливы следующие формулы:

(31)

Обратное преобразование имеет вид:

(32) (33)

Полученные значения амплитуды и фазы называют полярным представлением (polar notation). Значения же коэффициентов при синусах и косинусах характеризуют прямоугольное представление (rectangular notation). При выполнении первого преобразования возможно несколько вариантов. 1. Значение коэффициента при косинусе равно 0. Тогда значение фазы равно ±p/2. Соответствующее значение выбирается в соответствии со знаком коэффициента при синусе — если он положительный, то значение фазы p/2, если отрицательный, то -p/2. 2. Значение коэффициента при синусе равно 0. Тогда значение фазы равно 0 или p. Соответствующее значение выбирается в соответствии со знаком коэффициента при косинусе — если он положительный, то значение фазы 0, если отрицательный, то p. 3. «Дрейф» фазы. Подобный эффект наблюдается при очень малом, близком к 0, значении коэффициента при косинусе. При этом возможны резкие скачки значений фазы от -p/2 к +p/2. Так как значения коэффициента при косинусе очень малы, то, практически, фаза в этом случае не имеет значения и её можно принять равной -p/2 или +p/2.

Как правило, значение фазы сигнала несёт в себе больше информации о форме и изменениях сигнала. Пусть, например, во временном домене имеется импульс некоторой длительности. Преобразуем этот временной домен в частотный и далее в полярное представление. Установим все амплитуды в случайное значение и преобразуем частотный домен обратно во временной. Таким образом, новый временной домен содержит в себе информацию, полученную из значений фаз частотных составляющих. Теперь в том месте, где был расположен импульс на его границах заметны скачки. Это и объясняет то, что фаза сигнала несёт больше информации о форме сигнала.

Эффект Гиббса. Предположим, что из спектра прямоугольного импульса, убрали все частоты выше некоторой заданной. Далее применили обратное преобразование Фурье. Теперь на границах импульса будут отчётливо заметны затухающие колебания. Это объясняется тем, что границы идеального импульса представляются бесконечным числом синусоид и косинусоид. При увеличении этого количества от 0 до бесконечности форма фронтов импульса принимает свой истинный вид. При меньшем же количестве синусоид и косинусоид на границах импульса появляются искажения. Этот эффект носит название эффекта Гиббса. Таким образом, применение цифровых фильтров, построенных на основе преобразования Фурье в некоторых случаях может искажать сигнал. Этим ограничивается область применения таких фильтров.

2.6 Алгоритм дискретного преобразования Фурье

Ниже представлен исходный текст программы на C++ (рисунок 18), реализующей алгоритм преобразования Фурье. Мнимая функция GetValues () записывает во временной домен (массив f) некоторые значения, определяющие исследуемый сигнал.

Рисунок 18- текст программы на C++

2.7 Быстрое преобразование Фурье

Как было отмечено выше, обычное дискретное преобразование Фурье имеет большую временну сложность алгоритма (порядка O (n2)), что ограничивает его применение. Алгоритм быстрого преобразования Фурье основывается на таком математическом преобразовании как свёртка функций. Свёртка функций подробно описывается в учебниках по мат. анализу и здесь не рассматривается. Остановимся на некоторых характерных чертах работы алгоритма быстрого преобразования Фурье. Количество элементов в выборке, поступающих на вход быстрого преобразования Фурье должно быть 2^n. Временная сложность преобразования — O (n · log n). Алгоритм быстрого комплексного преобразования Фурье работает следующим образом.

1. Для всей выборки производится так называемая побитовая обратная сортировка (bit-reversal sorting), в процессе которой меняются элементы с номерами, соответствующими прямой и перевёрнутой двоичной записи номера элемента.

2. Для каждого элемента отсортированной выборки выполняется одноэлементное дискретное преобразование Фурье. Это действие является мнимым, так как спектр одноточечного дискретного сигнала соответствует самому сигналу. Фактически, на этом этапе ничего не выполняется, но подразумевается, что выполняется.

3. Производится операция, обратная побитовой обратной сортировке. Но при этом преобразуются не элементы выборки, а элементы спектра сигнала. Причём на каждом шаге выполняется умножение частотного домена на комплексную синусоиду и сложение частотных доменов.

4. Результирующая выборка из 2^n комплексных элементов представляет спектр комплексного сигнала.

Существуют модификации алгоритма для сигнала, выборки которого являются действительными числами. Для полного понимания работы этого алгоритма следует ознакомиться с теорией линейных систем, свёрткой, свойствами и парами преобразований Фурье и модификациями преобразований Фурье для функций комплексного переменного.

3. Фильтрация случайных сигналов

Если параметры случайного входного сигнала специально не оговариваются, то по умолчанию принимается, что на вход фильтра поступает реализация случайного стационарного процесса x (k?t) с нулевым средним, которая вызывает сигнал y (k?t) на выходе фильтра. Значение? t, как обычно, принимаем равным 1 [7].

3.1 Сохранение природы сигнала

Допустим, что фильтр имеет импульсный отклик h (n) = exp (-a·n), n 0. Зададим на входе фильтра стационарный квазидетерминированный случайный сигнал, который не обладает свойством эргодичности, но имеет все свойства случайного сигнала, и может быть описан в явной математической форме:

x (k) = A + cos (2k+б) (34)

где A и б — взаимно независимые случайные величины, причем значение равномерно распределено в интервале [0, 2?]. При этом выходной сигнал определится выражением:

y (k) = h (n) x (k-n) h (n) x (k-n) (35)

y (k) = A/3 + [3 cos (2k+ б) + 2 sin (2k+ б)]/13 (36)

Из этого выражения следует, что выходной сигнал фильтра также является случайным и содержит те же самые случайные параметры, что и входной сигнал, а, следовательно, для него существуют определенные статистические характеристики. Пример реализации квазидетерминированного случайного сигнала и его фильтрации аналогом сглаживающего RC-фильтра приведен на рисунке 19.

Рисунок 19- Фильтрация квазидетерминированного сигнала.

3.2 Математическое ожидание

Индекс операции — М произвольного входного случайного стационарного сигнала x (k) на выходе фильтра определится выражением:

= М{y (k)}= M{h (n) x (k-n)}=M{x (k-n)}h (n)= h (n)=Кпс (37)

Отсюда следует, что математическое ожидание выходных сигналов фильтра равно математическому ожиданию входных сигналов, умноженному на коэффициент усиления фильтром постоянной составляющей. При Кпс = 1 среднее значение выходных сигналов не изменяется и равно среднему значению входных сигналов. Если фильтр не пропускает постоянную составляющую сигналов (сумма коэффициентов импульсного отклика фильтра равна нулю), то случайный выходной сигнал всегда будет иметь нулевое математическое ожидание.

3.3 Корреляционные соотношения

Для нецентрированных входных сигналов x (k) размером (0-К) автокорреляционная функция (АКФ), а равно и функция автоковариации Kx (n) (ФАК) для центрированных случайных сигналов, вычисляется по формуле:

Rx (n) = [1/(K+1-n)]x (k) x (k+n) (38)

Формула применяется довольно редко, в основном для детерминированных сигналов с небольшим числом отсчетов. Для случайных и зашумленных сигналов уменьшение знаменателя (K-n) и числа перемножаемых отсчетов по мере увеличения сдвига приводит к нарастанию статистических флюктуаций вычисления АКФ. Большую достоверность в этих условиях обеспечивает вычисление АКФ в единицах мощности сигнала по формуле:

Rs (n) = sksk+n, sk-n = 0 при k+n > K, (39)

т.е. с нормированием на постоянный множитель 1/K и с продлением сигнала нулевыми значениями (в левую сторону при сдвигах k-n или в правую сторону при использовании сдвигов k+n). Эта оценка является смещенной и имеет несколько меньшую дисперсию, чем по формуле (38).

Разницу между нормировками по формулам (38) и (39) можно наглядно видеть на рисунке 20.

Рисунок 20 — Разницу между нормировками по формулам (38) и (39)

На рисунке 21 приведен пример нормированных АКФ входной и выходной случайных последовательностей при фильтрации RC-фильтром, форма импульсного отклика которого также приведена на рисунке.

Рисунок 21- Функции корреляционных коэффициентов.

Заметим, что для свертки импульсных откликов, производя замену n-j = m, мы имеем равенство:

h (n+i) h (n-j) = h (m+i+j) h (m) = h (m) h (m+p) = Rh (m) (40)

где Rh (m) — функция корреляции импульсного отклика фильтра. Отсюда:

Ry (n) = Rx (n) Rh (m) (41)

Это означает появление в случайном сигнале на выходе фильтра определенной корреляционной зависимости, определяемой инерционностью фильтра.

Эффективный интервал jk корреляции данных в сигнале тем меньше, чем выше верхняя граничная частота wв его спектра (по уровню 0. 5):

jк = p/wв =½fв (42)

Оценка интервала корреляции для конечных (непериодических) функций, как правило, производится непосредственно по функциям автокорреляции R (n):

jk = 2? n|R (n)/R (0)| - 1 (43)

Функция Rx (n) случайных статистически независимых отсчетов близка к функции, свертка которой с Rh (m) приведет к формированию на выходе выходного сигнала, нормированная форма АКФ которого будет стремиться к форме Rh (m). При достаточно большой выборке случайных отсчетов входного сигнала это означает практически полное повторение функцией Ry (n) формы корреляционной функции импульсного отклика, как это можно видеть на рисунке 22, который отличается от рис. 21 только количеством выборки К=10 000. Соответственно, интервал корреляции выходных сигналов для случайной входной последовательности можно определять непосредственно по функции (43) непосредственно импульсного отклика фильтра.

Рисунок 22- функции корреляционных кэффицентов большой выборки

4. Медианная фильтрация одномерных сигналов

Разновидности медианных фильтров [8].

1)Взвешенно-медианные фильтры применяют, если желательно придать больший вес центральным точкам. Это достигается путем повторения ki раз каждого набора отсчетов в апертуре фильтра. Так, например, при N=3 и k-1=k1=2, k0=3 вычисление взвешенной медианы входного числового ряда производится по формуле:

yi = med (xi-1, xi-1, x0, x0, x0, x1, x1) (44)

Такая растянутая последовательность также сохраняет перепады сигнала и в определенных условиях позволяет увеличить подавление дисперсии статистических шумов в сигнале. Ни один из весовых коэффициентов ki не должен быть значительно больше всех других.

2)Итерационные медианные фильтры выполняются последовательным повторением медианной фильтрации. Если апертура единичной медианной фильтрации сохраняет перепады в сигнале, то они сохраняются при итеративном применении фильтра вплоть до тех пор, пока не прекратятся изменения в фильтруемом сигнале, при этом конечный результат существенно отличается от итеративного применения скользящего среднего, где в пределе получается постоянная числовая последовательность. При использовании итерационных фильтров можно изменять апертуру фильтра при каждом шаге итерации.

Достоинства медианных фильтров.

· Простая структура фильтра, как для аппаратной, так и для программной реализации.

· Фильтр не изменяет ступенчатые и пилообразные функции.

· Фильтр хорошо подавляет одиночные импульсные помехи и случайные шумовые выбросы отсчетов.

Недостатки медианных фильтров.

· Медианная фильтрация нелинейна, так как медиана суммы двух произвольных последовательностей не равна сумме их медиан, что в ряде случаев может усложнять математический анализ сигналов.

· Фильтр вызывает уплощение вершин треугольных функций.

· Подавление белого и гауссового шума менее эффективно, чем у линейных фильтров. Слабая эффективность наблюдается также при фильтрации флюктуационного шума.

· При увеличении размеров окна фильтра происходит размытие крутых изменений сигнала и скачков.

5. Применение вейвлет-анализа для определения границ речи в зашумленном сигнале

Методика определения границ речи

Предложенная ниже методика определения границ речи использует быстрое вейвлет-преобразование Добеши и состоит из трех этапов: обучения шуму, классификации фреймов сигнала, определения границ речи [9].

Входными данными этой процедуры являются зашумленный сигнал x?(n) и об-разец шума e (n); выходными данными — отсчеты сигнала L, R, которые соответст-вуют левой и правой границам слова, вычисленные по образцу шума на каждом уровне разложения; пороги б (m) и массив номеров граничных фреймов, полученный в результате классификации фреймов.

На этапе обучения шуму выполняется вейвлет-разложение сигнала e (n), его разбиение на фреймы длиной? N, образующие множество фреймов Fe, и вычисление порогов б (m):

(45)

где jmax — максимальный уровень вейвлет-разложения; Aver (m), D (m) — полученные на множестве Fe среднее и смещенная оценка дисперсии величин (2), представляю-щих собой энергии спектра Es (m) сигнала e (n)

(46)

На этапе классификации каждый фрейм входного сигнала x?(n) относят к одно-му из четырех ШФК, перечисленных выше. Классификация фреймов проводится на множествах уровней разложения: Mvoc={m: mvoc? m? jmax} - соответствует полосе частот основного тона (100 — 300Гц); Mh={m:1? m? m } - соответствует высокочас-тотной области спектра (более 2500 Гц), где сосредоточена энергия звуков класса Sh.

Рисунок 24 демонстрирует поведение характеристик для сигнала, записанного в усло-виях высокоамплитудного производственного шума (отношение сигнал/шум 2,3 дБ), содержащего звуки различных ШФК (рисунок 24а), на уровне m€Msh (рисунок 24б) и m€Mvoc (рисунок 24в).

Рисунок 24 — поведение характеристик

Рисунок 24 — а) Амплитудно-временное представление слова «Сушка», записанного в условиях производственного шума, б) энергия вейвлет-спектра слова «Сушка» на уровне m€Msh; в) энергия вейвлет-спектра слова «Сушка» на уровне m€Mvoc

Как видно из рисунка 24, амплитудно-частотные характеристики банка вейвлет-фильтров позволяют на множестве уровней разложения M oc выделить из сигнала вокализованные звуки, на множестве уровней разложения Msh — звуки класса Sh.

Классификация фреймов сигнала проводится по следующим правилам:

Es(m) Ј a(m) ®--sО--NoiseЪ--P, (47)

mОMVoc ИMsh

Es(m) і a(m) ®--sОVoc, (48)

mОMVoc

жEs (m) Ј еa(m)ц--ЩжEs(m) і еa(m)ц--®--sОSh, и--------------------------------mОMVoc ш и--------------------------------mОM sh ш

где Es (m) — энергия s-го фрейма сигнала x?(n).

На основе классификации фреймов строится функция их маркировки:

Чтобы не принимать кратковременный высокоамплитудный шум за речь, необ-ходимо уточнить маркировку фреймов с учетом минимальной длительности фонемы согласно правилу:

$N1,N2: (0? N2 — N1 < Lmin) Щ--(Mark(N1) = Mark(N2) = 0) Щ--(Mark(N1 + 1) №--0) Щ--(Mark(N2 — 1) №--0) ®--«s: N1? s? N2 Mark(s) = 0, (50)

где Lmin — число фреймов, соответствующее максимальной длительности фонемы. Следующий этап — определение границ речи.

Номера отсчетов L и R, которые являются левой и правой границами речи, определяются согласно (51) и (52):

$Nl: («s< Nl Mark(s) = 0) Щ--Mark(Nl) №--0 ®--L = NlDN, (51) $Nr: («s: Nr < s Ј--Nr + Lmax Mark(s) =0) Щ--Mark(Nr) №--0 ®--R = NrDN, (52)

где Lmax — число фреймов, соответствующее максимальной длительности звука клас-са P; ?N — длина фрейма; Nl, Nr — номера фреймов, соответствующих левой и правой границам речи.

Чтобы не принимать низкоамплитудный речевой сигнал за шум, уточняется маркировка фреймов следующим образом:

«s: (Nl< s<Nr) Щ--(Mark(s) = 0) ®--Mark(s) = 3. (53)

Таким образом, с учетом (53) функция маркировки (49) примет вид:

(54) Функция (54) позволяет провести первичную сегментацию речевого сигнала с одновременной классификацией сегментов. Номера граничных фреймов образуют массив (55):

Bound = {s: (Nl + Lmin? s? Nr — Lmin) Щ--(Mark(s — 1) №--Mark(s))}. (55)

Результаты численного исследования

Предложенная методика была реализована в виде программного модуля, который является составной частью информационной технологии, реализующей функции предварительной обработки, сегментации речевого сигнала, классификации и распознавания фонем. Тестирование этого модуля проводилось на сигналах, зашумленных цветными шумами, а также содержащих производственные шумы от работающих технических устройств.

В численном исследовании участвовало 50 дикторов с различными голосовыми данными. Каждый диктор произносил слова, содержащие звуки различных ШФК. Слова записывались с частотой дискретизации 22 050 Гц, 8 бит, моно. Результаты исследования для сигналов с различными видами шумов сведены в табл. 1, куда при определении границ речи (столбец Noise) и сегментов, содержащих звуки классов Voc, Sh, P (столбцы Voc, Sh, P соответственно), занесены: вероятности ошибочного определения границ (столбцы B- вероятность ошибки первого рода) и пропуска гра-ниц (столбцы a- вероятность ошибки второго рода).

Таблица 1 — Вероятности ошибок первого и второго рода при определении границ речи и первичной сегментации

Тип шума

Voc

Sh

P

Noise

б

в

б

в

б

в

б

в

Коричневый шум, отношение сигнал/ шум 9 дБ

0,020

0,018

0,022

0,019

0,021

0,019

0,021

0,019

Розовый шум, отношение сигнал/ шум 15 дБ

0,045

0,043

0,049

0,030

0,043

0,029

0,049

0,030

Белый шум, отношение сигнал/ шум 18 дБ

0,025

0,021

0,041

0,036

0,018

0,015

0,041

0,036

Производственный шум, отношениесиг-нал/шум 2 — 5 дБ

0,020

0,019

0,024

0,015

0,016

0,014

0,024

0,019

Заключение

В данной курсовой работе были рассмотрены и приведены схемы современных фильтров, предназначенных для фильтрации звука. Так же было описано дискретное преобразование Фурье, его свойства. Кроме того, были описаны разновидности медианных фильтров, их достоинства и недостатки. Основным результатом при рассмотрении Вейвлет-анализа, отражающим научную новизну, является то, что усовершенствованы методики определения границ речи за счет использования акустических характеристик звуков речи, принадлежащих различным ШФК, что дает возможность: определить границы речи в звуковом сигнале при высокоамплитудных помехах, а также в условиях шума, уровень которого превышает или близок к уровню шумных глухих щелевых и смычно-щелевых звуков; провести первичную сегментацию речевого сигнала с одновременной классификацией полученных сегментов. Подобный подход на этапе предварительной обработки позволяет понизить ошибки дальнейшего распознавания. Численные исследования показали эффективность применения предложенной методики для сигналов, содержащих шумы различных видов, вероятности ошибок при определении границ речи и сегментов не превышают 0,05. Предложенный подход определения границ речи может быть использован для построения интеллектуальных систем взаимодействия пользователя и компьютера, а также систем речевого управления техническими устройствами.

Так же хотелось бы отметить, что техника вейвлет-преобразований находиться в начальной стадии её внедрения в измерительную технику. Но близится время, когда появятся серийные вейвлет-осциллографы, вейвлет-спектрометры и другие приборы на основе вейлет-преобразований. А пока вейвлет-обработка сигналов вполне возможна при стыковке серийных цифровых приборов с компьютерами, на которые установлены системы компьютерной математики с пакетами расширения по вейвлетам.

Список использованных источников

1. http: //websound. ru/articles/sound-processing/effects. htm

2. http: //analogiu. ru/6/6−5-2−1. html

3. http: //analogiu. ru/6/6−5-2−2. html

4. http: //analogiu. ru/6/6−5-2−3. html

5. http: //analogiu. ru/6/6−5-2−4. html

6. http: //shackmaster. narod. ru/fourier. htm

7. http: //www. twirpx. com/file/212 558/

8. http: //www. twirpx. com/file/212 590/

9. http: //www. bnti. ru/showart. asp? aid=38&lvl=02. 06

10. http: //archive. nbuv. gov. ua/portal/natural/ii/20091/1/00_Ermolenko_Lashchenko. pdf

11. http: //www. kipis. ru/upload/kipis_articles/article_Dyakonov2−2009. pdf

ПоказатьСвернуть
Заполнить форму текущей работой