Информационные технологии
Большинство современных методов анализа и обработки речевого сигнала основаны на получении его частотного спектра. Их плюсом является принципиальная аналогия с работой человеческого слуха, недостатком – неизбежно высокая ресурсоемкость. Иногда последняя выступает как фактор, ограничивающий возможности разработки устройств передачи и анализа речи.
Одним из альтернативных решений является предлагаемый метод амплитудной фильтрации (АФ), основанный на удалении из речевой волны экстремумов малой магнитуды.
Суть АФ заключается в аппроксимировании формы речевой волны более простой ломаной линией. Результирующий сигнал в 1,5 раза лучше поддается компрессии традиционными методами при несущественной потере разборчивости речи.
Незначительность влияния АФ на разборчивость речи объясняется известными особенностями спектра речевого сигнала (падение амплитуды колебаний с ростом частоты) и восприятия речи человеком (наиболее важными для разборчивости речи являются колебания частотой до 4 кГц).
Побочным продуктом АФ речевого сигнала является информация о фонетическом составе обрабатываемого фрагмента, которая может быть использована в целях автоматического распознавания речи.
Ввиду исключительно малой ресурсоемкости метода АФ, он может быть реализован в сверхмалых устройствах анализа, кодирования и передачи речевой информации.
В настоящее время нами создан действующий прототип программной библиотеки для обработки речевого сигнала методом АФ.
Дополнительные материалы: | Полный текст доклада |
Ваши комментарии Обратная связь |
[Головная страница] [Конференции] |
© 1996-2000, Институт вычислительных технологий СО РАН, Новосибирск
© 1996-2000, Сибирское отделение Российской академии наук, Новосибирск
Дата последней модификации: 06-Jul-2012 (11:48:14)