Модуль LTR24 в задаче многоканальной оценки разборчивости речи

Внедрение: 2018 г.

Статья [1] посвящена анализу подхода к многоканальной оценке разборчивости речи. Этот подход основан на выборе частотных диапазонов с наибольшим значением формантной разборчивости среди всех измерений и последующем вычислении индекса разборчивости речи по полученным выборкам. Авторами производились измерения в контрольных точках реального помещения традиционным методом с учетом явления многоканальности.

Реализация программно-аппаратного комплекса производилась не только для выполнения объективной (расчетной), но и для субъективной оценки разборчивости речи. В состав комплекса входили ПК, модуль АЦП LTR24‑2, измерительные микрофоны, акселерометры и акустический излучатель (AR). Для реализации подхода многоканальной разборчивости голоса использовалась крейтовая система LTR

Для оценки разборчивости речи разработаны две версии программы. Первая программа делает расчетную оценку и указывает наиболее уязвимые полосы частот в канале. Вторая программа позволяет произвести качественную оценку на основе отмеченных слабозащищенных диапазонов частот, заключающуюся в извлечении из звукозаписей для каждого из каналов выбранных частотных диапазонов с последующим микшированием в единый файл.

Процесс измерения с использованием двух каналов проводился в семи октавных полосах на средней частоте полосы. Блок-схема измерительной системы представлена на рисунке 1.

Рисунок 1. Блок-схема измерительной системы (1 – измерительный микрофон, 2 – акселерометр, GTS – источник тест-сигнала, AR – акустический излучатель, PC – компьютер, модуль LTR24‑2 в составе крейта LTR).

 

Разработанный программно-аппаратный комплекс даёт возможность производить качественную (субъективным методом) оценку разборчивости речи. Использование многоканального подхода позволяет повысить достоверность оценки помещений для переговоров. Расчет речевой разборчивости, проведенный синхронно по совокупности двух каналов, также указывает на увеличение разборчивости при использовании многоканального подхода с 19 % (в одном канале) до 29 % (в совокупности по двум каналам). После измерения в разных контрольных точках одной из реальных комнат получены результаты, которые демонстрируют увеличение разборчивости с 14 % до 32 % за счет применения многоканального подхода, что еще раз подчеркивает актуальность рассматриваемого вопроса.

Программно-аппаратный комплекс записывает и обрабатывает сигналы с контрольных точек, производит корректную обработку записей, суммируя сигналы в зависимости от выбранных частотных диапазонов. В результате аудиозапись, полученная путем объединения записей из разных контрольных точек, может быть подвергнута субъективному анализу оператором (определяется по количеству правильно принятых слов из тестовой записи).

В данном эксперименте разборчивость речи увеличилась примерно на 15 %. Полученные результаты рекомендуется учитывать при аттестации помещения для переговоров.

Данная статья была представлена на 14‑ой международной научно-техническойм конференции (APEIE) в 2018 г.

 

Источник:
Ivanov, Andrey & Markova, Maria. (2018). Application of a Multichannel Approach to Speech Intelligibility Assessment. 157‑161. DOI 10.1109/APEIE.2018.8545202.


Разработчик: Иванов А.В., Маркова М.А. (Новосибирский государственный технический университет)

Контакты

Адрес: 117105, Москва, Варшавское шоссе, д. 5, корп. 4, стр. 2

Многоканальный телефон:
+7 (495) 785-95-25
Факс: +7 (495) 785-95-14

Отдел продаж: sale@lcard.ru
Техническая поддержка: support@lcard.ru

Время работы: с 9-00 до 19-00 мск

L-CARD в проектах