ОЦЕНКИ КАЧЕСТВА ВОСПРОИЗВЕДЕНИЯ РЕЧИ В IP-ТЕЛЕФОНИИ


Тип работы:  Диссертация
Бесплатно:  Антиплагиат
Объем: 57 страниц
В избранное:   

МИНИCТEPCТВO OБPAЗOВAНИЯ И НAУКИ PECПУБЛИКИ КAЗAXCТAН

МЕЖДУНAPOДНЫЙ УНИВEPCИТEТ ИНФOPМAЦИOННЫX ТEXНOЛOГИЙ

Ералы Умитжан Айтақыұлы

ОЦЕНКИ КАЧЕСТВА ВОСПРОИЗВЕДЕНИЯ РЕЧИ В IP-ТЕЛЕФОНИИ

МAГИCТEPCКAЯ ДИCCEPТAЦИЯ

Специальность:

7M06201 - Телекоммуникационные системы и сети

Aлмaты 2021

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН

МЕЖДУНАРОДНЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

ФАКУЛЬТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

КАФЕДРА РЭТ

ДОПУЩЕН К ЗАЩИТЕ

Заведующий кафедрой

к. т. н. ассистент-профессор,

Бахтиярова Е. А.

«___» 2021

МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ

Оценки качества воспроизведения речи в IP-телефонии

МАГИСТРАНТ:: МАГИСТРАНТ:
Ералы Умитжан Айтақыұлы«__» 2021:

Ералы Умитжан Айтақыұлы

«__» 2021

(подпись):

(подпись)

МАГИСТРАНТ:: РУКОВОДИТЕЛЬ:
Ералы Умитжан Айтақыұлы«__» 2021: Бахтиярова Елена Ажибековна «__» 2021
(подпись):

(подпись)

МАГИСТРАНТ:: РЕЦЕНЗЕНТ:
Ералы Умитжан Айтақыұлы«__» 2021:

Фамилия И. О.

«__» 2021

(подпись):

(подпись)

МАГИСТРАНТ:: НОРМОКОНТРОЛЕР:
Ералы Умитжан Айтақыұлы«__» 2021:

Фамилия И. О.

«__» 2021

(подпись):

(подпись)

Алматы 2021

Аңдатпа

Осы магистрлік диссертацияда аналитикалық және имитациялық модельдеуді, сөйлеу сапасын объективті және субъективті бағалауды кешенді қолдана отырып, оларды пакеттік беру кезінде сөйлеу хабарламаларын қалпына келтіру теориясы қарастырылды.

Диссертация көлемі 60 бет, 11 суреттен, 10 кестеден, 30 әдебиет көзінен тұрады.

Түйінді сөздер: IP-телефония, сөйлеу сапасы, ықтималдықтар теориясы.

Аннотация

В данной магистерской диссертационной работе рассмотрены теории восстановления речевых сообщений при их пакетной передаче при комплексном использовании аналитического и имитационного моделирований, объективных и субъективных оценок качества речи.

Объем диссертации 60 страниц, он содержит 11 рисунков, 10 таблиц, 30 источников литературы.

Ключевые слова: IP-телефония, качество речи, теория вероятности.

Abstract

In this master's thesis, the theory of restoration of speech messages during their batch transmission with the complex use of analytical and simulation modeling, objective and subjective assessments of speech quality is considered.

The volume of the thesis is 60 pages, it contains 11 figures, 10 tables, 30 sources of literature.

Key words: IP-telephony, speech quality, probability theory.

ОСНОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ

АДИКМ - адаптивно дифференциальная импульсно кодовая модуляция;

ИКМ - импульсно кодовая модуляция;

ОСШ - критерий отношения сигнал/шумна входе воспроизводящего устройства;

ПС - порог слышимости;

РИ - речевая информация;

PC - речевой сигнал;

РР - разборчивость речи;

ТКУРИ -технический канал утечки речевой информации;

ТфОН - телефонные сети общего пользования;

ц е п - цифровые системы передачи;

AI - индекс артикуляции (Articulation Index) ;

DALT - диагностические аллитерационные испытания (Diagnostic Alliteration Test) ;

DMCT - испытания по серединному согласному (Diagnostic Medial Consonant Test) ;

DRT - диагностические рифмованные испытания (DiagnosticRhymeTest) ;

MRT - модифицированные рифмованные испытания (Modified Rhyme Test) ; HPAST - испытание no Гарвардским психоакустическим предложениям;

HST - испытание по предложениям Хаскинса (Haskins Sentence Test) ;

ETSI - Европейского Института стандартов в электросвязи (European Telecommunications Standards Institute) ;

ITU-T - Международный Союз Электросвязи (International Telecommunication Union) ;

MOS - усредненный показатель мнений о качестве (Mean Opinion Score) ; MTI - индекс модуляции (Modulation Transfer Index) ;

PBWL - испытания с использованием фонематически сбалансированных списков слов (Phonematicaly Balanced Word List) ;

PSIL - уровень помех восприятию речи с привилегированной частотой (Preferred-frequency Speech Interference Level) ;

R - показатель качества R (Quality Rating) ; RASTI - быстрый» индекс передачи речи; RT - рифмованные испытания (Rhyme Test) ;

SUS - испытание по семантически непредсказуемым предложениям (Semantic Unpredictable Sentences) ;

SII - индекс разборчивости речи; SIL - уровень помех восприятию речи (Speech Interference Level) ;

STI - индекс передачи речи передачи речи (Speech Transmission Index) ; STITEL - индекс передачи речи для телекоммуникационных систем;

SUS - испытание по семантически непредсказуемым предложениям (Semantic Unpredictable Sentences) ;

СОДЕРЖАНИЕ

ВВЕДЕНИЕ . …… ….

1 Обзор критериев оценивания качества речи . ………. …

1. 1 Категории речи. . . .

1. 2. Оценка качества речи по ГОСТу 50840-95. .

2 Приложение критериев качества восстановления речи к оцениванию качества ее пакетной передачи . ……. .

2. 1. Особенности пакетной передачи речи. ……. .

2. 2 Оценка качества восстановления речи по критерию отношения сигнал/шум . ……. .

2. 3 Оценка качества восстановления речи по критериям разборчивости

3 Объективные и субъективные оценки качества речи при аналитическом и имитационном моделировании ее пакетной . . .

3. 1 Аналитическое оценивание качества восстановления речи в IP-телефонии . . .

3. 2 Имитационное моделирование при оценивании качества восстановления речи в IP-телефонии . . .

3. 3 Сопоставление объективных и субъективных оценок качества речи при аналитическом и имитационном моделировании ее пакетной передачи . . .

ЗАКЛЮЧЕНИЕ . … . . .

Список использованных литератур . . .

3

5

8

11

13

15

16

18

22

26

29

39

55

66

67

ВВЕДЕНИЕ

Актуальность темы. Развитие современных телекоммуникационных технологий и, в частности, IP -телефонии, связано с пакетной передачей речевой информации [1, 35-43, 58-60, 67-75, 81, 84, 85], при этом на приемной стороне возможно возникновение коротких пауз в речи вследствие потери речевых пакетов в IP-сетях из-за невозможности переспрашивания. Плохое качество каналов связи и перегрузки в сетях приводят к частым потерям речевых пакетов, что, в свою очередь, вызывает ухудшение разборчивости, а иногда и полную невозможность речевого общения.

Искажение речевой информации, вызванное потерей речевых пакетов, зависит от типа кодеков, применяемых в шлюзах IP-сети. От потери пакетов качество речи в большей степени зависит при использовании низкоскоростных кодеков по сравнению с высокоскоростными кодеками. Принято считать, что в IP-телефонии хорошего качества допустимый уровень потери пакетов может составлять 1-3%, причем меньшее значение относится к низкоскоростным кодекам, а большее - к высокоскоростным.

Для сравнительной оценки качества передаваемой речевой информации разработаны различные методы.

Одним из них является метод MOS (Mean Opinion Score), характеризующий усредненный показатель мнений о качестве и представленный в Рекомендациях ITU-T Р. 800 и Р. 830 [8] .

Другим методом оценки является использование единиц рейтинга R (Quality Rating) по сто балльной шкале. Международным союзом электросвязи была предложена Е-модель, описанная в рекомендации ITU-T G. I07 [9], для расчета рейтинга R. Между MOS и R существует зависимость, представленная в [9] .

Методы исследовання. В работе использованы методы теории вероятностей, математического анализа, статистические методы обработки экспериментальных данных.

Научная новизна. Степень научной новизны диссертации определяется тем, что она развивает теорию восстановления речевых сообщений при их пакетной передаче при комплексном использовании аналитического и имитационного моделирований, объективных и субъективных оценок качества речи.

Практическая ценность разработанных в диссертации математического аппарата и методов имитационного моделирования заключен предоставленной возможности получения объективных результатов оценки качества речи, использованных при анализе и проектировании конкретных цифровых систем пакетной передачи речевой информации.

Традиционным является метод, использующий критерий отношения сигнал/шум (ОСШ) на выходе воспроизводящего устройства и разборчивости [52-54, 76, 79] .

Как будет показано ниже, существуют замечания, касающиеся как определения показателя R в Рекомендациях ITU-T, так и по поводу существенной несогласованности оценок качества пакетной передачи речи, предоставляемых критериями MOS и Е-модели и критериями ОСШ и разборчивости.

В связи с изложенными проблемами развития телекоммуникационных технологий анализ различных критериев оценки качества пакетной передачи речевой информации методами аналитического и имитационного моделирования представляется важной и актуальной научно-технической задачей.

Цель работы состоит в совершенствовании методики и критериев оценивания качества пакетной передачи речи путем использования аналитического и имитационного моделирований, выяснении физической сути различных подходов, используемых для оценки качества и выработке необходимых рекомендаций для практического применения используемых методов.

Реализуется следующая последовательность решения задач диссертационной работы:

1. Аналитический обзор критериев оценивания качества речи и их приложений к оцениванию качества пакетной передачи речевой информации.

2. Аналитическое оценивание качества восстановления речи в IP-телефонии по критерию отношения сигнал/ шум и критерию MOS и Е-модели.

3. Оценивание качества восстановления речи в IP-телефонии на основе использования имитационного моделирования процессов потери пакетов речи и процессов ее восстановления.

4. Сопоставление объективных и субъективных оценок качества речи при аналитическом и имитационном моделировании ее пакетной передачи

ГЛАВА 1 ОБЗОР КРИТЕРИЕВ ОЦЕНИВАНИЯ КАЧЕСТВА РЕЧИ

1. 1 Категории речи

Речь по зарубежной классификации разделяется на три категории [22] :

  • «Неусиленная речь» - обычная речь, используемая при разговоре «лицом к лицу» (характерная для прямых акустических методов объективной оценки показателей защищенности речевой информации (РИ) от утечки по техническим каналам ТКУРИ),
  • «Усиленная речь» - имеет место в системах, где передается форма исходного речевого сигнала (например, системы IP- телефонии при применении кодека рекомендации G. 711 стандарта Н, 323),
  • «Вокодерная или синтетическая речь» - имеет место в системах, где форма исходного речевого сигнала (PC) не передается (например, системы IP-телефонии при применении кодеков семейства рекомендаций стандарта Н, 323 за исключением рекомендации G, 711),

Вокодерные системы не могут быть проверены с использованием объективно-ориентированных методов, таких как рассмотренные ниже RASTI, AI, или прямые физические измерения. Вместо этого проводятся артикуляционные испытания разборчивости. Причина этого в акустических особенностях неестественной речи, В синтетической речи различия между фонемами могут быть меньше, её спектральное распределение иное, чем у реальной. Обычно списки слов как испытательный материал, используются чаще, чем предложения потому, что предложения обеспечивают грамматические и контекстные ключи, позволяющие угадать слова.

Рассмотрим методы определения разборчивости речи (РР) для каждой категории [22],

1. 2Артикуляционные испытания

Испытание разборчивости - прямой, иногда единственный путь

испытания качества речевой связи. При таких испытаниях диктором зачитывается набор сообщений (стимулов), аудитор делает отметки в ответном листе и подсчитывается число ошибок, сделанных аудитором. Испытания обычно применяются в научных исследованиях, они удобны для прослеживания влияния различных факторов на разборчивость речи. Наиболее часто за рубежом применяются сегментальные испытания с использованием фонематически сбалансированных списков слов (PBWL, Phonematicaly Balanced Word List), рифмованные испытания (RT, Rhyme

Test), по методам диагностического рифмованного иcпытaния(DRT, DiagnosticRhymeTest), модифицированного рифмованного иcпытaния(MRT, Modifled Rhyme test), испытание по серединному coглacнoмy(DMCT, Diagnostic Medial Consonant Test), диагностическое аллитерационное HcnbiTaHHe(DALT, Diagnostic ALliteration Test) и др. [22] .

Кроме того используются различные варианты испытания разборчивости слов в предложениях.

Рассмотрим содержание этих испытаний.

Сегментальные испытания. Сегментальные методы испытывают разборчивость отдельных фонем или сегментов речи. Используются «несущие предложения», включающие испытательные слова (например «Напишите [испытательное слово] сейчас») . Предложения возбуждают реверберационное поле до того, как испытательное слово будет произнесено. Испытательные слова произносятся без ударения и выражения, несущие предложения одни и те же для любого испытательного слова. Это необходимо для того, чтобы должным образом учесть эффект реверберации.

Фонематически сбалансированные списки слов PBWL [22] .

Испытательные материалы состоят из двадцати списков по 50 фонематически сбалансированных слов, то есть слова, подобраны так, что встречаемость фонем, их составляющих, та же, что и в нормальной повседневной речи. Иногда, аудитору зачитываются слова из различных списков в случайном порядке, чтобы он не мог угадать, какое слово услышит. Результаты испытания определяются, как процент корректно идентифицированных слов от числа всех воспроизведённых слов.

Метод испытания разборчивости при PBWL требует большего количества обученных аудиторов и дикторов, чем другие статистические испытания, и особенно чувствителен к соотношению сигнал/шум (S/N) : небольшое изменение S/N вызывает большие изменения результатов.

Рифмованные испытания RT [22] . Методы MRT, DRT, DMCT и DALT, описанные ниже, объединяют в группу «рифмованные испытания», наиболее полезные для сравнения систем связи, находящихся в одних и тех же условиях.

Диагностическое рифмованное испытание DRT [23] использует набор отдельных слов для испытания разборчивости согласных в начале слов. Тестовый материал состоит из 96 пар слов, отличающихся только по начальному согласному. Среди этих слов выделены категории по шести отличительным особенностям. Результаты по этим шести категориям усредняют и получают значение общей разборчивости. Несущие предложения не используются. Задача аудитора указать, догадываясь, если он не уверен, какое слово из двух представленных ему слов, воспроизведено в ответном листе.

Результатом DRT, является процент скорее правильно угаданных слов, чем корректно идентифицированных. Таким образом, 50 % правильно идентифицированных слов соответствует уровню DRT= 0; 75 % слов - уровню DRT= 50; 100 % слов - уровню DRT= 100.

DRT - широко используемый метод с большой диагностической информативностью о разборчивости согласных. Испытание может быть осуществлено за малое время. Однако DRT слабо проверяет разборчивость гласных и испытательный материал весьма ограничен, иснытательные стимулы не равновероятны (не тестируются все возможные вариации согласных) .

Модифицированное рифмованное исиытание MRT (расширение DRT [23, 25] ) - испытание на разборчивость согласных, находящихся и в начале и в конце слов.

Испытание по серединному согласному DMCT - модификация DRT

  1. Его испытательные материалы состоят из 96 пар двусложных слов, отобранных по отличию в серединном согласном, с выделением категорий какBDRT.

Диагностическое аллитерациоиное испытание DALT - модификация DRT [25] . Испытательные материалы DALT состоят из 96 пар односложных слов, отобранных так, чтобы отличаться по заключительному согласному с выделением категорий как в DRT.

Достоинства рифмованных испытаний: возможность привлечения небольшого числа (10 - 20) необученных дикторов и аудиторов без ущерба для достоверности результатов; легкость и быстрота проведения испытания.

Другие сегментальные испытания.

Стандартное сегментальное HcnbiTaHne(SST -Standard Segmental Test) использует списки бессмысленных слов (логатомов-не существующих в языке слов), имеющих структуру типа CV, VC, и VCV [25] . Основные элементы испытательного материала это все согласные и три гласных звука (a, i, и и) . Для каждого предъявленного аудитору стимула, в ответном листе должен быть вписан, отсутствующий в нём согласный, таким образом, гласные не тестируются вообще.

Испытание переходов согласный-гласный с использованием логатомов дает возможность тестировать переходы между гласными и согласными [25] (наиболее часто используемых методов оценки синтетической речи, применимый для речи вообще) . Испытательные слова обычно симметричные.

Испытание по идептифпкацип группы (CLID, CLuster IDentification Test) . Испытательный материал не предопределен, а генерируется для каждого испытания отдельно.

Процедура испытания состоит из трех главных стадий: генерации слов, фонемно-графемной конверсии и автоматического подсчета. На стадии генерации слова создаётся испытательный материал в фонетическом представлении. Пользователь может определять число генерируемых слов, структуру слога и частоту возникновения, отдельно для начальной, срединной и заключительной групп. Структуры слогов могут также быть генерированы в соответствии с их статистическим распределением. Например, структура CCVC встречается чаще, чем CCCVCCC. Используемые слова - обычно логатомы.

Тестироваппе с произпесепием слова по буквам (SpAT, Spelling Alphabet Test) разработано в ВМФ США для статистического испытания словесной разборчивости. Используются слова, стандартизированные ICAO (Международной организацией гражданской авиации) [25] .

Испытания разборчивости слов в предложениях.

Предложения обычно подбираются в соответствии со встречаемостью слов в данном языке. В отличие от сегментальных испытаний, некоторые элементы могут быть пропущены аудитором. Но данный им ответ может быть корректным, особенно, если используются осмысленные предложения (контекстные и грамматические ключи дают возможность угадывать пропущенные элементы) .

Испытание по Гарвардским психоакустическим предложениям

(HPAST) - закрытому набору из 100 предложений, разработанных, чтобы

проверить словесную разборчивость в контексте предложения [25] .

Предложения выбраны так, чтобы различные фонемы языка были представлены в соответствии с частотой их возникновения.

Испытание по предложепиям Хаскинса (HST - Haskins Sentence Test), также разработанным для испытания словесной разборчивости в предложениях [25] . Но, в отличие от Гарвардских предложений, они бессмысленны, а, следовательно, пропущенные в силу своей неразборчивости, элементы нельзя угадать по контексту. Как и в Гарвардском испытании используется определенный набор предложений, но только однажды, что повышает достоверность результатов и нейтрализует эффект узнавания.

Предложения более трудны для восприятия, чем Гарвардские (в реальной речи не встречаются) .

Испытанпе по семантически непредсказуемым предложениям

(SUS-Semantic Unpredictable Sentences) . Используемые в испытаниях слова,

  • основном односложные, отобраны в случайном порядке из предопределенного списка возможных слов.

Сравнивая испытания можно отметить, что испытание HPAST выполняется легко, не требует обучения, подсчет результатов прост, но при использовании установленного набора предложений, проявляется эффект узнавания. Этого недостатка лишены SUS и nST, в них отсутствуют ключи, так как в SUS испытательные предложения не имеют смысла, а в HST испытательные предложения формируются в ходе самого испытания.

1. 6. Оценка качества речи по ГОСТу 50840-95

  • 1994 году Московским государственным университетом и воинской частью 93901 разработан ГОСТ Р 50840-95. Он принят и введен в действие постановлением Госстандарта России от 21. 11. 95 №579.

Стандарт регламентирует получение комплексной оценки качества передачи речи, основанной на методах измерения показателей разборчивости и качества. Комплексная оценка включает в себя значения слоговой разборчивости, показателя заметности искажения качества речи в тракте (аппаратуре) связи по методу парных сравнений относительно контрольного тракта, показателя заметности искажения шести селективных признаков (картавость, гнусавость и др. ), а также ряда других оценок. Стандарт распространяется на телефонную проводную и радиосвязи, в которьгх используется аналоговый речевой сигнал. Включая в себя устройства, содержащие преобразователи речевого сигнала в цифровую форму, синтезаторы речи, данный стандарт устанавливает нормы качества передачи (воспроизведения) речи и методы измерений:

- разборчивости речи методом артикуляционных измерений;

- разборчивости речи методом артикуляционных измерений по таблицам неполных слогов (метод дописывания) ; качества речи методом парных сравнений испытуемого и контрольного трактов;

качества речи методом оценки величины заметности искажений селективных признаков;

разборчивости, качества речи и узнаваемости голоса диктора метода парных сравнений;

  • фразовой разборчивости в испытуемом тракте при ускоренном в 1, 4 - 1, 6 раза по сравнению с нормальным темпом произнесения. данном стандарте применяются следующие термины с соответствующими определениями.
... продолжение

Вы можете абсолютно на бесплатной основе полностью просмотреть эту работу через наше приложение.
Похожие работы
Минимизация Потерь Пакетов и Уменьшение Вибрационного Эффекта в Системах Передачи Голоса по Протоколу Интернета: Обзор Исследований и Развитие Технологий
Особенности Развития Телефонии в Сфере IP-Коммуникаций: Влияние на Маршрутизацию Звонков, Caller ID и Управление Совместимостью Мобильных Номеров MNP
Параметры задержек и алгоритмические сложности вокодеров в IP-телефонии
Требования к SoftSwitch в NGN-сетях: поддержка различных протоколов, открытая архитектура и обеспечение безопасности
Проектирование сети IP-телефонии на примере банка
Безопасность IP - телефонии
Контактные центры: эффективное решение для управления клиентскими запросами и оптимизации бизнес-процессов
Развитие фиксированной связи в Казахстане: перспективы и достижения компаний DUCAT и ASTEL на рынке телекоммуникационных услуг
Эффективное управление процессом работы системы сбора информации в Call-центре Кселл
Механизмы формирования и управления голосовыми вызовами в IP-телефонии: реализация шлюзовой функции, обеспечение безопасности и противодействие угрозам в системах голосовой связи
Дисциплины



Реферат Курсовая работа Дипломная работа Материал Диссертация Практика - - - 1‑10 стр. 11‑20 стр. 21‑30 стр. 31‑60 стр. 61+ стр. Основное Кол‑во стр. Доп. Поиск Ничего не найдено :( Недавно просмотренные работы Просмотренные работы не найдены Заказ Антиплагиат Просмотренные работы ru ru/