Сөз сигналдарын түрлендіру әдістері
МАЗМҰНЫ
КІРІСПЕ 10
1 Сөздік ақпараттарды кодалау және декодалау принциптері 12
1.1.Сигнал өңдеу 13
1.2. Сөз сигналдарын түрлендіру әдістері 14
1.3. Сөз сигналын вокалды, вокалсыз және тыныштық жеріне бөлу алгоритмы 16
1.4. Сөз сигналын қайтадан қалпына келтірудің тікелей әдісі 22
1.5. Дельта-модуляция әдісі 28
1.6. Сөздің формантты жиілігінің аналогты синтезі 31
2. Сөздік ақпараттарды кодалау және декодалау құрылғысын құрастырып жасау
39
2.1 Сөз сигналын сызықты болжау әдісі 39
2.2. Сызықты болжау коэффициенттерімен кодалау әдісі бойынша сөзді
синтездеу (СПК) 41
2.3 Сөз сигналын қайтадан қалпына келтіру 46
3 Есептеу бөлімі 47
3.1 Сөз сигналының параметрларын есептеу алгоритмын таңдау 47
3.2. Сөз сигналын кодалау-декодалау үрдісін моделдеу 48
3.3. Кодалау-декодалау құрылғысының жалпы сұлбасы 50
4 Экономикалық бөлім 57
4.1.1 Инвестицияның тұтынушылығын есептеу 57
4.1.2 Электроэнергияға кететін шығындар 58
5 Қауіпсіздік және еңбек қорғау бөлімі 65
5.1 Қазақстан Рeспубликасының Eңбeк кoдeксi 65
5.2 Элeктр қауiпсiздiгi 67
5.3 Жарықтандыру 69
5.4 Элeктрoмагниттiк өрiс 71
5.5 Өрт қауiпсiздiгi 72
ҚОРЫТЫНДЫ 75
Әдебиеттер тізбегі 76
КІРІСПЕ
Цифрлық байланыста ақпараттарды кодалау және декодалау жүйелері
кеңінен және нақты түрде қолданылады. Өңдеуге арналған ақпараттарды үш
түрге бөлуге болады. Бірінші сөздік (дауысты), екінші бейнелік (көрініс)
және үшінші текстік (жазба) ақпараттары. Әр түрлі мәліметтерді өңдеп
кодалау үшін әр түрлі кодалау жүйелері қолданылады. Кодалаудың сапасы оның
берілетін мәліметтерді ұтымды тығыздауына және ақпаратты жеткізудің
нақтылығына байланысты болады. Сондықтан бұл дипломдық жұмыста сөздік
ақпараттарды кодалау және декодалау жүйелері қарастырылған.
Сөздік ақпараттарды кодалау жүйесінде стандарт ретінде кеңістік
импулсті модуляция қолданылады. Әр телефондық байланысына жылдамдығы 64
кбитс арна беріледі. Қәзіргі уақытта осы каналда берілетін мәліметтерді
тығыздау нәтижесінде үш немесе төрт байланысты орнатуға мүмкіншілік бар.
Бірақ декодалаудан кейінгі қайтадан қалпына келтірілген айтылатын сөздердің
сапасы төмендеу болады. Мысалы қай адамның сөйлеп отырғанын білуге
болмайды және интонациалық мәліметтер жоғалады. Сондықтан сөздік
ақпараттарды кодалау және декодалау жүйесінде қолдануға болатын сөздік
ақпараттардың сапасын төмендетпейтін әдістерді зерттеп қолдану қажет.
Аналогты формантты синтезатор көмегімен сөздің фонетикалық синтезі
орындалады. Жиілік аймағындағы сөзді математикалық қайта қалпына келтіру
үшін сызықты болжау коэффициенттері арқылы кодалайтын цифрлы синтезаторлар
қолданылады.
Бұл әдістердің мүмкіндіктері мен шектеулерін жақсы ұғыну үшін, оларды
жақсылап қарастырамыз. Сөзді синтездеудің әдістерімен танысқаннан кейін
оқырман синтезатордың түрлерінің ерекшеліктерімен қажетті бағыт таба алады.
Егер сіздің назарыңызды нақты әдіс өзіне аударса, онда сіздің жолыңыз сөзді
синтездеумен басталуы мүмкін. Берілген бөлім компьютерден мәтін ақпаратының
шығысын тиімді әдіспен табуға мүмкіндік береді.
Сонымен өте тез таралатын қазіргі заманғы электронды техника аймағының
сөзді синтездеу аймағын қарастыруға көшеміз.
Сөздерді синтездеу әдістерінің аналогиясы бұл жерде өте алыс болып
көрінуі мүмкін, бірақ жасанды мәтіннің әрбір генерациялау әдісі сол бір
мақсатқа қызмет етеді- яғни компьютерге ақпараттың мәтін түрде шығуын. Бұл
мақсатқа жететін әдістер (сигнал пішіндерінің кодалауы- қайта қалпына
келтірілуі, фонетикалық-форматты синтез немесе мәтіннің математикалық қайта
қалпына келтірілуі) cөздің орындалу синтезінің жылдамдығымен, аппаратураның
құнымен және компьютердің тез әсерлілігімен ерекшеленеді. Синтезатордың
мұндай әрбір мүмкін болатын орындаулары синтезделген сөздердің сапасын және
дұрыстығының түрлі дәрежесін қамтамасыз етеді. Басқаша айтқанда сөзді
синтездеудің әрбір үш әдістеріне өзіңнің теріс және оң мінездемеңді бер:
сөзді жақсы артикуляциясымен береді, бірақ оның орындалуы қымбатқа түседі,
басқасы оның сөздік мүмкіндіктері шектелген және біз өз таңдауымызды сол не
басқа әдіске тоқтатқан кезде осыны ескеруіміз керек.
Тапсырма ретінде жылдамдығы 16 кбитс артпайтын каналда берілетін сөз
ақпараттарын өңдеп тығыздауға арналған әдістердің заманға сай түрлерін
қарастырып оның ішіндегі ең ұтымдысын анықтау қажет.
1 Сөздік ақпараттарды кодалау және декодалау принциптері
Сөз ақпараттардың басқалардан ерекшелігі оның негізгі
сипаттамаларында. Акустикалық сигнал микрофон арқылы электрлік сигналға
түрлендіргенде оның негізгі үн жиілігі, энергия қуаты шоғырланған жерлері
(форманта), спектрдің түрі және оның уақыт бойынша өзгеруі айтылған
сөздердің тек қана фонетикалық мәндерін көруге болады. Ол айтылған сөз
дыбысты, дыбыссыз немесе тыныштық кезі екенін тек қана сигналдың негізгі
сипаттамаларын өлшеп біле аламыз. Сөз айтылғанда оның акустикалық сигналы
жолағы 80-8000 Гц аралығында толық орналасады. Ал аналогты телефон
байланыста бір каналға берілген арнаны 340-3400 Гц жолағымен шектелген. Бұл
жағдайда сөз сапасы, мысалы дикторды тану және сөздерді анық естіп ажырату
сәл нашарлайды. Сондықтан сөз сигналын тығыздау үшін әртүрлі математикалық
аппараттар және құрылғылар қолданылады.
1.1.Сигнал өңдеу
Сигнал өңдеу үрдісі төмендегі сұлбада көрсетілген. Сөздік сигналдардың
ақпараттық дерекнамасы адам болғандықтан, оның аузынан шыққан сөздерге
байланысты акустикалық тербелістердің күшін өлшеу арқылы оны электрлі
сигналдарға түрлендіріледі. Ары қарай осы электрлі сигналдар (сөздік
сигналдар) күрделі өңдеуге жатады. Бірінші қадам - сөздік сигналдар белгілі
бір модель қолдану негізінде сигнал көрсетілуін керекті формаға өзгерту
арқылы сипаттамаларын қалыптастыру. Сигналдарды өңдеудің ең соңғы қадамы
оның ақпараттық маңызын бөліп алып қолдану болып табылады. Бұл қадам не
адам тыңдау арқылы не автоматты түрде іске асырылады. Мысал ретінде
шектелген дикторлардың ішінен сөйлеп тұрған дикторды дауысынан тану
(идентификация) қарастыруға болады. Бұл кезде сөздік сигналдың уақытқа
байланысты спектр көрсетілуі қолданылады. Тағы да түрлендірудің бір түрі
бүкіл фраза бойынша спектрдің орта шамасын әр диктордың спектрлерінің
эталонды шамаларымен салыстыру арқылы спектрлердің ұқсастық өлшемдерінің
ең жақынымен дикторды анықтауға болады. Бұл мысалда сөздік сигналдың
ақпараттық маңызы ретінде әр диктордың дауыстарының ерекшелігі қолданылады.
1.1 - сурет. Сөздік ақпараттарды өңдеу сұлбасы
Сондықтан, сигнал өңдеу екі негізгі мәселені шешуден тұрады:
- сөздік тербеліс формасында немесе керекті параметрлер ретінде
сигналдың жалпы көрсетілімдерін алу;
- алған көрсетілімдерді сигнал өңдеу мәселелерін шешуге ыңғайлы
формаға түрлендіру.
Цифрлы өңдеу екі бағытқа бөлінеді: бірінші, сигналдың дисреттік
көрсетілімдерін алу және екінші, цифрлық алгоритмдер теориясы, есептері
және оны қолданудан тұрады. Цифрлі өңдеудің бірінші әдістері күрделі
аналогты жүйелерді имитациялаудан тұрады [1]. Қазіргі уақытта ЭЕМ
программасы ретінде жазылған сөздік сигналдарды цифрлық өңдеу жүйелерін,
нақты алгоритмдерді дәл орындайтын арнаулы микропроцессорлы есептеу
құралдар түрінде жасап шығаруға болады. Заманға сай қәзіргі цифрлы әдістер
сөздік сигналдарды өңдеуде кеңінен қолданылуда [4, 10].
1.2. Сөз сигналдарын түрлендіру әдістері
Сөздік сигналдарды цифрлы өңдеудің үш бағытын қарастырайық:
- сөздік сигналдарды цифрлы формада көрсету;
- аналогты өңдеу тәсілдерінің цифрлы түрде іске асыру;
- тек қана цифрлы өңдеуге арналған тәсілдер.
Бұлардың ішіндегі ең маңыздысы сөздік сигналдарды цифрлы формаға
келтіру болып табылады. Негізгі қолданатын теория ол дискреттеу, немесе
жиілік бойынша шектелген сигнал белгілі уақыт сайын өлшенген шамалармен
көрсетуге болады деген Котельников теоремасы қарастырылады. Сонымен цифрлы
өңдеу теориясымен оны қолдану негізінде дискреттеу процедурасы жатады.
Сөздік сигналдарды дискретті көрсетілу тәсілдерін екі үлкен топқа бөлуге
болады – сөздік тербелістерді цифрлы және параметрлі көрсетілу.
1.2 - сурет. Сөздік сигналдарды көрсетілу тәсілдері
Сөздік тербелістің цифрлы көрсетілімдерін алу тәсілі дискреттеу және
кванттау кезінде тербеліс формасын мүмкіншілігінше сақтауға негізделген.
Параметрлі көрсетілімдер алу тәсілі сөзқұрылу моделіне сәйкес сөздік
сигнал суреттемесінің керекті көрсеткіштерін (параметлерін) алуға
негізделген. Параметрлік көрсетілімдер алудың бірінші кезеңінде сөздік
тербеліс дискретелінеді және квантталынады, одан кейін модел параметрлерін
алу үшін өңдеуге жатады. Модел параметрлары екіге бөлінеді. Біріншісі сөз
дыбыстарының дерекнамасына байланысты қозу параметрлары, екіншісі айтылған
сөздің жеке дыбыстарына байланысты дауыс трактысы параметрлары болады.
Төмендегі суретте әртүрлі цифрлы көрсетілімдер алу тәсілдерінің
ақпарат беру жылдамдығына байланысты салыстырмалы нәтижелері көрсетілген.
1.3 - сурет. Сөздік сигналдың өңдеу әдістерінің ақпарат беру
жылдамдығы
Пунктирлі сызық 15 кбитс жылдамдық нүктесінен өтіп сөз тербеліснің
цифрлы көрсетілуін парметрлік көрсетілуінен бөледі. Ақпарат берудің керекті
жылдамдығы 75 битс (текст) 200000 битс дейін өзгеріп отыратынын байқауға
болады. Сондықтан, цифрлы көрсетілу әдістеріне байланысты ақпарат беру
жылдамдығы орташа 3000 ретке дейін өзгертуге болады. Бірақ ақпарат беру
жылдамдығының көрсетілу әдістерін таңдаудағы негізгі фактор дың біреуі.
Құрылғының бағасы, цифрлық көрсетілімдердің бейімділігі, қайтадан қалпына
келтірілген сөздің сапасы және т.б. факторларда таңдау кезінде өз
қасиеттерін көрсете алады.
1.4 - сурет. Сөз сигналының өңдеуді қолданатын бағыттар
Бұл дипломдық жұмыста сөз сигналының сапасын арттыру мәселесі
қарастырылып сөз тығыздау құрылғысының жаңа түрлерін жасау мүмкіншілігі
көрсетілген. Негізгі сөз тығыздау үрдісінде сөз сапасын нашарлану себебі
келесі факторларға байланысты:
- аналогты байланыс жолында сөз тарату арнасы өте аз, 340 Гц – 3400
Гц арасында болғандықтан сөз сапасы нашарлайды.
- аналогты сигналды цифрлы сигналға түрлендіргенде қосымша шулар пайда
болып сөз сапасын төмендетеді.
- стандартты 64 кбитс жылдамдықтан 32 немесе 16 кбитс жылдамдыққа
сөз тығыздау құралдары қолданғандықтан сөз сапасы тағы да нашарлайды.
Төмендегі суретте кодалау және декодалау жалпы сұлбасы көрсетілген.
Ақпарат жіберушіде кодалайтын құрылғыны – кодер, ал қабылдағышта
декодалайтын – декодер деп атаймыз. Кодалық бірліктері кодалық кітапқа
жазылып кодермен декодердің жадысында сақталынады. Кодалық кітапта L түрлі
бірліктер жинағы сақталынған. Бірліктер көптігінің жинағы кодалық
кітапті құрайды. Кірістегі векторы сөз сигналының үлгілері ретінде
қарастырылады да кодалық кітаптағы векторлармен салыстырылып сондағы ең
ұқсас векторды табады. Жіберу каналына соған сәйкес ui табылған
вектордың номері индексі беріледі. Декодер қабылданған индекс бойынша
кодалық кітаптағы векторды шығарып алып оны сөз сигналына айналдырады.
1.5 - сурет. Сөз сигналын кодалау-декодалау жүйесінің құрамалық
сұлбасы
Ақпарат беру жылдамдығының төмен дәрежеде болуы сигналдың өзі емес
оның номері берілгендікке байланысты өзгереді.
1.3. Сөз сигналын вокалды, вокалсыз және тыныштық жеріне бөлу алгоритмы
1.3.1. Сөз сигналының уақыттық кадрының ұзақтығын таңдау
Сөз сигналының өзгеруін зерттеу үшін оның бөлінетін уақыттық
кадрлерінің ұзақтығын анықтап таңдау қажет.
1.6 - сурет. СС уақыттық кадрларының түрлері.
СС уақыттық кадрларының ұзақтығына қойылатын талаптар:
- кадрларының тізбегі сөз сигналының қысқа мерзімді динамикалық
өзгерістерін нақты көрсету үшін мүмкіншілігінше қыска болуы тиіс;
- кадрларының тізбегі сөз сигналының ұзақ мерзімді өзгерістерін нақты
көрсету үшін мүмкіншілігінше ұзақ болғаны дұрыс.
1.2 - кесте - СС уақыттық кадрларының түрлері
СС, fg = 8000 Гц, fот ≥ 100 Гц
Санақ Кадр Терезе қасиеті
саны ұзақтығы,
мс
32 328=4 СС қысқа мерзімді динамикалық өзгерістерін нақты
көрсетіп, бірақ оның периодикалық сиппаттамасын көрсете
алмайды
64 648=8 СС қысқа мерзімді динамикалық өзгерістерін нақты
көрсетіп, бірақ оның периодикалық сиппаттамасын толық
көрсете алмайды
128 1288=16 СС қысқа мерзімді динамикалық өзгерістерін толық
көрсете алмайды, бірақ оның периодикалық сиппаттамасын
көрсете алады
256 2568=32 СС қысқа мерзімді динамикалық өзгерістерін көрсете
алмайды, бірақ оның периодикалық сиппаттамасын толық
көрсете алады
СС кестеде көрсетілген шарттармен нақты қабылдау үшін кадр ұзақтығы
негізгі үн периодынан Tот = 1000100 = 10 мс. кем болмауы тиісті .
1.3.2. Сөз сигналының кадрларының түрін анықтау
Төмендегі суретте сөз сигналын тыныштық, вокалды және вокалсыз
жерлерге бөлу алгоритмы көрсетілген. Бұл алгоритм сөз сигналы – айнымалы,
қысқа мерзімді энергия мөлшері және нөл арқылы өту аралықтары күрт
өзгеретін тұрақсыз үрдіс ретінде қарастырамыз.
Алгоритм 7 блоктан тұрады.
1-блок. Бастапқы сөз сигналы , ;
2-блок. Сөз сигналын ұзақтығы 16 мс кадрларға бөлу;
3-блок. Сөз сигналының n-ші кадрының қысқа мерзімді энергиясын En
және нөл арқылы өту нүктелер аралығын Zn төмендегі кестедегі формулалар
қолдана отырып есептеледі.
1.7 - cурет. Сөз сигналын тыныштық, вокалды және вокалсыз жерлерге
бөлу алгоритмы
Мысалы, қысқа мерзімді энергия мөлшері немесе немесе
,
n – кадр номері;
– кадрдың терезелік функциясы;
; – кадр саны;
– сөз сигналының санақ саны.
Нөль арқылы өту нүктелер аралығының қысқа мерзімді функциясы көрші
нүктелердің белгісін салыстыру арқылы анықталады.
Мысалы, ,
және – белгілік функция.
4 және 6 -блок. Қысқа мерзімді энергия шегі Епор және нөль арқылы өту
нүктелер аралығының санының шегі Zпор тағайындалады;
5-блок. Еn Епор?: шарты тексеріледі, егер – шарт орындалса n-кадры
тыныштыққа жатқызылады; орындалмаса – 7-ші блокқа беріледі.
7-блок. Орындауға тексеру жағдайы Zn Zпор?: шарты тексеріледі, шарт
орындалса n-кадры вокалды, орындалмаса вокалсыз деп есептелінеді.
Бұл алгоритмнің кемшілігі En үлкен энергиялық сезімталдығы.
1.3 – кесте - СС қысқа мерзімді параметрларының кестесі
Қысқа мерзімді Қысқа мерзімді орташа Нөлден өту нүктелерінің қысқа
энергия энергия уақытты функцияся
Вокалдывокалсыз шешімінің қателерін азайту үшін келесі формула
қолданылуы тиіс
, (1.1)
– сөз сигналының орташа квадратты мөлшері.
Вокалды сөз жоғарғы энергиясымен және төменгі , ал
вокалсыз сөз бәсең энергиямен және жоғарғы сипатталынғандықтан
келесі шарт орындалуы тиісті
(1.2)
Осы жағдайда -ке қойылатын талап қарапайым түрде болғандықтан
вокалды немесе вокалсыз шешімін қабылдағанда қате жіберу мүмкіншілігі
азаяды.
1.3.3. Сөз сигналын тығыздаудағы жылдамдықтар
Төмендегі 1-кестеде 48Кбайт жадымен сақтауға болатын (К=1024) сөздік
хабарламаның толық ұзақтығы көрсетілген. Айтушы жүйенің жұмысы үшін
қолданылатын өте үлкен сөздікті және бағдарламаларды сақтауға арналған
максималды ұзақтылық(1 сағ 4 мин) көріп отырғанымыздай фонетикалық әдіске
сәйкес келеді. Ал интервалдың басқа соңында сөздің хабарламалық ұзақтығы
сөздің сигналын кодтауда тікелей сөзді синтездеудің тиімді әдісінде жатыр,
яғни онда компьютер жадысының сиымдылығы 48К болған кезде сөздік
хабарламаны ұзақтығы тек 3.2с етіп сақтауға болады.
Бұл жадыға қойылатын талаптар тек қана сөзге қатысты екенін ұмытпау
керек. Ал жадыда қолдануға қажетті сөздік болуы қажет. Егер сіз сөйлемдерді
құрастыруға арналған 100 сөзі бар сөздікке ие болғыңыз келсе, онда
сөздіктегі әрбір сөзді айтуға кететін уақыт шамамен 0,5c екенін ескере
отырып, сөздікті сақтау үшін хабарламаның ұзақтығына сәйкес аз мөлшерде 50c
болатын жады көлемі қажет етіледі.
1.4 – кесте – Тікелей кодтау әдісі
Синтездеу әдісіЖылдамдық, HELLO сөзін 48К жадылы компьютер
битс сақтауға арналған сақтай алатын сөздің
жады көлемі, байт толық мөлшері
Фонетикалық 100-800 4-30 1сағ 4 мин-8 мин
Сызықты кодтау 1200-5000 45-1885 мин 20с-1 мин 17с
Тікелей кодтау 16000-120000 24с-3.2с
600-4500
1.4- кестеге қайта қарайтын болсақ, тікелей кодтау әдісін қолданған
кезде біздің сөздік максимум 48 сөзге (24с) ие бола алады және осылайша
бағдарламалау үшін орын қалмай қалатынын көреміз. Мәселен егер сөйлемді
тікелей сөзді еркін таңдау мүмкіндігінсіз түрінде болса, бірақ қажетті
сәтте әрбір жазылған сөз орамын таңдау мүмкіндігімен шешуге болады. Бұл аз
сөздікпен шектелуге мүмкіндік береді, бірақ сонымен қатар сөйлемді
бағдарламасын сақтау үшін жадының бөлігін бөледі.
Көрсетілген сөйлемдік қорытындыларды салыстыру әдістерінің нәтижесін
сол немесе басқа әдісті таңдауға қатысты соңғы шешімді шығаруға негіз
ретінде қарауға болмайды. Бұл мәліметтер мүмкіндіктердің иллюстрациясы және
олардың әрқайсысының шегі ретінде қызмет етеді.
Жасанды сөздің генерациясының үш әдісін салыстыра отырып, ең алдымен
жасанды (синтезделген) сөз түсінігін анықтау маңызды. Компьютермен
орындалатын сөздің екі негізгі критериі бар, ал негізінде ол жасанды болып
табылады.
Біріншіден, егер компьютер синтетикалық сөзді генерацияласа, онда
онымен айтылатын сөздер сөз болмауы керек, керісінше адаммен жадысына
енгізілуі қажет. Бұл жерде көбінісе магнитафон аналогиясы орынды, мұндағы
лентаның атқаратын рөлін сандық немесе электронды жады атқарады. Расымен
де, егер компьютер айтатын сөздер немесе сөз орамдары шамамен адаммен
айтылған болса,(сөзбен немесе интегралды сұлбалармен дайындалған
шаралармен) онда мұндай жағдайда компьютердің сөзін қайта қалпына
келтірілген деп есептесе болады. Сөздік тахометрде қайта қалпына
келтірілген сөйлемді алудың екі әдісі көрсетілген: сигналдарды тікелей
кодтау әдісі және CПК- синтез әдісі. Бұл әдістер орындалу қабілетіне
байланысты айырмашылық жасайды, бірақ олардың екуіндеде келесіде сөйлемді
қайта қалпына келтіруге қолданылатын алдын ала айтылған сөздік қажет.
Осылайша расымен синтезделген сөйлемді жалғыз алу әдісі фонетикалық
синтездеу әдісі болып табылады.
Осылайша синтезделген сөз өзінің дыбысталуы бойынша басқа екі
жағдайларға қарағанда адамның сөзіне ұқсас. Қазіргі заманғы дәрежедегі
сөздің техникасының дамуы қайта қалпына келтіру әдісін ғана береді. Басқаша
айтқанда, егер сіз нақты синтезделген сөзді алғыңыз келсе, онда сіз
компьютеріңіздің сөзі механикалық түрде дыбысталатынына дайын болуыңыз
қажет. Егерде сіз сөзді қайта қалпына келтірудің бір әдісін қолданғыңыз
келсе, сіздің жүйеңіздің дыбысталуы естуге өте жағымды болады және адамның
бір қалыпты айтуына жақынырақ болады.
Сөздің жасандылығын анықтайтын екінші критерий ақпаратты жинау
аймағындағы негізгі теоремаларымен байланысты таңдау теоремасымен немесе
есептеумен байланысты болады.
1.4. Сөз сигналын қайтадан қалпына келтірудің тікелей әдісі
Бұл сөзді генерациялаудың қарапайым әдісі көбінесе сандық жазуға ұқсас
болып келеді. Жоғарыда біз сөзді немесе қайта қалпына келтіру мақсатында
аналогты сигналдарды таңдауды жүргіздік. Механизм туралы дұрыс ұғым сөзді
қайта қалпына келтіруді кодтау әдісін түсіну үшін өте маңызды. Аналогты
сигналдардың таңдалынуы қалай жүретінін түсіндіру үшін,мынадай мысал
келтірейік. Визуалды (көрермендік) сигналдың таңдалынуын қарастырайық.
Мұнда барлығы дыбыстық аналогты сигналдың жағдайындағыдай жүреді,тек
айырмашылығы, біз визуалды сигналмен жұмыс жасаймыз.
Ең алдымен қозғалыс жүретін сахнаны таңдап аламыз, айталық,теледидар
экраны немесе онда жақын көлікпен өтетін жылдамдықты магистрал. Енді бұл
көрініске қарап және көзіңізді жұмыңыз. Егер ары қарай өз көзіңізді тез
(жиілігі шамамен секундына 1 Гц) ашып – жұмсаңыз,онда қиындықсыз сахнада
болып жатқан жағдайларды бақыласаңыз болады. Көзді ашып-жұмуды жалғастыра
беріңіз,көзді бірнеше секундына аша отырып сіз көз алдыңызда жүріп жатқан
көріністерді шыныменде бақылай алатыныңызға көзіңіз жететін болады. Сіздің
жасағаныңыз қозғалысты визуалды таңдауға сәйкес келеді (аналогты сигналға).
Егер кейбір қозғалыстар тез арада болып өтсе,көзді ашып-жұму жиілігі 1 Гц
болғанымен,сіз оны байқамай да қаласыз. Енді көзді ашып-жұму жиілігі
шамамен бірге дейін 10 секундқа дейін азайтайық,яғни көзді жұмып сіз онға
дейін санайсыз,содан кейін тез арада оларды 10с-қа жабасыз және т.б . Бұл
тажірибені бір-екі минут ішінде қайталай отырып,сіз сахнада болып жатқан
барлық жағдайлардың тізбектілігін бақылау сіз үшін мүмкін болмайды.
Негізінде сіз Найквист критериімен анықталатын,қолданысы дәл бақылау үшін
қолданылатын таңдау жиілігін шекті көлемнен төмен кішірейтіңіз. Жоғары
жиілікпен көзді ашып-жұму кезінде сізде сахнаны бақылау және ондағы болып
жатқан қозғалыстарды сипаттау кезінде қиындықтар тумауы қажет.
Қарастырылған мысал естілінетін сөздердің таңдау үрдісіне аналогты болып
табылады. Ондағы бір ерекшелік,біздің мысалда таңдау визуалды жолмен,ал сөз
жағдайында – Электронды жолмен жүргізіледі. Сөз дыбыстарының микрафонмен
түрлену үрдісінде тез және асықпай ауысатын компоненттерді ұстаушы
электрлік сигнал генерацияланады. Егер де біз таңдауды осы сигналға қатысты
төменгі жиілікпен таңдаған кезде,онда бізге сигналда асықпай ауысатын
компоненттердің бар екенін анықтай аламыз. Сигналдың тез ауысатын
компоненттері мұндай зерттеу әдісінде бізден құтылып кететін еді. Егерде
біз микрафонның электрлік сигналдарын жоғары жиілігімен таңдайтын
болсақ,онда сигналда жоғары жиілікті сигналдарды табатын боламыз.
Иллютрациялау мақсатында 1.2 –суретте түрлі жиіліктермен орындалатын
таңдаулар көрсетілген.
Суреттің ең жоғарғы графигінде таңдаулар алынатын аналогты сигнал
көрсетілген. Оның түрі сөзді өндеу кезіндегі жұмыс істеуге тура келетін
күрделі тербелістерге ұқсас. Бұл сигналдың құрамында тез және асықпай
ауысатын құраушылардың бар екенін байқау қиын емес. Спектралды анализдің
терминдерін қолдана отырып,асықпай ауысатын компоненттер өзімен төменгі
жиілікті компоненттерді ұсынады,ал тез ауысатындар (графиктің орталық
бөлігі)жоғары жиілікті компоненттерді ұсынады деп айтуға болады. Егер
сигналдан ортақ ұзақтық 5 мс-қа тең болса,ол таңдаудың жиілігін милли
секундқа өндіреді, онда біз шығыс тербеліс туралы салыстырмалы аз ақпарат
беретін амплитудалық-модулденген импульсті сигналды (1.2а-сурет) аламыз.
Егер осы бес импульспен бастапқы сигналдың пішінін қайта қалпына келтіруге
тырысатын болсақ,онда ол бізге тек төменгі жиілікті компоненттер жайлы
ақпарат алмауға мүмкіндік береді. Таңдаудың жиілігін екі еселей отырып
(1.2б-сурет) біз шығыс сигнал туралы көп ақпарат беретін сигналды аламыз.
Тағыда және тағыда таңдау жиілігін екі еселей модульденген импульсті
сигналды аламыз. Таңдаудың жиілігін екі еселеу үрдісін таңдау жиілігінің
келесі жоғарылауына басқа ешнәрсені қоспайтын сигналдың алынған пішіні
шығыс сигналдың алынған пішіні шығыс тербеліске дәл сәйкес келмейінше көп
реттен жүргізе беруге болады. Себебі шығыс сигналдағы ең жоғарғы жиілікті
құраушылар (кіріс аналогты) уақытша интервалда бірнеше 0.5 мс-қа кішірейеді
сигналдың дәлме-дәл сипаттамасы үшін біз Найквист теоремасымен келісе
отырып,таңдау жиілігін миллисекундта төрт реттен жүргізуіміз қажет. Бұл
жағдай 1.2 в – суретінде көрсетілген.
Көрсетілген сигнал шығыс сигналдың жоғары жиілікті шығарып
тастауларының үлкен бөлігін өзінде ұстайды. Таңдау жиіліктерінің
сигналдарын дәл орындау үшін миллисекунд ішінде сегіз ретке дейін екі
еселеуге болады (1.2 г –сурет). Бұл жағдайда бастапқы сигнал ешқандай
бұрмалаусыз амплитудалық –модулденген импульсті сигналмен көрсетіледі.
Көрсетіліп өткендей,аналогты сигналдың таңдалынуы биіктігі таңдау
мезетіндегі амплитудалық сигналға,ал ұзақтығы –таңдаудың импульс ауданына
сәйкес келетін импульстердің тізбектілігін береді. Мұндай түрдегі ақпаратты
компьютердің жадысына кіргізу өте күрделі. Ол үшін ең алдымен амплитуда
импульстарының өзгерісін цифрлық түрге түрлендіру қажет. 1.7 суретте
көрсетілген блок –сұлба оны қалай жасауға болатынын көрсетеді.
1.8 – сурет. Анализделінген таңдау үдісі
Сөз сигналын дискреттеу жүйесінде таңдаудың жиілігінің жартысын
жоғарылататын олардың ішіндегі жиілікті құраушыларды жоюға мүмкіндік
беретін, сөз сигналдары ең алдымен төменгі жиілікті сүзгі өткізілетін
микрафонға келіп түседі. Ол сигналдың жиілігін екі еседен кем жоғарылатушы
жиілікте таңдау жүргізілген кезде пайда болатын артық сигналдардың кіруін
тоқтату үшін қажет. (Найквист теоремасын еске түсіріңіз) содан кейін сигнал
оның дәрежесі таңдау сұлбасының кірісіне кіруге мүмкіндік берілетіндей етіп
жоғарылатады. Бұл жерде 1.8 суретте анализделінген таңдау үдісі орындалады.
Таңдау сұлбасының шығысында амплитуда бойынша модулденген таңдаудың әрбір
мезетінен аналогты сигналдың көлемімен сәйкестелінген импульстердің
тізбектілігі алынады. Жүйенің соңғы блогы өзімен аналогты цифрлық
түрлендіргішті (АЦТ) ұсынады. Бұл блок аналогты сигналдардың таңдауы келіп
түсетін және сегіз шығыс торап болатын бір кіріс торапқа ие. Оданда күрделі
16 немесе 8 битті АЦТ-лар бар (разрядты),бірақ біз кіріс сигналдың 8 бит
көлемімен шектелеміз. Бұл АЦТ-ның 8 битті шығыс сигналы компьютерге
мәліметтерді енгізу үшін қызмет етеді. АЦТ-аналогты кіріс сигнал сандық
пішінге түрленеді және импульсті кодтық модуляция сигналы түрінде АЦТ-ның
шығысынан компьютердің жадысына келіп түседі. Импульсті кодттық
модуляцияның үрдісін көрсету үшін 1.9-суретте А,В және С әріптерімен
белгіленген, 1.9-суреттегі сигналдардың пішіні нақты көрсетілген. Біз
компьютердің жадысына енгізуге жарамды пішінге аналогты сөздік сигналдың
түрленуін қарастырдық. Осыған орай алдымен таңдау жүргізіледі, содан кейін
барып аналогты сигналдың ИКМ сигналына түрленуі жүреді.1.9- суретте
көрсетілген С сигналының ерекшелігі бұл импульстің тізбектілігі амплитуда
бойынша тұрақты және компьютердің жадысына енгізуге жарамды. ИКМ-сигналдың
әрбір 8 биті компьютердің тізбекті кірісіне оны жадыға жазу үшін
қолданылады. Сонымен бірге бұл 8 параллельді биттер компьютердің параллель
кірісі арқылы берілуі мүмкін және бір байттан бір байтқа тікелей жазылуы
мүмкін.Компьютердің кірісіне келіп түсетін мәліметтер оның жадысына шығыс
сөздің сигналдың амплитудасының сандық түрінде жазылуы мүмкін. Жадыда
сақталынатын сөздік ақпаратты бағдарламалық құралдармен ақпараттың тығыз
орналасуы үшін қолдана отырып басқаруға болады. Осы тәріздес манипуляциялар
жадыға қойылатын талаптарды төмендетуге мүмкіндік береді.
1.9 - сурет. Сигналды импульсті кодалық модуляциялау
Сонымен біз,біздің компьютердегі жадыға аналогты мәтіндік жазылуының
және таңдалынуының қалай орындалатынын білеміз. Енді тікелей кодтаумен өте
қарапайым мәтін синтезаторын құруға талпынайық. Мұндай синтезатордың
мысалдық сұлбасы 1.5- суретте көрсетілген. Суреттің жоғарғы бөлігінде бізге
таныс блогтар тізбегін көреміз,ол микрафоннан кейін сөздік сигналдың
таңдалынуын орындайды. Таңдаудың 6 кГц жиілігінде сұлба секундна 6000, 8
биттен-байттарды береді. Біз ертеректе hello сөзін айту үшін шамамен 0.3 с
кететінін айтып өткенбіз. Таңдаудың 6000 Гц жиілігі кезінде бұл сөз үшін
1.10-суреттегі тікбұрыш (штрихты сызықпен жүргізілген) – бұл 8 битті
енгізудің параллель порты және 8 битті шығудың параллель порты бар
компьютер. Әрине портта бір түрде орындалуы мүмкін,және сол кезде сөз ол
басында жазылған арқылы орындалады.Компьютермен мәліметтерде жинау
үрдісінде оның резиденті бағдарламасы АЦТ-ның 8 разрядты ақпаратын
тасымалдайды және оны тізбектеп жадыға жазады. Таңдау үрдісі сөзді айтуды
аяқтағаннан кейін аяқталады,ал жадыда hello сөзінің сандық жазылуы қалады.
Суретте көрініп тұрғандай,бұл ақпарат 1024 ұяшығынан шамамен 3073-не дейін
адрестік кеңістікте орын алады. Берілген жағдайда ақпарат кернеу
өзгерісінің ±5 толық диапазонында екілік кодта жеткізілген.Мәліметтермен
реттелген бағана кіріс сигналмен эквивалентті жазылған кернеу көлеміне ие.
Бұл реттелген ақпарат вальтте компьютер үшін ешқандай мәнге ие емес және
бұл жерде таңдаудың аналогты цифрлық үрдісін иллюстрациялау үшін
көрсетілген . Бұл сұлбаның нүктесінде сөз синтезаторын біз сөздің цифрлық
түрінде жазылуына орналастырамыз және бұл жазбаны таспада сақтауға болады
немесе келесі орындаулар үшін касетада сақтауға болады.
Синтезатордың орындаушы бөлігі 1.10-суреттің төменгі жағында
көрсетілген. Компьютердің жадысында сақталатын сөзді орындау бағдарламасы-
бұл ертеректе жазылып қойған ақпаратты тізбекті қадамдармен қарастыратын
және оны 8-разрядты –цифрлық аналогты түрлендіргішке (ЦАТ) байтпен
шығаратын қарапайым индекстеуші бағдарлама. Егер ЦАТ-ты АЦТ-ның кірісімен
біріктірсек,онда мәліметтердің реттелуі және кернеуге түрленуі уайым
шақырмайды. Түрлендіргіштер бірін-бірі аңдиды және кірісте таңдауға
ұшыраған шығыста дәл сол сигнал кернеуін береді. Факті түрінде ол егер
кернеуді екі түрлендіргіштерде кернеу бойынша ±5 cілтеуді құраса онда шығыс
сигнал синтезатордың кірісіне келіп түскен сигналға дәлдікте сәйкес келетін
болады.
ЦАТ-тың 8 разрядты шығысы сигналды қайта қалпына келтіру кезінде пайда
болатын қажет емес жоғары жиілікті компоненттерді сүзгілейтін,төменгі
жиілікті (3кГц) қосылған 1.10-суретінде импульстердің тікбұрышты
төбеліктері сәйкес келеді. Содан кейін сүзгінің сигналы қуатты күшейткішпен
күшейеді және қатты айтқышқа келіп түседі. Қатты айтқыштан еститін сөзіміз
сүзгінің төменгі жиілігімен шақырылған сөздік сигналдың жоғары жиілікті
бөлігінде үлкен емес шығындарды есептемегенде синтезатордың кірісінде шығыс
сөздік сигналды дәл қайталауы қажет. Басқаша айтқанда,өзінің айтылуы
бойынша алынған сөз айтушының дауысына сәйкес келеді және кіріс сөздік
сигнал сияқты модуляцияға және ырғаққа ие.
1.10 – сурет. Сөз сигналының өңдеудің нақты мысалы
Сөздік синтезатор сұлбасында (1.10 сурет) компьютерде сигналды
қабылдау кезінде қолданылатын сөзді сақтау әдістері және сөзді синтездеу
әдістері және сөзді синтездеу үрдісінде орындау бағдарламасы көрсетілген.
Таңдаудың жеткілікті жоғары жиілігінде компьютерде (6 кГц) ақпараттың әрбір
байтын жадыға жазуға және қабылдауға шамамен 17 мкс қалады. Компьютердің
тез әрекеттілігіне қойылатын мұндай талап Бейсик тілінде немесе басқа
жоғары дәрежеде құрылған жазу бағдарламасын және сөзді орындауды
мүмкіндігін алып тастайды. Сондықтанда иссемблерде құралған бағдарламаның
синтезделген сөзін жазуды және орындаудың бір ғана әдісі қабылданған. 1.10-
суретте көрсетілген блок–сұлба сөзді жазу бағдарламасының мүмкіндіктерін
қарастырып,сөзді кодалау үрдісінің қаншалықты қарапайым екенін көрсетеді.
Сөз жадыға енгізілгеннен кейін бастапқы кодталған сөзді орындау
бағдарламасын жүргізуге болады.
1.5. Дельта-модуляция әдісі
Біз қарастырған сөздің цифлық кодқа келесі декодалумен цифрлық кодаға
түрлендіру.Мысалы-сөзді синтездеу әдісінің жалғыз түрі емес. Тәжірибеде
цифрлық кодты түрлендіретін және сигналдарды сақтайтын тиімді басқа да
әдістері бар. Телефонияда және кейбір микросұлба синтезаторларының ішінде
кең қолданыс тапқан әдістерінің бірі-дельта-модуляция деп аталады. Алдында
сипатталғаннан (1.10 сурет) мұның негізгі ерекшелігі, оның абсолютті
көлемдерге емес, амплитудалық қатысты өзгерістерге негізделгендігі болып
табылады. Дельта –модуляция әдісін түсіндіру үшін жолда жүріп бара жатқан
автомобилдің таңдау үрдісін көрсететін визуалды сигналдар мысалына назар
аударайық. Алдында қарастырылған параллель кодалау әдісін қолданып,
автомобилдің А пункттен В пунктке қозғалуын келесі түрде сипаттай аламыз:
- автомобиль А пункттен 100 м қашықтықта орналасқан.
- автомобиль А пункттен 200 м қашықтықта орналасқан.
- автомобиль А пункттен 300 м қашықтықта орналасқан.
- автомобиль А пункттен 400 м қашықтықта орналасқан.
- автомобиль А пункттен 500 м қашықтықта орналасқан.
Осылайша, автомобильдің бастапқы қозғалу нүктесіне қатысты қай жерде
орналасқанын айта аламыз. Өзгермелі көлемнің абсолютті мәнін есептеу әдісі
1.11-суретте көрсетілген. Енді автомобильдің қозғалысын уақыт бойынша
аналогты сигнал түрінде қарастырайық.
1.11 – сурет. Дельта модуляцияның салыстырмалы мысалы
Дельта-модуляцияны қолданғандағы таңдамаларды алу үрдісі қалай
өзгергенін қарайық, бұл біз тек қатыстық өзгерістерге қызығушылық
тудырғанда. Осыған орай, біз әрбір таңдама кезінде сигналдың абсолютті
көлемі жайлы ақпаратты жоғалтамыз. Артық ақпараттты жойып,аналогты сигналды
бақылау мүмкіндігіне ие боламыз. Дельта-модуляцияны қолдану кезінде
автомобиль қозғалысы келесідей:
- автомобиль А пункттен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
Егер біз автомобильді бақылауды жүз километр бойынша бақыласақ,
бірінші есептеуде (1.11 сурет) 15000-ге дейінгі сандарды сақтауға тура
келер еді.
Әрбір таңдама автомобилінің қашықтығының нақты мәнін беретін еді.
Бірақ, әрбір таңдама бойынша жадыда сақтау көлемі өседі.
Дельта-модуляциямен кодалауда автомобиль қозғалысы көршілес таңдама
моментімен салыстырылады да оның айырмасы ғана беріледі. Яғни, тіпті жүз
километр қашықтықта жадыда сақталатын ең үлкен сан 100 санын жадыда сақтау
үшін 15000 саны cақталғаннан гөрі аз уақыт қажет. Осылайша, цифрлық кодтың
тиімділігі дельта-модуляцияны қолданғанда қанша –өсуі керек екені көрініп
тұр. Дельта-модуляция әдісін нүктелік өсімдердің кодталуы деп атайды.
Микрофоннан түсетін сөздік сигналды кодалауды қалай іске асыруға болады.
Микрофонмен қабылданған сөз сигналы cүзгіленіп, күшейеді. Содан кейін
сигнал дельта-модуляцияға ұшырайды, ол үшін аналогты компаратормен кері
байланыс контурынан тұратын аналогты интегратор қолданылады. Кері байланыс
контурында b-типті триггері бар, АЦТ тактілі жиілікті дельта-компонент
сигналын синхрондайды. Дельта-модуляция әдісін қолданатын сигналдар 1.12
суретте келтірілген. Сигнал өзгерісі әрбір Т период аралығында таңдалады.
Егер кіріс сигнал әрі қарай өссе, сұлбадағы А нүктесінің импульстарын куә
етеді. В нүктесіндегі импульстар кіріс сигналының да уақыт интервалы
импульстер кіріс сигналының да уақыт интервалы А және В импульсін кезекпен
генерирлейді.
1.12 – сурет. Дельта модуляция әдісімен кодалау
Дельта-модуляциямен кодалау сөздің дұрыс айтылуы үшін қарапайым сұлба
да жеткілікті. 1.12-суретте қарапайым интегратор көрсетілген. Интегратордың
Е кірісіне таңдама жиілігіне тең екі деңгейлі логикалық сигнал компьютерден
келіп түседі. Интегратордың уақыт тұрақтысын RC таңдама сұлбасындағы
интегралдау ұзақтығына сәйкес түрде таңдайды.
Егер сөздің айтылу кірісіне логикалық бірлік келіп түссе, интегратор
бір белгінің қисық иілу тұрақтысын береді. Кірісіне логикалық нөл түскен
жағдайда шығыс кернеудің иілу қисығы белгіні ауыстырады. Нәтижесінде Ғ
кестесінде көрсетілген типті сигнал алынады. Бұл сигнал дельта-модуляциямен
кодталған шығарылған кіріс сигналы болып табылады.
Көріп отырғанымыздай, сигналдың алынған формасы кейбір кедергілері
бар, шығысымен сәйкес келеді. Дельта-модуляция құрылатын кедергілер
дәрежесі кодтаудың бір кедергісімен анықталады, ол айналым бойынша жүктеу
деп аталынады. Кіріс сигналдың айналымы тез өзгерсе, онда шығыс сигнал
кіріс өзгерістеріне үлгермейді. Бұл модифинирленген әдіс сөздік
синтезаторлардың кейбір микросұлбаларында қолданылған, сонымен қатар Нэшнл
семикондактор фирмасының Диджитокер сөзді синтездеу жүйесінде де
пайдаланады.
Адаптивті импульсті-кодтық модуляцияға (АИКМ) негізделген жүйе
сызықтық жүйеге сәйкес, олардың арасындағы айырмашылық, АИКМ жүйесі соңғы
таңдамадан айналым өзгерісінің бағытын ғана емес,сол кездегі өлшем
өзгерістерін де өзінің жадысында сақтайды. Бұл алдыңғы жүйенің барлық
артықшылықтарын сақтауға және айналым бойынша жүктеме мәселесін жоюға
мүмкіндік береді. Басқаша айтқанда, сигналдың өсетін немесе төмендейтінін
көрсететін жалғыз битті қолдану орнына, өзгерістердің нақты өзгерісіне
байланысты мүмкін сегіз деңгейдің біреуін өсетін немесе төмендейтін сигнал
деп сипаттайтын төрт битті алуға болады. Бұл таңдамалар арасындағы
өзгерістерді нақты сипаттауға, сонымен қатар, сызықты дельта-модуляция
кезіндегі айналым бойынша жүктеу мәселесінен арылуға мүмкіндік береді.
Жоғарыда сипатталғандардан басқа сигналды кодтау арқылы сөз синтезінің
басқа да әдістері қолданылады; бірақ олардың негізінде құрылған жүйелер тек
олардың нұсқа түрленуі болып табылады. Сөздік сигналды кодтау-қалпына
келтіру әдісі бойынша сөз синтезі іске асырудың қарапайым әдістерінің бірі;
түсіну үшін де оңай. Бұрын көрсетілгендей, ол цифрлық әдіске сәйкес. Сөздің
сақтау әдістері болуы мүмкін, бірақ әртүрлі, сөздің тохометрі, сөз
айтылуының жоғарғы нақтылығын алу үшін таңдаманың жоғарғы жылдамдығы қажет.
Сөздік сигналдарды кодтаудың цифрлық әдістерінің тиімдісі АИКМ болып
табылады. Таңдамадағы кіріс сигналдарының өзгерістерінің оның иілу және
амплитуда мәндерімен таңдамаға беріп, әр таңдама бойынша қажет жады битін
қысқартуға болады. Сөз синтезаторларын өңдеуде негізгі мәселе бір айтылған
сөйлемді сақтауға арналған жады көлемін қысқарту болып отыр.
Сөз синтезінің басқа әдісі формантты жиілік синтезі қолданылатын
фонемді қозуы бар синтезаторға енгізілген. Бұл жүйенің жұмыс істеуімен
жақынырақ танысып, сөздің электронды синтез әдістерінің үлкен айырмашылығын
көре аламыз.
1.6. Сөздің формантты жиілігінің аналогты синтезі
Сөздік сигналдың кодтау –қалпына келу сипатталған әдісін сөздің
суреттеліну деп атауға болады. Сондай-ақ сөз синтезі аналогты формант
әдісі немесе формантты жиілік бойынша дұрысы сол сөздік суреттің бейнеленуі
ретінде сипаттаған жөн. Кодталған сөздік сигнал біз суретке түсіріп алатын
табиғи көрінісі немесе заттар сияқты оны синтезатор айтқанға дейін пайда
болуы тиіс. Осы әдістен ерекше, формантты жиілігін синтездеу сол сөзді
жасанды жолмен, яғни суретшінің бақылап салатын суретіне сәйкес көрсету
әдісі. Осы екі әдістің ерекшеліктері бейнеленетін заттың ерекшеліктеріне
сәйкес келуі: суреттің түпнұсқаның дәл жазылуын береді, ал бейнелеу беті
түпнұсқаға жақын, бірақ ешқашан онымен дәл келмейді. Бірақ қойылған
мақсатқа байланысты әрбір әдіс белгілі жақындылықпен сөзді немесе жағдайды
сипаттайды.
1.5 – кесте. Дауысты дыбыстардың жиіліктік типтік қатары
Фонема Сөз түрінде Ғ1 Ғ2 Ғ3
ее Feet 250 2300 3000
i hid 375 2150 2800
eh head 550 1950 2600
ae had 700 1800 2550
ah tot 775 1100 2500
aw talk 575 900 2450
u took 425 1000 2400
oo tool 275 850 2400
Сөздің формантты синтезін жүзеге асырудың әдістері бар. Бірақ әр түрлі
формантты синтез әдістеріндегі сөздің генерациялануының негізгі
функционалды операциялар бірдей. Олардың барлығы сөздің фонетикалық және
фонемді түбегейлі білуге негізделген. Фонетикалық сөздің көлемдік
сипаттамаларымен нақтырақ таныса отырып, сөз синтезінің формантты әдісін
түсінуге негіз саламыз.
Адамдық сөзді визуалды және электронды әдіспен танудың әдістерінің
болуындағы өзгермелі жиіліктер, қажет формантты жиіліктің бір уақытта
генерациялануын қажет санына негізделген жасанды сөздің синтездеу әдісін
қалыптастыруға мүмкіндік береді.
Енді 1.5-кестеге қарап, дауысты дыбыстардың фонемін еске түсірсек.
Онда бізге таныс дыбыстардың кейбір фонемдерін көре аламыз, бірақ олар бұл
жерде дәлірек сипатталған кестеде әрбір дыбыс үшін негізгі үш формантты
жиілік берілген, олар ердің орташа дауысымен айтылатын сәйкес фонемдердің
спектограммасында бақыланады. Бұл жиіліктерді, Ғ1,F2 және Ғ3 әрбір
айтылатын дауыстының спектограммасында тұрақты болып табылады, жиіліктері
айтылудың барлық уақытында тұрақты болып қалады. Енді, көмекке біраз
ойларды шақырып, электронды сұлбаны елестетуге болады (1.13-суретте). Үш
параллель жолақты сүзгі (олардың орташа жиілігі формантты жиіліктерге
Ғ1,Ғ2,Ғ3 сәйкес), олар дыбыстың қуыс қалыптасатын импульстерге сәйкес шығыс
сигналы бар генератор арқылы қозады. Бұл сұлба қанша қарапайым болса да,
формантты жиіліктері Ғ1, Ғ2, Ғ3 1.2 –кестедегі мән шегінде болса ғана,
дауыстардың негізгі фонемді синтезаторы ретінде қызмет етеді. Әрбір
параллель сүзгі жолағының орташа жиілігі синтезатор сөзі үрдісінде ауыз бен
тамақ ортасында эквивалентті резонанс сәйкесінше реттеліп отырады. Осы үш
сүзгі шығысының қосындысының нәтижесінен алынатын нәтижелеуші сөз адам
сөзіне өте жақын. Бұл сұлбаның шығыс сигнал спектограммасында дәл сол
дауыстыларды айтатын адам сөзінің спектограммасындағы формантты жиіліктерге
сәйкес үш формантты жиілік бар. Егер 1.13-суреттегі сұлбада реттеудің үш
кілтін дауыстың негізгі ырғағының биіктігімен және үш формантты жиілікті
компьютерлік басқарумен алмастырса, онда біздің сипаттағанымыз формантты
жиілік бойынша жүйенің сөзін синтездеудің негізі болып табылады.
Мұндай синтезатордың формантты жиілігін құрудың қиыншылығы, оның
сөздік қабілеттілігі қатаң шектелгенмен тек қана дауысты генерирлейді.
1.13-сурет. Сөздің формантты синтезаторының базалық сұлбасы
Бірақ құрылған сұлба өте қызықты, себебі ол фонетикалық сөздің
электронды генерация әдісін көрсетеді. Формантты синтезатор мүмкіндігінің
диапазонын кеңейту үшін сүзілмелі және жарылғыш дауыссыздарды
қалыптастыратын шу көзін, сонымен қатар мұрынды дауыссыздарды көрсететін
резонансты аналогын енгізу қажет. Бұл кеңейтілген формантты синтезатордың
блок-сұлбасы 1.13 –суретте көрсетілген.
Синтезатордың жаңа сұлбасын барлық амалдар жиынтығын енгізгеннен кейін
өте қатты болмаса да, алдыңғы сұлбаға қарағанда күрделенеді. Бұрынғы төрт
басқару мүшелері мен реттегіштер енді тоғызға жетті. Олардың үшеуі
–фрикативті, дауысты және мұрынды дыбыстардың амплитудасын басқаруға,
біреуі –дыбыс биіктігін реттеуге, ал бесеуі -әр түрлі резонанс жиілігін
реттеу үшін қызмет етеді. Алдыңғы панельде бес басқару қолы бар жүйені
құрсақ, егер сіздің қолыңыз абсолютті қозғалысқа ие болса, онда сіз жүйе
арқылы бірінші сөйлегіш машинаны жасағандар сияқты сөз айтатын едіңіз.
Бақытымызға орай, біз реттеудің компьтерлік басқару мүмкіндігіне иеміз,
сондықтан, компьютер бізге синтезделген сөз генерациясында баға жетпес
көмек көрсетеді. 1.14-суреттегі әрбір тоғыз реттегіш потенциометрді
параллельді компьютерлік порт қосылысымен алмастырып, синтезаторды
программалауға көшуімізге болады. Біраз уақыттан кейін синтез үрдісінде
адам сөзіне жақындау үшін бізге қажет жылдамдықпен реттеулерді жүргізуге
болады.
Енді, дифтонг пен статикалық емес фонемдерді синтезатор сұлбасын
толығымен 100 Гц басқарып форманты жиілік өзгерісін синтездейміз делік,онда
әрбір басқарылатын сөз 8 биттік байттан тұрса, онда біз синтезаторды 900
байтс жылдамдықпен басқаратын сөздерді параллель беру кезінде басқара
аламыз. Бірақ бұл әрі біз қолданатын фонем жылдамдығы емес, тек қана
синтезатордың өзіндегі деректерді беру жылдамдығы. Берілген ақпарат ереже
бойынша компьютер жадысында әрбір фонем мен оның вариациясы-аллофондар үшін
бөлек арнайы басқарылатын кестеде сақталады. Ол басқарылатын программаның
сөздік шығысындағы фонемнің кіріс жүйелілігімен анықталатын жүйелілік
түрінде шақырылады. Мысалы, әрбір фонемде, синтезатордың компьютер
басқарылуы сүзгі жүйесінің 30 толық қайта бапталуын талап ете алады. Бұл
келесіні білдіреді: компьютер форманты синтезатор басқару сұлбасына
секундына 900 байт беру үшін, оның томалық кестенің сұрау программасына
секундына тек 30 байт енгізіп отыру керек. Деректердің соңғы қолданушыға
берілуі жуық шамамен 240 битc жылдамдықпен жүргізуіне сәйкес келеді.
Сүзгілерді қайта жасаудың жоғарыда көрсетілген жылдамдық мәндері жүйеден
жүйеге өткенде өзгереді, фонем мен басқаратын кесте өлшемдерінің саны
өзгермейді десе де болады. Әрбір фонем бойынша анықтамалық кестеге көп
жүгінсе, соғұрлым синтетикалық сөз тербелмелілігімен ерекшеленеді және
айтылуы адам сөзінің артикуляциясына жақын болады. Бірақ бұл жүйе адам
дауысынан айыра алмайтындай болады деп үміттенуге болмайды. Оның
синтезделген сөзінде әрдайым жұмыс дауысы естіледі, бұл көпшіліктің ойы
бойынша компьютерлік сөзге тән. Егер сіз мұндай жүйені басқаларға
көрсеткіңіз келсе, нәтиже таңғаларлық болады, бірақ оларға жүйенің сөйлеп
тұрғанын айыру қиынға түседі. Бірақ, формантты синтезатордың синтезделген
сөзін фонемдік қозу кезінде айтылған немесе қалпына келтірілген сөзді
біреуден қабылдауы мүмкін емес. Мұндай жүйенің шығуы әрдайым компьютерлік
сөз болады.
1.14 – сурет. Сөздің формантты синтезаторының толық сұлбасы
Фондық қозуы бар формантты синтезатор сөзін компьютердің
қалай басқаратынын қарастырайық. Мұндай сөйлегіш жүйенің басқару сұлбасы
1.15 –суретте көрсетілген. Сұлбаның сол жағында компьютер бейнеленген.
Мұндай жүйені басқару үшін, компьютер келесі амалдарға ие болуы керек:
- әр түрлі басқару функцияларын іске асыру үшін шығыс порттардың 8-
битті жиынтығы;
- синтезатордың келесі деректер кадрын қабылдауға дайындығын
компьтерге жеткізу үшін қызмет ететін кіріс портының бір 8 биті.
Осы сұлбада әр түрлі блоктарды қосатын түрлі басқару желілерінің
жүрісін бақыласа, 1.14-суреттегі берілген басқарудың фармантты синтезатор
амалдарын білуге болады. Басқаратын желілерге келіп түсетін бос емес
сигналдар компьютерге сөздің формантты синтезаторы деректер кадрын айтып
болғанын хабарлайды. Деректер кадры термині кездейсоқ таңдалған жоқ: ол
бөлек порттар арқылы синтезаторды басқару өзіндік ретте жүргізілмейтіндігін
білдіреді. Керісінше компьютер фонем мен оның бөлігінің жүргізілуіне сәйкес
барлық тоғыз параллельді портта басқаратын деректерді басқарып отырады,
содан кейін кадрдың аяқты айтылуын күтеді, соңында фонем ... жалғасы
КІРІСПЕ 10
1 Сөздік ақпараттарды кодалау және декодалау принциптері 12
1.1.Сигнал өңдеу 13
1.2. Сөз сигналдарын түрлендіру әдістері 14
1.3. Сөз сигналын вокалды, вокалсыз және тыныштық жеріне бөлу алгоритмы 16
1.4. Сөз сигналын қайтадан қалпына келтірудің тікелей әдісі 22
1.5. Дельта-модуляция әдісі 28
1.6. Сөздің формантты жиілігінің аналогты синтезі 31
2. Сөздік ақпараттарды кодалау және декодалау құрылғысын құрастырып жасау
39
2.1 Сөз сигналын сызықты болжау әдісі 39
2.2. Сызықты болжау коэффициенттерімен кодалау әдісі бойынша сөзді
синтездеу (СПК) 41
2.3 Сөз сигналын қайтадан қалпына келтіру 46
3 Есептеу бөлімі 47
3.1 Сөз сигналының параметрларын есептеу алгоритмын таңдау 47
3.2. Сөз сигналын кодалау-декодалау үрдісін моделдеу 48
3.3. Кодалау-декодалау құрылғысының жалпы сұлбасы 50
4 Экономикалық бөлім 57
4.1.1 Инвестицияның тұтынушылығын есептеу 57
4.1.2 Электроэнергияға кететін шығындар 58
5 Қауіпсіздік және еңбек қорғау бөлімі 65
5.1 Қазақстан Рeспубликасының Eңбeк кoдeксi 65
5.2 Элeктр қауiпсiздiгi 67
5.3 Жарықтандыру 69
5.4 Элeктрoмагниттiк өрiс 71
5.5 Өрт қауiпсiздiгi 72
ҚОРЫТЫНДЫ 75
Әдебиеттер тізбегі 76
КІРІСПЕ
Цифрлық байланыста ақпараттарды кодалау және декодалау жүйелері
кеңінен және нақты түрде қолданылады. Өңдеуге арналған ақпараттарды үш
түрге бөлуге болады. Бірінші сөздік (дауысты), екінші бейнелік (көрініс)
және үшінші текстік (жазба) ақпараттары. Әр түрлі мәліметтерді өңдеп
кодалау үшін әр түрлі кодалау жүйелері қолданылады. Кодалаудың сапасы оның
берілетін мәліметтерді ұтымды тығыздауына және ақпаратты жеткізудің
нақтылығына байланысты болады. Сондықтан бұл дипломдық жұмыста сөздік
ақпараттарды кодалау және декодалау жүйелері қарастырылған.
Сөздік ақпараттарды кодалау жүйесінде стандарт ретінде кеңістік
импулсті модуляция қолданылады. Әр телефондық байланысына жылдамдығы 64
кбитс арна беріледі. Қәзіргі уақытта осы каналда берілетін мәліметтерді
тығыздау нәтижесінде үш немесе төрт байланысты орнатуға мүмкіншілік бар.
Бірақ декодалаудан кейінгі қайтадан қалпына келтірілген айтылатын сөздердің
сапасы төмендеу болады. Мысалы қай адамның сөйлеп отырғанын білуге
болмайды және интонациалық мәліметтер жоғалады. Сондықтан сөздік
ақпараттарды кодалау және декодалау жүйесінде қолдануға болатын сөздік
ақпараттардың сапасын төмендетпейтін әдістерді зерттеп қолдану қажет.
Аналогты формантты синтезатор көмегімен сөздің фонетикалық синтезі
орындалады. Жиілік аймағындағы сөзді математикалық қайта қалпына келтіру
үшін сызықты болжау коэффициенттері арқылы кодалайтын цифрлы синтезаторлар
қолданылады.
Бұл әдістердің мүмкіндіктері мен шектеулерін жақсы ұғыну үшін, оларды
жақсылап қарастырамыз. Сөзді синтездеудің әдістерімен танысқаннан кейін
оқырман синтезатордың түрлерінің ерекшеліктерімен қажетті бағыт таба алады.
Егер сіздің назарыңызды нақты әдіс өзіне аударса, онда сіздің жолыңыз сөзді
синтездеумен басталуы мүмкін. Берілген бөлім компьютерден мәтін ақпаратының
шығысын тиімді әдіспен табуға мүмкіндік береді.
Сонымен өте тез таралатын қазіргі заманғы электронды техника аймағының
сөзді синтездеу аймағын қарастыруға көшеміз.
Сөздерді синтездеу әдістерінің аналогиясы бұл жерде өте алыс болып
көрінуі мүмкін, бірақ жасанды мәтіннің әрбір генерациялау әдісі сол бір
мақсатқа қызмет етеді- яғни компьютерге ақпараттың мәтін түрде шығуын. Бұл
мақсатқа жететін әдістер (сигнал пішіндерінің кодалауы- қайта қалпына
келтірілуі, фонетикалық-форматты синтез немесе мәтіннің математикалық қайта
қалпына келтірілуі) cөздің орындалу синтезінің жылдамдығымен, аппаратураның
құнымен және компьютердің тез әсерлілігімен ерекшеленеді. Синтезатордың
мұндай әрбір мүмкін болатын орындаулары синтезделген сөздердің сапасын және
дұрыстығының түрлі дәрежесін қамтамасыз етеді. Басқаша айтқанда сөзді
синтездеудің әрбір үш әдістеріне өзіңнің теріс және оң мінездемеңді бер:
сөзді жақсы артикуляциясымен береді, бірақ оның орындалуы қымбатқа түседі,
басқасы оның сөздік мүмкіндіктері шектелген және біз өз таңдауымызды сол не
басқа әдіске тоқтатқан кезде осыны ескеруіміз керек.
Тапсырма ретінде жылдамдығы 16 кбитс артпайтын каналда берілетін сөз
ақпараттарын өңдеп тығыздауға арналған әдістердің заманға сай түрлерін
қарастырып оның ішіндегі ең ұтымдысын анықтау қажет.
1 Сөздік ақпараттарды кодалау және декодалау принциптері
Сөз ақпараттардың басқалардан ерекшелігі оның негізгі
сипаттамаларында. Акустикалық сигнал микрофон арқылы электрлік сигналға
түрлендіргенде оның негізгі үн жиілігі, энергия қуаты шоғырланған жерлері
(форманта), спектрдің түрі және оның уақыт бойынша өзгеруі айтылған
сөздердің тек қана фонетикалық мәндерін көруге болады. Ол айтылған сөз
дыбысты, дыбыссыз немесе тыныштық кезі екенін тек қана сигналдың негізгі
сипаттамаларын өлшеп біле аламыз. Сөз айтылғанда оның акустикалық сигналы
жолағы 80-8000 Гц аралығында толық орналасады. Ал аналогты телефон
байланыста бір каналға берілген арнаны 340-3400 Гц жолағымен шектелген. Бұл
жағдайда сөз сапасы, мысалы дикторды тану және сөздерді анық естіп ажырату
сәл нашарлайды. Сондықтан сөз сигналын тығыздау үшін әртүрлі математикалық
аппараттар және құрылғылар қолданылады.
1.1.Сигнал өңдеу
Сигнал өңдеу үрдісі төмендегі сұлбада көрсетілген. Сөздік сигналдардың
ақпараттық дерекнамасы адам болғандықтан, оның аузынан шыққан сөздерге
байланысты акустикалық тербелістердің күшін өлшеу арқылы оны электрлі
сигналдарға түрлендіріледі. Ары қарай осы электрлі сигналдар (сөздік
сигналдар) күрделі өңдеуге жатады. Бірінші қадам - сөздік сигналдар белгілі
бір модель қолдану негізінде сигнал көрсетілуін керекті формаға өзгерту
арқылы сипаттамаларын қалыптастыру. Сигналдарды өңдеудің ең соңғы қадамы
оның ақпараттық маңызын бөліп алып қолдану болып табылады. Бұл қадам не
адам тыңдау арқылы не автоматты түрде іске асырылады. Мысал ретінде
шектелген дикторлардың ішінен сөйлеп тұрған дикторды дауысынан тану
(идентификация) қарастыруға болады. Бұл кезде сөздік сигналдың уақытқа
байланысты спектр көрсетілуі қолданылады. Тағы да түрлендірудің бір түрі
бүкіл фраза бойынша спектрдің орта шамасын әр диктордың спектрлерінің
эталонды шамаларымен салыстыру арқылы спектрлердің ұқсастық өлшемдерінің
ең жақынымен дикторды анықтауға болады. Бұл мысалда сөздік сигналдың
ақпараттық маңызы ретінде әр диктордың дауыстарының ерекшелігі қолданылады.
1.1 - сурет. Сөздік ақпараттарды өңдеу сұлбасы
Сондықтан, сигнал өңдеу екі негізгі мәселені шешуден тұрады:
- сөздік тербеліс формасында немесе керекті параметрлер ретінде
сигналдың жалпы көрсетілімдерін алу;
- алған көрсетілімдерді сигнал өңдеу мәселелерін шешуге ыңғайлы
формаға түрлендіру.
Цифрлы өңдеу екі бағытқа бөлінеді: бірінші, сигналдың дисреттік
көрсетілімдерін алу және екінші, цифрлық алгоритмдер теориясы, есептері
және оны қолданудан тұрады. Цифрлі өңдеудің бірінші әдістері күрделі
аналогты жүйелерді имитациялаудан тұрады [1]. Қазіргі уақытта ЭЕМ
программасы ретінде жазылған сөздік сигналдарды цифрлық өңдеу жүйелерін,
нақты алгоритмдерді дәл орындайтын арнаулы микропроцессорлы есептеу
құралдар түрінде жасап шығаруға болады. Заманға сай қәзіргі цифрлы әдістер
сөздік сигналдарды өңдеуде кеңінен қолданылуда [4, 10].
1.2. Сөз сигналдарын түрлендіру әдістері
Сөздік сигналдарды цифрлы өңдеудің үш бағытын қарастырайық:
- сөздік сигналдарды цифрлы формада көрсету;
- аналогты өңдеу тәсілдерінің цифрлы түрде іске асыру;
- тек қана цифрлы өңдеуге арналған тәсілдер.
Бұлардың ішіндегі ең маңыздысы сөздік сигналдарды цифрлы формаға
келтіру болып табылады. Негізгі қолданатын теория ол дискреттеу, немесе
жиілік бойынша шектелген сигнал белгілі уақыт сайын өлшенген шамалармен
көрсетуге болады деген Котельников теоремасы қарастырылады. Сонымен цифрлы
өңдеу теориясымен оны қолдану негізінде дискреттеу процедурасы жатады.
Сөздік сигналдарды дискретті көрсетілу тәсілдерін екі үлкен топқа бөлуге
болады – сөздік тербелістерді цифрлы және параметрлі көрсетілу.
1.2 - сурет. Сөздік сигналдарды көрсетілу тәсілдері
Сөздік тербелістің цифрлы көрсетілімдерін алу тәсілі дискреттеу және
кванттау кезінде тербеліс формасын мүмкіншілігінше сақтауға негізделген.
Параметрлі көрсетілімдер алу тәсілі сөзқұрылу моделіне сәйкес сөздік
сигнал суреттемесінің керекті көрсеткіштерін (параметлерін) алуға
негізделген. Параметрлік көрсетілімдер алудың бірінші кезеңінде сөздік
тербеліс дискретелінеді және квантталынады, одан кейін модел параметрлерін
алу үшін өңдеуге жатады. Модел параметрлары екіге бөлінеді. Біріншісі сөз
дыбыстарының дерекнамасына байланысты қозу параметрлары, екіншісі айтылған
сөздің жеке дыбыстарына байланысты дауыс трактысы параметрлары болады.
Төмендегі суретте әртүрлі цифрлы көрсетілімдер алу тәсілдерінің
ақпарат беру жылдамдығына байланысты салыстырмалы нәтижелері көрсетілген.
1.3 - сурет. Сөздік сигналдың өңдеу әдістерінің ақпарат беру
жылдамдығы
Пунктирлі сызық 15 кбитс жылдамдық нүктесінен өтіп сөз тербеліснің
цифрлы көрсетілуін парметрлік көрсетілуінен бөледі. Ақпарат берудің керекті
жылдамдығы 75 битс (текст) 200000 битс дейін өзгеріп отыратынын байқауға
болады. Сондықтан, цифрлы көрсетілу әдістеріне байланысты ақпарат беру
жылдамдығы орташа 3000 ретке дейін өзгертуге болады. Бірақ ақпарат беру
жылдамдығының көрсетілу әдістерін таңдаудағы негізгі фактор дың біреуі.
Құрылғының бағасы, цифрлық көрсетілімдердің бейімділігі, қайтадан қалпына
келтірілген сөздің сапасы және т.б. факторларда таңдау кезінде өз
қасиеттерін көрсете алады.
1.4 - сурет. Сөз сигналының өңдеуді қолданатын бағыттар
Бұл дипломдық жұмыста сөз сигналының сапасын арттыру мәселесі
қарастырылып сөз тығыздау құрылғысының жаңа түрлерін жасау мүмкіншілігі
көрсетілген. Негізгі сөз тығыздау үрдісінде сөз сапасын нашарлану себебі
келесі факторларға байланысты:
- аналогты байланыс жолында сөз тарату арнасы өте аз, 340 Гц – 3400
Гц арасында болғандықтан сөз сапасы нашарлайды.
- аналогты сигналды цифрлы сигналға түрлендіргенде қосымша шулар пайда
болып сөз сапасын төмендетеді.
- стандартты 64 кбитс жылдамдықтан 32 немесе 16 кбитс жылдамдыққа
сөз тығыздау құралдары қолданғандықтан сөз сапасы тағы да нашарлайды.
Төмендегі суретте кодалау және декодалау жалпы сұлбасы көрсетілген.
Ақпарат жіберушіде кодалайтын құрылғыны – кодер, ал қабылдағышта
декодалайтын – декодер деп атаймыз. Кодалық бірліктері кодалық кітапқа
жазылып кодермен декодердің жадысында сақталынады. Кодалық кітапта L түрлі
бірліктер жинағы сақталынған. Бірліктер көптігінің жинағы кодалық
кітапті құрайды. Кірістегі векторы сөз сигналының үлгілері ретінде
қарастырылады да кодалық кітаптағы векторлармен салыстырылып сондағы ең
ұқсас векторды табады. Жіберу каналына соған сәйкес ui табылған
вектордың номері индексі беріледі. Декодер қабылданған индекс бойынша
кодалық кітаптағы векторды шығарып алып оны сөз сигналына айналдырады.
1.5 - сурет. Сөз сигналын кодалау-декодалау жүйесінің құрамалық
сұлбасы
Ақпарат беру жылдамдығының төмен дәрежеде болуы сигналдың өзі емес
оның номері берілгендікке байланысты өзгереді.
1.3. Сөз сигналын вокалды, вокалсыз және тыныштық жеріне бөлу алгоритмы
1.3.1. Сөз сигналының уақыттық кадрының ұзақтығын таңдау
Сөз сигналының өзгеруін зерттеу үшін оның бөлінетін уақыттық
кадрлерінің ұзақтығын анықтап таңдау қажет.
1.6 - сурет. СС уақыттық кадрларының түрлері.
СС уақыттық кадрларының ұзақтығына қойылатын талаптар:
- кадрларының тізбегі сөз сигналының қысқа мерзімді динамикалық
өзгерістерін нақты көрсету үшін мүмкіншілігінше қыска болуы тиіс;
- кадрларының тізбегі сөз сигналының ұзақ мерзімді өзгерістерін нақты
көрсету үшін мүмкіншілігінше ұзақ болғаны дұрыс.
1.2 - кесте - СС уақыттық кадрларының түрлері
СС, fg = 8000 Гц, fот ≥ 100 Гц
Санақ Кадр Терезе қасиеті
саны ұзақтығы,
мс
32 328=4 СС қысқа мерзімді динамикалық өзгерістерін нақты
көрсетіп, бірақ оның периодикалық сиппаттамасын көрсете
алмайды
64 648=8 СС қысқа мерзімді динамикалық өзгерістерін нақты
көрсетіп, бірақ оның периодикалық сиппаттамасын толық
көрсете алмайды
128 1288=16 СС қысқа мерзімді динамикалық өзгерістерін толық
көрсете алмайды, бірақ оның периодикалық сиппаттамасын
көрсете алады
256 2568=32 СС қысқа мерзімді динамикалық өзгерістерін көрсете
алмайды, бірақ оның периодикалық сиппаттамасын толық
көрсете алады
СС кестеде көрсетілген шарттармен нақты қабылдау үшін кадр ұзақтығы
негізгі үн периодынан Tот = 1000100 = 10 мс. кем болмауы тиісті .
1.3.2. Сөз сигналының кадрларының түрін анықтау
Төмендегі суретте сөз сигналын тыныштық, вокалды және вокалсыз
жерлерге бөлу алгоритмы көрсетілген. Бұл алгоритм сөз сигналы – айнымалы,
қысқа мерзімді энергия мөлшері және нөл арқылы өту аралықтары күрт
өзгеретін тұрақсыз үрдіс ретінде қарастырамыз.
Алгоритм 7 блоктан тұрады.
1-блок. Бастапқы сөз сигналы , ;
2-блок. Сөз сигналын ұзақтығы 16 мс кадрларға бөлу;
3-блок. Сөз сигналының n-ші кадрының қысқа мерзімді энергиясын En
және нөл арқылы өту нүктелер аралығын Zn төмендегі кестедегі формулалар
қолдана отырып есептеледі.
1.7 - cурет. Сөз сигналын тыныштық, вокалды және вокалсыз жерлерге
бөлу алгоритмы
Мысалы, қысқа мерзімді энергия мөлшері немесе немесе
,
n – кадр номері;
– кадрдың терезелік функциясы;
; – кадр саны;
– сөз сигналының санақ саны.
Нөль арқылы өту нүктелер аралығының қысқа мерзімді функциясы көрші
нүктелердің белгісін салыстыру арқылы анықталады.
Мысалы, ,
және – белгілік функция.
4 және 6 -блок. Қысқа мерзімді энергия шегі Епор және нөль арқылы өту
нүктелер аралығының санының шегі Zпор тағайындалады;
5-блок. Еn Епор?: шарты тексеріледі, егер – шарт орындалса n-кадры
тыныштыққа жатқызылады; орындалмаса – 7-ші блокқа беріледі.
7-блок. Орындауға тексеру жағдайы Zn Zпор?: шарты тексеріледі, шарт
орындалса n-кадры вокалды, орындалмаса вокалсыз деп есептелінеді.
Бұл алгоритмнің кемшілігі En үлкен энергиялық сезімталдығы.
1.3 – кесте - СС қысқа мерзімді параметрларының кестесі
Қысқа мерзімді Қысқа мерзімді орташа Нөлден өту нүктелерінің қысқа
энергия энергия уақытты функцияся
Вокалдывокалсыз шешімінің қателерін азайту үшін келесі формула
қолданылуы тиіс
, (1.1)
– сөз сигналының орташа квадратты мөлшері.
Вокалды сөз жоғарғы энергиясымен және төменгі , ал
вокалсыз сөз бәсең энергиямен және жоғарғы сипатталынғандықтан
келесі шарт орындалуы тиісті
(1.2)
Осы жағдайда -ке қойылатын талап қарапайым түрде болғандықтан
вокалды немесе вокалсыз шешімін қабылдағанда қате жіберу мүмкіншілігі
азаяды.
1.3.3. Сөз сигналын тығыздаудағы жылдамдықтар
Төмендегі 1-кестеде 48Кбайт жадымен сақтауға болатын (К=1024) сөздік
хабарламаның толық ұзақтығы көрсетілген. Айтушы жүйенің жұмысы үшін
қолданылатын өте үлкен сөздікті және бағдарламаларды сақтауға арналған
максималды ұзақтылық(1 сағ 4 мин) көріп отырғанымыздай фонетикалық әдіске
сәйкес келеді. Ал интервалдың басқа соңында сөздің хабарламалық ұзақтығы
сөздің сигналын кодтауда тікелей сөзді синтездеудің тиімді әдісінде жатыр,
яғни онда компьютер жадысының сиымдылығы 48К болған кезде сөздік
хабарламаны ұзақтығы тек 3.2с етіп сақтауға болады.
Бұл жадыға қойылатын талаптар тек қана сөзге қатысты екенін ұмытпау
керек. Ал жадыда қолдануға қажетті сөздік болуы қажет. Егер сіз сөйлемдерді
құрастыруға арналған 100 сөзі бар сөздікке ие болғыңыз келсе, онда
сөздіктегі әрбір сөзді айтуға кететін уақыт шамамен 0,5c екенін ескере
отырып, сөздікті сақтау үшін хабарламаның ұзақтығына сәйкес аз мөлшерде 50c
болатын жады көлемі қажет етіледі.
1.4 – кесте – Тікелей кодтау әдісі
Синтездеу әдісіЖылдамдық, HELLO сөзін 48К жадылы компьютер
битс сақтауға арналған сақтай алатын сөздің
жады көлемі, байт толық мөлшері
Фонетикалық 100-800 4-30 1сағ 4 мин-8 мин
Сызықты кодтау 1200-5000 45-1885 мин 20с-1 мин 17с
Тікелей кодтау 16000-120000 24с-3.2с
600-4500
1.4- кестеге қайта қарайтын болсақ, тікелей кодтау әдісін қолданған
кезде біздің сөздік максимум 48 сөзге (24с) ие бола алады және осылайша
бағдарламалау үшін орын қалмай қалатынын көреміз. Мәселен егер сөйлемді
тікелей сөзді еркін таңдау мүмкіндігінсіз түрінде болса, бірақ қажетті
сәтте әрбір жазылған сөз орамын таңдау мүмкіндігімен шешуге болады. Бұл аз
сөздікпен шектелуге мүмкіндік береді, бірақ сонымен қатар сөйлемді
бағдарламасын сақтау үшін жадының бөлігін бөледі.
Көрсетілген сөйлемдік қорытындыларды салыстыру әдістерінің нәтижесін
сол немесе басқа әдісті таңдауға қатысты соңғы шешімді шығаруға негіз
ретінде қарауға болмайды. Бұл мәліметтер мүмкіндіктердің иллюстрациясы және
олардың әрқайсысының шегі ретінде қызмет етеді.
Жасанды сөздің генерациясының үш әдісін салыстыра отырып, ең алдымен
жасанды (синтезделген) сөз түсінігін анықтау маңызды. Компьютермен
орындалатын сөздің екі негізгі критериі бар, ал негізінде ол жасанды болып
табылады.
Біріншіден, егер компьютер синтетикалық сөзді генерацияласа, онда
онымен айтылатын сөздер сөз болмауы керек, керісінше адаммен жадысына
енгізілуі қажет. Бұл жерде көбінісе магнитафон аналогиясы орынды, мұндағы
лентаның атқаратын рөлін сандық немесе электронды жады атқарады. Расымен
де, егер компьютер айтатын сөздер немесе сөз орамдары шамамен адаммен
айтылған болса,(сөзбен немесе интегралды сұлбалармен дайындалған
шаралармен) онда мұндай жағдайда компьютердің сөзін қайта қалпына
келтірілген деп есептесе болады. Сөздік тахометрде қайта қалпына
келтірілген сөйлемді алудың екі әдісі көрсетілген: сигналдарды тікелей
кодтау әдісі және CПК- синтез әдісі. Бұл әдістер орындалу қабілетіне
байланысты айырмашылық жасайды, бірақ олардың екуіндеде келесіде сөйлемді
қайта қалпына келтіруге қолданылатын алдын ала айтылған сөздік қажет.
Осылайша расымен синтезделген сөйлемді жалғыз алу әдісі фонетикалық
синтездеу әдісі болып табылады.
Осылайша синтезделген сөз өзінің дыбысталуы бойынша басқа екі
жағдайларға қарағанда адамның сөзіне ұқсас. Қазіргі заманғы дәрежедегі
сөздің техникасының дамуы қайта қалпына келтіру әдісін ғана береді. Басқаша
айтқанда, егер сіз нақты синтезделген сөзді алғыңыз келсе, онда сіз
компьютеріңіздің сөзі механикалық түрде дыбысталатынына дайын болуыңыз
қажет. Егерде сіз сөзді қайта қалпына келтірудің бір әдісін қолданғыңыз
келсе, сіздің жүйеңіздің дыбысталуы естуге өте жағымды болады және адамның
бір қалыпты айтуына жақынырақ болады.
Сөздің жасандылығын анықтайтын екінші критерий ақпаратты жинау
аймағындағы негізгі теоремаларымен байланысты таңдау теоремасымен немесе
есептеумен байланысты болады.
1.4. Сөз сигналын қайтадан қалпына келтірудің тікелей әдісі
Бұл сөзді генерациялаудың қарапайым әдісі көбінесе сандық жазуға ұқсас
болып келеді. Жоғарыда біз сөзді немесе қайта қалпына келтіру мақсатында
аналогты сигналдарды таңдауды жүргіздік. Механизм туралы дұрыс ұғым сөзді
қайта қалпына келтіруді кодтау әдісін түсіну үшін өте маңызды. Аналогты
сигналдардың таңдалынуы қалай жүретінін түсіндіру үшін,мынадай мысал
келтірейік. Визуалды (көрермендік) сигналдың таңдалынуын қарастырайық.
Мұнда барлығы дыбыстық аналогты сигналдың жағдайындағыдай жүреді,тек
айырмашылығы, біз визуалды сигналмен жұмыс жасаймыз.
Ең алдымен қозғалыс жүретін сахнаны таңдап аламыз, айталық,теледидар
экраны немесе онда жақын көлікпен өтетін жылдамдықты магистрал. Енді бұл
көрініске қарап және көзіңізді жұмыңыз. Егер ары қарай өз көзіңізді тез
(жиілігі шамамен секундына 1 Гц) ашып – жұмсаңыз,онда қиындықсыз сахнада
болып жатқан жағдайларды бақыласаңыз болады. Көзді ашып-жұмуды жалғастыра
беріңіз,көзді бірнеше секундына аша отырып сіз көз алдыңызда жүріп жатқан
көріністерді шыныменде бақылай алатыныңызға көзіңіз жететін болады. Сіздің
жасағаныңыз қозғалысты визуалды таңдауға сәйкес келеді (аналогты сигналға).
Егер кейбір қозғалыстар тез арада болып өтсе,көзді ашып-жұму жиілігі 1 Гц
болғанымен,сіз оны байқамай да қаласыз. Енді көзді ашып-жұму жиілігі
шамамен бірге дейін 10 секундқа дейін азайтайық,яғни көзді жұмып сіз онға
дейін санайсыз,содан кейін тез арада оларды 10с-қа жабасыз және т.б . Бұл
тажірибені бір-екі минут ішінде қайталай отырып,сіз сахнада болып жатқан
барлық жағдайлардың тізбектілігін бақылау сіз үшін мүмкін болмайды.
Негізінде сіз Найквист критериімен анықталатын,қолданысы дәл бақылау үшін
қолданылатын таңдау жиілігін шекті көлемнен төмен кішірейтіңіз. Жоғары
жиілікпен көзді ашып-жұму кезінде сізде сахнаны бақылау және ондағы болып
жатқан қозғалыстарды сипаттау кезінде қиындықтар тумауы қажет.
Қарастырылған мысал естілінетін сөздердің таңдау үрдісіне аналогты болып
табылады. Ондағы бір ерекшелік,біздің мысалда таңдау визуалды жолмен,ал сөз
жағдайында – Электронды жолмен жүргізіледі. Сөз дыбыстарының микрафонмен
түрлену үрдісінде тез және асықпай ауысатын компоненттерді ұстаушы
электрлік сигнал генерацияланады. Егер де біз таңдауды осы сигналға қатысты
төменгі жиілікпен таңдаған кезде,онда бізге сигналда асықпай ауысатын
компоненттердің бар екенін анықтай аламыз. Сигналдың тез ауысатын
компоненттері мұндай зерттеу әдісінде бізден құтылып кететін еді. Егерде
біз микрафонның электрлік сигналдарын жоғары жиілігімен таңдайтын
болсақ,онда сигналда жоғары жиілікті сигналдарды табатын боламыз.
Иллютрациялау мақсатында 1.2 –суретте түрлі жиіліктермен орындалатын
таңдаулар көрсетілген.
Суреттің ең жоғарғы графигінде таңдаулар алынатын аналогты сигнал
көрсетілген. Оның түрі сөзді өндеу кезіндегі жұмыс істеуге тура келетін
күрделі тербелістерге ұқсас. Бұл сигналдың құрамында тез және асықпай
ауысатын құраушылардың бар екенін байқау қиын емес. Спектралды анализдің
терминдерін қолдана отырып,асықпай ауысатын компоненттер өзімен төменгі
жиілікті компоненттерді ұсынады,ал тез ауысатындар (графиктің орталық
бөлігі)жоғары жиілікті компоненттерді ұсынады деп айтуға болады. Егер
сигналдан ортақ ұзақтық 5 мс-қа тең болса,ол таңдаудың жиілігін милли
секундқа өндіреді, онда біз шығыс тербеліс туралы салыстырмалы аз ақпарат
беретін амплитудалық-модулденген импульсті сигналды (1.2а-сурет) аламыз.
Егер осы бес импульспен бастапқы сигналдың пішінін қайта қалпына келтіруге
тырысатын болсақ,онда ол бізге тек төменгі жиілікті компоненттер жайлы
ақпарат алмауға мүмкіндік береді. Таңдаудың жиілігін екі еселей отырып
(1.2б-сурет) біз шығыс сигнал туралы көп ақпарат беретін сигналды аламыз.
Тағыда және тағыда таңдау жиілігін екі еселей модульденген импульсті
сигналды аламыз. Таңдаудың жиілігін екі еселеу үрдісін таңдау жиілігінің
келесі жоғарылауына басқа ешнәрсені қоспайтын сигналдың алынған пішіні
шығыс сигналдың алынған пішіні шығыс тербеліске дәл сәйкес келмейінше көп
реттен жүргізе беруге болады. Себебі шығыс сигналдағы ең жоғарғы жиілікті
құраушылар (кіріс аналогты) уақытша интервалда бірнеше 0.5 мс-қа кішірейеді
сигналдың дәлме-дәл сипаттамасы үшін біз Найквист теоремасымен келісе
отырып,таңдау жиілігін миллисекундта төрт реттен жүргізуіміз қажет. Бұл
жағдай 1.2 в – суретінде көрсетілген.
Көрсетілген сигнал шығыс сигналдың жоғары жиілікті шығарып
тастауларының үлкен бөлігін өзінде ұстайды. Таңдау жиіліктерінің
сигналдарын дәл орындау үшін миллисекунд ішінде сегіз ретке дейін екі
еселеуге болады (1.2 г –сурет). Бұл жағдайда бастапқы сигнал ешқандай
бұрмалаусыз амплитудалық –модулденген импульсті сигналмен көрсетіледі.
Көрсетіліп өткендей,аналогты сигналдың таңдалынуы биіктігі таңдау
мезетіндегі амплитудалық сигналға,ал ұзақтығы –таңдаудың импульс ауданына
сәйкес келетін импульстердің тізбектілігін береді. Мұндай түрдегі ақпаратты
компьютердің жадысына кіргізу өте күрделі. Ол үшін ең алдымен амплитуда
импульстарының өзгерісін цифрлық түрге түрлендіру қажет. 1.7 суретте
көрсетілген блок –сұлба оны қалай жасауға болатынын көрсетеді.
1.8 – сурет. Анализделінген таңдау үдісі
Сөз сигналын дискреттеу жүйесінде таңдаудың жиілігінің жартысын
жоғарылататын олардың ішіндегі жиілікті құраушыларды жоюға мүмкіндік
беретін, сөз сигналдары ең алдымен төменгі жиілікті сүзгі өткізілетін
микрафонға келіп түседі. Ол сигналдың жиілігін екі еседен кем жоғарылатушы
жиілікте таңдау жүргізілген кезде пайда болатын артық сигналдардың кіруін
тоқтату үшін қажет. (Найквист теоремасын еске түсіріңіз) содан кейін сигнал
оның дәрежесі таңдау сұлбасының кірісіне кіруге мүмкіндік берілетіндей етіп
жоғарылатады. Бұл жерде 1.8 суретте анализделінген таңдау үдісі орындалады.
Таңдау сұлбасының шығысында амплитуда бойынша модулденген таңдаудың әрбір
мезетінен аналогты сигналдың көлемімен сәйкестелінген импульстердің
тізбектілігі алынады. Жүйенің соңғы блогы өзімен аналогты цифрлық
түрлендіргішті (АЦТ) ұсынады. Бұл блок аналогты сигналдардың таңдауы келіп
түсетін және сегіз шығыс торап болатын бір кіріс торапқа ие. Оданда күрделі
16 немесе 8 битті АЦТ-лар бар (разрядты),бірақ біз кіріс сигналдың 8 бит
көлемімен шектелеміз. Бұл АЦТ-ның 8 битті шығыс сигналы компьютерге
мәліметтерді енгізу үшін қызмет етеді. АЦТ-аналогты кіріс сигнал сандық
пішінге түрленеді және импульсті кодтық модуляция сигналы түрінде АЦТ-ның
шығысынан компьютердің жадысына келіп түседі. Импульсті кодттық
модуляцияның үрдісін көрсету үшін 1.9-суретте А,В және С әріптерімен
белгіленген, 1.9-суреттегі сигналдардың пішіні нақты көрсетілген. Біз
компьютердің жадысына енгізуге жарамды пішінге аналогты сөздік сигналдың
түрленуін қарастырдық. Осыған орай алдымен таңдау жүргізіледі, содан кейін
барып аналогты сигналдың ИКМ сигналына түрленуі жүреді.1.9- суретте
көрсетілген С сигналының ерекшелігі бұл импульстің тізбектілігі амплитуда
бойынша тұрақты және компьютердің жадысына енгізуге жарамды. ИКМ-сигналдың
әрбір 8 биті компьютердің тізбекті кірісіне оны жадыға жазу үшін
қолданылады. Сонымен бірге бұл 8 параллельді биттер компьютердің параллель
кірісі арқылы берілуі мүмкін және бір байттан бір байтқа тікелей жазылуы
мүмкін.Компьютердің кірісіне келіп түсетін мәліметтер оның жадысына шығыс
сөздің сигналдың амплитудасының сандық түрінде жазылуы мүмкін. Жадыда
сақталынатын сөздік ақпаратты бағдарламалық құралдармен ақпараттың тығыз
орналасуы үшін қолдана отырып басқаруға болады. Осы тәріздес манипуляциялар
жадыға қойылатын талаптарды төмендетуге мүмкіндік береді.
1.9 - сурет. Сигналды импульсті кодалық модуляциялау
Сонымен біз,біздің компьютердегі жадыға аналогты мәтіндік жазылуының
және таңдалынуының қалай орындалатынын білеміз. Енді тікелей кодтаумен өте
қарапайым мәтін синтезаторын құруға талпынайық. Мұндай синтезатордың
мысалдық сұлбасы 1.5- суретте көрсетілген. Суреттің жоғарғы бөлігінде бізге
таныс блогтар тізбегін көреміз,ол микрафоннан кейін сөздік сигналдың
таңдалынуын орындайды. Таңдаудың 6 кГц жиілігінде сұлба секундна 6000, 8
биттен-байттарды береді. Біз ертеректе hello сөзін айту үшін шамамен 0.3 с
кететінін айтып өткенбіз. Таңдаудың 6000 Гц жиілігі кезінде бұл сөз үшін
1.10-суреттегі тікбұрыш (штрихты сызықпен жүргізілген) – бұл 8 битті
енгізудің параллель порты және 8 битті шығудың параллель порты бар
компьютер. Әрине портта бір түрде орындалуы мүмкін,және сол кезде сөз ол
басында жазылған арқылы орындалады.Компьютермен мәліметтерде жинау
үрдісінде оның резиденті бағдарламасы АЦТ-ның 8 разрядты ақпаратын
тасымалдайды және оны тізбектеп жадыға жазады. Таңдау үрдісі сөзді айтуды
аяқтағаннан кейін аяқталады,ал жадыда hello сөзінің сандық жазылуы қалады.
Суретте көрініп тұрғандай,бұл ақпарат 1024 ұяшығынан шамамен 3073-не дейін
адрестік кеңістікте орын алады. Берілген жағдайда ақпарат кернеу
өзгерісінің ±5 толық диапазонында екілік кодта жеткізілген.Мәліметтермен
реттелген бағана кіріс сигналмен эквивалентті жазылған кернеу көлеміне ие.
Бұл реттелген ақпарат вальтте компьютер үшін ешқандай мәнге ие емес және
бұл жерде таңдаудың аналогты цифрлық үрдісін иллюстрациялау үшін
көрсетілген . Бұл сұлбаның нүктесінде сөз синтезаторын біз сөздің цифрлық
түрінде жазылуына орналастырамыз және бұл жазбаны таспада сақтауға болады
немесе келесі орындаулар үшін касетада сақтауға болады.
Синтезатордың орындаушы бөлігі 1.10-суреттің төменгі жағында
көрсетілген. Компьютердің жадысында сақталатын сөзді орындау бағдарламасы-
бұл ертеректе жазылып қойған ақпаратты тізбекті қадамдармен қарастыратын
және оны 8-разрядты –цифрлық аналогты түрлендіргішке (ЦАТ) байтпен
шығаратын қарапайым индекстеуші бағдарлама. Егер ЦАТ-ты АЦТ-ның кірісімен
біріктірсек,онда мәліметтердің реттелуі және кернеуге түрленуі уайым
шақырмайды. Түрлендіргіштер бірін-бірі аңдиды және кірісте таңдауға
ұшыраған шығыста дәл сол сигнал кернеуін береді. Факті түрінде ол егер
кернеуді екі түрлендіргіштерде кернеу бойынша ±5 cілтеуді құраса онда шығыс
сигнал синтезатордың кірісіне келіп түскен сигналға дәлдікте сәйкес келетін
болады.
ЦАТ-тың 8 разрядты шығысы сигналды қайта қалпына келтіру кезінде пайда
болатын қажет емес жоғары жиілікті компоненттерді сүзгілейтін,төменгі
жиілікті (3кГц) қосылған 1.10-суретінде импульстердің тікбұрышты
төбеліктері сәйкес келеді. Содан кейін сүзгінің сигналы қуатты күшейткішпен
күшейеді және қатты айтқышқа келіп түседі. Қатты айтқыштан еститін сөзіміз
сүзгінің төменгі жиілігімен шақырылған сөздік сигналдың жоғары жиілікті
бөлігінде үлкен емес шығындарды есептемегенде синтезатордың кірісінде шығыс
сөздік сигналды дәл қайталауы қажет. Басқаша айтқанда,өзінің айтылуы
бойынша алынған сөз айтушының дауысына сәйкес келеді және кіріс сөздік
сигнал сияқты модуляцияға және ырғаққа ие.
1.10 – сурет. Сөз сигналының өңдеудің нақты мысалы
Сөздік синтезатор сұлбасында (1.10 сурет) компьютерде сигналды
қабылдау кезінде қолданылатын сөзді сақтау әдістері және сөзді синтездеу
әдістері және сөзді синтездеу үрдісінде орындау бағдарламасы көрсетілген.
Таңдаудың жеткілікті жоғары жиілігінде компьютерде (6 кГц) ақпараттың әрбір
байтын жадыға жазуға және қабылдауға шамамен 17 мкс қалады. Компьютердің
тез әрекеттілігіне қойылатын мұндай талап Бейсик тілінде немесе басқа
жоғары дәрежеде құрылған жазу бағдарламасын және сөзді орындауды
мүмкіндігін алып тастайды. Сондықтанда иссемблерде құралған бағдарламаның
синтезделген сөзін жазуды және орындаудың бір ғана әдісі қабылданған. 1.10-
суретте көрсетілген блок–сұлба сөзді жазу бағдарламасының мүмкіндіктерін
қарастырып,сөзді кодалау үрдісінің қаншалықты қарапайым екенін көрсетеді.
Сөз жадыға енгізілгеннен кейін бастапқы кодталған сөзді орындау
бағдарламасын жүргізуге болады.
1.5. Дельта-модуляция әдісі
Біз қарастырған сөздің цифлық кодқа келесі декодалумен цифрлық кодаға
түрлендіру.Мысалы-сөзді синтездеу әдісінің жалғыз түрі емес. Тәжірибеде
цифрлық кодты түрлендіретін және сигналдарды сақтайтын тиімді басқа да
әдістері бар. Телефонияда және кейбір микросұлба синтезаторларының ішінде
кең қолданыс тапқан әдістерінің бірі-дельта-модуляция деп аталады. Алдында
сипатталғаннан (1.10 сурет) мұның негізгі ерекшелігі, оның абсолютті
көлемдерге емес, амплитудалық қатысты өзгерістерге негізделгендігі болып
табылады. Дельта –модуляция әдісін түсіндіру үшін жолда жүріп бара жатқан
автомобилдің таңдау үрдісін көрсететін визуалды сигналдар мысалына назар
аударайық. Алдында қарастырылған параллель кодалау әдісін қолданып,
автомобилдің А пункттен В пунктке қозғалуын келесі түрде сипаттай аламыз:
- автомобиль А пункттен 100 м қашықтықта орналасқан.
- автомобиль А пункттен 200 м қашықтықта орналасқан.
- автомобиль А пункттен 300 м қашықтықта орналасқан.
- автомобиль А пункттен 400 м қашықтықта орналасқан.
- автомобиль А пункттен 500 м қашықтықта орналасқан.
Осылайша, автомобильдің бастапқы қозғалу нүктесіне қатысты қай жерде
орналасқанын айта аламыз. Өзгермелі көлемнің абсолютті мәнін есептеу әдісі
1.11-суретте көрсетілген. Енді автомобильдің қозғалысын уақыт бойынша
аналогты сигнал түрінде қарастырайық.
1.11 – сурет. Дельта модуляцияның салыстырмалы мысалы
Дельта-модуляцияны қолданғандағы таңдамаларды алу үрдісі қалай
өзгергенін қарайық, бұл біз тек қатыстық өзгерістерге қызығушылық
тудырғанда. Осыған орай, біз әрбір таңдама кезінде сигналдың абсолютті
көлемі жайлы ақпаратты жоғалтамыз. Артық ақпараттты жойып,аналогты сигналды
бақылау мүмкіндігіне ие боламыз. Дельта-модуляцияны қолдану кезінде
автомобиль қозғалысы келесідей:
- автомобиль А пункттен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
- автомобиль алдыңғы таңдау нүктесінен 100 м жүрді.
Егер біз автомобильді бақылауды жүз километр бойынша бақыласақ,
бірінші есептеуде (1.11 сурет) 15000-ге дейінгі сандарды сақтауға тура
келер еді.
Әрбір таңдама автомобилінің қашықтығының нақты мәнін беретін еді.
Бірақ, әрбір таңдама бойынша жадыда сақтау көлемі өседі.
Дельта-модуляциямен кодалауда автомобиль қозғалысы көршілес таңдама
моментімен салыстырылады да оның айырмасы ғана беріледі. Яғни, тіпті жүз
километр қашықтықта жадыда сақталатын ең үлкен сан 100 санын жадыда сақтау
үшін 15000 саны cақталғаннан гөрі аз уақыт қажет. Осылайша, цифрлық кодтың
тиімділігі дельта-модуляцияны қолданғанда қанша –өсуі керек екені көрініп
тұр. Дельта-модуляция әдісін нүктелік өсімдердің кодталуы деп атайды.
Микрофоннан түсетін сөздік сигналды кодалауды қалай іске асыруға болады.
Микрофонмен қабылданған сөз сигналы cүзгіленіп, күшейеді. Содан кейін
сигнал дельта-модуляцияға ұшырайды, ол үшін аналогты компаратормен кері
байланыс контурынан тұратын аналогты интегратор қолданылады. Кері байланыс
контурында b-типті триггері бар, АЦТ тактілі жиілікті дельта-компонент
сигналын синхрондайды. Дельта-модуляция әдісін қолданатын сигналдар 1.12
суретте келтірілген. Сигнал өзгерісі әрбір Т период аралығында таңдалады.
Егер кіріс сигнал әрі қарай өссе, сұлбадағы А нүктесінің импульстарын куә
етеді. В нүктесіндегі импульстар кіріс сигналының да уақыт интервалы
импульстер кіріс сигналының да уақыт интервалы А және В импульсін кезекпен
генерирлейді.
1.12 – сурет. Дельта модуляция әдісімен кодалау
Дельта-модуляциямен кодалау сөздің дұрыс айтылуы үшін қарапайым сұлба
да жеткілікті. 1.12-суретте қарапайым интегратор көрсетілген. Интегратордың
Е кірісіне таңдама жиілігіне тең екі деңгейлі логикалық сигнал компьютерден
келіп түседі. Интегратордың уақыт тұрақтысын RC таңдама сұлбасындағы
интегралдау ұзақтығына сәйкес түрде таңдайды.
Егер сөздің айтылу кірісіне логикалық бірлік келіп түссе, интегратор
бір белгінің қисық иілу тұрақтысын береді. Кірісіне логикалық нөл түскен
жағдайда шығыс кернеудің иілу қисығы белгіні ауыстырады. Нәтижесінде Ғ
кестесінде көрсетілген типті сигнал алынады. Бұл сигнал дельта-модуляциямен
кодталған шығарылған кіріс сигналы болып табылады.
Көріп отырғанымыздай, сигналдың алынған формасы кейбір кедергілері
бар, шығысымен сәйкес келеді. Дельта-модуляция құрылатын кедергілер
дәрежесі кодтаудың бір кедергісімен анықталады, ол айналым бойынша жүктеу
деп аталынады. Кіріс сигналдың айналымы тез өзгерсе, онда шығыс сигнал
кіріс өзгерістеріне үлгермейді. Бұл модифинирленген әдіс сөздік
синтезаторлардың кейбір микросұлбаларында қолданылған, сонымен қатар Нэшнл
семикондактор фирмасының Диджитокер сөзді синтездеу жүйесінде де
пайдаланады.
Адаптивті импульсті-кодтық модуляцияға (АИКМ) негізделген жүйе
сызықтық жүйеге сәйкес, олардың арасындағы айырмашылық, АИКМ жүйесі соңғы
таңдамадан айналым өзгерісінің бағытын ғана емес,сол кездегі өлшем
өзгерістерін де өзінің жадысында сақтайды. Бұл алдыңғы жүйенің барлық
артықшылықтарын сақтауға және айналым бойынша жүктеме мәселесін жоюға
мүмкіндік береді. Басқаша айтқанда, сигналдың өсетін немесе төмендейтінін
көрсететін жалғыз битті қолдану орнына, өзгерістердің нақты өзгерісіне
байланысты мүмкін сегіз деңгейдің біреуін өсетін немесе төмендейтін сигнал
деп сипаттайтын төрт битті алуға болады. Бұл таңдамалар арасындағы
өзгерістерді нақты сипаттауға, сонымен қатар, сызықты дельта-модуляция
кезіндегі айналым бойынша жүктеу мәселесінен арылуға мүмкіндік береді.
Жоғарыда сипатталғандардан басқа сигналды кодтау арқылы сөз синтезінің
басқа да әдістері қолданылады; бірақ олардың негізінде құрылған жүйелер тек
олардың нұсқа түрленуі болып табылады. Сөздік сигналды кодтау-қалпына
келтіру әдісі бойынша сөз синтезі іске асырудың қарапайым әдістерінің бірі;
түсіну үшін де оңай. Бұрын көрсетілгендей, ол цифрлық әдіске сәйкес. Сөздің
сақтау әдістері болуы мүмкін, бірақ әртүрлі, сөздің тохометрі, сөз
айтылуының жоғарғы нақтылығын алу үшін таңдаманың жоғарғы жылдамдығы қажет.
Сөздік сигналдарды кодтаудың цифрлық әдістерінің тиімдісі АИКМ болып
табылады. Таңдамадағы кіріс сигналдарының өзгерістерінің оның иілу және
амплитуда мәндерімен таңдамаға беріп, әр таңдама бойынша қажет жады битін
қысқартуға болады. Сөз синтезаторларын өңдеуде негізгі мәселе бір айтылған
сөйлемді сақтауға арналған жады көлемін қысқарту болып отыр.
Сөз синтезінің басқа әдісі формантты жиілік синтезі қолданылатын
фонемді қозуы бар синтезаторға енгізілген. Бұл жүйенің жұмыс істеуімен
жақынырақ танысып, сөздің электронды синтез әдістерінің үлкен айырмашылығын
көре аламыз.
1.6. Сөздің формантты жиілігінің аналогты синтезі
Сөздік сигналдың кодтау –қалпына келу сипатталған әдісін сөздің
суреттеліну деп атауға болады. Сондай-ақ сөз синтезі аналогты формант
әдісі немесе формантты жиілік бойынша дұрысы сол сөздік суреттің бейнеленуі
ретінде сипаттаған жөн. Кодталған сөздік сигнал біз суретке түсіріп алатын
табиғи көрінісі немесе заттар сияқты оны синтезатор айтқанға дейін пайда
болуы тиіс. Осы әдістен ерекше, формантты жиілігін синтездеу сол сөзді
жасанды жолмен, яғни суретшінің бақылап салатын суретіне сәйкес көрсету
әдісі. Осы екі әдістің ерекшеліктері бейнеленетін заттың ерекшеліктеріне
сәйкес келуі: суреттің түпнұсқаның дәл жазылуын береді, ал бейнелеу беті
түпнұсқаға жақын, бірақ ешқашан онымен дәл келмейді. Бірақ қойылған
мақсатқа байланысты әрбір әдіс белгілі жақындылықпен сөзді немесе жағдайды
сипаттайды.
1.5 – кесте. Дауысты дыбыстардың жиіліктік типтік қатары
Фонема Сөз түрінде Ғ1 Ғ2 Ғ3
ее Feet 250 2300 3000
i hid 375 2150 2800
eh head 550 1950 2600
ae had 700 1800 2550
ah tot 775 1100 2500
aw talk 575 900 2450
u took 425 1000 2400
oo tool 275 850 2400
Сөздің формантты синтезін жүзеге асырудың әдістері бар. Бірақ әр түрлі
формантты синтез әдістеріндегі сөздің генерациялануының негізгі
функционалды операциялар бірдей. Олардың барлығы сөздің фонетикалық және
фонемді түбегейлі білуге негізделген. Фонетикалық сөздің көлемдік
сипаттамаларымен нақтырақ таныса отырып, сөз синтезінің формантты әдісін
түсінуге негіз саламыз.
Адамдық сөзді визуалды және электронды әдіспен танудың әдістерінің
болуындағы өзгермелі жиіліктер, қажет формантты жиіліктің бір уақытта
генерациялануын қажет санына негізделген жасанды сөздің синтездеу әдісін
қалыптастыруға мүмкіндік береді.
Енді 1.5-кестеге қарап, дауысты дыбыстардың фонемін еске түсірсек.
Онда бізге таныс дыбыстардың кейбір фонемдерін көре аламыз, бірақ олар бұл
жерде дәлірек сипатталған кестеде әрбір дыбыс үшін негізгі үш формантты
жиілік берілген, олар ердің орташа дауысымен айтылатын сәйкес фонемдердің
спектограммасында бақыланады. Бұл жиіліктерді, Ғ1,F2 және Ғ3 әрбір
айтылатын дауыстының спектограммасында тұрақты болып табылады, жиіліктері
айтылудың барлық уақытында тұрақты болып қалады. Енді, көмекке біраз
ойларды шақырып, электронды сұлбаны елестетуге болады (1.13-суретте). Үш
параллель жолақты сүзгі (олардың орташа жиілігі формантты жиіліктерге
Ғ1,Ғ2,Ғ3 сәйкес), олар дыбыстың қуыс қалыптасатын импульстерге сәйкес шығыс
сигналы бар генератор арқылы қозады. Бұл сұлба қанша қарапайым болса да,
формантты жиіліктері Ғ1, Ғ2, Ғ3 1.2 –кестедегі мән шегінде болса ғана,
дауыстардың негізгі фонемді синтезаторы ретінде қызмет етеді. Әрбір
параллель сүзгі жолағының орташа жиілігі синтезатор сөзі үрдісінде ауыз бен
тамақ ортасында эквивалентті резонанс сәйкесінше реттеліп отырады. Осы үш
сүзгі шығысының қосындысының нәтижесінен алынатын нәтижелеуші сөз адам
сөзіне өте жақын. Бұл сұлбаның шығыс сигнал спектограммасында дәл сол
дауыстыларды айтатын адам сөзінің спектограммасындағы формантты жиіліктерге
сәйкес үш формантты жиілік бар. Егер 1.13-суреттегі сұлбада реттеудің үш
кілтін дауыстың негізгі ырғағының биіктігімен және үш формантты жиілікті
компьютерлік басқарумен алмастырса, онда біздің сипаттағанымыз формантты
жиілік бойынша жүйенің сөзін синтездеудің негізі болып табылады.
Мұндай синтезатордың формантты жиілігін құрудың қиыншылығы, оның
сөздік қабілеттілігі қатаң шектелгенмен тек қана дауысты генерирлейді.
1.13-сурет. Сөздің формантты синтезаторының базалық сұлбасы
Бірақ құрылған сұлба өте қызықты, себебі ол фонетикалық сөздің
электронды генерация әдісін көрсетеді. Формантты синтезатор мүмкіндігінің
диапазонын кеңейту үшін сүзілмелі және жарылғыш дауыссыздарды
қалыптастыратын шу көзін, сонымен қатар мұрынды дауыссыздарды көрсететін
резонансты аналогын енгізу қажет. Бұл кеңейтілген формантты синтезатордың
блок-сұлбасы 1.13 –суретте көрсетілген.
Синтезатордың жаңа сұлбасын барлық амалдар жиынтығын енгізгеннен кейін
өте қатты болмаса да, алдыңғы сұлбаға қарағанда күрделенеді. Бұрынғы төрт
басқару мүшелері мен реттегіштер енді тоғызға жетті. Олардың үшеуі
–фрикативті, дауысты және мұрынды дыбыстардың амплитудасын басқаруға,
біреуі –дыбыс биіктігін реттеуге, ал бесеуі -әр түрлі резонанс жиілігін
реттеу үшін қызмет етеді. Алдыңғы панельде бес басқару қолы бар жүйені
құрсақ, егер сіздің қолыңыз абсолютті қозғалысқа ие болса, онда сіз жүйе
арқылы бірінші сөйлегіш машинаны жасағандар сияқты сөз айтатын едіңіз.
Бақытымызға орай, біз реттеудің компьтерлік басқару мүмкіндігіне иеміз,
сондықтан, компьютер бізге синтезделген сөз генерациясында баға жетпес
көмек көрсетеді. 1.14-суреттегі әрбір тоғыз реттегіш потенциометрді
параллельді компьютерлік порт қосылысымен алмастырып, синтезаторды
программалауға көшуімізге болады. Біраз уақыттан кейін синтез үрдісінде
адам сөзіне жақындау үшін бізге қажет жылдамдықпен реттеулерді жүргізуге
болады.
Енді, дифтонг пен статикалық емес фонемдерді синтезатор сұлбасын
толығымен 100 Гц басқарып форманты жиілік өзгерісін синтездейміз делік,онда
әрбір басқарылатын сөз 8 биттік байттан тұрса, онда біз синтезаторды 900
байтс жылдамдықпен басқаратын сөздерді параллель беру кезінде басқара
аламыз. Бірақ бұл әрі біз қолданатын фонем жылдамдығы емес, тек қана
синтезатордың өзіндегі деректерді беру жылдамдығы. Берілген ақпарат ереже
бойынша компьютер жадысында әрбір фонем мен оның вариациясы-аллофондар үшін
бөлек арнайы басқарылатын кестеде сақталады. Ол басқарылатын программаның
сөздік шығысындағы фонемнің кіріс жүйелілігімен анықталатын жүйелілік
түрінде шақырылады. Мысалы, әрбір фонемде, синтезатордың компьютер
басқарылуы сүзгі жүйесінің 30 толық қайта бапталуын талап ете алады. Бұл
келесіні білдіреді: компьютер форманты синтезатор басқару сұлбасына
секундына 900 байт беру үшін, оның томалық кестенің сұрау программасына
секундына тек 30 байт енгізіп отыру керек. Деректердің соңғы қолданушыға
берілуі жуық шамамен 240 битc жылдамдықпен жүргізуіне сәйкес келеді.
Сүзгілерді қайта жасаудың жоғарыда көрсетілген жылдамдық мәндері жүйеден
жүйеге өткенде өзгереді, фонем мен басқаратын кесте өлшемдерінің саны
өзгермейді десе де болады. Әрбір фонем бойынша анықтамалық кестеге көп
жүгінсе, соғұрлым синтетикалық сөз тербелмелілігімен ерекшеленеді және
айтылуы адам сөзінің артикуляциясына жақын болады. Бірақ бұл жүйе адам
дауысынан айыра алмайтындай болады деп үміттенуге болмайды. Оның
синтезделген сөзінде әрдайым жұмыс дауысы естіледі, бұл көпшіліктің ойы
бойынша компьютерлік сөзге тән. Егер сіз мұндай жүйені басқаларға
көрсеткіңіз келсе, нәтиже таңғаларлық болады, бірақ оларға жүйенің сөйлеп
тұрғанын айыру қиынға түседі. Бірақ, формантты синтезатордың синтезделген
сөзін фонемдік қозу кезінде айтылған немесе қалпына келтірілген сөзді
біреуден қабылдауы мүмкін емес. Мұндай жүйенің шығуы әрдайым компьютерлік
сөз болады.
1.14 – сурет. Сөздің формантты синтезаторының толық сұлбасы
Фондық қозуы бар формантты синтезатор сөзін компьютердің
қалай басқаратынын қарастырайық. Мұндай сөйлегіш жүйенің басқару сұлбасы
1.15 –суретте көрсетілген. Сұлбаның сол жағында компьютер бейнеленген.
Мұндай жүйені басқару үшін, компьютер келесі амалдарға ие болуы керек:
- әр түрлі басқару функцияларын іске асыру үшін шығыс порттардың 8-
битті жиынтығы;
- синтезатордың келесі деректер кадрын қабылдауға дайындығын
компьтерге жеткізу үшін қызмет ететін кіріс портының бір 8 биті.
Осы сұлбада әр түрлі блоктарды қосатын түрлі басқару желілерінің
жүрісін бақыласа, 1.14-суреттегі берілген басқарудың фармантты синтезатор
амалдарын білуге болады. Басқаратын желілерге келіп түсетін бос емес
сигналдар компьютерге сөздің формантты синтезаторы деректер кадрын айтып
болғанын хабарлайды. Деректер кадры термині кездейсоқ таңдалған жоқ: ол
бөлек порттар арқылы синтезаторды басқару өзіндік ретте жүргізілмейтіндігін
білдіреді. Керісінше компьютер фонем мен оның бөлігінің жүргізілуіне сәйкес
барлық тоғыз параллельді портта басқаратын деректерді басқарып отырады,
содан кейін кадрдың аяқты айтылуын күтеді, соңында фонем ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz