КОМПЬЮТЕРЛІК КӨРУ ТЕХНОЛОГИЯСЫНЫҢ ӘДІСТЕРІ
Қазақстан Республикасының Білім және ғылым министрлігі
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ
Қурметбек Бекболат
КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІН ҚОЛДАНА ОТЫРЫП, ӨНДІРІСТІК ОБЪЕКТІЛЕРДІҢ ІШКІ ҚОСЫМШАЛАРЫНДА ТЕХНИКАЛЫҚ ҚАУІПСІЗДІК ТАЛАПТАРЫН БАҒАЛАУ
7M06112 - Жасанды интеллект технологиялары білім беру
бағдарламасы бойынша
магистр дәрежесін алу үшін дайындалған
диссертация
(ғылыми-педагогикалық бағыт)
Нұр-Сұлтан, 2023 ж.
Қазақстан Республикасының Білім және ғылым министрлігі
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ
Қорғауға жіберілді:
Ақпараттық технологиялар
факультетінің деканы
________________ Сеилов Ш.Ж.
____ ___________ 2023 ж.
Магистрлік диссертация
КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІН ҚОЛДАНА ОТЫРЫП, ӨНДІРІСТІК ОБЪЕКТІЛЕРДІҢ ІШКІ ҚОСЫМШАЛАРЫНДА ТЕХНИКАЛЫҚ ҚАУІПСІЗДІК ТАЛАПТАРЫН БАҒАЛАУ
білім беру бағдарламасы: 7M06102 Жасанды интеллект технологиялары
(ғылыми-педагогикалық бағыт)
Магистрант ________________ Қу рметбек Б.
Ғылыми жетекші,
техника ғылымдарының
кандидаты ________________ Разахова Б.Ш.
Кафедра меңгерушісі ________________ Разахова Б.Ш.
Нұр-Сұлтан, 2023
МАЗМҰНЫ
НОРМАТИВТІК СІЛТЕМЕЛЕР 4
АНЫҚТАМАЛАР 5
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР 6
КІРІСПЕ 7
1 КОМПЬЮТЕРЛІК КӨРУ ТЕХНОЛОГИЯСЫНЫҢ ӘДІСТЕРІ 9
1.1 Кескінді тану 9
1.2 Кескінді классификациялау 9
1.3 Объектіні анықтау 9
1.4 Терең оқыту әдісінің архитектуралары 11
1.4 Объектіні анықтау моделін оқыту 18
2 ЖЕКЕ ҚОРҒАНЫС ҚҰРАЛДАРЫН ТАНУДЫҢ ӘДІСНАМАСЫ 19
ҚОРЫТЫНДЫ 22
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 22
НОРМАТИВТІК СІЛТЕМЕЛЕР
Диссертациялық жұмыс келесі нормативтік құжаттардың талаптарын ескере отырып әзірленді:
Бiлiм туpaлы Қазақстан Республикасының 2007 жылғы 27 шілдедегі № 319 Заңы;
Ғылым туралы Қазақстан Республикасының 2011 жылғы 18 ақпандағы № 407-IV Заңы;
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ 2017 жылғы 6 қарашадағы магистрлік диссертацияныжобаны рәсімдеу туралы ережеcі (орысша);
Қазақстан Республикасы Білім және ғылым министрінің 2018 жылғы 31 қазандағы № 604 бұйрығы. Жоғары оқу орнынан кейінгі білім берудің мемлекеттік жалпыға міндетті стандарты;
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ 2021 жылғы 29 қарашадағы магистратура туралы ережеcі
АНЫҚТАМАЛАР
Диссертациялық жұмыста төмендегідей анықтамаларға сәйкес терминдер қолданылды:
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР
YOLO - You Only Look Once
ЖҚҚ - жеке қорғаныс құралдары
КІРІСПЕ
Жұмыстың жалпы сипаттамасы. Компьютерлік көру жүйесі - өндірістік процесстерді және сапаны басқарудың тиімді құралы. Бұл жүйе өндірістік операцияларды автоматты түрде бағыттау үшін цифрлық суреттерден алынған ақпаратты қолдануға арналған интеграцияланған компоненттер жиынтығы болып табылады. Ол әр түрлі салаларда кеңінен қолданылады және оны кез келген қарапайым, қайталанатын тапсырмаларды автоматтандыру үшін қолдануға болады. Компьютерлік көру әдістемесінің дамуымен өндірістегі жұмысшылардың қауіпсіздігі мен жұмыс жағдайын талдауды жақсартуға болады. Қауіпсіздік талаптарының сақталуы қауіпсіз өндірістік орта үшін маңызды. Өндірістегі қауіпті жағдайларды қолмен бақылау қиын, сондықтан қауіпсіз ортаны қамтамасыз ету үшін автоматты бақылаудың интеллектуалды құрылымы қажет.
Компьютерлік көруге негізделген жүйесінің артықшылығы - жоғары жұмыс жылдамдығы, тәулік бойы жұмыс істеу мүмкіндігі және өлшеу дәлдігі. Бұл адами факторды толығымен жояды және қателіктер санын азайтады.
Зерттеудің өзектілігі. Өндіріс орындарында қауіпсіздік ережелері сақтала бермейді, бұл апаттардың негізгі себебі болып табылады. Қазақстан Республикасы Стратегиялық жоспарлау және реформалар агенттігінің Ұлттық статистика бюросы мәліметі бойынша 2021 жылдың қорытындысы бойынша өндірістегі жазатайым оқиғалардың салдарынан 2133 жұмысшы зардап шекті. Зардап шеккендердің жалпы санынан жазатайым оқиғалар кезінде 176 адам өлді [1]. Құлаған объектілер мен соқтығысқан жазатайым оқиғалар құрылыс алаңдарында жиі кездесетін апаттардың бірі болып табылады және жазатайым оқиғаларды азайтудың ең маңызды жолы - жеке қорғаныс құралдарын (ЖҚҚ) қолдану.
Зерттеу мақсаты. Жұмыстың мақсаты өндірістің ішкі қосымшаларында жеке қауіпсіздікті арттыру үшін компьютерлік көру технологиясын қолдану арқылы жұмысшылар мен олардың ЖҚҚ анықтау және қауіпсіздік талаптарың сақталуын бағалау мүмкіндіктерін зерттеу болып табылады.
Зерттеу міндеттері. Жұмыста қойылған мақсаттарға жету үшін келесі міндеттер қойылды:
Компьютерлік көру жүйесінің негізін зерттеу;
Өндіріс алаңдарында жұмысшылар мен олардың ЖҚҚ анықтау әдісін зерттеу;
Компьютерлік көру жүйесін қолдану арқылы өндірістік объектілердегі техникалық қауіпсіздік талаптарының сақталуын бағалайтын бағдарлама әзірлеу.
Зерттеудің әдістері. Кескінді тану - 3D модельдеу және объектілерді бақылау сияқты әдістерді қамтитын кең зерттеу саласы болып табылатын компьютерлік көру саласы. Компьютерлік көрудің пайда болу тарихы 70-ші жылдардың басында пайда болды және кескінді өңдеу саласындағы алдыңғы жұмыстардан айырмашылығы, мақсаты кескіндерден әлемнің 3D құрылысын алу арқылы сахнаны толық түсінуге мүмкіндік беру болды [2, б.12]. Бүгінгі күні компьютерлік көру әртүрлі нақты сценарийлерде қолданылады, мысалы, оптикалық таңбаларды тану, бұл кескіндердегі мәтінді ажыратуды және оны мәтіндік файлға түрлендіруді білдіреді. Операция алдындағы және операция ішілік бейнелерді тіркеу үшін медициналық бейнелеуде, аутентификация үшін саусақ ізін тануда да қолданылады [2, б.5]. Кескінді тану кескіндерді түсіндіруге және орындар, адамдар және жануарлар сияқты әртүрлі айнымалыларды анықтауға бағытталған. Бұл жұмыс кескінді классификациялау және нысанды анықтау әдістерін қамтиды.
Зерттеудің практикалық құндылығы.
Зерттеу нәтижелері келесі ғылыми конференцияларда баяндалып талқыланды:
ǴYLYM JÁNE BILIM - 2022 cтуденттер мен жас ғалымдардың XVII Халықаралық ғылыми конференциясы, ӘӨЖ 004. 832.22.
Мақала тақырыбы: Компьютерлік көру негізіндегі технологиялар тенденциялары
Диссертациялық жұмыстың құрылымы және көлемі.
Диссертациялық жұмыс анықтамалардан, белгілеулер мен қысқартулардан, кіріспеден, 3 бөлімнен, қорытындыдан және пайдаланылған әдебиеттер тізімінен, қосымшалардан тұрады. Жұмыстың мазмұны ?? баспа беттен тұрады, оның ішінде ? кесте, ?? сурет және ?? пайдаланылған дереккөз көрсетілген.
Кіріспеде диссертациялық жұмыстың өзектілігі, теориялық және практикалық маңыздылығы, мақсаты, күтілетін нәтижелер және конференцияда баяндалған, жарияланған мақалалар келтірілді.
Бұл құжат компьютерлік көру қолданбаларының ағымдағы жағдайын бағалау, енгізудегі қиындықтар мен болашақ зерттеу мүмкіндіктерін анықтау үшін құрылыстағы компьютерлік көру технологиясына соңғы шолуды ұсынады.
1-ші бөлім. Өндірістік кешендерде денсаулық пен қауіпсіздікті бақылаудың компьютерлік көру әдістері атты бөлімде компьютерлік көру әдістері мен архитектураларына жалпы шолу жүргізілді. Басты назар кескіндігі объектіні тану мен өңдеу әдістеріне аударылды.
2-ші бөлім. Жеке қорғаныс құралдарын танудың әдіснамасы атты бағдарлама құрлымына шолу жүргізілді.
1 КОМПЬЮТЕРЛІК КӨРУ ТЕХНОЛОГИЯСЫНЫҢ ӘДІСТЕРІ
Бұл тарауда теория мен анықтамалық ақпарат осы жұмысқа қатысты тұжырымдамалар үшін берілген.
Кескінді тану
Кескінді тану - 3D модельдеу мен нысанды бақылауды қоса алғанда, кең ауқымды зерттеу бағыттарын қамтитын компьютерлік көру саласы. Компьютерлік көрудің пайда болуын 1970 жылдардың басынан басталды, мұнда фокус кескіндерді өңдеуден әлемнің 3D құрылымын кескіндерден алу арқылы толық көріністі түсінуге қол жеткізуге ауысты [23, 12 б.]. Бүгінгі күні компьютерлік көру әртүрлі практикалық қолданбаларда қолданылады, мысалы, оптикалық таңбаларды тану, ол кескіндер ішіндегі мәтінді тануды және оны мәтіндік файлға түрлендіруді қамтиды. Бұған қоса, ол операцияға дейінгі және операция ішілік кескіндерді тіркеу үшін медициналық бейнелеуде және аутентификация мақсатында саусақ ізін тану үшін қолданылады [23, 5 б.]. Кескінді тану, ең алдымен, кескіндерді түсіндіруге және орындар, адамдар және жануарлар сияқты әртүрлі элементтерді анықтауға бағытталған. Адамдар нысандардың әртүрлі пішіндерде, бұрыштарда және жарықтандыру жағдайында пайда болуы мүмкін екенін мойындай отырып, кескінде көргендерін оңай түсіндіре алатынымен, компьютерлер бірдей тапсырманы орындау үшін арнайы алгоритмдерді қажет етеді. Адамның көзі мысық пен итті еш қиындықсыз ажырата алады және иттердің әртүрлі тұқымдары әлі де иттер екенін мойындайды. Бұл дипломдық жұмыс кескінді танумен байланысты әдістер болып табылатын кескінді классификациялау және объектілерді анықтауға бағытталған және келесі бөлімдерде толығырақ сипатталатын болады.
Кескінді классификациялау
Кескінді классификациялау компьютерлерге кескінді тұтастай түсінуге және оның классын алдын ала белгіленген класстар жиынтығынан анықтауға мүмкіндік беру процесін қамтиды. Әдетте кескіннің классификациясы кескін тек бір нысанды қамтитын кезде пайдаланылады. Мысалы, мысықтың бейнесі мысық ретінде жіктеледі. Терең оқыту алгоритмдері кескін классификациясын тиімдірек етті. Терең оқыту - бұл машиналық оқытудың бір түрі және машиналарға бақыланатын деректерден үйренуге мүмкіндік беретін жасанды интеллект жиынтығы. Нейрондық желілер түйіндердің қабаттарынан тұрады, ал терең нейрондық желілерде бірнеше қабаттар болады. Түйіндердің әрбір қабаты мүмкіндіктер жиынтығы бойынша оқытылады және желіге ілгерілеген сайын түйіндер күрделірек мүмкіндіктерді тануға қабілетті болады.
Конволюционды нейрондық желілер (CNN) кескіндерді талдау үшін жиі пайдаланылады, өйткені олар негізінен кескін кірістерін өңдеуге арналған [30]. Кәдімгі нейрондық желілерден айырмашылығы, CNN үш өлшемде орналасқан түйіндерге ие: биіктік, ені және тереңдігі.
Объектіні анықтау
Объектіні анықтау - кескіндегі белгілі нысандарды анықтау үшін қолданылатын әдіс және ол кескін классификациясымен ұқсас әдістерді қамтиды. Дегенмен, объектіні анықтау тек объектілерді анықтау ғана емес, сонымен қатар оларды локализациялау міндетін де қамтиды. Объектіні анықтау мақсаты суретті сканерлеу және адам, велосипед, үй және ит сияқты қызығушылық санаттарының алдын ала анықталған тізімінен таңдалған кескінде қандай нысандар орын алатынын анықтау болып табылады. Бейнеде нысан болған кезде, нысанның орны мен өлшемдері нысанды мықтап қоршап тұрған шектейтін қораппен (box) қамтамасыз етіледі [24]. Шектеу жолағы нүктемен, енмен және биіктікпен анықталады.
Объектіні анықтау саласында бірқатар зерттеулер жүргізілді. Қаралған жұмыстардың көпшілігі осы зерттеу тақырыбына тікелей қатысты бар және олар өте тығыз байланысты.
Объектіні қадағалау
Объектілерді қадағалау - объектілердің траекториясын сақтай отырып, бейнедегі кадрлар тізбегі бойымен қозғалуын қадағалау үшін қолданылатын әдіс. Мақсатты нысандар көбінесе адамдар болып табылады, бірақ жануарлар, көліктер немесе басқа да қызығушылық тудыратын объектілер болуы мүмкін. Нысандарды бақылау процесі объектілерді анықтаудан басталады және оларға шектейтін ұяшықтарды тағайындайды (яғни, нысанды анықтау). Нысандарды бақылау әдістері кескіндегі әрбір анықталған нысанға идентификаторды тағайындайды және келесі кадрларда осы идентификатор арқылы тасымалдауға және сол нысанның жаңа орнын анықтауға тырысады. Қозғалыстағы объектілерді анықтау және қозғалысқа негізделген бақылау жаяу жүргіншілерді бақылау [25], адам мен компьютердің өзара әрекеттесуі [26], автономды көліктер, робототехника, қозғалысқа негізделген тану, бейне индекстеу, бақылау және қауіпсіздік қоса алғанда, әртүрлі нақты уақытғы қолданбаларының құрамдас бөліктері болып табылады [27].
Диссертациялық жұмыс үшін артқы фонды зерттеу мақсатында әртүрлі жұмыстар қарастырылды. Бұл жұмыстардың ішінде объектіні тану, сәйкестендіру, кескінді қысу алгоритмдердің әртүрлі түрлері, сондай-ақ нақты уақыттағы ескерту тәсілдерінің түрлері мұқият зерттелді. Бұл зерттеудің негізі ретінде өндіріс орындарының қауіпсіздігін визуализациялау саласындағы тиісті зерттеу жұмыстары қарастырылды.
Объектіні анықтауда сенсорға негізделген әдістер қолданылады. Сенсорға негізделген әдістер әдетте қауіпсіздік дулығасы мен жұмысшыны қадағалауға тырысады. ЖҚҚ анықтау үшін Zigbee және Радиожиіліктік сәйкестендіру (RFID) технологияларын біріктірді [3]. Жұмысшылар ЖҚҚ анықтау үшін микроконтроллер негізіндегі құрылғыны киеді және жұмысшы ЖҚҚ дұрыс кимеген жағдайда ескерту жасайтын орталық блокқа ақпаратты жібереді. Дегенмен, RFID негізіндегі технология жұмысшының ЖҚҚ немесе қауіпсіздік дулығасын дұрыс кигенін растай алмайды. Сонымен қатар, сенсорға негізделген технология жақсы сенімді шешім бола алатынымен, бұл әдістер әрқашан сыртқы жабдыққа сүйенеді. Сондықтан бұл технологияны өте үлкен өндіріс алаңдарында жүзеге асыруды қиындатады. Оның үстіне сенсорға негізделген әдістер қымбат болып табылады [4].
Құрылғыға тәуелділік мәселесін жеңу үшін машиналық оқытуға негізделген объектілерді анықтау әдістері кеңінен қолданылды. Машиналық оқытуға негізделген әдістер көп мүмкіндікті және жоғары анықтау дәлдігін ұсынады. Объектілерді анықтауда кейде әдістердің комбинациясын қолданады. Варанусаст бас сегментациясы үшін тік және көлденең проекция әдістерін, ал дулығаны анықтау үшін оларды K Nearest Neighbor (KNN) әдісімен біріктірді [5]. Дунгмалада өз зерттеулерінде дулығаны анықтаудың екі әдісін біріктіреді [6]. Алдымен дулыға аймағын анықтау үшін Хаар ұқсас мүмкіндіктер әдісін пайдаланылды, содан кейін жартылай және толық дулығаларды анықтау үшін Circle Hough Transform (CHT) қолданылды.
Машиналық оқытуға негізделген технологиялар қауіпсіздік дулығасын анықтау үшін қолмен жасалған мүмкіндіктерді пайдаланады, бұл қолайсыз ауа-райы немесе үлкен құрылыс алаңдары сияқты күрделі орталарда нашар өндеуге әкелуі мүмкін. Терең оқытуға негізделген нысанды анықтау саласындағы соңғы жетістіктермен көптеген зерттеушілер қауіпсіздік дулығасын анықтау үшін терең оқыту стратегияларын қолданды. Ван төрт түрлі түсті қауіпсіздік дулығаларын, адамдарды және кеудешелерді анықтау үшін әртүрлі YOLO архитектурасын пайдаланды [7]. Барлық архитектуралардың ішінде YOLOv5x ең жақсы дәлдікті береді және YOLOv5s ең жылдам жылдамдыққа ие. Бірақ бұл жұмыстағы негізгі шектеулердің бірі тұлғаны анықтауға негізделген тәсілді пайдалану болып табылады. Соның әсерінен модель құрылыс алаңдарында жиі кездесетін жұмысшы камераға қарамаған кезде сәтсіздікке ұшырайды.
Сенсор, машиналық оқыту және терең оқыту әдістеріне негізделген құрылыс алаңдарында қауіпсіздік дулығасын анықтау бойынша көптеген зерттеулер жүргізілгенін көре аламыз. Олардың көпшілігі күрделі сценарийлерде, мысалы, бірнеше жұмысшылары бар сайттарда қауіпсіздік дулығасын анықтай алмайды. Сонымен қатар, аз жарық жағдайында және шағын нысан өлшемдері бар дулығаны анықтау нақты уақыттағы жүйелерді орналастыру үшін айтарлықтай жақсартуларды қажет етеді. Сондықтан, бұл зерттеу екі сценарийді де қарастырады және құрылыс жұмысшыларының қауіпсіздігін қамтамасыз ету үшін терең оқытуға (YOLO алгоритміне) негізделген автоматтандырылған дулығаны анықтау жүйесін ұсынады. Бұдан басқа, ұсынылған әдістің өнімділігі басқа YOLO нұсқаларын (YOLOv3, YOLOv4, YOLOv5, YOLOv8) қолданатын қолданыстағы дулығаны анықтау әдістерімен салыстырылды.
Сурет 1. Машиналық оқыту көмегімен жұмысшылардың қауіпсіздік
құралдарын анықтаудың жалпы архитектурасы
1.4 Терең оқыту әдісінің архитектуралары
Көптеген нейрондық желі архитектуралары сияқты, терең оқыту архитектуралары қабаттардан (енгізу, жасырын және шығыс), нейрондардан, активтендіру функцияларынан a және {W, b} салмақтарынан тұрады. Нейрондар функция детектор ретінде әрекет етеді және төменгі, жоғары қабаттарда ұйымдастырылған. Төменгі қабаттар негізгі белгілерді анықтайды және оларды неғұрлым күрделі белгілерді анықтайтын жоғары қабаттарға береді. Терең оқыту архитектураларының көпшілігі болжау немесе классификациялау тапсырмаларының ауқымына қолданылатын болса да, олар кейде жақсырақ жұмыс істеу үшін ансамбльдік модельдеу арқылы біріктіріледі. Бұл бөлімде кейбір дәстүрлі терең оқыту архитектуралары сипатталады, сонымен бірге олардың оқу моделі мен жалпы қолдану аймақтарына тоқталамыз. 1-кесте талқыланатын терең оқыту архитектураларының маңызды функцияларын, құрылымын және жалпы қолдану салаларын көруге болады.
Терең оқыту архитектурасы
Негізі функция
Жалпы қолдану аймақтары
Кескінді классифика-циялау
Кескін-ге жазу
Объек-тіні анықтау
Объек-тіні қадаға-лау
Семантика-лық талдак
Терең нейрондық желі
Бейнелерді оқыту
-
+
+
+
+
Конволюционды нейрондық желі
Кескінді модельдеу
+
+
+
+
+
Рекурентті нейрондық желі
Тізбекті модельдеу
-
+
+
+
+
Автокодерлер
Өлшемді кішірейту
-
+
+
+
+
Генеративті нейрендық желілер
Генеративті модельдеу
+
+
+
+
+
Кесте 1. Терең оқыту архитектуралары және олардың маңызды функциялары
Терең нейрондық желі (DNN)
Терең нейрондық желі әдетте тереңдігі бар стандартты нейрондық желі болып табылады. Нейрондық желінің тереңдігі кіріс және шығыс қабаттар арасындағы жасырын қабаттардың санымен анықталады.
Сурет 2. Терең нейрондық желі архитектурасы
Нейрондық желіні қашан терең деп анықтауға болатынын ешбір шек анықталмаса да, зерттеушілердің көпшілігі тереңдігі 2-ден үлкен болса, терең деп санауға болады деп келіскен [8].
Конволюционды нейрондық желі (CNN)
CNN кескіндерді өңдеу қолданбалары үшін кеңінен қолданылады [9]. Архитектура ImageNet байқауында AlexNet (суретті жіктеу үшін пайдаланылатын терең оқыту желісі) нәтижелерінен кейін танымал болды. Кәдімгі көп деңгейлі нейрондық желіден айырмашылығы, CNN нейрондары кескіндердің еніне, биіктігіне және тереңдігіне сәйкес келетін етіп орналастырылған. Кіріс қабаттарынан, шығыс қабаттарынан және белсендіру функцияларынан басқа, CNN-де екі қосымша қабат бар, конвульсия және біріктіру қабаттары (3-суретте екіншіден жетінші қабаттар ретінде бейнеленген). Конволюция қабаты әртүрлі конволюциялық сүзгілерді пайдалану және қабылдау өрістерін біртіндеп ауыстыру арқылы кескінді айналдырады. Кезекті конволюционды қабаттар арасында біріктіру қабатын кірістіру әдеттегі тәжірибе. Біріктіру қабаты, керісінше, әртүрлі пикселдердегі кескіннің орташа, максимум, медиана немесе басқа статистикалық ерекшеліктерін есептеу арқылы конволюция қабатынан шығатын өнімнің өлшемін азайтады.
Сурет 3. Конволюционды нейрондық желі архитектурасы
Рекурентті нейрондық желі (RNN)
RNN тізбекті деректерді өңдеу үшін ең қолайлы. Олар уақытқа тәуелді ақпаратты өңдеу кезінде терең оқытудың басқа формаларын басып озады. Әртүрлі уақыт қадамдары бойынша параметрлер дәйекті деректер сипаттары негізінде ортақ пайдаланылады. RNN негізінен бейне және сөйлеуді өңдеуде қолданылады, өйткені олар кезекті деректерге болжам жасау үшін бұрын өңделген аудио бөлігінде немесе бейне кадрында ақпаратты сақтай алады. Кез келген t уақытындағы RNN шығысы yt тек xt кірісіне ғана емес, сонымен қатар t-1 уақыттағы xt−1-ге де тәуелді. Басқа терең оқыту архитектуралары сияқты, RNN-ді кері таралу алгоритмі арқылы оқытуға болады. Нақтырақ айтқанда, кері таралу нұсқасы - Уақыт бойынша кері таралу (BPTT) RNN үшін стандартты оқыту алгоритмі болып табылады [8]. RNN архитектурасының үлгісі 4-суретте көрсетілген.
Сурет 4. Рекурентті нейрондық желі архитектурасы
Автокодтауыш
Автокодтауыштар (AEs) негізінен деректерді жою және өлшемді азайту үшін қолданылады [10]. Басқа көп деңгейлі нейрондық желіден айырмашылығы, AE шығыс деңгейінде бірдей кіріс деректерін қайталау мақсатында кіріс деңгейінен керек деректерді шығарады. AE кодтау және декодтау процесін қамтиды, ол желіні кірістің шулы бөлігін елемеуге мәжбүр етеді және оның орнына неғұрлым ақпаратты сегменттерді кодтауғакөрсетуге назар аударады. AE-дегі шығыс қабаты көптеген көп деңгейлі нейрондық желілердегі сияқты X берілген Y-ді болжаудың орнына кіріс деректерін репликациялауға бағытталған кіріс деңгейімен бірдей өлшемге (түйіндер саны) ие (5-суретте көрсетілген). Жасырын деңгей желі кіріс деректерінің бірдей нұсқасын шығарып қана қоймай, кіріс деректерінің мүмкіндіктерін нақты меңгеруін қамтамасыз ету арқылы маңызды рөл атқарады.
Сурет 5. Автокодтауыш архитектурасы
Генеративті нейрондық желілер (GAN)
GAN атауын ең алғаш ұсынған және танымал еткен Гудфеллоу [11]. Желі екі ішкі желіден тұрады: (1) Генеративті желі - әдеттегі көпқабатты перцептрон, оның мақсаты θG параметрлерін пайдалана отырып, кіріс векторын G(X, θG) мүмкіндік кеңістігіне алдын ала білімі бар немесе кіріс векторының деректерің салыстыру болып табылады. (2) Дискриминациялық желі - бастапқы деректер мен генеративті желі арқылы жасалған деректер арасындағы айырмашылықтарды табатын екілік классификатор. GAN негізінен таңбаланбаған деректер жиынынан деректерді таратуды үйрену үшін (яғни, кірісте бірдей деректерді таратуды генерациялау) және кескінді генерациялау үшін қолданылады. GAN архитектурасының үлгісі 6-суретте көрсетілген.
Сурет 6. GAN архитектурасы
R-CNN
R-CNN әдісін ойлап тапқанға дейін CNN 1990 жылдардағы тірек векторлық машиналары көтерілгеннен кейін объектіні анықтау сатысынан түсіп қалды. CNN өзінің танымалдылығын жоғалтуының себебі қызықтыратын объектілердің әртүрлі кеңістіктік орналасуы мен әртүрлі арақатынастары болуы мүмкін, бұл таңдалуды қажет ететін және үлкен есептеу ресурстарын талап ететін аймақтардың көбеюіне әкелді [12]. 2014 жылы Росс Гиршик және оның командасы 2000 аймақтық ұсыныстарды шығару, әр аймақ үшін мүмкіндіктерді есептеу үшін үлкен CNN пайдалану және сызықтық тірек векторлық машиналары (SVMs) арқылы әр аймақты жіктеу арқылы CNN оқшаулау мәселелерін шешті [13].
R-CNN алгоритмінің артықшылығы сол кездегі объектіні анықтаудың ең дәл әдісі болды және ... жалғасы
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ
Қурметбек Бекболат
КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІН ҚОЛДАНА ОТЫРЫП, ӨНДІРІСТІК ОБЪЕКТІЛЕРДІҢ ІШКІ ҚОСЫМШАЛАРЫНДА ТЕХНИКАЛЫҚ ҚАУІПСІЗДІК ТАЛАПТАРЫН БАҒАЛАУ
7M06112 - Жасанды интеллект технологиялары білім беру
бағдарламасы бойынша
магистр дәрежесін алу үшін дайындалған
диссертация
(ғылыми-педагогикалық бағыт)
Нұр-Сұлтан, 2023 ж.
Қазақстан Республикасының Білім және ғылым министрлігі
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ
Қорғауға жіберілді:
Ақпараттық технологиялар
факультетінің деканы
________________ Сеилов Ш.Ж.
____ ___________ 2023 ж.
Магистрлік диссертация
КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІН ҚОЛДАНА ОТЫРЫП, ӨНДІРІСТІК ОБЪЕКТІЛЕРДІҢ ІШКІ ҚОСЫМШАЛАРЫНДА ТЕХНИКАЛЫҚ ҚАУІПСІЗДІК ТАЛАПТАРЫН БАҒАЛАУ
білім беру бағдарламасы: 7M06102 Жасанды интеллект технологиялары
(ғылыми-педагогикалық бағыт)
Магистрант ________________ Қу рметбек Б.
Ғылыми жетекші,
техника ғылымдарының
кандидаты ________________ Разахова Б.Ш.
Кафедра меңгерушісі ________________ Разахова Б.Ш.
Нұр-Сұлтан, 2023
МАЗМҰНЫ
НОРМАТИВТІК СІЛТЕМЕЛЕР 4
АНЫҚТАМАЛАР 5
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР 6
КІРІСПЕ 7
1 КОМПЬЮТЕРЛІК КӨРУ ТЕХНОЛОГИЯСЫНЫҢ ӘДІСТЕРІ 9
1.1 Кескінді тану 9
1.2 Кескінді классификациялау 9
1.3 Объектіні анықтау 9
1.4 Терең оқыту әдісінің архитектуралары 11
1.4 Объектіні анықтау моделін оқыту 18
2 ЖЕКЕ ҚОРҒАНЫС ҚҰРАЛДАРЫН ТАНУДЫҢ ӘДІСНАМАСЫ 19
ҚОРЫТЫНДЫ 22
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 22
НОРМАТИВТІК СІЛТЕМЕЛЕР
Диссертациялық жұмыс келесі нормативтік құжаттардың талаптарын ескере отырып әзірленді:
Бiлiм туpaлы Қазақстан Республикасының 2007 жылғы 27 шілдедегі № 319 Заңы;
Ғылым туралы Қазақстан Республикасының 2011 жылғы 18 ақпандағы № 407-IV Заңы;
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ 2017 жылғы 6 қарашадағы магистрлік диссертацияныжобаны рәсімдеу туралы ережеcі (орысша);
Қазақстан Республикасы Білім және ғылым министрінің 2018 жылғы 31 қазандағы № 604 бұйрығы. Жоғары оқу орнынан кейінгі білім берудің мемлекеттік жалпыға міндетті стандарты;
Л.Н. Гумилев атындағы Еуразия ұлттық университеті КеАҚ 2021 жылғы 29 қарашадағы магистратура туралы ережеcі
АНЫҚТАМАЛАР
Диссертациялық жұмыста төмендегідей анықтамаларға сәйкес терминдер қолданылды:
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР
YOLO - You Only Look Once
ЖҚҚ - жеке қорғаныс құралдары
КІРІСПЕ
Жұмыстың жалпы сипаттамасы. Компьютерлік көру жүйесі - өндірістік процесстерді және сапаны басқарудың тиімді құралы. Бұл жүйе өндірістік операцияларды автоматты түрде бағыттау үшін цифрлық суреттерден алынған ақпаратты қолдануға арналған интеграцияланған компоненттер жиынтығы болып табылады. Ол әр түрлі салаларда кеңінен қолданылады және оны кез келген қарапайым, қайталанатын тапсырмаларды автоматтандыру үшін қолдануға болады. Компьютерлік көру әдістемесінің дамуымен өндірістегі жұмысшылардың қауіпсіздігі мен жұмыс жағдайын талдауды жақсартуға болады. Қауіпсіздік талаптарының сақталуы қауіпсіз өндірістік орта үшін маңызды. Өндірістегі қауіпті жағдайларды қолмен бақылау қиын, сондықтан қауіпсіз ортаны қамтамасыз ету үшін автоматты бақылаудың интеллектуалды құрылымы қажет.
Компьютерлік көруге негізделген жүйесінің артықшылығы - жоғары жұмыс жылдамдығы, тәулік бойы жұмыс істеу мүмкіндігі және өлшеу дәлдігі. Бұл адами факторды толығымен жояды және қателіктер санын азайтады.
Зерттеудің өзектілігі. Өндіріс орындарында қауіпсіздік ережелері сақтала бермейді, бұл апаттардың негізгі себебі болып табылады. Қазақстан Республикасы Стратегиялық жоспарлау және реформалар агенттігінің Ұлттық статистика бюросы мәліметі бойынша 2021 жылдың қорытындысы бойынша өндірістегі жазатайым оқиғалардың салдарынан 2133 жұмысшы зардап шекті. Зардап шеккендердің жалпы санынан жазатайым оқиғалар кезінде 176 адам өлді [1]. Құлаған объектілер мен соқтығысқан жазатайым оқиғалар құрылыс алаңдарында жиі кездесетін апаттардың бірі болып табылады және жазатайым оқиғаларды азайтудың ең маңызды жолы - жеке қорғаныс құралдарын (ЖҚҚ) қолдану.
Зерттеу мақсаты. Жұмыстың мақсаты өндірістің ішкі қосымшаларында жеке қауіпсіздікті арттыру үшін компьютерлік көру технологиясын қолдану арқылы жұмысшылар мен олардың ЖҚҚ анықтау және қауіпсіздік талаптарың сақталуын бағалау мүмкіндіктерін зерттеу болып табылады.
Зерттеу міндеттері. Жұмыста қойылған мақсаттарға жету үшін келесі міндеттер қойылды:
Компьютерлік көру жүйесінің негізін зерттеу;
Өндіріс алаңдарында жұмысшылар мен олардың ЖҚҚ анықтау әдісін зерттеу;
Компьютерлік көру жүйесін қолдану арқылы өндірістік объектілердегі техникалық қауіпсіздік талаптарының сақталуын бағалайтын бағдарлама әзірлеу.
Зерттеудің әдістері. Кескінді тану - 3D модельдеу және объектілерді бақылау сияқты әдістерді қамтитын кең зерттеу саласы болып табылатын компьютерлік көру саласы. Компьютерлік көрудің пайда болу тарихы 70-ші жылдардың басында пайда болды және кескінді өңдеу саласындағы алдыңғы жұмыстардан айырмашылығы, мақсаты кескіндерден әлемнің 3D құрылысын алу арқылы сахнаны толық түсінуге мүмкіндік беру болды [2, б.12]. Бүгінгі күні компьютерлік көру әртүрлі нақты сценарийлерде қолданылады, мысалы, оптикалық таңбаларды тану, бұл кескіндердегі мәтінді ажыратуды және оны мәтіндік файлға түрлендіруді білдіреді. Операция алдындағы және операция ішілік бейнелерді тіркеу үшін медициналық бейнелеуде, аутентификация үшін саусақ ізін тануда да қолданылады [2, б.5]. Кескінді тану кескіндерді түсіндіруге және орындар, адамдар және жануарлар сияқты әртүрлі айнымалыларды анықтауға бағытталған. Бұл жұмыс кескінді классификациялау және нысанды анықтау әдістерін қамтиды.
Зерттеудің практикалық құндылығы.
Зерттеу нәтижелері келесі ғылыми конференцияларда баяндалып талқыланды:
ǴYLYM JÁNE BILIM - 2022 cтуденттер мен жас ғалымдардың XVII Халықаралық ғылыми конференциясы, ӘӨЖ 004. 832.22.
Мақала тақырыбы: Компьютерлік көру негізіндегі технологиялар тенденциялары
Диссертациялық жұмыстың құрылымы және көлемі.
Диссертациялық жұмыс анықтамалардан, белгілеулер мен қысқартулардан, кіріспеден, 3 бөлімнен, қорытындыдан және пайдаланылған әдебиеттер тізімінен, қосымшалардан тұрады. Жұмыстың мазмұны ?? баспа беттен тұрады, оның ішінде ? кесте, ?? сурет және ?? пайдаланылған дереккөз көрсетілген.
Кіріспеде диссертациялық жұмыстың өзектілігі, теориялық және практикалық маңыздылығы, мақсаты, күтілетін нәтижелер және конференцияда баяндалған, жарияланған мақалалар келтірілді.
Бұл құжат компьютерлік көру қолданбаларының ағымдағы жағдайын бағалау, енгізудегі қиындықтар мен болашақ зерттеу мүмкіндіктерін анықтау үшін құрылыстағы компьютерлік көру технологиясына соңғы шолуды ұсынады.
1-ші бөлім. Өндірістік кешендерде денсаулық пен қауіпсіздікті бақылаудың компьютерлік көру әдістері атты бөлімде компьютерлік көру әдістері мен архитектураларына жалпы шолу жүргізілді. Басты назар кескіндігі объектіні тану мен өңдеу әдістеріне аударылды.
2-ші бөлім. Жеке қорғаныс құралдарын танудың әдіснамасы атты бағдарлама құрлымына шолу жүргізілді.
1 КОМПЬЮТЕРЛІК КӨРУ ТЕХНОЛОГИЯСЫНЫҢ ӘДІСТЕРІ
Бұл тарауда теория мен анықтамалық ақпарат осы жұмысқа қатысты тұжырымдамалар үшін берілген.
Кескінді тану
Кескінді тану - 3D модельдеу мен нысанды бақылауды қоса алғанда, кең ауқымды зерттеу бағыттарын қамтитын компьютерлік көру саласы. Компьютерлік көрудің пайда болуын 1970 жылдардың басынан басталды, мұнда фокус кескіндерді өңдеуден әлемнің 3D құрылымын кескіндерден алу арқылы толық көріністі түсінуге қол жеткізуге ауысты [23, 12 б.]. Бүгінгі күні компьютерлік көру әртүрлі практикалық қолданбаларда қолданылады, мысалы, оптикалық таңбаларды тану, ол кескіндер ішіндегі мәтінді тануды және оны мәтіндік файлға түрлендіруді қамтиды. Бұған қоса, ол операцияға дейінгі және операция ішілік кескіндерді тіркеу үшін медициналық бейнелеуде және аутентификация мақсатында саусақ ізін тану үшін қолданылады [23, 5 б.]. Кескінді тану, ең алдымен, кескіндерді түсіндіруге және орындар, адамдар және жануарлар сияқты әртүрлі элементтерді анықтауға бағытталған. Адамдар нысандардың әртүрлі пішіндерде, бұрыштарда және жарықтандыру жағдайында пайда болуы мүмкін екенін мойындай отырып, кескінде көргендерін оңай түсіндіре алатынымен, компьютерлер бірдей тапсырманы орындау үшін арнайы алгоритмдерді қажет етеді. Адамның көзі мысық пен итті еш қиындықсыз ажырата алады және иттердің әртүрлі тұқымдары әлі де иттер екенін мойындайды. Бұл дипломдық жұмыс кескінді танумен байланысты әдістер болып табылатын кескінді классификациялау және объектілерді анықтауға бағытталған және келесі бөлімдерде толығырақ сипатталатын болады.
Кескінді классификациялау
Кескінді классификациялау компьютерлерге кескінді тұтастай түсінуге және оның классын алдын ала белгіленген класстар жиынтығынан анықтауға мүмкіндік беру процесін қамтиды. Әдетте кескіннің классификациясы кескін тек бір нысанды қамтитын кезде пайдаланылады. Мысалы, мысықтың бейнесі мысық ретінде жіктеледі. Терең оқыту алгоритмдері кескін классификациясын тиімдірек етті. Терең оқыту - бұл машиналық оқытудың бір түрі және машиналарға бақыланатын деректерден үйренуге мүмкіндік беретін жасанды интеллект жиынтығы. Нейрондық желілер түйіндердің қабаттарынан тұрады, ал терең нейрондық желілерде бірнеше қабаттар болады. Түйіндердің әрбір қабаты мүмкіндіктер жиынтығы бойынша оқытылады және желіге ілгерілеген сайын түйіндер күрделірек мүмкіндіктерді тануға қабілетті болады.
Конволюционды нейрондық желілер (CNN) кескіндерді талдау үшін жиі пайдаланылады, өйткені олар негізінен кескін кірістерін өңдеуге арналған [30]. Кәдімгі нейрондық желілерден айырмашылығы, CNN үш өлшемде орналасқан түйіндерге ие: биіктік, ені және тереңдігі.
Объектіні анықтау
Объектіні анықтау - кескіндегі белгілі нысандарды анықтау үшін қолданылатын әдіс және ол кескін классификациясымен ұқсас әдістерді қамтиды. Дегенмен, объектіні анықтау тек объектілерді анықтау ғана емес, сонымен қатар оларды локализациялау міндетін де қамтиды. Объектіні анықтау мақсаты суретті сканерлеу және адам, велосипед, үй және ит сияқты қызығушылық санаттарының алдын ала анықталған тізімінен таңдалған кескінде қандай нысандар орын алатынын анықтау болып табылады. Бейнеде нысан болған кезде, нысанның орны мен өлшемдері нысанды мықтап қоршап тұрған шектейтін қораппен (box) қамтамасыз етіледі [24]. Шектеу жолағы нүктемен, енмен және биіктікпен анықталады.
Объектіні анықтау саласында бірқатар зерттеулер жүргізілді. Қаралған жұмыстардың көпшілігі осы зерттеу тақырыбына тікелей қатысты бар және олар өте тығыз байланысты.
Объектіні қадағалау
Объектілерді қадағалау - объектілердің траекториясын сақтай отырып, бейнедегі кадрлар тізбегі бойымен қозғалуын қадағалау үшін қолданылатын әдіс. Мақсатты нысандар көбінесе адамдар болып табылады, бірақ жануарлар, көліктер немесе басқа да қызығушылық тудыратын объектілер болуы мүмкін. Нысандарды бақылау процесі объектілерді анықтаудан басталады және оларға шектейтін ұяшықтарды тағайындайды (яғни, нысанды анықтау). Нысандарды бақылау әдістері кескіндегі әрбір анықталған нысанға идентификаторды тағайындайды және келесі кадрларда осы идентификатор арқылы тасымалдауға және сол нысанның жаңа орнын анықтауға тырысады. Қозғалыстағы объектілерді анықтау және қозғалысқа негізделген бақылау жаяу жүргіншілерді бақылау [25], адам мен компьютердің өзара әрекеттесуі [26], автономды көліктер, робототехника, қозғалысқа негізделген тану, бейне индекстеу, бақылау және қауіпсіздік қоса алғанда, әртүрлі нақты уақытғы қолданбаларының құрамдас бөліктері болып табылады [27].
Диссертациялық жұмыс үшін артқы фонды зерттеу мақсатында әртүрлі жұмыстар қарастырылды. Бұл жұмыстардың ішінде объектіні тану, сәйкестендіру, кескінді қысу алгоритмдердің әртүрлі түрлері, сондай-ақ нақты уақыттағы ескерту тәсілдерінің түрлері мұқият зерттелді. Бұл зерттеудің негізі ретінде өндіріс орындарының қауіпсіздігін визуализациялау саласындағы тиісті зерттеу жұмыстары қарастырылды.
Объектіні анықтауда сенсорға негізделген әдістер қолданылады. Сенсорға негізделген әдістер әдетте қауіпсіздік дулығасы мен жұмысшыны қадағалауға тырысады. ЖҚҚ анықтау үшін Zigbee және Радиожиіліктік сәйкестендіру (RFID) технологияларын біріктірді [3]. Жұмысшылар ЖҚҚ анықтау үшін микроконтроллер негізіндегі құрылғыны киеді және жұмысшы ЖҚҚ дұрыс кимеген жағдайда ескерту жасайтын орталық блокқа ақпаратты жібереді. Дегенмен, RFID негізіндегі технология жұмысшының ЖҚҚ немесе қауіпсіздік дулығасын дұрыс кигенін растай алмайды. Сонымен қатар, сенсорға негізделген технология жақсы сенімді шешім бола алатынымен, бұл әдістер әрқашан сыртқы жабдыққа сүйенеді. Сондықтан бұл технологияны өте үлкен өндіріс алаңдарында жүзеге асыруды қиындатады. Оның үстіне сенсорға негізделген әдістер қымбат болып табылады [4].
Құрылғыға тәуелділік мәселесін жеңу үшін машиналық оқытуға негізделген объектілерді анықтау әдістері кеңінен қолданылды. Машиналық оқытуға негізделген әдістер көп мүмкіндікті және жоғары анықтау дәлдігін ұсынады. Объектілерді анықтауда кейде әдістердің комбинациясын қолданады. Варанусаст бас сегментациясы үшін тік және көлденең проекция әдістерін, ал дулығаны анықтау үшін оларды K Nearest Neighbor (KNN) әдісімен біріктірді [5]. Дунгмалада өз зерттеулерінде дулығаны анықтаудың екі әдісін біріктіреді [6]. Алдымен дулыға аймағын анықтау үшін Хаар ұқсас мүмкіндіктер әдісін пайдаланылды, содан кейін жартылай және толық дулығаларды анықтау үшін Circle Hough Transform (CHT) қолданылды.
Машиналық оқытуға негізделген технологиялар қауіпсіздік дулығасын анықтау үшін қолмен жасалған мүмкіндіктерді пайдаланады, бұл қолайсыз ауа-райы немесе үлкен құрылыс алаңдары сияқты күрделі орталарда нашар өндеуге әкелуі мүмкін. Терең оқытуға негізделген нысанды анықтау саласындағы соңғы жетістіктермен көптеген зерттеушілер қауіпсіздік дулығасын анықтау үшін терең оқыту стратегияларын қолданды. Ван төрт түрлі түсті қауіпсіздік дулығаларын, адамдарды және кеудешелерді анықтау үшін әртүрлі YOLO архитектурасын пайдаланды [7]. Барлық архитектуралардың ішінде YOLOv5x ең жақсы дәлдікті береді және YOLOv5s ең жылдам жылдамдыққа ие. Бірақ бұл жұмыстағы негізгі шектеулердің бірі тұлғаны анықтауға негізделген тәсілді пайдалану болып табылады. Соның әсерінен модель құрылыс алаңдарында жиі кездесетін жұмысшы камераға қарамаған кезде сәтсіздікке ұшырайды.
Сенсор, машиналық оқыту және терең оқыту әдістеріне негізделген құрылыс алаңдарында қауіпсіздік дулығасын анықтау бойынша көптеген зерттеулер жүргізілгенін көре аламыз. Олардың көпшілігі күрделі сценарийлерде, мысалы, бірнеше жұмысшылары бар сайттарда қауіпсіздік дулығасын анықтай алмайды. Сонымен қатар, аз жарық жағдайында және шағын нысан өлшемдері бар дулығаны анықтау нақты уақыттағы жүйелерді орналастыру үшін айтарлықтай жақсартуларды қажет етеді. Сондықтан, бұл зерттеу екі сценарийді де қарастырады және құрылыс жұмысшыларының қауіпсіздігін қамтамасыз ету үшін терең оқытуға (YOLO алгоритміне) негізделген автоматтандырылған дулығаны анықтау жүйесін ұсынады. Бұдан басқа, ұсынылған әдістің өнімділігі басқа YOLO нұсқаларын (YOLOv3, YOLOv4, YOLOv5, YOLOv8) қолданатын қолданыстағы дулығаны анықтау әдістерімен салыстырылды.
Сурет 1. Машиналық оқыту көмегімен жұмысшылардың қауіпсіздік
құралдарын анықтаудың жалпы архитектурасы
1.4 Терең оқыту әдісінің архитектуралары
Көптеген нейрондық желі архитектуралары сияқты, терең оқыту архитектуралары қабаттардан (енгізу, жасырын және шығыс), нейрондардан, активтендіру функцияларынан a және {W, b} салмақтарынан тұрады. Нейрондар функция детектор ретінде әрекет етеді және төменгі, жоғары қабаттарда ұйымдастырылған. Төменгі қабаттар негізгі белгілерді анықтайды және оларды неғұрлым күрделі белгілерді анықтайтын жоғары қабаттарға береді. Терең оқыту архитектураларының көпшілігі болжау немесе классификациялау тапсырмаларының ауқымына қолданылатын болса да, олар кейде жақсырақ жұмыс істеу үшін ансамбльдік модельдеу арқылы біріктіріледі. Бұл бөлімде кейбір дәстүрлі терең оқыту архитектуралары сипатталады, сонымен бірге олардың оқу моделі мен жалпы қолдану аймақтарына тоқталамыз. 1-кесте талқыланатын терең оқыту архитектураларының маңызды функцияларын, құрылымын және жалпы қолдану салаларын көруге болады.
Терең оқыту архитектурасы
Негізі функция
Жалпы қолдану аймақтары
Кескінді классифика-циялау
Кескін-ге жазу
Объек-тіні анықтау
Объек-тіні қадаға-лау
Семантика-лық талдак
Терең нейрондық желі
Бейнелерді оқыту
-
+
+
+
+
Конволюционды нейрондық желі
Кескінді модельдеу
+
+
+
+
+
Рекурентті нейрондық желі
Тізбекті модельдеу
-
+
+
+
+
Автокодерлер
Өлшемді кішірейту
-
+
+
+
+
Генеративті нейрендық желілер
Генеративті модельдеу
+
+
+
+
+
Кесте 1. Терең оқыту архитектуралары және олардың маңызды функциялары
Терең нейрондық желі (DNN)
Терең нейрондық желі әдетте тереңдігі бар стандартты нейрондық желі болып табылады. Нейрондық желінің тереңдігі кіріс және шығыс қабаттар арасындағы жасырын қабаттардың санымен анықталады.
Сурет 2. Терең нейрондық желі архитектурасы
Нейрондық желіні қашан терең деп анықтауға болатынын ешбір шек анықталмаса да, зерттеушілердің көпшілігі тереңдігі 2-ден үлкен болса, терең деп санауға болады деп келіскен [8].
Конволюционды нейрондық желі (CNN)
CNN кескіндерді өңдеу қолданбалары үшін кеңінен қолданылады [9]. Архитектура ImageNet байқауында AlexNet (суретті жіктеу үшін пайдаланылатын терең оқыту желісі) нәтижелерінен кейін танымал болды. Кәдімгі көп деңгейлі нейрондық желіден айырмашылығы, CNN нейрондары кескіндердің еніне, биіктігіне және тереңдігіне сәйкес келетін етіп орналастырылған. Кіріс қабаттарынан, шығыс қабаттарынан және белсендіру функцияларынан басқа, CNN-де екі қосымша қабат бар, конвульсия және біріктіру қабаттары (3-суретте екіншіден жетінші қабаттар ретінде бейнеленген). Конволюция қабаты әртүрлі конволюциялық сүзгілерді пайдалану және қабылдау өрістерін біртіндеп ауыстыру арқылы кескінді айналдырады. Кезекті конволюционды қабаттар арасында біріктіру қабатын кірістіру әдеттегі тәжірибе. Біріктіру қабаты, керісінше, әртүрлі пикселдердегі кескіннің орташа, максимум, медиана немесе басқа статистикалық ерекшеліктерін есептеу арқылы конволюция қабатынан шығатын өнімнің өлшемін азайтады.
Сурет 3. Конволюционды нейрондық желі архитектурасы
Рекурентті нейрондық желі (RNN)
RNN тізбекті деректерді өңдеу үшін ең қолайлы. Олар уақытқа тәуелді ақпаратты өңдеу кезінде терең оқытудың басқа формаларын басып озады. Әртүрлі уақыт қадамдары бойынша параметрлер дәйекті деректер сипаттары негізінде ортақ пайдаланылады. RNN негізінен бейне және сөйлеуді өңдеуде қолданылады, өйткені олар кезекті деректерге болжам жасау үшін бұрын өңделген аудио бөлігінде немесе бейне кадрында ақпаратты сақтай алады. Кез келген t уақытындағы RNN шығысы yt тек xt кірісіне ғана емес, сонымен қатар t-1 уақыттағы xt−1-ге де тәуелді. Басқа терең оқыту архитектуралары сияқты, RNN-ді кері таралу алгоритмі арқылы оқытуға болады. Нақтырақ айтқанда, кері таралу нұсқасы - Уақыт бойынша кері таралу (BPTT) RNN үшін стандартты оқыту алгоритмі болып табылады [8]. RNN архитектурасының үлгісі 4-суретте көрсетілген.
Сурет 4. Рекурентті нейрондық желі архитектурасы
Автокодтауыш
Автокодтауыштар (AEs) негізінен деректерді жою және өлшемді азайту үшін қолданылады [10]. Басқа көп деңгейлі нейрондық желіден айырмашылығы, AE шығыс деңгейінде бірдей кіріс деректерін қайталау мақсатында кіріс деңгейінен керек деректерді шығарады. AE кодтау және декодтау процесін қамтиды, ол желіні кірістің шулы бөлігін елемеуге мәжбүр етеді және оның орнына неғұрлым ақпаратты сегменттерді кодтауғакөрсетуге назар аударады. AE-дегі шығыс қабаты көптеген көп деңгейлі нейрондық желілердегі сияқты X берілген Y-ді болжаудың орнына кіріс деректерін репликациялауға бағытталған кіріс деңгейімен бірдей өлшемге (түйіндер саны) ие (5-суретте көрсетілген). Жасырын деңгей желі кіріс деректерінің бірдей нұсқасын шығарып қана қоймай, кіріс деректерінің мүмкіндіктерін нақты меңгеруін қамтамасыз ету арқылы маңызды рөл атқарады.
Сурет 5. Автокодтауыш архитектурасы
Генеративті нейрондық желілер (GAN)
GAN атауын ең алғаш ұсынған және танымал еткен Гудфеллоу [11]. Желі екі ішкі желіден тұрады: (1) Генеративті желі - әдеттегі көпқабатты перцептрон, оның мақсаты θG параметрлерін пайдалана отырып, кіріс векторын G(X, θG) мүмкіндік кеңістігіне алдын ала білімі бар немесе кіріс векторының деректерің салыстыру болып табылады. (2) Дискриминациялық желі - бастапқы деректер мен генеративті желі арқылы жасалған деректер арасындағы айырмашылықтарды табатын екілік классификатор. GAN негізінен таңбаланбаған деректер жиынынан деректерді таратуды үйрену үшін (яғни, кірісте бірдей деректерді таратуды генерациялау) және кескінді генерациялау үшін қолданылады. GAN архитектурасының үлгісі 6-суретте көрсетілген.
Сурет 6. GAN архитектурасы
R-CNN
R-CNN әдісін ойлап тапқанға дейін CNN 1990 жылдардағы тірек векторлық машиналары көтерілгеннен кейін объектіні анықтау сатысынан түсіп қалды. CNN өзінің танымалдылығын жоғалтуының себебі қызықтыратын объектілердің әртүрлі кеңістіктік орналасуы мен әртүрлі арақатынастары болуы мүмкін, бұл таңдалуды қажет ететін және үлкен есептеу ресурстарын талап ететін аймақтардың көбеюіне әкелді [12]. 2014 жылы Росс Гиршик және оның командасы 2000 аймақтық ұсыныстарды шығару, әр аймақ үшін мүмкіндіктерді есептеу үшін үлкен CNN пайдалану және сызықтық тірек векторлық машиналары (SVMs) арқылы әр аймақты жіктеу арқылы CNN оқшаулау мәселелерін шешті [13].
R-CNN алгоритмінің артықшылығы сол кездегі объектіні анықтаудың ең дәл әдісі болды және ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz