Графиканы танудың кейбір әдістері
Қазақстан Республикасының Білім және ғылым минстрлігі
Әл-Фараби атындағы Қазақ ұлттық университеті
Сабит М. Е.
БЕЙНЕЛЕРДЕГІ СӘЙКЕСТІКТЕРДІ БАҒЫТТАЛҒАН ІЗДЕУ АЛГОРИТМДЕРДІҢ НЕГІЗІНДЕ САЛЫСТЫРМАЛЫ ТАЛДАУ ЖӘНЕ ҚҰРУ
ДИПЛОМДЫҚ ЖҰМЫС
5B070300 - Ақпараттық жүйелер мамандығы
Алматы - 2022
Қазақстан Республикасының Білім және ғылым министрлігі
әл-Фараби атындағы Қазақ ұлттық университеті
Қоpғaуғa жібеpілген
Ақпараттық жүйелер
кафедрасының меңгерушісі, х.ғ.к.,
аға оқытушы _____________ Айдаров К. А.
__ __________ 2022 ж.
5B070300 - Ақпараттық жүйелер мамандығы бойынша
БЕЙНЕЛЕРДЕГІ СӘЙКЕСТІКТЕРДІ БАҒЫТТАЛҒАН ІЗДЕУ АЛГОРИТМДЕРДІҢ НЕГІЗІНДЕ САЛЫСТЫРМАЛЫ ТАЛДАУ ЖӘНЕ ҚҰРУ
тақырыбында жазылған
ДИПЛОМДЫҚ ЖҰМЫС
Орындаған: _______________________ Сабит М. Е.
4 курс студенті
Ғылыми жетекші: _______________________
аға оқытушы
Норма бақылаушы: _______________________
Алматы - 2022
РЕФЕРАТ
Дипломдық жұмыс Х беттен, Х бөлімнен тұрады. Зерттеу жұмысында Х сурет, Х кесте, Х сызба бар. Программа Python бағдарламалау және сұраныстар тілдерінде жүзеге асырылды.
Дипломдық жұмыстың мақсаты: Бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру. Оптикалық кескінді модельдеу, жазу және цифрлық өңдеу негіздерін зерттеу және осының негізінде нақты уақыттағы кескінді өңдеу алгоритмін құру. Үш өлшемді нысандардың суреттерін еркін көру бұрыштарында тану жүйесін дамыту.
Осы мақсатқа жету үшін жұмыста келесі міндеттер қойылды және шешілді:
Екі өлшемді және төрт өлшемді векторлардан тұратын нормаланған деректер үлгілерін жинау және енгізу;
Тану объектілерінің кеңістіктік түрлендірулерін ескере отырып, оларға тән белгілерді тұжырымдау.
ANN-де қолданылатын математикалық заңдылықтар мен қасиеттерді анықтау үшін оқыту әдістерін зерттеу және талдау;
Ұсынылған нысанды ұсыну моделін қолдана отырып, тану жүйесін оқыту әдісін жасау.
Әртүрлі объектілер арасындағы салыстырмалы қашықтық дәрежесін анықтайтын графиктер мен диаграммаларды құру;
АПН-ның қадамдық алгоритмін және графикалық блок-схемасын құру;
Әрбір партиядан үлгілердің ең аз санымен жоғары классификациялық баллға қол жеткізу;
Ұялы автомат арқылы АНН күрделі құрылымдық моделін бағдарламалық қамтамасыз етуді модельдеу, тестілеу және жөндеу;
Оқыту параметрлерін бұрыннан бар аналогтармен салыстыру.
Белгілі жүйелермен салыстырғанда оқытудың тиімділігі мен дамыған жүйенің танылуын бағалаңыз.
Жұмыстың өзектілігі. XXI ғасыр ақпаратты технологиялар заманы екені белгілі. Суретті тану, ақпаратты басқару және өңдеу жүйелерінің, автоматтандырылған жүйелер мен шешім қабылдау жүйелерінің маңызды компоненттерінің бірі. Жіктеуге байланысты белгілі бір қасиеттер мен сипаттамалардың түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстар мен сигналдарды сәйкестендіру робототехника, ақпаратты іздеу, визуалды деректерді бақылау және талдау және жасанды интеллект саласындағы зерттеулер сияқты салаларда пайда болады. Суреттерді алгоритмді өңдеу және жіктеу қауіпсіздігі, кіруді бақылау және басқару жүйелерінде, бейнебақылау жүйелерінде, виртуалды шындық жүйелерінде және ақпарат жинау жүйелерінде қолданылады. Қазіргі уақытта өндірісте бағдарламалық жасақтама интерфейстерінде, қауіпсіздік жүйелерінде және адамдарды сәйкестендіру жүйелерінде, сондай-ақ басқа да қолданбалы мақсаттарда қолданылатын қолжазбаны, нөмірді, саусақ ізін немесе адамның бет-әлпетін тану жүйелері кеңінен қолданылады. Сондықтан бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру кең танымал десем қате тұжырымдама емес. Осылайша, жұмысты OpenCV және imutils ашық кітапханасының көмегімен нақты уақыттағы объектіні тану алгоритмін жасауда болып табылады.
Зерттеу объектісі - үш өлшемді объектілердің сұлбасын кез келген көру бұрыштарында анықтап , тану жүйесі.
Зерттеу пәні -үш өлшемді объектілерді суреттерден тану жүйесінің математикалық әдістері, модельдері және алгоритмдері.
Жұмыстың құрылымы. Диплoмдық жұмысты oрындау кезіндегі белгіленген мақсаттар мен міндеттерге сәйкес келеді. Oл жoба мазмұнымен анықталады және кіріспеден, үш бөлімнен, қoрытындыдан, пайдаланылған әдебиеттер мен қoсымшалар тізімінен тұрады.
Диссертациялық жұмыстың ғылыми жаңалығы келесідей:
Кездейсоқ көру бұрыштарында бейнеленген объектілерді жергілікті эквивариантты бейнелеудің иерархиялық моделін қолдана отырып, кескіндерді танудың нейрондық желілік жүйесінің теориялық ережелері жасалды.
Көрнекілік пен оптикалық трекинг салаларын бағалау арқылы объектінің жергілікті белгілерінің иерархиясын қалыптастыратын мұғалімсіз визуалды деректер ағынында кескінді тану жүйесін оқыту әдісі жасалды.
Нысандарды бейнелеудің иерархиялық моделі негізінде кездейсоқ көру бұрыштарында объектілердің суреттерін тану алгоритмі жасалды.
РЕФЕРАТ
Дипломная работа состоит из х страниц, х разделов. Исследовательская работа содержит рисунок Х, таблицу Х, схему Х. Программа реализована на языках программирования и запросов Python.
Цель дипломной работы: сравнительный анализ и построение на основе алгоритмов направленного поиска совпадений в образах. Изучение основ оптического моделирования изображения, записи и цифровой обработки и создание на основе этого алгоритма обработки изображения в реальном времени. Развитие системы распознавания изображений трехмерных объектов под свободными углами зрения.
В работе поставлены и решены следующие задачи для достижения этой цели:
Сбор и ввод нормированных образцов данных, состоящих из двумерных и четырехмерных векторов;
Формулировать характерные для них признаки с учетом пространственных преобразований объектов познания.
Изучение и анализ методов обучения для выявления математических закономерностей и свойств, используемых в ANN;
Разработать метод обучения системы распознавания с использованием предложенной модели представления объекта.
Построение графиков и диаграмм, определяющих степень относительного расстояния между различными объектами;
Построение пошагового алгоритма и графической блок-схемы АПН;
Достижение высокого классификационного балла с минимальным количеством образцов от каждой партии;
Моделирование, тестирование и отладка программного обеспечения сложной структурной модели Энн с помощью мобильного автомата;
Сравнение параметров обучения с уже существующими аналогами.
Оцените эффективность обучения и узнаваемость разработанной системы по сравнению с известными системами.
Актуальность работы. Известно, что XXI век-это время информационных технологий. Один из важнейших компонентов систем распознавания изображений, управления и обработки информации, автоматизированных систем и систем принятия решений. Идентификация объектов, явлений и сигналов, характеризующихся конечным набором определенных свойств и характеристик, связанных с классификацией, происходит в таких областях, как робототехника, поиск информации, контроль и анализ визуальных данных и исследования в области искусственного интеллекта. Используется в системах алгоритмической обработки и классификации изображений, контроля и управления доступом, системах видеонаблюдения, системах виртуальной реальности и системах сбора информации. В настоящее время в производстве широко используются системы распознавания почерка, номера, отпечатка пальца или лица человека, используемые в интерфейсах программного обеспечения, системах безопасности и системах идентификации людей, а также в других прикладных целях. Поэтому не будет ошибкой сказать, что сравнительный анализ и создание совпадающих изображений на основе поисковых алгоритмов широко известны. Таким образом, работа заключается в разработке алгоритма распознавания объекта в реальном времени с помощью OpenCV и открытой библиотеки imutils.
Объект исследования-система обнаружения и распознавания контуров трехмерных объектов под любыми углами зрения.
Предмет исследования-математические методы, модели и алгоритмы системы распознавания трехмерных объектов по изображениям.
Структура работы. Соответствует установленным целям и задачам при выполнении дипломной работы. Она определяется содержанием проекта и состоит из введения, трех глав, заключения, списка использованной литературы и приложений.
Научная новизна диссертационной работы следующие:
Разработаны теоретические положения нейросетевой системы распознавания образов с использованием иерархической модели локального эквивариантного изображения объектов, изображенных в случайных углах обзора.
Разработан метод обучения системы распознавания изображений в потоке визуальных данных без учителя, который формирует иерархию локальных признаков объекта путем оценки областей визуализации и оптического трекинга.
Разработан алгоритм распознавания изображений объектов в случайных углах обзора на основе иерархической модели изображения объектов.
Abstract
The thesis consists of x pages, x sections. The research paper contains Figure X, table X, diagram X. The program is implemented in Python programming and query languages.
The purpose of the thesis: comparative analysis and construction based on algorithms of directed search for matches in images. Studying the basics of optical image modeling, recording and digital processing and creating a real-time image processing algorithm based on this. Development of an image recognition system for three-dimensional objects at free angles of view.
To achieve this goal, the following tasks were set and solved in the work:
Collection and input of normalized data samples consisting of two-dimensional and four-dimensional vectors;
Formulate their characteristic features taking into account the spatial transformations of objects of cognition.
Study and analysis of teaching methods to identify mathematical patterns and properties used in ANN;
Develop a method for training the recognition system using the proposed object representation model.
Construction of graphs and diagrams that determine the degree of relative distance between different objects;
Construction of a step-by-step algorithm and a graphical flowchart of the APN;
Achieving a high classification score with a minimum number of samples from each batch;
Modeling, testing and debugging of the software of a complex structural model of Ann using a mobile vending machine;
Comparison of training parameters with existing analogues.
Evaluate the effectiveness of training and recognition of the developed system in comparison with known systems.
The relevance of the work: It is known that the XXI century is the time of information technology. One of the most important components of image recognition systems, information management and processing, automated systems and decision-making systems. Identification of objects, phenomena and signals characterized by a finite set of certain properties and characteristics associated with classification occurs in such areas as robotics, information retrieval, control and analysis of visual data and research in the field of artificial intelligence. It is used in algorithmic image processing and classification systems, access control and management, video surveillance systems, virtual reality systems and information collection systems. Currently, handwriting, number, fingerprint or human face recognition systems are widely used in production, used in software interfaces, security systems and human identification systems, as well as for other applied purposes. Therefore, it is not a mistake to say that comparative analysis and creation of matching images based on search algorithms is widely known. Thus, the work consists in developing an algorithm for recognizing an object in real time using OpenCV and the open library imutils.
Object of research: a system for detecting and recognizing contours of three-dimensional objects from any angle of view.
Subject of research: mathematical methods, models and algorithms of the three-dimensional object recognition system based on images.
The structure of the work : Corresponds to the established goals and objectives when performing the thesis. It is determined by the content of the project and consists of an introduction, three chapters, a conclusion, a list of references and appendices.
The scientific novelty of the dissertation work is as follows:
Theoretical provisions of a neural network pattern recognition system have been developed using a hierarchical model of a local equivariant image of objects depicted in random viewing angles.
A method has been developed for training an image recognition system in a visual data stream without a teacher, which forms a hierarchy of local features of an object by evaluating visualization areas and optical tracking.
An algorithm for recognizing images of objects in random viewing angles based on a hierarchical model of object images has been developed.
Мазмұны
1. КІРІСПЕ 10
1.1 АДАМ ЖӘНЕ КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІ АРҚЫЛЫ ВИЗУАЛДЫ АҚПАРАТТЫ АЛУ ПРОЦЕСІ 12
1.2 КЕСКІНДІ ТАНУДЫҢ ЗАМАНАУИ ӘДІСТЕРІНЕ АНАЛИТИКАЛЫҚ ШОЛУ 13
1.3 МҰҒАЛІММЕН ЖАТТЫҒУ. ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР. ВЕКТОРЛЫҚ МАШИНАНЫ ҚОЛДАНУ 15
1.4 ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР 17
2. НЫСАН КЕСКІНІН КӨРСЕТУ МОДЕЛІ 19
2.1 МОДЕЛЬДІҢ ЭЛЕМЕНТАР БІРЛІГІ РЕТІНДЕ ЭКВИВАЛЕНТТІ ДЕТЕКТОР ҰҒЫМЫ 19
3. НӘТИЖЕЛЕРІ ЭКСПЕРИМЕНТТІК ДЕРЕКТЕР 30
4. ҚОРЫТЫНДЫ 32
5. ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 34
КІРІСПЕ
Қазіргі уақытта сандық өңдеу және кейіннен кескінді тану ғылыми зерттеулердің қарқынды дамып келе жатқан салаларының бірі болып табылады. Ақпаратты алуға, өңдеуге, сақтауға және беруге байланысты көптеген технологиялық салалар қазіргі уақытта ақпараттың кескін сипаты бар жүйелерді дамытуға бағытталған.
Анықтау мүмкіндігі бір типтегі объектілердің ұқсастығына негізделген. Барлық нысандар мен жағдайлар тар мағынада ерекше болғанымен, сіз әрқашан олардың кейбіреулерінің ұқсастығын таба аласыз. Осыдан жіктеу тұжырымдамасы пайда болады - объектілердің бүкіл жиынтығын бөлінбейтін ішкі жиындарға бөлу-элементтері оларды басқа сыныптардың элементтерінен ерекшелейтін кейбір ұқсас қасиеттері бар сыныптар. Осылайша, тану міндеті-қарастырылатын нысандарды немесе құбылыстарды олардың сипаттамасына сәйкес қажетті сыныптармен салыстыру. Сол. егер сенсорлық ғана емес, сонымен қатар басқа ақпарат ағынындағы заттарды табу туралы айтатын болсақ, тану ұғымын кеңейтуге болады. Мысалы, ауруды науқаста оның белгілері бойынша тану немесе статистикалық ақпарат арқылы әлеуметтік құбылыстарды анықтау туралы айтуға болады.
XIX ғасырдың соңында машиналарға олар өңдейтін ақпаратты тануға мүмкіндік беретін технологиялар қажет болды. Машиналарды тану әдістерін жасау Компьютерлік тапсырмалардың ауқымын кеңейтуге және ақпаратты машиналық өңдеуді неғұрлым ақылды етуге мүмкіндік береді. Тану Қосымшаларының мысалдары-мәтінді тану жүйелері, машиналық көру, сөйлеуді тану, саусақ ізін тану және т.б. Бұл міндеттердің кейбірін адам бейсаналық деңгейде жоғары жылдамдықпен шешсе де, оларды кеңінен шешетін компьютерлік бағдарламалар әлі құрылған жоқ. Қолданыстағы жүйелер қатаң шектеулі көлемде ерекше жағдайларда ғана жұмыс істеуге арналған.
Дипломдық жұмыстың мақсаты: Бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру. Оптикалық кескінді модельдеу, жазу және цифрлық өңдеу негіздерін зерттеу және осының негізінде нақты уақыттағы кескінді өңдеу алгоритмін құру. Үш өлшемді нысандардың суреттерін еркін көру бұрыштарында тану жүйесін дамыту.
Жұмыстың өзектілігі. XXI ғасыр ақпаратты технологиялар заманы екені белгілі. Суретті тану, ақпаратты басқару және өңдеу жүйелерінің, автоматтандырылған жүйелер мен шешім қабылдау жүйелерінің маңызды компоненттерінің бірі. Жіктеуге байланысты белгілі бір қасиеттер мен сипаттамалардың түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстар мен сигналдарды сәйкестендіру робототехника, ақпаратты іздеу, визуалды деректерді бақылау және талдау және жасанды интеллект саласындағы зерттеулер сияқты салаларда пайда болады. Суреттерді алгоритмді өңдеу және жіктеу қауіпсіздігі, кіруді бақылау және басқару жүйелерінде, бейнебақылау жүйелерінде, виртуалды шындық жүйелерінде және ақпарат жинау жүйелерінде қолданылады. Қазіргі уақытта өндірісте бағдарламалық жасақтама интерфейстерінде, қауіпсіздік жүйелерінде және адамдарды сәйкестендіру жүйелерінде, сондай-ақ басқа да қолданбалы мақсаттарда қолданылатын қолжазбаны, нөмірді, саусақ ізін немесе адамның бет-әлпетін тану жүйелері кеңінен қолданылады.
Жұмыстың құрылымы. Диплoмдық жұмысты oрындау кезіндегі белгіленген мақсаттар мен міндеттерге сәйкес келеді. Oл жoба мазмұнымен анықталады және кіріспеден, үш бөлімнен, қoрытындыдан, пайдаланылған әдебиеттер мен қoсымшалар тізімінен тұрады.
АДАМ ЖӘНЕ КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІ АРҚЫЛЫ ВИЗУАЛДЫ АҚПАРАТТЫ АЛУ ПРОЦЕСІ
Адамның көзі-бұл көзге түсетін барлық Жарық ақпаратын алатын және өңдейтін нәзік құрылғы. Адамдарда кескіннің қалыптасуы торда жүреді, содан кейін өңдеу және мидағы жадқа жазу.
Жарық толқын ұзындығы 400-700 нм болатын электромагниттік энергияның спектрлік таралуынан тұрады. Осы диапазоннан тыс толқындар ультракүлгін (ультракүлгін) және инфрақызыл (IR) деп аталады. Адамның графикалық, бейне және аудио ақпараттарды өңдеуі қабылдаудан басталады. Түс көру теориясына сәйкес, түс әртүрлі толқын ұзындығының жарығын қабылдай алатын таяқшалар мен конустар арқылы рецепторлар, фотосезімтал сетчатка арқылы қабылданады. Компьютерлік көру жүйелері көбінесе адамның визуалды ақпаратын өңдеу кезеңдеріне ұқсайды, бірақ жүйенің мақсаты мен қолдану саласына байланысты олардың айтарлықтай айырмашылықтары мен ерекшеліктері бар.
1.2 КЕСКІНДІ ТАНУДЫҢ ЗАМАНАУИ ӘДІСТЕРІНЕ АНАЛИТИКАЛЫҚ ШОЛУ
Үлгіні тану теориясы-белгілі бір қасиеттер мен қасиеттердің түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстарды, процестерді, сигналдарды, жағдайларды және т.б. зерттеу. Компьютерлік ғылымдар және сабақтас пәндер кафедрасы, жіктеу және сәйкестендіру негіздері мен әдістерін әзірлейді. Мұндай тапсырмалар көбінесе шешіледі, мысалы, бағдаршамнан өту немесе өту кезінде. Жанып жатқан бағдаршамның түсін біліп, жол ережелерін біле отырып, сіз жолдан өте аласыз ба, жоқ па, дұрыс шешім қабылдай аласыз. Мұндай анықтаудың қажеттілігі әскери жүйелер мен қауіпсіздік жүйелерінен бастап аналогтық сигналдарды цифрландыруға дейін әртүрлі салаларда туындайды. Үлгіні тану мәселесі, әсіресе, ақпараттық жүктеме жағдайында, адам алынған хабарламаларды сызықтық және дәйекті түсінумен күреспеген кезде, оның миы осындай танумен сипатталатын бір мезгілде қабылдау мен ойлау режиміне өткен кезде өзекті болды. Сондықтан кескінді тану мәселесі пәнаралық зерттеулер саласында, соның ішінде жасанды интеллект құру, кескінді танудың техникалық жүйелерін дамытуда көбірек назар аударатыны кездейсоқ емес.
Үлгіні танудағы бағыттар.
Айналаны зерттеу қабілетін зерттеу, түсіндіру және модельдеу;
Жеке қолданбалы есептерді шешуге арналған құрылғыларды құру теориясы мен әдістерін әзірлеу.Мәселенің ресми тұжырымы .
Үлгіні тану деректердің жалпы массасынан осы деректерді сипаттайтын маңызды сипаттамаларды бөліп, бастапқы деректерді белгілі бір класқа сәйкес келеді. Жасанды нейрондық желілер теориясынан айырмашылығы, танымдық есептерді шешуде олар эксперименттік нәтижелердің негізін құрайтын математикалық тілді қолдануға тырысады және экспериментті логикалық ойлау мен математикалық ойлаумен алмастырады. Оларды жіктеу керек. Жиын сыныптар деп аталатын ішкі жиындармен ұсынылған. Берілген: сыныптар туралы ақпарат, бүкіл жиынтықтың сипаттамасы және белгілі бір сыныпқа жататын объект туралы ақпараттың сипаттамасы белгісіз. Бұл нысан сыныптар мен объектілерді сипаттау үшін қол жетімді ақпаратты қолдана отырып, қай сыныпқа жататынын анықтау үшін қажет.Көбінесе үлгіні тану тапсырмалары монохромды кескіндерді өңдейді, осылайша сіз кескінді ұшақтың функциясы ретінде көре аласыз. Егер біз t жазықтығындағы көптеген нүктелерді қарастыратын болсақ, онда кескіннің әр нүктесіндегі f (x, y) функциясы өзінің қасиеттерін - жарықтығын, мөлдірлігін, оптикалық тығыздығын білдіреді, мұндай функция кескіннің ресми жазбасы болып табылады. F (x, y) - барлық функциялардың жиынтығы, t деңгейінде барлық x кескіндерінің жиынтығы бар, мұндай нәтиженің нақты сипаты белгілі бір тәсілге сәйкес келетін танудың кейінгі кезеңдеріне байланысты.
Графиканы танудың кейбір әдістері.
Оптикалық кескіндерді тану үшін Сіз әдісті, әртүрлі бұрыштардағы нысан түрін, масштабты, жылжуды және т.б. қолдана аласыз. өту. Әріптер үшін қаріп, қаріп қасиеттері және т. б. арқылы өту керек.
Екінші тәсіл-объектінің құрылымын табу және оның қасиеттерін зерттеу (байланыс, бұрыштардың болуы және т.б.).
Тағы бір тәсіл-жасанды нейрондық желілерді пайдалану. Бұл әдіс анықтау тапсырмасының көптеген мысалдарын (дұрыс жауаптармен) немесе осы тапсырманың ерекшеліктерін ескеретін нейрондық желінің арнайы құрылымын қажет етеді.
Үлгіні тану әдісі ретінде қабылдау.
Құрылымы мен функционалдық сипаттамалары белгілі физикалық жүйеде психологиялық құбылыстардың қалай пайда болатынын көрсететін ми моделінің тұжырымдамасын ұсынған Фрэнк Розенблатт дискриминацияның қарапайым тәжірибелерін сипаттады. Бұл тәжірибелер үлгіні тану әдістеріне толығымен қатысты, бірақ шешім алгоритмі детерминистік емес екендігімен ерекшеленеді.Белгілі бір жүйе туралы психологиялық тұрғыдан маңызды ақпарат алуға болатын қарапайым эксперимент модельдер екі түрлі ынталандыруды ұсынады және оларға әр түрлі жауап беруі керек. Мұндай эксперименттің мақсаты экспериментатордың араласуынсыз сіздің стихиялық дискриминацияңыздың мүмкіндігін зерттеу немесе, керісінше, эксперимент жүргізуші жүйені қажетті жіктеуді орындауға үйретуге тырысатын мәжбүрлі дискриминацияны зерттеу болуы мүмкін. Оқу экспериментінде перцептрон әдетте ажыратылуы керек әр сыныптың өкілдерінен тұратын белгілі бір суреттер тізбегін ұсынады. Жадты өзгерту Ережесіне сәйкес реакцияны дұрыс таңдау күшейтіледі. Содан кейін басқарушы ынталандыру персептронға ұсынылады және осы сыныптың ынталандыруларына дұрыс жауап алу ықтималдығы анықталады. Таңдалған салықтық ынталандыру оқыту тізбегінде қолданылатын суреттердің біріне сәйкес келетініне байланысты әр түрлі нәтижелер алынады:
Егер бақылау ынталандыруы оқытудың кез-келген ынталандырғышына сәйкес келмесе, эксперимент таза дискриминациямен ғана байланысты емес, сонымен қатар жалпылау элементтерін де қамтиды.
Егер бақылау стимулы сол кластағы бұрын ұсынылған ынталандырулардың әсерінен іске қосылған элементтерден мүлдем өзгеше сенсорлық элементтердің белгілі бір жиынтығын ынталандырса, эксперимент таза жалпылауды зерттеу болып табылады.
Перцептрондардың таза жалпылау мүмкіндігі жоқ, бірақ олар дискриминация эксперименттерінде өте қанағаттанарлық жұмыс істейді, әсіресе егер бақылау стимулы перцептрон бұрыннан тәжірибесі бар заңдылықтардың біріне сәйкес келсе.
1.3 МҰҒАЛІММЕН ЖАТТЫҒУ. ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР. ВЕКТОРЛЫҚ МАШИНАНЫ ҚОЛДАНУ
Кескінді тану саласында кеңінен қолданылатын негізгі тәсілдердің бірі-бақыланатын классификаторлардың классикалық модельдерін қолдану. Мұндай модельдерді оқыту үшін кескін массивінен және суреттің қай категорияға жататынын анықтайтын тиісті белгілер массивінен тұратын таңбалары бар мәліметтер шаблоны қолданылады. Оқу процесінде бұл мәліметтер жиынтығы екі тең емес бөлікке бөлінеді - бір жаттығу үлгісі және сынақ үлгісі, содан кейін белгілі бір алгоритмді қолдана отырып, модель параметрлерін оқытудың нақты ережелері үлгіні қолдана отырып түзетіледі, осылайша модель суретті алғаннан кейін Шығыс қолтаңбаның кіріс деректері ретінде шығарылады. тиісті сынып. Бұл тәсіл көптеген модельдермен ұсынылған, ең көп қолданылатын регрессиялық модель, жасанды нейрондық желі (көп қабатты перцептрон), қолдау векторларының машинасы, сонымен қатар шешім ағаштары мен ансамбльдер модельдері, олар кейбір модельдердің комбинациясы болып табылады.
Кері таратылатын көп қабатты перцептрондар көбінесе қолмен жазылған сандар, қолжазба, адамның бет-әлпеті және Роботты жүйелердің визуалды сенсорларының деректері сияқты әртүрлі санаттағы суреттерді тану үшін қолданылады . Перцептронның көп қабатты моделі - жасанды нейрондардың жиынтығы - модельдің есептеу бірлігі-иерархиялық ретпен берілген қабаттарға (қабаттарға) топтастырылған. Жасанды нейрон-бұл бір немесе бірнеше кіріс, шығыс және активтендіру функциясымен ұсынылған биологиялық нейронның (жүйке жасушасының) моделі. Сонымен қатар, жасанды нейронның әр кірісі тиісті коэффициентке немесе салмаққа ие .
Көп қабатты перцептрондар табиғи тілдегі таңбалар, қолжазба сандары және қолжазба сияқты кейбір таңдалған шектеулі санаттардың суреттерін тану үшін сәтті нәтиже көрсетеді. Қазіргі уақытта тікелей бақыланатын кескінді тану бойынша оқытуды қолданатын қосымшалардың көпшілігінде нейрондық желілер есептеу ресурстары тұрғысынан тиімді шешім қабылдауға мүмкіндік беретін векторлық қолдау машинасымен алмастырылды. Қолдау векторларының машинасы деректердің әр данасын (кескінін) үш өлшемді кеңістіктегі нүкте ретінде қарастырады, ол деректер өлшеміне немесе суреттегі пикселдердің жалпы санына сәйкес келеді. Әр тармақ белгілі бір сыныпқа (санатқа) жатады. Бұл жағдайда тану мәселесі белгілі бір сыныптың суреттеріне сәйкес келетін барлық нүктелерді оған жатпайтын басқалардан бөлетін n өлшемді кеңістіктегі гиперплан табу мәселесі ретінде ұсынылған. Мұндай гиперплазиялар көп болуы мүмкін деп болжай отырып, қолдау векторларының машинасы жазықтықты іздеуге бағытталған, оның қашықтығы келесі нүктеге дейін мүмкін болатын көптеген нұсқалар шегінде - деп аталады. оңтайлы бөлу гиперплазиясы және тиісті оңтайлы сүзгі.
Векторды қолдау машинасының көп қабатты перцептрондарды қолданудың жақсы және жаман жақтары бар:
Көп қабатты перцептрон-бұл желілік нейрондардың санына байланысты көптеген жасырын параметрлері бар модель. Параметрленген модель жоғары деңгейдегі күрделі функцияларды инкапсуляциялай алады, бірақ оқыту және параметрлерді реттеу үшін көп уақыт пен есептеу ресурстарын қажет етеді. Қолдау векторларының машинасы оқу үлгісінен таңдалған векторларды қолданады, ал жоғарыдағы параметрлер саны үлгінің өлшемімен шектеледі және оны функционалды инженерия арқылы іс жүзінде сұйылтуға болады.
Төмен градиент әдісі (және олардың вариация) және желілік қате пайдалана отырып жүзеге асырылады нейрондық желі оқыту айырмашылығы бағалау ғана емес, қателерді Support Vector Machine Training қамтиды, сонымен қатар нәтижесінде Hyper деңгейі көрсеткіштің күрделілігі. Нейрондық желінің оңтайлы мәнін табу градиенттің түсу процесін тоқтата алатын жергілікті минимумның болуына байланысты, ал метапараметрлерді дұрыс таңдауы бар векторлық қолдау машинасы Ғаламдық шешімді іздеуге кепілдік береді.
Оқытылған нейрондық желі анықтау режимінде жұмыс істеу үшін минималды есептеу ресурстарын қажет етеді (санаттарды болжау). Қолдау векторлық машинасы кейбір жағдайларда векторлардың саны үлгі өлшемімен салыстырғанда үлкен болған кезде, Болжамдар әлдеқайда баяу болады.
Сызықты емес векторлық қолдау машинасымен (өзектерді қолдана отырып) салыстырғанда, нейрондық желі үлгі өлшемі орнатылмаған және жаңа мәліметтерге байланысты толықтырылған кезде онлайн режимінде оқытудың жетілдірілген мүмкіндіктерін көрсетеді.
1.4 ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР
Бүгінгі таңда, жүз жыл бұрынғыдай, ми адам жасаған кез-келген компьютерлік машинадан гөрі тиімді және түбегейлі басқаша жұмыс істейтініне күмән жоқ. Дәл осы факт көптеген жылдар бойы жасанды нейрондық желілерді (ANN) құру және зерттеу бойынша бүкіл әлемдегі ғалымдардың жұмысын ынталандырды және бағыттады.
Мидың жоғары тиімділігінің құпиясын ашуға алғашқы талпыныстардың бірі - Рамон мен Каджалдың жұмысы (1911), ол нейронның мидың құрылымдық бірлігі ретінде идеясын білдірді. Алайда, нейронның жауап беру жылдамдығы жартылай өткізгіш логика элементіне қарағанда 5-6 есе төмен. Соңғы зерттеулер көрсеткендей, мидың жоғары қуатының құпиясы көптеген нейрондар мен олардың арасындағы жаппай байланыстарда жатыр.
Адам миын құрайтын нейрондар желісі-бұл жоғары тиімді, күрделі, сызықты емес, негізінен параллель ақпаратты өңдеу жүйесі. Ол өзінің нейрондарын кескінді қабылдау, оны тану немесе қозғалысты басқару осы тапсырмаларды ең заманауи компьютерлер шеше алатындай етіп ұйымдастыра алады.
Анн-мидың жеңілдетілген моделі. Ол жасанды нейрондарға негізделген, олар тірі заттармен бірдей негізгі қасиетке ие: икемділік. Мидың құрылымын және нейрондардың икемділігін қолдану миды ақпаратты өңдеудің әмбебап жүйесіне айналдырады. Жалпы, ANN-бұл мидың жұмысына еліктейтін машина. СТН әдетте электронды құрылғылар немесе компьютерлік бағдарламалар түрінде жүзеге асырылады. Көптеген адамдар арасында ANN-дің адаптивті машина ретінде анықтамасын бөліп көрсетуге болады: жасанды нейрондық желі - бұл тәжірибені сақтап, оны бізге жеткізуге табиғи бейімділігі бар параллель таратылған процессор. Бұл миға екі аспект бойынша ұқсас: білімді желі оқу процесінде алады, синаптикалық таразылар деп те аталатын интерн-нейрондық байланыс күштері білімді сақтау үшін қолданылады.
Оқу процесін орындау процедурасы оқыту алгоритмі деп аталады. Оның функциясы мидың синаптикалық салмағын белгілі бір жолмен өзгерту болып табылады, осылайша ол қажетті сипаттамаларға ие болады.
Салмақты өзгерту-бұл ANNs жаттығуларының дәстүрлі әдісі. Бұл тәсіл басқаруда бұрыннан сәтті қолданылған адаптивті сызықтық сүзгілер теориясына жақын. Алайда, ANN үшін тірі мида нейрондар пайда болуы, өлуі және басқа нейрондармен байланысын өзгерте ... жалғасы
Әл-Фараби атындағы Қазақ ұлттық университеті
Сабит М. Е.
БЕЙНЕЛЕРДЕГІ СӘЙКЕСТІКТЕРДІ БАҒЫТТАЛҒАН ІЗДЕУ АЛГОРИТМДЕРДІҢ НЕГІЗІНДЕ САЛЫСТЫРМАЛЫ ТАЛДАУ ЖӘНЕ ҚҰРУ
ДИПЛОМДЫҚ ЖҰМЫС
5B070300 - Ақпараттық жүйелер мамандығы
Алматы - 2022
Қазақстан Республикасының Білім және ғылым министрлігі
әл-Фараби атындағы Қазақ ұлттық университеті
Қоpғaуғa жібеpілген
Ақпараттық жүйелер
кафедрасының меңгерушісі, х.ғ.к.,
аға оқытушы _____________ Айдаров К. А.
__ __________ 2022 ж.
5B070300 - Ақпараттық жүйелер мамандығы бойынша
БЕЙНЕЛЕРДЕГІ СӘЙКЕСТІКТЕРДІ БАҒЫТТАЛҒАН ІЗДЕУ АЛГОРИТМДЕРДІҢ НЕГІЗІНДЕ САЛЫСТЫРМАЛЫ ТАЛДАУ ЖӘНЕ ҚҰРУ
тақырыбында жазылған
ДИПЛОМДЫҚ ЖҰМЫС
Орындаған: _______________________ Сабит М. Е.
4 курс студенті
Ғылыми жетекші: _______________________
аға оқытушы
Норма бақылаушы: _______________________
Алматы - 2022
РЕФЕРАТ
Дипломдық жұмыс Х беттен, Х бөлімнен тұрады. Зерттеу жұмысында Х сурет, Х кесте, Х сызба бар. Программа Python бағдарламалау және сұраныстар тілдерінде жүзеге асырылды.
Дипломдық жұмыстың мақсаты: Бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру. Оптикалық кескінді модельдеу, жазу және цифрлық өңдеу негіздерін зерттеу және осының негізінде нақты уақыттағы кескінді өңдеу алгоритмін құру. Үш өлшемді нысандардың суреттерін еркін көру бұрыштарында тану жүйесін дамыту.
Осы мақсатқа жету үшін жұмыста келесі міндеттер қойылды және шешілді:
Екі өлшемді және төрт өлшемді векторлардан тұратын нормаланған деректер үлгілерін жинау және енгізу;
Тану объектілерінің кеңістіктік түрлендірулерін ескере отырып, оларға тән белгілерді тұжырымдау.
ANN-де қолданылатын математикалық заңдылықтар мен қасиеттерді анықтау үшін оқыту әдістерін зерттеу және талдау;
Ұсынылған нысанды ұсыну моделін қолдана отырып, тану жүйесін оқыту әдісін жасау.
Әртүрлі объектілер арасындағы салыстырмалы қашықтық дәрежесін анықтайтын графиктер мен диаграммаларды құру;
АПН-ның қадамдық алгоритмін және графикалық блок-схемасын құру;
Әрбір партиядан үлгілердің ең аз санымен жоғары классификациялық баллға қол жеткізу;
Ұялы автомат арқылы АНН күрделі құрылымдық моделін бағдарламалық қамтамасыз етуді модельдеу, тестілеу және жөндеу;
Оқыту параметрлерін бұрыннан бар аналогтармен салыстыру.
Белгілі жүйелермен салыстырғанда оқытудың тиімділігі мен дамыған жүйенің танылуын бағалаңыз.
Жұмыстың өзектілігі. XXI ғасыр ақпаратты технологиялар заманы екені белгілі. Суретті тану, ақпаратты басқару және өңдеу жүйелерінің, автоматтандырылған жүйелер мен шешім қабылдау жүйелерінің маңызды компоненттерінің бірі. Жіктеуге байланысты белгілі бір қасиеттер мен сипаттамалардың түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстар мен сигналдарды сәйкестендіру робототехника, ақпаратты іздеу, визуалды деректерді бақылау және талдау және жасанды интеллект саласындағы зерттеулер сияқты салаларда пайда болады. Суреттерді алгоритмді өңдеу және жіктеу қауіпсіздігі, кіруді бақылау және басқару жүйелерінде, бейнебақылау жүйелерінде, виртуалды шындық жүйелерінде және ақпарат жинау жүйелерінде қолданылады. Қазіргі уақытта өндірісте бағдарламалық жасақтама интерфейстерінде, қауіпсіздік жүйелерінде және адамдарды сәйкестендіру жүйелерінде, сондай-ақ басқа да қолданбалы мақсаттарда қолданылатын қолжазбаны, нөмірді, саусақ ізін немесе адамның бет-әлпетін тану жүйелері кеңінен қолданылады. Сондықтан бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру кең танымал десем қате тұжырымдама емес. Осылайша, жұмысты OpenCV және imutils ашық кітапханасының көмегімен нақты уақыттағы объектіні тану алгоритмін жасауда болып табылады.
Зерттеу объектісі - үш өлшемді объектілердің сұлбасын кез келген көру бұрыштарында анықтап , тану жүйесі.
Зерттеу пәні -үш өлшемді объектілерді суреттерден тану жүйесінің математикалық әдістері, модельдері және алгоритмдері.
Жұмыстың құрылымы. Диплoмдық жұмысты oрындау кезіндегі белгіленген мақсаттар мен міндеттерге сәйкес келеді. Oл жoба мазмұнымен анықталады және кіріспеден, үш бөлімнен, қoрытындыдан, пайдаланылған әдебиеттер мен қoсымшалар тізімінен тұрады.
Диссертациялық жұмыстың ғылыми жаңалығы келесідей:
Кездейсоқ көру бұрыштарында бейнеленген объектілерді жергілікті эквивариантты бейнелеудің иерархиялық моделін қолдана отырып, кескіндерді танудың нейрондық желілік жүйесінің теориялық ережелері жасалды.
Көрнекілік пен оптикалық трекинг салаларын бағалау арқылы объектінің жергілікті белгілерінің иерархиясын қалыптастыратын мұғалімсіз визуалды деректер ағынында кескінді тану жүйесін оқыту әдісі жасалды.
Нысандарды бейнелеудің иерархиялық моделі негізінде кездейсоқ көру бұрыштарында объектілердің суреттерін тану алгоритмі жасалды.
РЕФЕРАТ
Дипломная работа состоит из х страниц, х разделов. Исследовательская работа содержит рисунок Х, таблицу Х, схему Х. Программа реализована на языках программирования и запросов Python.
Цель дипломной работы: сравнительный анализ и построение на основе алгоритмов направленного поиска совпадений в образах. Изучение основ оптического моделирования изображения, записи и цифровой обработки и создание на основе этого алгоритма обработки изображения в реальном времени. Развитие системы распознавания изображений трехмерных объектов под свободными углами зрения.
В работе поставлены и решены следующие задачи для достижения этой цели:
Сбор и ввод нормированных образцов данных, состоящих из двумерных и четырехмерных векторов;
Формулировать характерные для них признаки с учетом пространственных преобразований объектов познания.
Изучение и анализ методов обучения для выявления математических закономерностей и свойств, используемых в ANN;
Разработать метод обучения системы распознавания с использованием предложенной модели представления объекта.
Построение графиков и диаграмм, определяющих степень относительного расстояния между различными объектами;
Построение пошагового алгоритма и графической блок-схемы АПН;
Достижение высокого классификационного балла с минимальным количеством образцов от каждой партии;
Моделирование, тестирование и отладка программного обеспечения сложной структурной модели Энн с помощью мобильного автомата;
Сравнение параметров обучения с уже существующими аналогами.
Оцените эффективность обучения и узнаваемость разработанной системы по сравнению с известными системами.
Актуальность работы. Известно, что XXI век-это время информационных технологий. Один из важнейших компонентов систем распознавания изображений, управления и обработки информации, автоматизированных систем и систем принятия решений. Идентификация объектов, явлений и сигналов, характеризующихся конечным набором определенных свойств и характеристик, связанных с классификацией, происходит в таких областях, как робототехника, поиск информации, контроль и анализ визуальных данных и исследования в области искусственного интеллекта. Используется в системах алгоритмической обработки и классификации изображений, контроля и управления доступом, системах видеонаблюдения, системах виртуальной реальности и системах сбора информации. В настоящее время в производстве широко используются системы распознавания почерка, номера, отпечатка пальца или лица человека, используемые в интерфейсах программного обеспечения, системах безопасности и системах идентификации людей, а также в других прикладных целях. Поэтому не будет ошибкой сказать, что сравнительный анализ и создание совпадающих изображений на основе поисковых алгоритмов широко известны. Таким образом, работа заключается в разработке алгоритма распознавания объекта в реальном времени с помощью OpenCV и открытой библиотеки imutils.
Объект исследования-система обнаружения и распознавания контуров трехмерных объектов под любыми углами зрения.
Предмет исследования-математические методы, модели и алгоритмы системы распознавания трехмерных объектов по изображениям.
Структура работы. Соответствует установленным целям и задачам при выполнении дипломной работы. Она определяется содержанием проекта и состоит из введения, трех глав, заключения, списка использованной литературы и приложений.
Научная новизна диссертационной работы следующие:
Разработаны теоретические положения нейросетевой системы распознавания образов с использованием иерархической модели локального эквивариантного изображения объектов, изображенных в случайных углах обзора.
Разработан метод обучения системы распознавания изображений в потоке визуальных данных без учителя, который формирует иерархию локальных признаков объекта путем оценки областей визуализации и оптического трекинга.
Разработан алгоритм распознавания изображений объектов в случайных углах обзора на основе иерархической модели изображения объектов.
Abstract
The thesis consists of x pages, x sections. The research paper contains Figure X, table X, diagram X. The program is implemented in Python programming and query languages.
The purpose of the thesis: comparative analysis and construction based on algorithms of directed search for matches in images. Studying the basics of optical image modeling, recording and digital processing and creating a real-time image processing algorithm based on this. Development of an image recognition system for three-dimensional objects at free angles of view.
To achieve this goal, the following tasks were set and solved in the work:
Collection and input of normalized data samples consisting of two-dimensional and four-dimensional vectors;
Formulate their characteristic features taking into account the spatial transformations of objects of cognition.
Study and analysis of teaching methods to identify mathematical patterns and properties used in ANN;
Develop a method for training the recognition system using the proposed object representation model.
Construction of graphs and diagrams that determine the degree of relative distance between different objects;
Construction of a step-by-step algorithm and a graphical flowchart of the APN;
Achieving a high classification score with a minimum number of samples from each batch;
Modeling, testing and debugging of the software of a complex structural model of Ann using a mobile vending machine;
Comparison of training parameters with existing analogues.
Evaluate the effectiveness of training and recognition of the developed system in comparison with known systems.
The relevance of the work: It is known that the XXI century is the time of information technology. One of the most important components of image recognition systems, information management and processing, automated systems and decision-making systems. Identification of objects, phenomena and signals characterized by a finite set of certain properties and characteristics associated with classification occurs in such areas as robotics, information retrieval, control and analysis of visual data and research in the field of artificial intelligence. It is used in algorithmic image processing and classification systems, access control and management, video surveillance systems, virtual reality systems and information collection systems. Currently, handwriting, number, fingerprint or human face recognition systems are widely used in production, used in software interfaces, security systems and human identification systems, as well as for other applied purposes. Therefore, it is not a mistake to say that comparative analysis and creation of matching images based on search algorithms is widely known. Thus, the work consists in developing an algorithm for recognizing an object in real time using OpenCV and the open library imutils.
Object of research: a system for detecting and recognizing contours of three-dimensional objects from any angle of view.
Subject of research: mathematical methods, models and algorithms of the three-dimensional object recognition system based on images.
The structure of the work : Corresponds to the established goals and objectives when performing the thesis. It is determined by the content of the project and consists of an introduction, three chapters, a conclusion, a list of references and appendices.
The scientific novelty of the dissertation work is as follows:
Theoretical provisions of a neural network pattern recognition system have been developed using a hierarchical model of a local equivariant image of objects depicted in random viewing angles.
A method has been developed for training an image recognition system in a visual data stream without a teacher, which forms a hierarchy of local features of an object by evaluating visualization areas and optical tracking.
An algorithm for recognizing images of objects in random viewing angles based on a hierarchical model of object images has been developed.
Мазмұны
1. КІРІСПЕ 10
1.1 АДАМ ЖӘНЕ КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІ АРҚЫЛЫ ВИЗУАЛДЫ АҚПАРАТТЫ АЛУ ПРОЦЕСІ 12
1.2 КЕСКІНДІ ТАНУДЫҢ ЗАМАНАУИ ӘДІСТЕРІНЕ АНАЛИТИКАЛЫҚ ШОЛУ 13
1.3 МҰҒАЛІММЕН ЖАТТЫҒУ. ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР. ВЕКТОРЛЫҚ МАШИНАНЫ ҚОЛДАНУ 15
1.4 ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР 17
2. НЫСАН КЕСКІНІН КӨРСЕТУ МОДЕЛІ 19
2.1 МОДЕЛЬДІҢ ЭЛЕМЕНТАР БІРЛІГІ РЕТІНДЕ ЭКВИВАЛЕНТТІ ДЕТЕКТОР ҰҒЫМЫ 19
3. НӘТИЖЕЛЕРІ ЭКСПЕРИМЕНТТІК ДЕРЕКТЕР 30
4. ҚОРЫТЫНДЫ 32
5. ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 34
КІРІСПЕ
Қазіргі уақытта сандық өңдеу және кейіннен кескінді тану ғылыми зерттеулердің қарқынды дамып келе жатқан салаларының бірі болып табылады. Ақпаратты алуға, өңдеуге, сақтауға және беруге байланысты көптеген технологиялық салалар қазіргі уақытта ақпараттың кескін сипаты бар жүйелерді дамытуға бағытталған.
Анықтау мүмкіндігі бір типтегі объектілердің ұқсастығына негізделген. Барлық нысандар мен жағдайлар тар мағынада ерекше болғанымен, сіз әрқашан олардың кейбіреулерінің ұқсастығын таба аласыз. Осыдан жіктеу тұжырымдамасы пайда болады - объектілердің бүкіл жиынтығын бөлінбейтін ішкі жиындарға бөлу-элементтері оларды басқа сыныптардың элементтерінен ерекшелейтін кейбір ұқсас қасиеттері бар сыныптар. Осылайша, тану міндеті-қарастырылатын нысандарды немесе құбылыстарды олардың сипаттамасына сәйкес қажетті сыныптармен салыстыру. Сол. егер сенсорлық ғана емес, сонымен қатар басқа ақпарат ағынындағы заттарды табу туралы айтатын болсақ, тану ұғымын кеңейтуге болады. Мысалы, ауруды науқаста оның белгілері бойынша тану немесе статистикалық ақпарат арқылы әлеуметтік құбылыстарды анықтау туралы айтуға болады.
XIX ғасырдың соңында машиналарға олар өңдейтін ақпаратты тануға мүмкіндік беретін технологиялар қажет болды. Машиналарды тану әдістерін жасау Компьютерлік тапсырмалардың ауқымын кеңейтуге және ақпаратты машиналық өңдеуді неғұрлым ақылды етуге мүмкіндік береді. Тану Қосымшаларының мысалдары-мәтінді тану жүйелері, машиналық көру, сөйлеуді тану, саусақ ізін тану және т.б. Бұл міндеттердің кейбірін адам бейсаналық деңгейде жоғары жылдамдықпен шешсе де, оларды кеңінен шешетін компьютерлік бағдарламалар әлі құрылған жоқ. Қолданыстағы жүйелер қатаң шектеулі көлемде ерекше жағдайларда ғана жұмыс істеуге арналған.
Дипломдық жұмыстың мақсаты: Бейнелердегі сәйкестіктерді бағытталған іздеу алгоритмдердің негізінде салыстырмалы талдау және құру. Оптикалық кескінді модельдеу, жазу және цифрлық өңдеу негіздерін зерттеу және осының негізінде нақты уақыттағы кескінді өңдеу алгоритмін құру. Үш өлшемді нысандардың суреттерін еркін көру бұрыштарында тану жүйесін дамыту.
Жұмыстың өзектілігі. XXI ғасыр ақпаратты технологиялар заманы екені белгілі. Суретті тану, ақпаратты басқару және өңдеу жүйелерінің, автоматтандырылған жүйелер мен шешім қабылдау жүйелерінің маңызды компоненттерінің бірі. Жіктеуге байланысты белгілі бір қасиеттер мен сипаттамалардың түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстар мен сигналдарды сәйкестендіру робототехника, ақпаратты іздеу, визуалды деректерді бақылау және талдау және жасанды интеллект саласындағы зерттеулер сияқты салаларда пайда болады. Суреттерді алгоритмді өңдеу және жіктеу қауіпсіздігі, кіруді бақылау және басқару жүйелерінде, бейнебақылау жүйелерінде, виртуалды шындық жүйелерінде және ақпарат жинау жүйелерінде қолданылады. Қазіргі уақытта өндірісте бағдарламалық жасақтама интерфейстерінде, қауіпсіздік жүйелерінде және адамдарды сәйкестендіру жүйелерінде, сондай-ақ басқа да қолданбалы мақсаттарда қолданылатын қолжазбаны, нөмірді, саусақ ізін немесе адамның бет-әлпетін тану жүйелері кеңінен қолданылады.
Жұмыстың құрылымы. Диплoмдық жұмысты oрындау кезіндегі белгіленген мақсаттар мен міндеттерге сәйкес келеді. Oл жoба мазмұнымен анықталады және кіріспеден, үш бөлімнен, қoрытындыдан, пайдаланылған әдебиеттер мен қoсымшалар тізімінен тұрады.
АДАМ ЖӘНЕ КОМПЬЮТЕРЛІК КӨРУ ЖҮЙЕСІ АРҚЫЛЫ ВИЗУАЛДЫ АҚПАРАТТЫ АЛУ ПРОЦЕСІ
Адамның көзі-бұл көзге түсетін барлық Жарық ақпаратын алатын және өңдейтін нәзік құрылғы. Адамдарда кескіннің қалыптасуы торда жүреді, содан кейін өңдеу және мидағы жадқа жазу.
Жарық толқын ұзындығы 400-700 нм болатын электромагниттік энергияның спектрлік таралуынан тұрады. Осы диапазоннан тыс толқындар ультракүлгін (ультракүлгін) және инфрақызыл (IR) деп аталады. Адамның графикалық, бейне және аудио ақпараттарды өңдеуі қабылдаудан басталады. Түс көру теориясына сәйкес, түс әртүрлі толқын ұзындығының жарығын қабылдай алатын таяқшалар мен конустар арқылы рецепторлар, фотосезімтал сетчатка арқылы қабылданады. Компьютерлік көру жүйелері көбінесе адамның визуалды ақпаратын өңдеу кезеңдеріне ұқсайды, бірақ жүйенің мақсаты мен қолдану саласына байланысты олардың айтарлықтай айырмашылықтары мен ерекшеліктері бар.
1.2 КЕСКІНДІ ТАНУДЫҢ ЗАМАНАУИ ӘДІСТЕРІНЕ АНАЛИТИКАЛЫҚ ШОЛУ
Үлгіні тану теориясы-белгілі бір қасиеттер мен қасиеттердің түпкілікті жиынтығымен сипатталатын объектілерді, құбылыстарды, процестерді, сигналдарды, жағдайларды және т.б. зерттеу. Компьютерлік ғылымдар және сабақтас пәндер кафедрасы, жіктеу және сәйкестендіру негіздері мен әдістерін әзірлейді. Мұндай тапсырмалар көбінесе шешіледі, мысалы, бағдаршамнан өту немесе өту кезінде. Жанып жатқан бағдаршамның түсін біліп, жол ережелерін біле отырып, сіз жолдан өте аласыз ба, жоқ па, дұрыс шешім қабылдай аласыз. Мұндай анықтаудың қажеттілігі әскери жүйелер мен қауіпсіздік жүйелерінен бастап аналогтық сигналдарды цифрландыруға дейін әртүрлі салаларда туындайды. Үлгіні тану мәселесі, әсіресе, ақпараттық жүктеме жағдайында, адам алынған хабарламаларды сызықтық және дәйекті түсінумен күреспеген кезде, оның миы осындай танумен сипатталатын бір мезгілде қабылдау мен ойлау режиміне өткен кезде өзекті болды. Сондықтан кескінді тану мәселесі пәнаралық зерттеулер саласында, соның ішінде жасанды интеллект құру, кескінді танудың техникалық жүйелерін дамытуда көбірек назар аударатыны кездейсоқ емес.
Үлгіні танудағы бағыттар.
Айналаны зерттеу қабілетін зерттеу, түсіндіру және модельдеу;
Жеке қолданбалы есептерді шешуге арналған құрылғыларды құру теориясы мен әдістерін әзірлеу.Мәселенің ресми тұжырымы .
Үлгіні тану деректердің жалпы массасынан осы деректерді сипаттайтын маңызды сипаттамаларды бөліп, бастапқы деректерді белгілі бір класқа сәйкес келеді. Жасанды нейрондық желілер теориясынан айырмашылығы, танымдық есептерді шешуде олар эксперименттік нәтижелердің негізін құрайтын математикалық тілді қолдануға тырысады және экспериментті логикалық ойлау мен математикалық ойлаумен алмастырады. Оларды жіктеу керек. Жиын сыныптар деп аталатын ішкі жиындармен ұсынылған. Берілген: сыныптар туралы ақпарат, бүкіл жиынтықтың сипаттамасы және белгілі бір сыныпқа жататын объект туралы ақпараттың сипаттамасы белгісіз. Бұл нысан сыныптар мен объектілерді сипаттау үшін қол жетімді ақпаратты қолдана отырып, қай сыныпқа жататынын анықтау үшін қажет.Көбінесе үлгіні тану тапсырмалары монохромды кескіндерді өңдейді, осылайша сіз кескінді ұшақтың функциясы ретінде көре аласыз. Егер біз t жазықтығындағы көптеген нүктелерді қарастыратын болсақ, онда кескіннің әр нүктесіндегі f (x, y) функциясы өзінің қасиеттерін - жарықтығын, мөлдірлігін, оптикалық тығыздығын білдіреді, мұндай функция кескіннің ресми жазбасы болып табылады. F (x, y) - барлық функциялардың жиынтығы, t деңгейінде барлық x кескіндерінің жиынтығы бар, мұндай нәтиженің нақты сипаты белгілі бір тәсілге сәйкес келетін танудың кейінгі кезеңдеріне байланысты.
Графиканы танудың кейбір әдістері.
Оптикалық кескіндерді тану үшін Сіз әдісті, әртүрлі бұрыштардағы нысан түрін, масштабты, жылжуды және т.б. қолдана аласыз. өту. Әріптер үшін қаріп, қаріп қасиеттері және т. б. арқылы өту керек.
Екінші тәсіл-объектінің құрылымын табу және оның қасиеттерін зерттеу (байланыс, бұрыштардың болуы және т.б.).
Тағы бір тәсіл-жасанды нейрондық желілерді пайдалану. Бұл әдіс анықтау тапсырмасының көптеген мысалдарын (дұрыс жауаптармен) немесе осы тапсырманың ерекшеліктерін ескеретін нейрондық желінің арнайы құрылымын қажет етеді.
Үлгіні тану әдісі ретінде қабылдау.
Құрылымы мен функционалдық сипаттамалары белгілі физикалық жүйеде психологиялық құбылыстардың қалай пайда болатынын көрсететін ми моделінің тұжырымдамасын ұсынған Фрэнк Розенблатт дискриминацияның қарапайым тәжірибелерін сипаттады. Бұл тәжірибелер үлгіні тану әдістеріне толығымен қатысты, бірақ шешім алгоритмі детерминистік емес екендігімен ерекшеленеді.Белгілі бір жүйе туралы психологиялық тұрғыдан маңызды ақпарат алуға болатын қарапайым эксперимент модельдер екі түрлі ынталандыруды ұсынады және оларға әр түрлі жауап беруі керек. Мұндай эксперименттің мақсаты экспериментатордың араласуынсыз сіздің стихиялық дискриминацияңыздың мүмкіндігін зерттеу немесе, керісінше, эксперимент жүргізуші жүйені қажетті жіктеуді орындауға үйретуге тырысатын мәжбүрлі дискриминацияны зерттеу болуы мүмкін. Оқу экспериментінде перцептрон әдетте ажыратылуы керек әр сыныптың өкілдерінен тұратын белгілі бір суреттер тізбегін ұсынады. Жадты өзгерту Ережесіне сәйкес реакцияны дұрыс таңдау күшейтіледі. Содан кейін басқарушы ынталандыру персептронға ұсынылады және осы сыныптың ынталандыруларына дұрыс жауап алу ықтималдығы анықталады. Таңдалған салықтық ынталандыру оқыту тізбегінде қолданылатын суреттердің біріне сәйкес келетініне байланысты әр түрлі нәтижелер алынады:
Егер бақылау ынталандыруы оқытудың кез-келген ынталандырғышына сәйкес келмесе, эксперимент таза дискриминациямен ғана байланысты емес, сонымен қатар жалпылау элементтерін де қамтиды.
Егер бақылау стимулы сол кластағы бұрын ұсынылған ынталандырулардың әсерінен іске қосылған элементтерден мүлдем өзгеше сенсорлық элементтердің белгілі бір жиынтығын ынталандырса, эксперимент таза жалпылауды зерттеу болып табылады.
Перцептрондардың таза жалпылау мүмкіндігі жоқ, бірақ олар дискриминация эксперименттерінде өте қанағаттанарлық жұмыс істейді, әсіресе егер бақылау стимулы перцептрон бұрыннан тәжірибесі бар заңдылықтардың біріне сәйкес келсе.
1.3 МҰҒАЛІММЕН ЖАТТЫҒУ. ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР. ВЕКТОРЛЫҚ МАШИНАНЫ ҚОЛДАНУ
Кескінді тану саласында кеңінен қолданылатын негізгі тәсілдердің бірі-бақыланатын классификаторлардың классикалық модельдерін қолдану. Мұндай модельдерді оқыту үшін кескін массивінен және суреттің қай категорияға жататынын анықтайтын тиісті белгілер массивінен тұратын таңбалары бар мәліметтер шаблоны қолданылады. Оқу процесінде бұл мәліметтер жиынтығы екі тең емес бөлікке бөлінеді - бір жаттығу үлгісі және сынақ үлгісі, содан кейін белгілі бір алгоритмді қолдана отырып, модель параметрлерін оқытудың нақты ережелері үлгіні қолдана отырып түзетіледі, осылайша модель суретті алғаннан кейін Шығыс қолтаңбаның кіріс деректері ретінде шығарылады. тиісті сынып. Бұл тәсіл көптеген модельдермен ұсынылған, ең көп қолданылатын регрессиялық модель, жасанды нейрондық желі (көп қабатты перцептрон), қолдау векторларының машинасы, сонымен қатар шешім ағаштары мен ансамбльдер модельдері, олар кейбір модельдердің комбинациясы болып табылады.
Кері таратылатын көп қабатты перцептрондар көбінесе қолмен жазылған сандар, қолжазба, адамның бет-әлпеті және Роботты жүйелердің визуалды сенсорларының деректері сияқты әртүрлі санаттағы суреттерді тану үшін қолданылады . Перцептронның көп қабатты моделі - жасанды нейрондардың жиынтығы - модельдің есептеу бірлігі-иерархиялық ретпен берілген қабаттарға (қабаттарға) топтастырылған. Жасанды нейрон-бұл бір немесе бірнеше кіріс, шығыс және активтендіру функциясымен ұсынылған биологиялық нейронның (жүйке жасушасының) моделі. Сонымен қатар, жасанды нейронның әр кірісі тиісті коэффициентке немесе салмаққа ие .
Көп қабатты перцептрондар табиғи тілдегі таңбалар, қолжазба сандары және қолжазба сияқты кейбір таңдалған шектеулі санаттардың суреттерін тану үшін сәтті нәтиже көрсетеді. Қазіргі уақытта тікелей бақыланатын кескінді тану бойынша оқытуды қолданатын қосымшалардың көпшілігінде нейрондық желілер есептеу ресурстары тұрғысынан тиімді шешім қабылдауға мүмкіндік беретін векторлық қолдау машинасымен алмастырылды. Қолдау векторларының машинасы деректердің әр данасын (кескінін) үш өлшемді кеңістіктегі нүкте ретінде қарастырады, ол деректер өлшеміне немесе суреттегі пикселдердің жалпы санына сәйкес келеді. Әр тармақ белгілі бір сыныпқа (санатқа) жатады. Бұл жағдайда тану мәселесі белгілі бір сыныптың суреттеріне сәйкес келетін барлық нүктелерді оған жатпайтын басқалардан бөлетін n өлшемді кеңістіктегі гиперплан табу мәселесі ретінде ұсынылған. Мұндай гиперплазиялар көп болуы мүмкін деп болжай отырып, қолдау векторларының машинасы жазықтықты іздеуге бағытталған, оның қашықтығы келесі нүктеге дейін мүмкін болатын көптеген нұсқалар шегінде - деп аталады. оңтайлы бөлу гиперплазиясы және тиісті оңтайлы сүзгі.
Векторды қолдау машинасының көп қабатты перцептрондарды қолданудың жақсы және жаман жақтары бар:
Көп қабатты перцептрон-бұл желілік нейрондардың санына байланысты көптеген жасырын параметрлері бар модель. Параметрленген модель жоғары деңгейдегі күрделі функцияларды инкапсуляциялай алады, бірақ оқыту және параметрлерді реттеу үшін көп уақыт пен есептеу ресурстарын қажет етеді. Қолдау векторларының машинасы оқу үлгісінен таңдалған векторларды қолданады, ал жоғарыдағы параметрлер саны үлгінің өлшемімен шектеледі және оны функционалды инженерия арқылы іс жүзінде сұйылтуға болады.
Төмен градиент әдісі (және олардың вариация) және желілік қате пайдалана отырып жүзеге асырылады нейрондық желі оқыту айырмашылығы бағалау ғана емес, қателерді Support Vector Machine Training қамтиды, сонымен қатар нәтижесінде Hyper деңгейі көрсеткіштің күрделілігі. Нейрондық желінің оңтайлы мәнін табу градиенттің түсу процесін тоқтата алатын жергілікті минимумның болуына байланысты, ал метапараметрлерді дұрыс таңдауы бар векторлық қолдау машинасы Ғаламдық шешімді іздеуге кепілдік береді.
Оқытылған нейрондық желі анықтау режимінде жұмыс істеу үшін минималды есептеу ресурстарын қажет етеді (санаттарды болжау). Қолдау векторлық машинасы кейбір жағдайларда векторлардың саны үлгі өлшемімен салыстырғанда үлкен болған кезде, Болжамдар әлдеқайда баяу болады.
Сызықты емес векторлық қолдау машинасымен (өзектерді қолдана отырып) салыстырғанда, нейрондық желі үлгі өлшемі орнатылмаған және жаңа мәліметтерге байланысты толықтырылған кезде онлайн режимінде оқытудың жетілдірілген мүмкіндіктерін көрсетеді.
1.4 ЖАСАНДЫ НЕЙРОНДЫҚ ЖЕЛІЛЕР
Бүгінгі таңда, жүз жыл бұрынғыдай, ми адам жасаған кез-келген компьютерлік машинадан гөрі тиімді және түбегейлі басқаша жұмыс істейтініне күмән жоқ. Дәл осы факт көптеген жылдар бойы жасанды нейрондық желілерді (ANN) құру және зерттеу бойынша бүкіл әлемдегі ғалымдардың жұмысын ынталандырды және бағыттады.
Мидың жоғары тиімділігінің құпиясын ашуға алғашқы талпыныстардың бірі - Рамон мен Каджалдың жұмысы (1911), ол нейронның мидың құрылымдық бірлігі ретінде идеясын білдірді. Алайда, нейронның жауап беру жылдамдығы жартылай өткізгіш логика элементіне қарағанда 5-6 есе төмен. Соңғы зерттеулер көрсеткендей, мидың жоғары қуатының құпиясы көптеген нейрондар мен олардың арасындағы жаппай байланыстарда жатыр.
Адам миын құрайтын нейрондар желісі-бұл жоғары тиімді, күрделі, сызықты емес, негізінен параллель ақпаратты өңдеу жүйесі. Ол өзінің нейрондарын кескінді қабылдау, оны тану немесе қозғалысты басқару осы тапсырмаларды ең заманауи компьютерлер шеше алатындай етіп ұйымдастыра алады.
Анн-мидың жеңілдетілген моделі. Ол жасанды нейрондарға негізделген, олар тірі заттармен бірдей негізгі қасиетке ие: икемділік. Мидың құрылымын және нейрондардың икемділігін қолдану миды ақпаратты өңдеудің әмбебап жүйесіне айналдырады. Жалпы, ANN-бұл мидың жұмысына еліктейтін машина. СТН әдетте электронды құрылғылар немесе компьютерлік бағдарламалар түрінде жүзеге асырылады. Көптеген адамдар арасында ANN-дің адаптивті машина ретінде анықтамасын бөліп көрсетуге болады: жасанды нейрондық желі - бұл тәжірибені сақтап, оны бізге жеткізуге табиғи бейімділігі бар параллель таратылған процессор. Бұл миға екі аспект бойынша ұқсас: білімді желі оқу процесінде алады, синаптикалық таразылар деп те аталатын интерн-нейрондық байланыс күштері білімді сақтау үшін қолданылады.
Оқу процесін орындау процедурасы оқыту алгоритмі деп аталады. Оның функциясы мидың синаптикалық салмағын белгілі бір жолмен өзгерту болып табылады, осылайша ол қажетті сипаттамаларға ие болады.
Салмақты өзгерту-бұл ANNs жаттығуларының дәстүрлі әдісі. Бұл тәсіл басқаруда бұрыннан сәтті қолданылған адаптивті сызықтық сүзгілер теориясына жақын. Алайда, ANN үшін тірі мида нейрондар пайда болуы, өлуі және басқа нейрондармен байланысын өзгерте ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz