Нейронды желілер медицинада



Жұмыс түрі:  Диссертация
Тегін:  Антиплагиат
Көлемі: 68 бет
Таңдаулыға:   
ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ
АЛМАТЫ ТЕХНОЛОГИЯЛЫҚ УНИВЕРСИТЕТІ АҚ

Манасбай Еламан Қуатбекұлы

"BRAIN NETWORKS"МОДЕЛЬДЕРІ МЕН ДЕРЕКТЕР ӨҢДЕУ ӘДІСТЕРІН ЗЕРТТЕУ ЖӘНЕ ТАЛДАУ

МАГИСТРЛІК ДИССЕРТАЦИЯ

Білім беру бағдарламасы: 7М06101 - Ақпараттық жүйелер

Алматы, 2021 ж.
ҚАЗАҚСТАН РЕСПУБЛИКАСЫ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ
АЛМАТЫ ТЕХНОЛОГИЯЛЫҚ УНИВЕРСИТЕТІ

Магистрлік диссертация

"BRAIN NETWORKS"МОДЕЛЬДЕРІ МЕН ДЕРЕКТЕР ӨҢДЕУ ӘДІСТЕРІН ЗЕРТТЕУ ЖӘНЕ ТАЛДАУ

Білім беру бағдарламасы: 7М06101 - Ақпараттық жүйелер

Магистрант: _____________________Манасбай Е.Қ.
(қолы)

Ғылыми жетекші: ________________Калижанова А.У.
(қолы)

ҚОРҒАУҒА ЖІБЕРІЛДІ:
Норма бақылаушы: ____________Абельмажинова Д.З.
(қолы)
_____ ___________________ 20_____ж.
Кафедра меңгерушісі:
_________________________________Ма ликова Ф.У.
(қолы)
_____ ___________________ 20_____ж.

ЖООКБББ бастығы:
_______________________________ Кошербаева Л.М.
(қолы)
_____ ___________________ 20_____ж.

Алматы, 2021 ж.
Манасбай Еламан Қуатбекұлының
ғылыми еңбектер тізімі


Ғылыми мақаланың
атауы
Жұмыстың түрі

Баспа, журнал, атауы,
нөмірі, жылы, беттері
Көлемі
(б.т.)

Қосалқы авторлар

1
2
3
4
5
6
1
Мидың нейрондық құрылымының визуалды түрін зерттеу

Мақала
Студенческий вестник ғылыми журналы, №12 (157) 5-бөлім Мәскеу 2021ж.
80-84б.
0,25

Калижанова А. У.
Мухамади А.
2
Применение алгоритма k-means для нейронной сети кохонена
Мақала
Студенческий вестник ғылыми журналы, №12 (157)
0,25

Калижанова А. У.
Мухамади А.
3
Методы визуализации головного мозга
Мақала
Наука и Мир ғылыми журналы, (№ 4 (92), апрель) 1-бөлім
Волгоград, сәуір 2021 ж. 39-40б.
0,50

Калижанова А. У.

4
Структура и функции сложных мозговых сетей
Мақала
Наука и Мир ғылыми журналы, (№ 4 (92), апрель) 1-бөлім
Волгоград, сәуір 2021 ж. 40-41б.
0,50

Калижанова А. У.

5
Деректерді өңдеудің нейро желілік әдістерін моделдеу және талдау
Халықаралық ғылыми-тәжірибелік конференция
COMPUTER SCIENCE AND CYBER SECURITY 2021 Халықаралық ғылыми-тәжірибелік конференциясының МАТЕРИАЛДАРЫ Алматы, Қазақстан,
28 ақпан 2021 жыл
0,25

Калижанова А. У.
Мухамади А.
Ғылыми хатшы
____________________________
(қолы)
Раимбаева Н.Т.
Магистрант

____________________________
(қолы)
Манасбай Е.Қ.

___________________________________ ________________________________ БББ бойынша (БББ және коды)
_________________________________ _________ магистрі дәрежесіне ізденуге ұсынылған ___________________________________ _____________________________________________
(магистранттың Т.А.Ә.)
___________________________________ __________________________________________
(диссертация тақырыбы)
тақырыптағы магистрлік диссертациясына сыртқы рецензенттің

РЕЦЕНЗИЯСЫ

1. Зерттеу тақырыбының өзектілігі және оның тәжірибе талаптары мен ғылым мен техниканың дамуымен байланысы.

2. Магистрлік диссертация талаптары деңгейіндегі ғылыми нәтижелер.

3. Диссертацияда магистрант келтірген ғылыми нәтиженің, тұжырым, қорытындының дәйектігі және нақтылығы.

4. Диссертацияда магистрант келтірген ғылыми нәтиженің, тұжырым, қорытындының жаңалық деңгейі.

5. Диссертацияның негізгі тұжырымдарының, қорытынды, нәтижелерінің жарияланымы туралы айғақтар.

6. Диссертацияның мазмұны мен рәсімделуі бойынша кемшіліктер.

7. Диссертацияның қойылған талаптарға сәйкестігі.

8. Қорытынды.

Рецензент
ғылыми дәрежесі, атағы
жұмыс орны
___________________
(қолы)
(А.Ә.Т.)
___________________________________ ________________________________ БББ бойынша (БББ және коды)
_________________________________ _____ магистрі дәрежесін алу үшін қорғауға ұсынылған ___________________________________ __________________________________
(магистранттың Т.А.Ә.)
___________________________________ __________________________________________
(диссертация тақырыбы)
тақырыптағы магистрлік диссертациясына ғылыми жетекшінің

ПІКІРІ
___________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ___________________________________ ________________________________ ________________________________________________

Ғылыми жетекші
PhD доктор,
қауымды.профессор
____________________
(қолы)
Калижанова А.У.
МAЗМҰНЫ

КІPІCПЕ

3
1.
Пәндік облыстың анализі және зерттеуі
4
1.1
Нейрондық желілерге кіріспе
4
1.2
Нейронды желілер медицинада
10
1.3
Үлкен деректер көлемі
12
1.4
Data mining-тегі кластерлік анализ
16

2.
Нейронды желілердегі деректерді өңдеудің әдістерінің
және алгоритмдерінің анализі
25
2.1
Кластеризацияның әдістері
25
2.2
k-орталардың кластеризациясы
27
2.2.1
k-орталардың кластеризациясы туралы негізгі мәліметтер
28
2.2.2
k-орталардың кластеризациясының бапталуы
29
2.3
k-means кластеризациясының алгоритмі
30
2.4
k-means алгоритмінің қолданылу облысы
33

3.
Эксперименттік деректердің кластеризациясы мен визуализациясы
40
3.1
Нейронды желілердің негізінде жатқан негізгі идеялар
40
3.2
Нейронды желі үшін деректерді жинау
42
3.3
Эксперименталдық деректердің өңделуі
44
3.3.1
Активация паттерндерінің анализі
44
3.3.2
Мультиграфтар әдісі
45
3.4
Бас миының визуализациясы
46
3.5
Бас миын визуализациялау әдістері
50
3.5.1
Функционалды магнитті-резонансты томография
50
3.5.2
Компьютерлі томография
55
3.5.3
Позитронды-эмиссионды томография
59
3.5.4
Электроэнцефалография
62
3.5.5
Магнитоэнцефалография
64

КІРІСПЕ

Қазіргі әлемде ақпарат маңызды байлықтардың бірі болып табылады, ал ақпараттық жүйе (АЖ) барлық қызмет саласында қажетті құрал болып танылады.
Ақпараттық жүйенің көмегімен шешілетін міндеттердің әртүрлілігі, құрастырылу қағидасымен және оларға енгізілген ақпаратты өңдеу ережесімен айрықшаланатын көптеген әртүрлі жүйелердің пайда болуына алып келді.
Диссертациялық жұмысымның тақырыбы осы ақпараттық жүйеге қатысты нейрондық желілерді тереңдетіп оқытуды зерттеу болып табылады. Бұл жұмыстың мақсаты ақпараттық жүйенің пәндік аймақ ретінде нейрондық желілерді зерттеу болып саналады.
Диссертациялық жұмыстың мақсаты:
- Диссертациялық жұмыста үлкен көлемдегі мәліметтерді кластерлеу мәселелері қарастырыл-ған. Дипломдық жұмыстың мақсаты - k-орташа кластерлеу әдісі арқылы адамның миымен байланысты аурулардың дәл диагнозын анықтайтын тапсырмаларды оңтайландыру.
- k-means Кластерлеу әдісін талдау
Диссертациялық жұмыста қойылатын талаптар:
- диссертация тақырыбына байланысты танымдық белсенділікті көрсету мақсатында мәліметтер жинақтау;
- диссерациялық жұмыстар тақырыптарын анықтау кезінде өндіріс, білім және ғылымның нақты мәселелерін ескеру;
- қорғалып отырған диссертациялық жұмыстың тақырыбын ашу мақсатында, оны жеткізу ретінде зерттеу жұмыстарын енгізу;
- диссертациялық жұмыс тапсырмаға сәйкес перспективті теориялық және практикалық мәселелерді қамту.
Диссертациялық жұмыстың өзектілігі:
- Қазіргі заманғы нейробиология үлкен көлемді және егжей-тегжейлі үлкен нейрондық деректерді жеткізетін миды картаға түсіру және жазу технологиясының дамуына негізделген трансформацияның ортасында тұр. Желілік ғылым нейрондық жүйелерді модельдеуге және талдауға, жеке нейрондардан бастап, бүкіл миды қамтитын тізбектерге негізделген принциптердің бірі ретінде пайда болды. Ми желілеріндегі зерттеулер ұлттық және халықаралық конференцияларда, жетекші ғылыми журналдардың арнайы басылымдарында және АҚШ-тың Адамның Коннектом жобасы, BRAIN бастамасы және Еуропалық ми сияқты ми жұмысын түсінуге бағытталған кең ауқымды бастамалардың бір бөлігі болды.Шекті криптожүйелер құпия ақпаратты кеңістікте бөлуді ұйымдастырады, оған сәйкес шекті схеманың n абоненттерінің тек құпияны қалпына келтіре алады. Шекті схемалар ауқымы ақпараттарды жасырын беру жүйелеріне, желідегі компьютерлер арасында деректерді берудің динамикалық тепе-теңдігіне және мәліметтер қорын қорғауға кеңейеді.
1 Пәндік облыстың анализі және зерттеуі
1.1 Нейронды желілерге кіріспе
Нейронды желілер - күрделі тәуелділіктерді жүргізуге арналған қуатты модельдеу әдісі. Нейронды желілер табиғатына сәйкес, әдетте, сызықты емес. Көптеген жылдар бойы сызықты модельдеу облыстардың көпшілігінде модельдеудің негізгі әдісі болды, себебі ол үшін оптимизация процедуралары жақсы құрастырылған. Сызықты аппроксимация қанағаттандырылмаған есептерде (ал мұндайлар көп) сызықты әдістер нашар жұмыс істейді. Сонымен бірге, нейронды желілер айнымалылар саны көп жағдайда сызықты тәуелділіктерді модельдеуге мүмкіндік бермейтін өлшем қарғысына қарсы тұра алады.
Соңғы жылдары біз көптеген облыстарда - бизнесте, медицинада, техникада, геологияда, физикада кеңінен қолданылып жүрген нейронды желілерге деген қызығушылықтың көбеюін байқап жүрміз. Нейронды желілер болжауды, классификацияны немесе басқаруды қажет ететін есептерді шешу керек тәжірибелердің барлығына ендірілді.
Нейронды желілер мысалдарда үйренеді. Нейронды желінің қолданушысы ұсынылатын деректерді таңдайды, содан кейін деректер құрылымын автоматты түрде қабылдайтын оқыту алгоритмі іске қосылады. Қолданушыдан деректерді қалай таңдау және дайындау, қажетті архитектураны таңдау және нәтижелерді интерпретациялау туралы эврестикалық сауаттылық талап етіледі, алайда нейронды желілерді сәтті қолдануға қажетті білім деңгейі статистиканың дәстүрлі әдістеріне қарағанда қарапайым болып келеді.
Нейронды желілер интуитивті тұрғыдан дұрыс болып табылады, себебі олар жүйке жүйелерінің примитивті биологиялық моделінде негізделген. Болашақта мүндай нейро-биологиялық модельдердің өсуі шынымен де ойлай алатын компьютерлердің пайда болуына алып келуі мүмкін.
Адамды мидың құрылысы, оның жұмыс істеу қағидалары және ұйымдастырылуы үнемі қызықтырды. Нейронның (мидың негізгі элементі) математикалық моделі 1943 жылы америкалық ғалым Уоррен Маккаллок (McCulloch W.) және оның оқушысы У. Питтс (Pitts W.) мидың қолданылу аясының теориясының негізгі ұғымдарын тұжырымдаған кезде құрастырылды. Олар келесілерді жасады:
1) вектордың скаляр көбейтіндісінің кіріс сигналдары мен салмақты коэффициенттер векторының өтпелі функциясының есептеуін орынжайтын нейронның ең қарапайым процессорлық элемент ретіндегі моделі құрастырылды;
2) осындай элементтердің логикалық және арифметикалық операцияларын орындау үшін желі құрылымы ұсынылды;
3) мұндай желінің оқуға, бейнелерді тануға, қабылданған ақпаратты жалпылауға қабілетті екендігі жайлы негізгі тұжырымдар жасалды.
Өткен онжылдық ішінде нейронды желілер айтарлықтай алға жылжыды, алайда У. Маккаллоктың көптеген тұжырымдары бүгінге дейін өзекті болып қалды. Нейрон модельдерінің түрлілігіне қарамастан, У. Маккаллок және У. Питтспен ұсынылған олардың қозғалыс қағидалары өзгеріссіз қалды. У. Маккаллоктың моделінің кемшілігі нейронның өз моделі болып табылады - белсенді функцияның шекаралық түрі. Функцияның шекаралық түрі нейронды желіге оқыту және қойылған есепті баптау барысында жеткілікті иілгіштікті бермейді.
Нейронды желілер теориясының дамуы америкалық нейрофизиолог Френсис Розенблаттың (Rosenblatt F.) жұмыстарында жалғасын тапты. 1958 жылы ол нейронды желінің моделін ұсынды. Ф. Розенблат У. Маккаллоктың және У. Питтстің моделіне оны оқытуға мүмкін ететін модификацияға байланыс қабілеттілігін енгізді. Бұл модель персептрон деп аталды. Алғашында персептрон процессорлы элементтің қатты шекаралы функциялы, бинарлы немесе көпбелгілі кірістері бар бір қабатты құрылымынан тұратын. Одан кейін бұл модель жеткілікті түрде дамытылды. Алғашында үлкен энтузиазммен қабылданған персептрон ірі ғылыми беделділер жағынан интенсивті шабуылға ұшырады.
1982 жылы америкалық биофизик Дж. Хопфилд (Hopfield J.) кейінірек оның есімімен аталған нейронды желінің негізгі нұсқасын ұсынды. Джн Хопфилдтің желісі қабаттар арасында кері байланысқа ие, бұл оның жалпылау қасиеттерін ұлғайтады. Мұндай желілер үлгілерді танып білуде кең қолданысқа ие болды. Келесі жылдары кері тарату, екі бағытты ассоциативті жады, өздігінен ұйымдастырылатын карталар және т.б. көптеген эффективті алгоритмдер мен нейрожелілер архитектуралары табылды. Кез келген нейронды желіні құру есептеудің үлкен көлемін қажет етеді (желіні оқыту, әдетте, итерационды процесс болып табылады). Сондықтан компьютерлердің есептеу қуаттылығының артуымен ғана нейрожелілерді тәжірибеде қолдануға мүмкіндік туды. Бұл нейрожелілік деректерді өңдеу принциптерін қолданатын бағдарламалардың кеңінен таралуына мүмкіндік берді.
Нейрожелілер мен нейромодельдеу пайда болып, өскен негізгі идеялар келесілер болып табылады:
1. Нейронды желі тірі ағзалардың жүйке жүйесінің құрылымы мен қасиеттерін имитациялайды: ол өзара байланысқан қарапайым бір типті есептеу элементтерінің (нейрондар) көп мөлшерінен тұрады және әр бөлек нейронның мүмкіндіктерімен салыстырғанда иілгіш және күрделі мінез-құлыққа ие.
2. Нейрожелі кірісте кіріс сигналдардың жиынын қабылдайды және оларға сәйкес қандай да бір есептің шешімі болып табылатын жауапты (шығыс сигналдарын) шығарады.
Әр нейрон кіші көлемді жұмыс орындайды - мысалы, оған келген кейбір салмақты коэффициенттері бар сигналдарды суммалайды және бұл кіріс деректерінің суммасын сызықты емес түрлендіреді. Басқа таралған нұсқасы кейбір есте сақталған эталоннан жоғары шығыс сигналын шығаратын нейрон-детектор болып табылады.
Нейрондар қабаттар тізбегіне топтасады: кіріс сигналдар бірінші қабатқа түседі және тізбектелген түрде соңғысына дейін барлық қабаттардан өтеді. Бірақ ішкі сигналдардың кейбір жиынының циркуляциясын қамтамасыз ететін рекурентті құрылымдар да болады.
Желінің кейбір қабатын құрайтын нейрондар параллельді режимде жұмыс істейді. Қабаттар мен нейрондар санының өзгеруі қолданылып отырған есептеу техникасының (процессор, микроконтроллер, нейрокомпьютер, т.б.) ерекшеліктеріне сәйкес ортақ параллельді-тізбекті есептеу көлемін максималды эффективті түрде баптауға мүмкіндік береді.
Желі құрылымында нейрондардан басқа иерархияның немесе абстракцияның өзге деңгейлерінде параллельді және тәуелсіз жұмыс істейтін элементтерді атап өтуге болады. Жасанды нейронда оның синапстары параллельді жұмыс істейді, желіде көпқабатты нейронды бағандар параллельді жұмыс істеуі мүмкін.
Нейрожелінің жұмыс процесі сыртқы сенсорлы деректердің ағынының қозғалысын (қандай да бір кірістен шығысқа) және осы деректердің түрленуін ұсынады. Жалпы жағдайда деректер ағыны (сигналдар) қиылысатын және кері байланыстарды формалай алады.
Жасанды нейрожелі оның биологиялық прототипі тәрізді үйрене алады: ол нейрондардың және өзінің құрылымының ішкі адаптивті параметрлеріне ие, оларды ауыстыру арқылы өзінің мінез-құлқын өзгерте алады.
Бағдарламалау орны нейронды желіні үйренуді алады: деректерді анализдеудің келесі есебіне көшу барысында қандай да бір жаңа алгоритмді бағдарламалау қажет емес - жай ғана әмбебап нейрожелілі жабдықты алып, жаңа нейрожеліні құрып, үйрету керек (құрылымы, өлшемдері және басқа да ерекшеліктері осы жаңа есепке сәйкес келетін).
Нейронды желі есепті шешуге әрқайсысы нейрожелінің кіріс сигналдарының өлшемдерін сипаттайтын және осы кіріс сигналдарда жауапты талап ететін қандай да бір кітапта - оқиғалар жиындарында үйренеді. Кітап белгілі нәтижелі эталонды оқиғалар жиынын береді, ал нейронды желі кіріс сигналдар мен талап етілетін жауаптар арасында тәуелділіктерді есте сақтауға тиіс.
Үйренген нейрожелі қабылданған шешім әдісін жалпылап (интерполярлау және экстраполярлау), жаңа оқиғаларға кітапқа енбеген болжам шығара алады - кіріс сигналдардың өлшемдерінің тех байланысын.
Оқытушымен үйренуден басқа (кейбір оқиғалар жиыны үшін белгілі эталонды жауаптар туралы ақпарат негізінде) оқытушысыз үйрену де болады - бұл кезде оқиғаларды сипаттау анализі болады және тенденциялар іздестіріледі (мысалы, ұқсас оқиғалар топтарға топ ішіндегі деректер бір-біріне басқа топтағылардағы деректерге қарағанда көбірек ұқсас болатындай бірігеді).
Нейронды желі адамда рәсімделген, жылдам немесе нақтылықпен жұмыс істей алатын теориялық және эмпирикалық алгоритмдердің болмауы себебінен есептерді шешуге үйрене алады. Үйретуші деректермен қатар, нейрожелі оқу барысында төмендетуге немесе оптимизациялауы тиіс есепті шешудің сапасының кейбір критерийін беру ғана талап етіледі.
Нейрожелінің құрылымы есепке адаптациялануы мүмкін. Егер нейрожелі шешімнің қажетті нақтылығын қанағаттандыра алмаса, қосымша нейрондар, тіпті, нейрондар қабаттары қосылуы мүмкін. Егер бастапқы желі артық болса, нейрожеліден керек емес нейрондар шығарылуы мүмкін. Нейрожелі есеп үшін кіріс сигналдарды өзі шығарып, шешім сенімділігін арттыра алады. Нейронды желінің өлшемінің коррекциясы алдында үйретілген әдістерді толық ұмытуға алып келмейді, бұл нейрожеліні оқыту процесін жылдамдатады.
Нейрожелілер бостандықтың үлкен көлемді деңгейлеріне ие күрделі сызықты емес жүйелер болып табылады. Олардың ақпаратты өңдейтін қағидасы фон-нейман архитектурасы негізіндегі процессорлы компьютерлерде (ЖӘНЕ, НЕМЕСЕ, НЕ логикалық базисті) қолданылатын принциптен өзгеше.
Нейронды желілер үшін деректерді жинастыру. Егер есеп нейронды желі көмегімен шешілетін болса, онда оқу үшін барлық ақпараттарды жинау керек. Оқытылатын деректер жиыны кіріс және шығыс айнымалыларының шамалары көрсетілген бақылау жиынынан тұрады. Шешуге тиіс алғашқы сұрақ - айнымалылардың қандай түрін қолдану мен қанша бақылауды жинау.
Айнымалыларды таңдау (алғашқы) интуитивті түрде жүзеге асырылады. Бұл пәндік облыстағы сіздің жұмыс тәжірибеңіз қай айнымалылардың маңызды екенін анықтауға көмектеседі.
Нейронды желілер белгілі бір шектелген диапазонда жатқан сандық деректермен жұмыс істей алады. Бұл деректерде қалдырылып кеткен шамалар және ақпарат сандық емес болған жағдайдағы қалыпты емес масштабқа ие кезінде қиындықтарды тудырады. STNeuralNetwork пакетінде бұл қиындықтарды жеңетін жабдықтар бар. Сандық деректер желіге сай диапазонда масштабталады, ал қалдырылып кеткен шамаларды осы айнымалының орта шамасына (немесе басқа статистикаға) барлық бар оқытушы мысалдармен алмастыруға болады (Bishop, 1995).
Бұдан қиынырақ мәселе сандық емес деректермен жұмыс істеу болып табылады. Сандық емес деректер Жыныс = {Ер, Әйел} сияқты номиналды айнымалыларымен жиі ұсынылады. Номиналды шамалы айнымалыларды сандық түрде ұсынуға болады және ST Neural Network жүйесінде мұндай деректермен жұмыс істеуге арналған жабдықтар бар. Алайда нейронды желілер түрлі шамаларға ие бола алатын номиналды айнымалылармен жұмыс барысында жақсы нәтижелерді бермейді.
Мысалы, біз нейронды желіні жылжымайтын объекттердің бағасын бағалауға үйреткіміз келеді деп ойлайық. Үйдің бағасы қаланың қай ауданында орналасқанына байланысты. Қала өзіндік атауға ие бірнеше ондаған аудандарға бөлінуі мүмкін. Бұл кезде ауданды белгілеу үшін номиналды шамалы айнымалыны қолдану қалыпты болып көрінуі мүмкін. Өкінішке орай, бұл жағдайда нейронды желіні оқыту өте қиын болады, мұның орнына әр ауданға белгілі бір рейтингті берген дұрыс (мамандардың баңасына сүйене отырып).
Басқа типті сандық деректерді не сандық формаға түрлендіруге болады, не елемеуге болады деп жариялауға болады. Қажет болған жағдайда мезгіл мен уақыт шамаларын олардан алғашқы мезгілді (уақытты) азайта отырып, сандыққа түрлендіруге болады. Ақша қосындыларының белгілерін түрлендіру қиын емес. Ерікті мәтіндік өрістермен (мысалы, адамдардың фамилияларымен) жұмыс істеуге болмайды, оларды елемеуге болатындай жасау керек.
Желіні оқыту үшін қанша бақылауға ие болу керек туралы сұрақ оңай емес болып табылады. Желінің мөлшерлерімен бақылауға қажетті санды байланыстыратын эвристикалық ережелердің тізбегі белгілі (олардың ең қарапайымы бақылау саны желідегі байланыс санынан он есе үлкен болуы тиіс деп айтады). Шын мәнінде бұл сан нейронды желі жүргізуге тырысып жатқан бейненің қиындығына да тәуелді. Айнымалылардың көбеюімен талап етілетін бақылаулар саны сызықты емес түрде өседі, сондықтан айнымалылардың жеткілікті көлемінде (мысалы, елу) бақылаулардың үлкен саны талап етілуі мүмкін. Бұл қиындық өлшемділік қарғысы деген атпен белгілі және ол туралы осы бөлімде айтылады.
Көптеген есептер үшін жүздеген немесе мыңдаған бақылаулар болады. Қиын есептер үшін бұдан да көбірек көлем талап етілуі мүмкін, алайда жүзден төмен бақылау жеткілікті болатын есеп өте сирек кездесуі мүмкін. Егер деректер айтылған көлемнен аз болса, Сізде желіні оқу үшін ақпарат жеткіліксіз және деректерге кейбір сызықты модельді істеп көрген дұрыс. ST Neural Network пакетінде сызықты модельдерді жасау үшін жабдықтар бар.
Көптеген есептерде сенімді емес деректермен жұмыс істеуге тура келеді. Кейбір айнымалылардың шамалары шумен нашарлауы немесе болмауы мүмкін. ST Neural Network пакеті қалдырылған шамалармен жұмыс істеу үшін арнайы жабдықтарға ие (олар осы айнымалының орта шамасына немесе басқа статистикаларына алмастырылуы мүмкін). Сондықтан, егер сізде көп деректер болмаса, қалдырылған белгілермен жағдайларды қарастыруды қосуыңызға болады. Сонымен бірге, нейронды желілер шуға төзімді болып табылады. Алайда бұл төзімділіктің шегі бар. Мысалы, шығарындылар, яғни, қандай да бір айнымалының қалыпты щамалар облысынан өте алыс жатқан белгілер оқыту нәтижесін азайтуы мүмкін. Мұндай жағдайларда оларды тауып, жойған дұрыс (не сәйкес бақылауларды жою арқылы, не шығарындыларды жіберілген шамаларға түрлендіру арқылы). Егер оларды табу қиын болса, ST Neural Network пакетіндегі мүмкіндіктерді қолдануға болады.

1.2 Нейронды желілер медицинада
Жасанды нейронды желілер, биологиялық тәріздес, көптеген байланыстарға ие параллель функцияланатын қарапайым процессорлардың үлкен көлеміне ие есептеу жүйесі болып табылады. Мұндай желілерді құрастыру барысында әдетте биологиялық аналогтардан ерекшеленетін айтарлықтай қарапайымдылау қатары жасалғанымен, жасанды нейронды желілер таңқаларлық қаситтер көлемін ұсынады.
Нейронды желілер өз мінезін оларды қоршайтын ортаның күйіне байланысты өзгерте алады. Кіріс сигналдарының анализінен кейін (талап етілетін шығыс сигналдарымен қоса) олар дұрыс реакцияны қамтамасыз ету үшін өздігінен бапталып, оқытылады. Оқытылған желі оған түрлі кедергілерге ие бейнені дұрыс көруге мүмкіндік беретін кіріс деректердің кейбір ақаулықтарына төзімді болуы мүмкін.
Өткен ғасырдың 50-ші жылдарында зерттеушілер тобы биологиялық және физиологиялық әдістерді біріктіре отырып, алғашқы жасанды нейронды желілерді құрастырды. Сол кезде жасанды интеллектке кілт табылды деп есептелінді. Бірақ бұл желілер жасанды көзқарас облысынан ауа-райын болжау және деректер анализі сияқты кейбір есептерді эффективті түрде шешкенімен, мұндай ой өзгертілді. Желілер өздері сәтті шығарып жатқан есептерге ұқсас есептерді шешуге қабілетсіз болды. Осы уақыттан бастап интенсивті анализ периоды басталды. Теориялар құрылып, теоремалар қатары дәлелденді. Бірақ сол кездің өзінде күрделі математикалық әдістердің қолданылуынсыз ірі жетістіктерге жету қиын екені түсінікті болды.
70-жылдардан бастап ғылыми журналдарда жасанды нейронды желілерге қатысты мақалалар жариялана бастады. Біраз уақыттан кейін негізінде көптеген желілер құрылған жақсы теориялық фундамент қалыптасты. Соңғы екі онжылдықта құрастырылған теория іргелі есептердің шешімі үшін кең қолданыла бастады. Жасанды нейронды желілерді конструкциялау үшін іргелі бағдарламалық қамтаманы құрастырумен айналысатын фирмалар пайда болды. Сонымен бірге, 90-шы жылдар жасанды нейронды желілердің бизнеске келуімен ерекше болды. Бұл облыста, өнімге сұранысты болжаудан банк клиенттерінің төлеу қабілеттіліктерін анализдеуге дейін, олар көптеген есептерді шешу барысында өздерінің эффективтілігін көрсетті.
Бүгінгі таңда түрлі есептерді шешуге бағытталған, көптеген функциялау қағидаларына ие нейронды желі конфигурацияларының үлкен көлемі бар.
Оқуға қабілеттілік мидың негізгі қасиеті болып табылады. Жасанды нейронды желілер үшін оқыту ретінде қойылған есептің эффективті шешімі үшін синаптикалық байланыстардың желі архитектурасын баптау болып есептелінеді. Әдетте нейронды желіні оқыту кейбір таңдалымда жүзеге асырылады. Қандай да бір алгоритм бойынша жүретін оқыту процесінің мөлшері бойынша желі кіріс сигналдарға жақсырақ (дұрысырақ) жауап қайтаруы тиіс.
Түрлі есептерді шешуге бағытталған оқыту алгоритмдерінің үлкен көлемі бар.
Көпөлшемді статистика қағидаларына негізделген математикалық модельдеу әдістері диагностика, болжау және тәжірибелі медицинада ішкі ауру түрлерінің терапиясы үшін қолданылуы қиын. Бұл мақсаттар үшін факторлы, кластерлі, регрессионды және дискриминантты анализдің қолданылуы жоғары деңгейдегі ғылыми қызығушылықты тудырады.
Тәжірибелік мақсатта дәрігерлер өз науқастарының диагнозын қоюы, болжауы және емдеуі үшін табылған математикалық модельдерді қолданбайды. Бұл модельдердің тәжірибеде қолданылуының қиындылығымен түсіндіріледі.
Нейрокомпьютерлердің немесе адам миының нейрондарының жұмысын имитациялайтын бағдарламалардың - нейронды желілердің медицинада қолданылуы дәрігерлердің жұмысын жеңілдетіп, жылдамдатады. Мұндай жүйелер мысалдарға негізделіп, өздігінен оқуға және есептердің белгілі бір кластарын шешуге қабілетті. Нейрокомпьютерлердің бұл қасиеті, әсіресе, көптеген есептер формализацияға ұшырамайтын, ал кіріс деректері жиі толық емес болатын медицинада өзекті.
Оқыту барысында нейронды желі медициналық есептерлі шешу тәжірибесіне ие болғандықтан, деректер базасы білім базасына модифицияланады. Тәжірибенің болуы дұрыс шешім мүмкіндігін мұндай жағдай бұрын кездеспесе де, алдын ала қарастырады. Яғни, дәрігердің жұмысы сияқты аналогия бақыланады.
Біздің жағдайымызда оқытушы таңдалым ретінде науқас аурулары жайлы 180 мәлімет қолданылды. Нейронды желінің тәжірибеде қолданылуы миокард инфаркті бар науқастардың рискстратификациясы барысында оның жоғары эффективтілігін көрсетті. 90% жағдайда диагнозды қоюда және осыған ұқсас науқастардың асқынуларын болжауда негізгі болып табылған 15 параметр анықталды.
Нейрожелілік мамандық жүйелердің артықшылықтары көрініп тұр. Дәрігерге (қолданушыға) кіріс деректері мен ақырлы шешім арасында ешқандай байланыс орнатудың қажеті жоқ. Дәрігер ақпараттың классикалық статистикалық түрлендірілуі мен математикалық модельдің тексерісіне уақыт кетірмейді. Нейрожелілер категориялық болып табылмайды. Нейрожелілер шешімді дәрігерге алынған нәтижені (диагнозды) түрлендіру мүмкіндігінде сенімділік деңгейімен шығарады. Ол шешімді өте жылдам (секунд ішінде) береді. Бұл нейрожеліні диалогтық режимде түрлі динамикалық жүйелерде қолдануға мүмкіндік береді. Нейронды бағдарламалардың мұндай ерекшеліктерінің барлығы миокард инфаркті бар науқастардың рискстратификациясы үшін ортақ медициналық мамандандырылған жүйені құруды жеңілдетуге мүмкіндік береді.
1.4 Үлкен деректер көлемі
Big Data (үлкен деректер) - үлкен көлемді құрылымдалған және құрылымдалмаған деректерді өңдеудің және адаммен қабылданатын, үздіксіз өсім, есептеу желісінің көп санды түйіндері бойынша үлестіру шарттарында эффективті нәтижелерді алу үшін 2000-ші жылдардың соңында құралған, деректер қорларын басқарудың дәстүрлі жүйелеріне альтернативті әдістердің, құралдардың және тәсілдердің сериясы.
Үлкен деректер үшін анықтаушы сипаттамалар ретінде үш V белгіленеді: көлем (ағылш. volume, физикалық көлемнің шамасы мағынасында), жылдамдық (ағылш. velocity, өсім жылдамдығы, жоғары жылдамдықты өңдеудің және нәтижелерді алудың қажеттілігі ретінде), әртүрлілік (ағылш. variety, түрлі типті құрылымдалған және құрылымдалмаған деректерді бір уақытта өңдеудің мүмкіндігі ретінде).
Ақпаратты жинаудың жылдам қарқынымен бірге деректерді анализдеу технологиясы да даму үстінде. Егер бірнеше жыл бұрын клиенттерді ұқсас сипаттамалар бойынша топтарға сегменттеу ғана мүмкін болса, қазіргі таңда әр клиент үшін нақты уақыт режимінде, мысалы, нақты тауарды іздеу үшін оның Ғаламтор желісі бойынша әрекеттерін анализдеп, модельдерді құрастыруға болады. Тұтынушының қызығушылықтары анализделуі мүмкін және құрастырылған модельмен сәйкес қолайлы жарнама немесе нақты ұсыныстар шығарылуы мүмкін. Модель нақты уақыт режимінде бапталып, қайта құрастырыла да алады, бұл бірнеше жылдар бұрын мүмкін емес болған еді.
Телекоммуникация облысында, мысалы, ұялы телефондардың және олардың иелерінің физикалық орналасуын анықтау үшін технологиялар дамыған және жақын арада 2002 жылғы Ерекше пікір ғылыми-фантастикалық фильмінде сипатталған, сауда орталықтарындағы жарнамалық ақпараттың бейнеленуі сол маңайда өтіп жатқан нақты тұлғалардың қызығушылықтарына сәйкес шығады деген ой шындыққа айналуы мүмкін.
Сонымен бірге, жаңа технологияларды қолданудың кемшіліктері де болуы мүмкін. Мысалы, кейде шындықтың маңызды түсінігін беретін сиретілген деректер (Sparse data) тауларды, көбінесе, жоқ ақпаратты сипаттайтын үлкен деректерге (Big Data) қарағанда құндырақ болады.
Заманауи талқылауларда Big Data түсінігі терабайттардағы деректер ретінде сипатталады.
Тәжірибеде (егер сөз гигабайттарда немесе терабайттарда болса) мұндай деректерді сақтау және оларды дәстүрлі деректер қорларының және стандартты құрылғылардың (деректер қорларының серверлері) көмегімен басқару жеңіл.
Ережеге сәйкес, Big Data талқылауы көлемі жай бірнеше терабайттан анағұрлым үлкенірек деректер қорларының айналасында (және осындай қорларға негізделген анализді жүргізуге) бағытталған. Атап айтқанда, кейбір деректер қорлары мыңдаған терабайттарға дейін, яғни, петабайттарға дейін (1000 терабайт = 1 петабайт) өсуі мүмкін. Петабайттардан жоғары деректердің жиналуы эксабайттарда өлшенуі мүмкін, мысалы, бүкіл әлем бойынша өндірістік секторда 2010 жылғы бағалар бойынша жалпы көлемде 2 эксабайт жаңа ақпарат жиналған.
Деректер өте интенсивті түрде жиналатын салалар бар. Мысалы, электростанция сияқты өндірістік сферада деректердің үздіксіз ағыны әр минут немесе әр секунд сайын кейде ондаған мың параметрлер үшін түрлендіріледі.
Сонымен бірге, соңғы бірнеше жылдары коммуналды қызметтерге электроэнергияны тұтынуды әр минут немесе әр секунд сайын жеке өлшеуге мүмкіндік беретін smart grid деп аталатын технологиялар ендірілуде. Деректер жылдар бойымен сақталуы керек қосымшалардың мұндай түрі үшін жиналған мәліметтер Extremely Big Data ретінде классификацияланады. Коммерциялық және мемлекеттік секторлардың арасында қорлардағы деректердің көлемі жүздеген терабайт немесе петабайт болатын Big Data қосымшаларының саны да артуда.
Заманауи технологиялар адамдарды және олардың әрекетін түрлі әдістермен аңдуға мүмкіндік береді. Мысалы, ғаламторды қолданған кезде Ғаламтор-дүкендерде немесе Walmart сияқты (Уикипедияға сәйкес Walmart деректер қорлары 2 петабайттан аса көлемге бағаланады) дүкендердің ірі желілерінде сатып алуды жүзеге асырамыз немесе қосылған ұялы телефондармен орын ауыстырамыз - біз қимылдарымыздың ізін қалдырамыз, бұл жаңа ақпараттың жиналуына алып келеді.
Жай телефондық қоңыраулардан Facebook (Уикипедияға сәйкес әр ай сайын ақпарат алмасу 30 млрд. бірлікті құрайды) сияқты әлеуметтік желілердің сайттарынан ақпаратты жүктеуге немесе YouTube (Youtube-тың мәліметтеріне сәйкес әр минут сайын 24 сағат видео жүктеледі) сияқты сайттарда видео алмасуға дейін байланыстың түрлі әдістері күн сайын жаңа деректердің үлкен көлемін түрлендіріледі.
Ұқсас тәсілмен жаңа медициналық технологиялар медициналық көмекті көрсетуге қатысты деректердің үлкен көлемін түрлендіреді (нақты уақыттағы суреттер, видео, мониторинг).
Деректердің көлемінің классификациясын келесі түрде ұсынуға болады:
oo деректердің үлкен жиыны: 1000 мегабайттан (1 гигабайт) жүздеген гигабайттарға дейін;
oo деректердің ірі жиыны: 1000 гигабайттан (1 терабайт) бірнеше терабайттарға дейін;
oo big data: бірнеше терабайттардан жүздеген терабайттарға дейін;
oo extremely big data: 1000-нан 10000 терабайтқа дейін = 1-ден 10 петабайтқа дейін.
Big Data-мен байланысты есептердің үш түрі бар:
oo сақтау және басқару. Жүздеген терабайттардағы немесе петабайттардағы деректердің көлемі оларды дәстүрлі реляционды деректер қорларының көмегімен жеңіл сақтауға және басқаруға мүмкіндік бермейді;
oo құрылымдалмаған ақпарат. Барлық Big Data деректерінің көпшілігі құрылымдалмаған болып табылады, яғни, мәтінді, видеоны, суретті және т.б. қалай ұйымдастыруға болады;
oo big data анализі, құрылымдалмаған ақпаратты қалай анализдеу керек, big data-ның негізінде қалай қарапайым есепті, тереңдетілген болжамдық модельдерді құрастырып, ендіру керек.
Big Data-ны сақтау және басқару. Big Data әдетте үлестірілген файлдық жүйелерде сақталады және ұйымдастырылады. Жалпы алғанда, ақпарат бірнеше (кейде мыңдаған) қатқыл дисктерде, стандартты компьютерлерде сақталады. Карта (map) ақпараттың нақты бөлігі қайда (қай компьютерде жәненемесе дискте) сақталғанын анықтайды. Қателікке тұрақтылықты және сенімділікті қамтамасыз ету үшін ақпараттың әрбір бөлігі әдетте бірнеше рет, мысалы - үш рет сақталады. Сонымен, мысалы, сіз дүкендердің үлкен бөлшектік желісінде индивидуалды транзакцияларды жинадыңыз деп есептейік. Әрбір транзакция туралы жан-жақты мәлімет түрлі серверлерде және қатқыл дисктерде сақталады, ал карта (map) сәйкес келісім жайлы ақпарат қайда сақталатындығын индекстейді. Стандартты құрылғының және ашық бағдарламалық жабдықтардың көмегімен осы үлестірілген файлдық жүйені (мысалы, Hadoop) басқару үшін салыстырмалы түрде петабайт масштабында сенімді деректер қорын жеңіл жүзеге асыруға болады.
Құрылымдалмаған ақпарат. Үлестірілген файлдық жүйедегі жинақталған ақпараттың үлкен бөлігі мәтін, сурет, фотографиялар немесе видео сияқты құрылымдалмаған деректерден тұрады. Бұл өзіндік артықшылықтарға және кемшіліктерге ие.
Артықшылығы мәліметтердің қай бөлігі келесі анализ және шешімді қабылдау үшін өзекті екендігін ескермей, үлкен деректерді сақтаудың барлық ақпаратты сақтауға мүмкіндік беретіндігінде.
Кемшілігі мұндай жағдайларда пайдалы ақпаратты алу үшін мәліметтердің осы ірі жиымын келесі өңдеудің талап етілуінде. Бұл операциялардың кейбіреулері қарапайым (мысалы, жай есептеулер және т.б.) болуы мүмкін екендігіне қарамастан, басқалар үлестірілген файлдық жүйедегі эффективті жұмыс үшін арнайы құрастырылған күрделірек алгоритмдерді талап етеді.
Сонымен, деректердің жиыны геометриялық прогрессияда өсуі мүмкін болған уақытта ақпаратты алу және осы ақпараттың негізінде әрекет ету мүмкіндігі шектелген және шекке асимптоталық түрде жетеді.
Модельдерді құрастыру, жаңарту үшін, сонымен бірге шешімдерді қабылдау процесін автоматизациялау үшін әдістер мен процедуралардың деректерді сақтау жүйелерімен қатар, осындай жүйелердің кәсіпорын үшін пайдалы және табысты екендігіне кепілдік беру үшін құрастырылғандығы маңызды.

1.5 Data Mining-тегі кластерлік анализ
Data Mining - іргелі статистика, бейнелерді тану, жасанды интеллект, деректер қорының теориясы және т.б. ғылымдардың негізінде пайда болып, дамып жатқан мультидисциплиналық облыс.
Кластеризация объектілердің жиынтығын бір текті топтарға (кластерлерге немесе кластарға) бөлу үшін тағайындалған. Егер берілген таңдамаларды белгілік кеңістіктегі нүктелер ретінде ұсынса, онда кластеризация есебі нүктелерді жиілетуді анықтауға үйлеседі.
Кластеризацияның мақсаты - бар құрылымдарды іздеу. Кластеризация сипаттамалық процедура болып табылады, ол ешқандай статистикалық қорытындыларды жасамайды, бірақ барлау анализін жүргізу және деректердің құрылымын оқу мүмкіндігін береді.
Кластер ұғымы бір мәнді анықталмаған: әрбір зерттеудің өзіндік кластерлері бар. Кластер (cluster) ұғымы жинақтама, топтама ретінде аударылады. Кластерді ортақ қасиеттерге ие объектілердің тобы ретінде сипаттауға болады.
Көпөлшемді анализдің әдістері - сипаттамалардың үлкен санымен сипатталатын әлеуметтік-экономикалық процестерді зерттеудің ықпалдырақ сандық құралы. Оған кластерлі анализ, таксономия, бейнелерді тану, факторлық анализ жатады.
Кейде кластерлі анализ әдісін әдебиетте таксономия, сандық классификация, өзіндік оқытумен тану және т.б. деп атайды.
Кластерлі анализ алғашқы қолданысын социологияда тапты. Кластерлі анализ атауы ағылшын сөзінен cluster - топтама, жинақтама шығады. Кластерлі анализ пәні алғаш рет 1939 жылы анықталды және оның сипаттамасын Трион жасады. Кластерлі анализдің басты тағайындалуы - зерттелетін объектілердің және белгілердің жиынын сәйкесінше бір текті топтарға немесе кластерлерге бөлу. Бұл деректердің классификациясы және сәйкес құрылымды анықтау есебі оның ішінде шешілетіндігін білдіреді. Кластерлі анализдің әдістерін түрлі жағдайларда, тіпті сөз барлығы сандық ұқсастық бойынша топтардың құрастырылуына үйлесетін жай топтастыру жайлы жүріп жатса да қолдануға болады.
Кластерлі анализдің үлкен артықшылығы объектілерді бөлуді бір параметр бойынша емес, белгілердің толық жиыны бойынша жүргізуге мүмкіндік беруінде. Сонымен бірге, кластерлі анализ көптеген математико-статистикалық әдістерге қарағанда қарастырылатын объектілердің түріне ешқандай шектеулер қоймайды және кез келген түрдегі бастапқы мәліметтердің жиынын қарастыруға мүмкіндік береді. Бұл үлкен мағынаға ие, мысалы, көрсеткіштер дәстүрлі эконометрикалық әдістерді қолдануды қиындататын түрге ие болғанда конъюнктураны болжау үшін.
Кластерлі анализ ақпараттың жеткілікті үлкен көлемін қарастыруға және кенеттен қысқартуға, әлеуметтік-экономикалық ақпараттың үлкен жиымдарын сығуға, оларды ықшамды және көрнекті қылуға мүмкіндік береді.
Кластерлі анализ экономикалық дамуды (мысалы, жалпы шаруашылық және тауарлық конъюнктура) сипаттайтын уақытша қатарлардың жиынтықтарына қатысты үлкен мағынаға ие. Мұнда сәйкес көрсеткіштердің мәндері жеткілікті жуық болған периодтарды бөлуге, сонымен бірге динамикасы ұқсас уақытша қатарлардың топтарын анықтауға мүмкіндік береді.
Кластерлер қиылыспайтын немесе эксклюзивті (non-overlapping, exclusive) және қиылысатын (overlapping) болуы мүмкін. Қиылыспайтын және қиылысатын кластерлердің схемалық бейнесі 1.1-ші суретте көрсетілген.

1.1-ші сурет - Қиылыспайтын және қиылысатын кластерлер
Кластерлі анализдің түрлі әдістерін қолданудың нәтижесінде түрлі формалы кластерлер алынуы мүмкін. Мысалы, кластерлер ұзын тізбектермен ұсынылған тізбекті типті кластерлердің, ұзартылған формалы кластерлердің және т.б. болуы мүмкін, ал кейбір әдістер кез келген формалы кластерлерді құрастыра алады. Түрлі әдістер белгілі бір мөлшерлі (мысалы, кіші немесе ірі) кластерлерді құрастыруға немесе деректер жиынында түрлі мөлшерлі кластерлердің болуын болжауға талпынуы мүмкін. Кластерлі анализдің кейбір әдістері шуларға немесе шығарындыларға ерекше, басқалары - азырақ сезімтал.
Кластеризацияның түрлі әдістерін қолданудың нәтижесінде бірдей емес нәтижелер алынуы мүмкін, бұл қалыпты және белгілі бір алгоритмнің жұмысының ерекшелігі болып табылады. Бұл ерекшеліктерді кластеризация әдісін таңдау барысында ескерген дұрыс. Кластерлі анализдің барлық қасиеттері оның әдістеріне арналған бөлімде толығырақ қарастырылады. Бүгінгі таңда кластеризацияның жүздеген түрлі алгоритмдері құрастырылған. Кейбір, кеңірек қолданылатын алгоритмдер екінші бөлімде сипатталады.
Мысалы, 14 мысалдардан тұратын, екі X және Y белгісі бар А деректердің жиыны болсын. Деректердің жиынының мысалы 1.1-ші кестеде келтірілген.
Мысалдың №
X белгісі
Y белгісі
1
27
19
2
11
46
3
25
15
4
36
27
5
35
25
6
10
43
7
11
44
8
36
24
9
26
14
10
26
14
11
9
45
12
33
23
13
27
16
14
10
47
1.1-ші кесте - А деректердің жиыны
Кластерлі анализді циклдық түрде қолдануға болады. Бұл жағдайда зерттеу қажетті нәтижелерге қол жеткізілгенге дейін жүргізіледі. Бұл кезде әрбір цикл мұнда кластерлі анализдің келешек қолданысының бағытын және әдістерін қатты өзгертуге қабілетті ақпаратты бере алады. Бұл процесті кері байланысты жүйемен ұсынуға болады.
X және Y айнымалыларын 1.2-ші суретте бейнеленген шашырау диаграммасының түрінде көрсетейік.

1.2-ші сурет - X және Y айнымалыларының шашырау диаграммасы
Суретте ұқсас параметрлердің бірнеше топтары бар. X және Y мәндері бойынша бір-біріне ұқсас мысалдар (объектілер) бір топқа (кластерге) тиісті; түрлі кластерлі объектілер бір-біріне ұқсас емес.
Кластерлердің ұқсастығы мен айырмашылығын анықтау үшін критерий шашырау диаграммасындағы нүктелердің арасындағы қашықтық болып табылады. Бұл ұқсастықты өлшеуге болады, ол графиктегі нүктелердің арақашықтығына тең. Жақындықтың өлшемі деп те аталатын кластерлердің арасындағы қашықтықтың өлшемін анықтаудың бірнеше әдістері бар. Ең кең таралған әдіс - жазықтықтағы екі i және y нүктелерінің арасындағы евклидтік қашықтықты олардың X және Y координаталары белгілі болғанда есептеу.
Ескерту: екі нүктелердің арасындағы қашықтықты білу үшін олардың әрбір ось бойынша координаталарының айырмасын алып, оны квадраттап, алынған мәндерді барлық осьтер үшін қосып, қосындыдан квадраттық түбір алу керек.
Осьтердің саны екіден артық болғанда қашықтық келесі түрде есептеледі: координаталардың айырмасының квадраттарының қосындысы кеңістіктегі осьтердің (өлшемдердің) санына тең қосылғыштардан тұрады. Мысалы, үш өлшемді кеңістіктегі екі нүктенің арақашықтығын табу керек болсын.

1.3-ші сурет - Үш өлшемді кеңістіктегі екі нүктенің арақашықтығы
Кластер келесі математикалық сипаттамаларға ие: центр, радиус, орташа квадраттық ауытқу, кластердің мөлшері.
Кластердің центрі - бұл айнымалылардың кеңістігіндегі нүктелердің орташа геометриялық орны.
Кластердің радиусы - нүктелердің кластердің центрінен максималды қашықтығы.
Алдыңғы бөлімдердің бірінде көрсетілгендей кластерлер қиылысатын болуы мүмкін. Мұндай жағдай кластерлердің қабаттасуы болғанда пайда болады. Бұл жағдайда математикалық процедуралардың көмегімен объектті екі кластерлердің біріне жатқызу мүмкін емес. Мұндай объектілер даулы деп аталады.
Даулы объект - бұл ұқсастық мөлшерімен бірнеше кластерлерге жатқызылуы мүмкін объектілер.
Кластердің мөлшері не кластердің радиусы, не объектілердің осы кластер үшін орташа квадраттық жуықталуы бойынша анықталуы мүмкін. Егер объектіден кластердің центріне дейінгі қашықтық кластердің радиусынан кіші болса, объект кластерге жатқызылады. Егер бұл шарт екі және одан да көп кластерлер үшін орындалса, объект даулы болып табылады.
Берілген есептің бір мәнсіздігі сарапшымен немесе аналитикпен шешілуі мүмкін.
Кластерлі анализдің жұмысы екі болжамға негізделеді. Бірінші болжам - объектінің қарастырылып отырған белгілері объектілер пулының (жиынтықтың) кластерлерге бөлінуіне жол береді. Бөлімнің басында шкалалардың салыстырылуы қарастырылды, бұл екінші болжам болып табылады - белгілер масштабын немесе өлшем бірліктерін таңдаудың дұрыстығы.
Кластерлік анализде масштабтың таңдалуы үлкен мағынаға ие. Мысалды қарастырайық. А деректер жиынтығындағы х белгісінің мәліметтері y белгісінің мәліметтерінен екі есе үлкен болсын: х айнымалысының мәндері 100-ден 700-ге дейінгі диапазонда, ал y айнымалысының мәндері - 0-ден 1-ге дейінгі диапазонда.
Сонда, объектілердің қасиеттердің кеңістігіндегі орнын бейнелейтін нүктелердің арақашықтығын есептеу барысында үлкен мәндерге ие айнымалы, яғни, х айнымалысы кіші мәндерге ие айнымалыны, яғни, y айнымалысын толығымен басқарады. Осылайша белгілерді өлшеу бірліктерінің бір тексіздігінен нүктелердің арасындағы қашықтықты дұрыс есептеу мүмкін емес болады. Бұл мәселе айнымалылардың алдын ала стандартизациясының көмегімен шешіледі.
Стандартизация (standartization) немесе нормалдандыру (normalization) барлық түрлендірілген айнымалыларды мәндердің жалпы диапазонына осы мәндердің нақты белгінің белгілі бір қасиеттерін бейнелейтін қандай да бір шамаға қатынасы арқылы өрнектеу жолымен алып келеді. Бастапқы мәліметтерді нормалдандырудың түрлі әдістері бар.
Екі кең таралған әдістер:
oo бастапқы мәліметтерді сәйкес айнымалылардың орташа квадраттық ауытқуына бөлу;
oo Z-салымды немесе стандартталған салымды есептеу.
Айнымалылардың стандартизациясымен бірге олардың әрқайсысына сәйкес айнымалының маңыздылығын көрсететін белгілі бір маңыздылық коэффициентін немесе салмағын беру нұсқасы бар. Салмақтар ретінде пәндік облыстың сарапшы-мамандарына сауалнама өткізудің барысында алынған сараптамалық бағалар болуы мүмкін. Нормалданған айнымалылардың сәйкес салмақтарға алынған жүргізулері көп өлшемді кеңістікте нүктелердің арасындағы қашықтықты айнымалылардың бірдей емес салмағын ескере отырып алуға мүмкіндік береді.
Тәжірибелердің барысында сараптамалық бағалардың есебімен немесе оларсыз алынған нәтижелердің салыстырылуы және олардың ең жақсысының таңдалуы мүмкін.
Әлеуметтік-экономикалық болжамның есептерінде кластерлі анализдің басқа сандық әдістермен ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Нейрондық желілерге кіріспе
Нейрожүйе
Жасанды интеллект және нейрондық желілер
Динамикалық хаос радиотехникалық генераторлардың негізінде нейрондық торды құру
Жасанды интеллекттің бастаулары
Компьютерлік желілер жайында мәліметтер
Жасанды интеллект туралы
Нейронды желілер тарихы туралы
Сараптама жүйелерінің мысалдары
Жасанды нейрондық желілер
Пәндер