Кластерлік талдау ұғымы
Кластерлік талдау.
1.1. Кластерлік талдау ұғымы
Әлеуметті - экономикалық құбылыстарды анықтауда зерттеуші олардың сиппаттама көпөлшемдігімен жиі кездеседі. Нарықты сегменттеу жағдайларында, көпөлшемді көрсеткіштер бойынша мемлекеттердің типологиясын құруда, экономикалық дағдарысты болжамдауда және т.б. жағдайдарға тап болады.
Кластерлік талдаудың негізгі тағайындалуы - зерттелетін объектілер мен белгілер жиынтығының сәйкес біртекті топ немесе кластерлерге бөлінуі. Бұл дегеніміз, мәліметтерді реттеу есебінің шығарылуы және оның құрамдас бөліктерінің анықталуы. Кластерлік талдау әдісін, барлық мәліметтер санды бірдей қасиеттері бойынша топтасуға жинақталатын жағдайда да қолдануға болады.
Кластерлік талдаудың негізгі қасиеттерінің бірі - бұл талдау объектілердің бір көрсеткіші бойынша ғана емес, сонымен қатар барлық жинақталған белгілер бойынша зерттеуге, әлеуметті - экономикалық ақпараттың көпөлшемді санымен жұмыс атқаруға және оны бірден қысқартуға мүмкіндік береді.
Кластерлік талдаудың негізгі есебі Х жиынтығында қамтылған мәліметтер негізінде, G объектілер жиынтығын m бөлшектерге (m - бүтін сан), Gj әр объектілер бір тек ғана бір ішкі жиын бөлінуіне тиісті болатын, сонымен қатар бірдей кластерлерге тиісті объектілер жинақты болатындай және әр түрлі кластерлерге тиісті объектілер әр текті болып бөлінетін Q1, Q2, ...,Qm кластерлерді айтамыз.
Мысалы, G - n мемлекеттерден тұратын болсын, әр біреуі ІҰӨ жан басына шаққанда (F1) сипатталады, 1 мың адамға М автокөлік санымен (F2), жан басына шаққанда электроэнергияның тұтынылуымен (F3), жан басына шаққанда болаттың тұтынылуымен (F4) және т.б.. Сонда Х1 (өлшем векторы) бірінші мемлекет үшін сипаттама жиынтығы, Х2 - екінші, Х3 үшінші, және т.с.с. Есептің басты мақсаты мемлекеттерді даму деңгейлері бойынша реттеу, бөлу.
Кластерлік талдау есебінің басты мақсаты, кейбір тиімді критерийлер бойынша бөлу. Бұл критерийді мақсаттық функция ретінде қарастыруға болады. Мысалы, мақсаттық функция ретінде ауытқудың ішкі топтық қосындысының квадратын аламыз:
мұндағы xj - j-ші объектінің өлшемі.
1.2. Объектілердің біртекті өлшемдері
Кластерлік талдау есебін шығару үшін жиынтық және әр тектілік ұғымдарын анықтау қажет.
х1 және х2 объектілердің басқарылатын белгілері бір бірімен жақын орналасқан бір топқа тиісті объектілер, біртекті деп аталады, ал берілген нормадан үлкен қашықтықта орналасқан объектілер біртексіз деп аталады. Норма қашықтығы арақашықтық метрикасы деп аталады. Объектілердің бірдей немесе әртүрлі кластерлерге түсуі Хi және Хj арақашықтық ұғымымен анықталады. d(Хi, Хj) кері емес функциясы арақышықтық функциясы (метрика) деп аталады, егер:
а) d(Хi , Хj) ³ 0;
б) d(Хi, Хj) = 0, сонда тек ғана сонда Хi = Хj
в) d(Хi, Хj) = d(Хj, Хi)
Келесі функция арақашықтығы жиі кездеседі:
1. Евклид арақашықтығы d(Хi , Хj) =
2. l1 - норма d1(Хi , Хj) =
3. lp - норма dр(Хi , Хj) =
Евклидтік метрика кеңінен тараған. l1 метрикасы есептеуде қолдану тиімді, ал lp - 1, 2, 3, арақашықтық функцияларын қамтиді.
Х1, Х2,..., Хn n өлшемдер p ' n өлшемді матрица ретінде берілген болсын:
Онда d(Хi , Хj) жұптық векторлар арақашықтығы симметриялық матрица түрінде өрнектеледі:
Арақашықтықққа қарама қарсы ұғымы ол, Gi. және Gj объектілердің жиынтығы (ұқсастығы). S(Хi ; Хj) = Sij кері емес функция жиынтық метрикасы деп аталады, егер:
1) 0Pound S(Хi , Хj)1 Хi ¹ Хj үшін
2) S(Хi , Хi) = 1
3) S(Хi , Хj) = S(Хj , Хi)
Жиынтық өлшемдер мәнін матрица түрінде жазуға болады:
Sij шамасын жиынтық коэффициенті деп атаймыз.
1.3. Кластерлік талдау әдістері
Қолдаңбалы әлеуметті - экономикалық зерттеулерде кластерлік талдаудың екі әдісі кеңінен тараған:
1) иерархиялық алгоритмдер әдісі
2) объектілерді анықтаудың ортаграфикалық әдісі.
Иерархиялық алгоритмдер әдісі.
Иерархиялық алгоритмдер -- жалпыдан жекеге қатысты ұстанымдары бойынша топтасқан алгоритмдер тізбегі.
Иерархиялық алгоритмдер саны, тізбегі, метрика бойынша жіктеледі. Мұндай жағдайда жақын көрші, алыс көрші, орта байланыс әдістері қарастырылады.
Кез келген иерархиялық алгоритмдер әдісінің практикалық жүзеге асырылуы келесі бес амалдан тұрады:
1) хi (i= 1,2, ..., п) барлық байқалатын объектілер тізбегін ki өзіндік кластерлерден тұратын п түрінде өрнектеу.
2) l объектімен т кластер арасындағы dlm ең кіші арақашықтық жұбын анықтау;
3) алынған жұптардың тізбектелген бірлесуі және әр бір қадам деңгейінде кластерлер санын бір бірлікке азаюы.
4) r және кез келген q арасындағы drq арақашықтығын анықтау;
5) 2 -- 4 қадамдарын бір және тек ғана бір ақырғы кластер алынғанға дейін тізбектеп орындау.
Кез келген иерархиялық алгоритмде, байқаланатын ішкітоптық (dij) және топаралас (drq) арақашықтықтар нормаланған немесе алдын ала метрикамен анықталады.
l және m кластерлерін q кластерімен біріктіруі, r түрінде тұжырымдалуы кластер арасындағы арақашықтық формуласы келесі түрде анықталады:
мұндағы dlq, dmq, dlm - сәйкес ... жалғасы
1.1. Кластерлік талдау ұғымы
Әлеуметті - экономикалық құбылыстарды анықтауда зерттеуші олардың сиппаттама көпөлшемдігімен жиі кездеседі. Нарықты сегменттеу жағдайларында, көпөлшемді көрсеткіштер бойынша мемлекеттердің типологиясын құруда, экономикалық дағдарысты болжамдауда және т.б. жағдайдарға тап болады.
Кластерлік талдаудың негізгі тағайындалуы - зерттелетін объектілер мен белгілер жиынтығының сәйкес біртекті топ немесе кластерлерге бөлінуі. Бұл дегеніміз, мәліметтерді реттеу есебінің шығарылуы және оның құрамдас бөліктерінің анықталуы. Кластерлік талдау әдісін, барлық мәліметтер санды бірдей қасиеттері бойынша топтасуға жинақталатын жағдайда да қолдануға болады.
Кластерлік талдаудың негізгі қасиеттерінің бірі - бұл талдау объектілердің бір көрсеткіші бойынша ғана емес, сонымен қатар барлық жинақталған белгілер бойынша зерттеуге, әлеуметті - экономикалық ақпараттың көпөлшемді санымен жұмыс атқаруға және оны бірден қысқартуға мүмкіндік береді.
Кластерлік талдаудың негізгі есебі Х жиынтығында қамтылған мәліметтер негізінде, G объектілер жиынтығын m бөлшектерге (m - бүтін сан), Gj әр объектілер бір тек ғана бір ішкі жиын бөлінуіне тиісті болатын, сонымен қатар бірдей кластерлерге тиісті объектілер жинақты болатындай және әр түрлі кластерлерге тиісті объектілер әр текті болып бөлінетін Q1, Q2, ...,Qm кластерлерді айтамыз.
Мысалы, G - n мемлекеттерден тұратын болсын, әр біреуі ІҰӨ жан басына шаққанда (F1) сипатталады, 1 мың адамға М автокөлік санымен (F2), жан басына шаққанда электроэнергияның тұтынылуымен (F3), жан басына шаққанда болаттың тұтынылуымен (F4) және т.б.. Сонда Х1 (өлшем векторы) бірінші мемлекет үшін сипаттама жиынтығы, Х2 - екінші, Х3 үшінші, және т.с.с. Есептің басты мақсаты мемлекеттерді даму деңгейлері бойынша реттеу, бөлу.
Кластерлік талдау есебінің басты мақсаты, кейбір тиімді критерийлер бойынша бөлу. Бұл критерийді мақсаттық функция ретінде қарастыруға болады. Мысалы, мақсаттық функция ретінде ауытқудың ішкі топтық қосындысының квадратын аламыз:
мұндағы xj - j-ші объектінің өлшемі.
1.2. Объектілердің біртекті өлшемдері
Кластерлік талдау есебін шығару үшін жиынтық және әр тектілік ұғымдарын анықтау қажет.
х1 және х2 объектілердің басқарылатын белгілері бір бірімен жақын орналасқан бір топқа тиісті объектілер, біртекті деп аталады, ал берілген нормадан үлкен қашықтықта орналасқан объектілер біртексіз деп аталады. Норма қашықтығы арақашықтық метрикасы деп аталады. Объектілердің бірдей немесе әртүрлі кластерлерге түсуі Хi және Хj арақашықтық ұғымымен анықталады. d(Хi, Хj) кері емес функциясы арақышықтық функциясы (метрика) деп аталады, егер:
а) d(Хi , Хj) ³ 0;
б) d(Хi, Хj) = 0, сонда тек ғана сонда Хi = Хj
в) d(Хi, Хj) = d(Хj, Хi)
Келесі функция арақашықтығы жиі кездеседі:
1. Евклид арақашықтығы d(Хi , Хj) =
2. l1 - норма d1(Хi , Хj) =
3. lp - норма dр(Хi , Хj) =
Евклидтік метрика кеңінен тараған. l1 метрикасы есептеуде қолдану тиімді, ал lp - 1, 2, 3, арақашықтық функцияларын қамтиді.
Х1, Х2,..., Хn n өлшемдер p ' n өлшемді матрица ретінде берілген болсын:
Онда d(Хi , Хj) жұптық векторлар арақашықтығы симметриялық матрица түрінде өрнектеледі:
Арақашықтықққа қарама қарсы ұғымы ол, Gi. және Gj объектілердің жиынтығы (ұқсастығы). S(Хi ; Хj) = Sij кері емес функция жиынтық метрикасы деп аталады, егер:
1) 0Pound S(Хi , Хj)1 Хi ¹ Хj үшін
2) S(Хi , Хi) = 1
3) S(Хi , Хj) = S(Хj , Хi)
Жиынтық өлшемдер мәнін матрица түрінде жазуға болады:
Sij шамасын жиынтық коэффициенті деп атаймыз.
1.3. Кластерлік талдау әдістері
Қолдаңбалы әлеуметті - экономикалық зерттеулерде кластерлік талдаудың екі әдісі кеңінен тараған:
1) иерархиялық алгоритмдер әдісі
2) объектілерді анықтаудың ортаграфикалық әдісі.
Иерархиялық алгоритмдер әдісі.
Иерархиялық алгоритмдер -- жалпыдан жекеге қатысты ұстанымдары бойынша топтасқан алгоритмдер тізбегі.
Иерархиялық алгоритмдер саны, тізбегі, метрика бойынша жіктеледі. Мұндай жағдайда жақын көрші, алыс көрші, орта байланыс әдістері қарастырылады.
Кез келген иерархиялық алгоритмдер әдісінің практикалық жүзеге асырылуы келесі бес амалдан тұрады:
1) хi (i= 1,2, ..., п) барлық байқалатын объектілер тізбегін ki өзіндік кластерлерден тұратын п түрінде өрнектеу.
2) l объектімен т кластер арасындағы dlm ең кіші арақашықтық жұбын анықтау;
3) алынған жұптардың тізбектелген бірлесуі және әр бір қадам деңгейінде кластерлер санын бір бірлікке азаюы.
4) r және кез келген q арасындағы drq арақашықтығын анықтау;
5) 2 -- 4 қадамдарын бір және тек ғана бір ақырғы кластер алынғанға дейін тізбектеп орындау.
Кез келген иерархиялық алгоритмде, байқаланатын ішкітоптық (dij) және топаралас (drq) арақашықтықтар нормаланған немесе алдын ала метрикамен анықталады.
l және m кластерлерін q кластерімен біріктіруі, r түрінде тұжырымдалуы кластер арасындағы арақашықтық формуласы келесі түрде анықталады:
мұндағы dlq, dmq, dlm - сәйкес ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz