Корреляциялық және регрессиялық анализ



Пән: Математика, Геометрия
Жұмыс түрі:  Курстық жұмыс
Тегін:  Антиплагиат
Көлемі: 47 бет
Таңдаулыға:   
Мазмұны
Кіріспе ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .2
I-Тарау. Корреляциялық және регрессиялық анализ ... ... ... ... ... .3
1.1. Функционалдық және корреляциялық
тәуеділіктер ... ... ... ... ... ... ...3
1.2. Корреляциялық таблица және регрессия
теңдеуі ... ... ... ... ... ... ... ...5
1.3. Ең аз квадраттары
әдісі ... ... ... ... ... ... ... .. ... ... ... ... ... ... ... ... ... ... ..
..9
1.4. Жиі пайданылатын функциялар мен олардың қалыпты теңдеулері...

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... .12
1.5. Корреляция
коэффициенті ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
.13
1.6. Кез келген түдегі керреляциялық
байланыс ... ... ... ... ... ... ... ... ... .16
1.7. Корреляциялық коэффициент сенімділігі. Корреляциялық қатынас..

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... 18
1.8. Көп шамалар арасындағы корреляциялық байланыс. Барлық

корреляция ... ... ... ... ... ... . ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ..18
1.9. Рангтік белгілер үшін корреляция
коэффициенттері ... ... ... ... 22
1.10. Спирменнің рангтік корреляция
коэффициенті ... ... ... ... ... ..2 2
II-тарау. Үрдістердің базасын модельдеу әдісімен алдын ала болжам жасап
зерттеу ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ..24

Қорытынды ... ... ... ... ... ... .. ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... 58
Пайдаланған
әдебиеттер ... ... ... ... ... ... . ... ... ... ... ... ... ... ... ... ... ..
... ... ... ...59
Қосымша ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... 61

Кіріспе

Ғасырымыздың ең маңызды жаңалықтарының бірі болып табылатын компьютер
күнделікті өміріміздің әрбір саласына ене бастады. Компьютер алғашқы кезде
тек белгілі бір мақсаттарға ғана қолданылды. Уақыт өте келе көлемі
кішірейіп құны да арзандады. Соның нәтижесінде түрлі салаларда кеңінен
қолданыла бастады.
Ғылыми ақпараттың құрылымы мен жалпы қасиеттерін, сондай-ақ оны іздеп
табу, жинау, сақтау, өңдеу, түрлендіру, тарату және қолдану мәселелерін
зерттейтін информатиканың ғылым болып қалыптасуы және адам іс-әрекетінің
барлық салаларында компьютердің (электрондық есептеуіш техниканың)
қолданылуы өткен ғасырдың елуінші жылдарына түтас келді. Одан бергі кезеңде
информатика дербес ғылым саласы болып кемелденіп, компьютер технологиялық
көліктік, энергетикалық және басқа да өндірістік процесстерді басқаруда.
Күрделі объектілерді жобалауда, жосларлау, статистика, үйымдастыру-
әкімшілік басқару, оқыту, ғылыми зерттеулер жүргізу салаларында, әсіресе
информатикада кеңінен қолданылатын болды. Ғылыми техникалық прогрестің
қарқынын жеделдетуде жөне түптеп келгенде, қоғамдық өндірістің
нәтижелілігін кеңейтуде бұл салалардың маңызы барған сайын арта тусіп отыр.
Өркениет өріне бет түзеп, озық елдермен теңесуге күш салып жатқан біздің
елімізде де бұл салаларға мемлекеттік тұрғыдан барынша көңіл бөлініп,
ауқымды шаралар атқарылуда. Осыған байланысты. жаңа программалардың
тасқыны, көптеген адамдарға кәсіптік-ақпараттық технология құралдарын
жоғары дәрежеде білу қажеттігін көрсетеді.

I-Тарау.ҚОРРЕЛЯЦИЯЛЫҚ ЖӘНЕ РЕГРЕССИЯЛЫҚ АНАЛИЗ
1.1. Функционалдық және корреляциялық тәуеділіктер
Шамалар арасындағы функционалдық тәуелділіктер туралы сөз еттік. Одан
шамалардың біреуінің әрбәр мәніне екіншісінің белгілі бір мәні (функция
бірмәнді) немесе бірнеше мәндері (функция көпмәнді) сәйкес келуі мүмкін. Ал
іс жүзінде мұндай анық бола бермейді. Мысалы, мақта өнімін (шаманы)
қарастырсақ, онда бұл өнімге түрлі факторл ар әсер етеді. Бұл факторларға
тыңайтқыш мөлшері, жауын – шашын, күн сәулесі, түсетін күндер саны
т.т.жатады. Мұндай бір шаманың бір мәніне екінші шаманың бірнеше мәндері
сәйкес келгенімен, яғни бір шаманы екіншісіне тәуелділігі байқалғанымен, ол
шамалар саны да және қабылдайтын мәндері де толық, анық еместігін
байқаймыз.
Біртектес жиынды оның кез – келген белгісі бойынша немесе бірнеше
белгілерінің байланысы бойынша қарастыруымызға болады. Тек осылайша
қарастыру нәтижесінде процесс немесе құбылыс заңдылығын, яғни процесс не
құбылысты сипаттайтын әр түрлі шамалар арасындағы байланысты математикалық
абстракциялау мүмкін. Сондықтан математикалық әдістерді қолданатын
зертеушілердің алдына қоятын бірден бір міндет сол математикалық
абстракциялау формула күйнде немесе таблица күйінде, немесе график түрінде
беріледі.
Математикалық екі шама немесе айнымалылар арасындағы тәуелділік y=f(x)
түрінде, ал бір айнымалы бірнеше (x1, x2, ... , xk ) айнымалыларға тәуелді
болса, онда бұл функционалдық байланысу y=f(x1, x2, ... , xk) түрінде
беріледі. Мұндай функционалдық тәуелділіктер математикада, физикада,
механикада, химияда, астрономияда т.т. жиі кездеседі..
Функционалдық тәуелділік тек айнымалылар арасында ғана болмастан,
кездейсоқ шамалар арасында да болады. Бірақ іс жүзінде кездейсоқ шамалар
арасындағы функционалдық тәуелділік өте сирек беріледі, өйткені бір шаманың
өзгеруі тек бір негізгі шаманың өзгеруімен ғана анықталып қоймайды. Оған
есептеуге мүмкін болмайтын көптеген факторлардың әсері де болуы мүмкін. Бұл
факторлар жеке тәжірибелерде кездейсоқтық қасиетке ие. Сондықтан олардың
қандайда болсын заңдылықтарын ашу үшін көптеген эксперименттер жүргізуі
керек. Бірақ эксперимент нәтижесінде x шамасының бір мәніне екінші y
шамасының көптеген мәндері, яғни y мәндерінің жиыны немесе үлестіруі сәйкес
келеді. Оның үстіне x-тің мәні өзгергенде x мәндерінің жиыны да өзгереді.
Ал y мәнінің өзі болса x бойынша алынған y-тің орташа мәні төңірегінде
топталады. Шамалар арасындағы мұндай тәуелділікті статистикалық тәуелділік
немесе корреляциялық тәуелділік деп атайды.
Сонымен статистикалық тәуелділік туралы сөз еткенде x-тің әрбір мәніне
y мәндерінің үлестіруі сәйкес келеді дейміз. Былайша айтқанда x – тің әрбір
мәніне осы x – тің өзгеруіне байланысты өзгеріп отыратын ықтималдықтар
мәндерінің жиыны сәйкес келеді дейді. Статистикалық тәуелділік дегенде бас
жиыннан алынған таңдамадағы байланысты ұғамыз. Ал бас жиындағы шамалар
арасындағы тәуелділік стохастикалық (ықтималдықтық) болады. Әрине тандама
көлемі жеткілікті үлкен болса, онда белгілі шарттар орындалғанда
статистикалық тәуелділік стохастикалық тәуелділікті сипаттай алады.
Шамалар арасындағы тәуелділік туралы сөз еткенде оның тығыздығы мен
түрі қандай болатыны анықтау қажет болады. Тәуелділіктің тығыздығы
корреляциялық коэффициент және корреляциялық қатынаспен сипатталады. Ал
тәуелділіктің түрі болса графикпен, регрессия теңдеуімен немесе регрессия
коэффициентімен анықталады. Шамалар арасындағы бұл байланыстар таңдамадан
алынған мәліметтер бойынша көрсетіледі. Олай болса, корреляциялық анализде
қарастыратын екінші мәселе тәжірибелік сипаттамалардың бас жиын немесе
теориялық жиын сипаттамаларына қаншалықты дәл келуін бағалау болмақ. Бұл
мәселелермен математикалық статистиканың корреляциялық теория деп аталатын
бөлімі айналысады. Сонымен корреляциялық теория кездейсоқ шамалар
арасындағы тәуелділіктің тығыздығы мен түрін қарастырады. Ал бұларды талдау
әдістерін корреляциялық анализ деп атайды.
Корреляциялық анализде қарастыратын негізгі шаманың (нәтижелік
белгінің) бір немесе бірнеше факторларға байланысын қарастырады. Егерде
нәтижелік белгінің бір факторға байланысын қарастырса, жұптық корреляция
дейді де, ал екі не бірнеше факторға байланысын қарастырса, оны көп өлшемді
корреляция дейді.
Біз талдауымызды жұптық корреляциядан бастайық. Корреляциялық анализ
жасау корреляциялық таблица мәліметтеріне сүйенеді. Сонымен қатар бастапқы
информацияны бір жүйеге келтірудің екінші жолы графиктік тәсіл. Графикалық
тәсілдің мақсаты – корреляциялық өріс құру. Мұның үшін тікбұрышты
координаттар жүйесінің абсциссалар өсіне факториалды белгілі мәндерін, ал
ординаталар өсіне нәтижелік белгі мәндерін салып координаттар
жазықтығындағы нүктелер жиынын анықтаймыз. Бұл жиындар түрлі формадағы
өрістерді көрсетеді. Мұның кейбір түрлері 1-суретте келтірілген: а-суретте
x пен y арасындағы тәуелділігі 1,ә-суретте x пен y тәуелділігі әлсіз тура
түзу сызықты (r=+0.5) болуын көрсетеді: 1,б- суретте x пен y-тің
тәуелділігі түзу сызықты (r=0.000) болуын көрсетеді: 1,в-суретте x пен y
тәуелділігі әлсіз кері түзу сызықты (r=-0.5) болуы көрсетіледі; 1,г-суретте
x пен y тәуелділігі қатаң кері түзу сызықты (r=-1.00) болуын көрсетеді.
Мұндағы айнымалылар арасындағы тәуелділік тығыздығын көрсететін шама – бұл
корреляциялық коэффициент.

1.2. Корреляциялық таблица және регрессия теңдеуі.

Статистикалық бақылаулар нәтижесінде қарастырып отырған шамалар
жайында мәліметтер жинастырамыз. Ол мәліметтер бойынша статистикалық
байланыс таблица күйінде жасалынады. Мұндай таблицалар екі түрде болады.
Бірінде ол таблица мәліметтерді санау арқылы жасалады, екіншісінде
қарапайым корреляциялық таблица, корреляциялық тор немесе корреляциялық
матрица күйінде болады. Егерде x-тің жиынындағы әрбір мәнін жазып оның
қасына сол мәнге сәйкес y-тің мәнін жазсақ, қарапайым корреляциялық таблица
аламыз:

x x1 x2 ... xn
y y1 y2 ... yn

Мұндай таблицалар практикада жиі кездеседі. Мұндағы x –тің мәні тек
бір реттен ғана қайталанып отырса онда келесі есептеулерді тікелей осы
таблица бойынша орындау қажет. Көп жағдайда x пен y мәндері сан рет
қайталанып отырылуы мүмкін. Бұл жағдайда таблицадағы мәліметтерді
қарастырып отырған x және y белгілері бойынша топтастыру керек.
Топтастырудың екі тәсілі бар. Бірінші тәсілінде, 1-таблицада
көрсетілгендей, белгілердің жеке мәндері бойынша, екіншісінде интервал
бойынша топтастырылады

1-таблица
... ...
x1 x2 ... xi ... xk
xxi xx1 xx2 ... xxi ... xxk

3-таблица
yyj y1 y2 ... yj ... yt
y1 y2 ... yj ... yt
nyj ny1 ny2 ... nyj ... nyi

Интервал бойынша топтастырудан жасалған корреляциялық таблица да
1–таблицадай болады. Бұл жағдайда X және Y-тің жалпы өзгеру интервалдарын
дербес ∆x және ∆y (әдетте Интервалдарға бөледі, сөйтіп бұл
интервалдар ортасын сәйкес және арқылы белгілеп әрі қарай 1-
таблица сияқты жазылады. Мұндағы дербес шартты арифметикалық орталар
бұрынна мәлім формулалармен анықталады.
yj=, j=1,2, ... ,l,

xi=, i=1,2, ... ,k,
Ал жалпы арифметикалық орта

=,
= x,x
1-таблицадан айнымалы X –тің Y әрбір мәніне Y-тің топтық
арифметикалық орта мәні yk сәйкес келіп отыр. Олай болса, айнымалы X пен
айнымалы Y-тің топтық орта мәндері арасында функционалдық байланыс болуы
мүмкін, оны x=f(x) түрінде жазамыз. Дәл осы сияқты, 1-таблицадан
айнымалы Y-тің әрбір мәніне X-тің топтық арифметикалық ортасы y
cәйкес келіп отырғанын байқаймыз. Олай болса, бұл жағдайда Y пен X-тің
топтық орта мәндері арасындағы функционалдық тәуелділікті y
=түрінде жазамыз. Мұндағы x, y шартты арифметикалық
орталар, біріншісінде X орындалғандағы Y – тің шартты арифметикалық ортасы
болса, екіншісінде Y орындалғандағы X-тің шартты арифметикалық ортасы болып
отыр.
Сонымен екі айнымалы арасындағы корреляциялық тәуелділік деп біреуінің
бір мәніне екіншісінің шартты арифметикалық орта мәні сәйкес келетін
функционалдық тәуелділікті айтады. Біріншісін Y-тің X-ке, екіншісін X –тің
Y-ке қатысты корреляциялық теңдеулері немесе регрессия теңдеулері деп
атайды.

4-таблица
X 1 2 3 4 5
yx 14 14,5 15,7 16,5 18

X пен Y мәндерінің әр жұбын нүктемен көрсетсек, онда 1-таблицадан
корреляциялық өріс, 4-таблицадан сынық сызық аламыз. Бұл таблицадан x
–тің сызқтық функциясы болуын көрсетеді. Оны x=ax+b түрінде жазуға
болады. Егер Y-тің белгілі мәніне сәйкес X-тің арифметикалық ортасын
есептесек, онда x мәндері төмендегі 5- таблицада келтірілгендей болар
еді.

5-таблица

y 14 15 16 17 18
xy 1,5 2,5 3,3 4 5

Мұның графигі де түзу сызыққа өте-мөте жуық, сондықтан олардық
арасындағы байланысты =cy+d түрінде жазуға болады. Бұлардың графигін Y-
тің X-ке және X -тің Y –ке қатысты қисықтары делінеді. Ал таблицадағы
статистикалық мәліметтерді суретке түсіргенде ол түзу сызыққа жақындау
мүмкіндігін айттық. Бірақ сынау саны неғұрлым аз болған сайын қисықтағы
заңдылықты байқау соғұрлым қиынға соғады. Оның себебі тәжірибеден алынған
мәліметтер бойынша суретке салынған нұктелерді бір – бірімен қосқаннан
шыққан сынық сызықтары теориялық сызықтан біресе жоғары, біресе төмен түсіп
аралары алшақтап отыруы мүмкін. Сондықтан сынау санын арттырып топтастырсақ
олардың аралығы кемиді. Бірақ бұл жолмен мақсатқа жету қиын, себебі іс
жүзінде сынау саны шекті аз болады. Олай болса, алдымен тәжірибелік
(статистикалық) мәліметтер бойынша қисықты таңдайды. Мұндай қисықтар,
әрине, түзу де, парабола да, жоғары дәрежелі парабола да т.т. болуы мүмкін.
Сонымен айнымалы шамалар арасындағы өзара тәуелділікті қарастырудан
бұрын оның түрлерін анықтап алу керектігі туады. Әр түрлі тәуелділіктер
ішінде ең кең тараған да, қарапайым да, практикада кеңірек қолданыс тапқан
да және толығырақ зерттелінгені де сызықты тәуелділік. Оның үстіне,
тәуелділіктің бұл түріне түрлендіру арқылы әр түрлі қисық сызықты
тәуелділіктерді әкелуге болатынын ескертеміз. Олай болса (Ляпуновтың
орталық теоремасы бойынша), кейбір шарт орындалғанда Y мәндерінің – орта
шартты x төңірегінде үлестіруі нормаль заңына жақын болады. Бұл
айтылғаннан салдар ретінде, регрессия сызығының түзуге жақын болып шығуын,
екінші сөзбен айтқанда, корреляциялық тәуелділіктің түзу сызыққа жақын
болуын байқаймыз. Сондықтан да сызықты корреляцияны қалыпты корреляция деп
қарастырады, мұның теориялық және практикалық мәні зор. Сонымен,
статистикалық мәліметтер бойынша сызықты регрессия теңдеуін іздестірейік.
Оны анықтау үшін y=ax+b сызықты теңдеуін a, b параметрлерін табуымыз керек.
Бұларды табудың бірнеше әдісі бар. Біз айырымның квадраттары ең аз болу
әдісін пайдаланамыз. Бұл әдіспен y=a+bx+c теңдуінің a,b,c
параметрлерін, сондай-ақ n дәрежелі парабола
y=anx+an-1x+...+a1x+a0
теңдеуінің (i=0,1,2, ... ,n) параметрлерін де анықтай аламыз.

1.3. Ең аз квадраттары әдісі
Бұл әдіс тәжірибеден алынған нәтижелерді өңдеуге байланысты түрлі
есептерді шығаруға қолданылады, бірақ теориялық функцияның жалпы түрін
таңдау мәселесін шешпейді. Бұл әдіс арқылы y=f(x) функциясының берілген
түрінің сәйкес параметрлерінің ең ықтималды мәндерін табуға мүмкіндік
аламыз. Жалпы квадраттары ең аз әдісін көпшілік жағдайда, не сызықты
тәуелділіктегі y=ax+b не квадратты тәуелділіктегі y=a+bx+c формуласын
пайдаланып, оның параметрлерін анықтайды.
4-таблицада келтірілген мәліметтер бойынша тікбұрышты координаталар
жүйесінде A1(x1), A2(x2y2), ... ,An (xn, yn) нүктелерін салайық. Әрине
A1, A2 , ... , An нүктелер бір түзу бойында жатаса, онда мәселе шешілген
болады, өйткені іздеген байланыс дәл сызықты болады. Сондықтан A1, A2 , ...
, An нүктелері бір түзу бойында жатпайды деп ұйғарамыз. Олай болса, осы
нүктелерге ең жақын түзуді іздестірудің қажеттігі туады. Бұл мақсатты
орындау үшін теңдеуі y=ax+b болайық. Бұл түзу бойында жататын нүктелер
B1(x1, ax1+b), B(x2, ax2+b), Bn(xn, axn+b) болсын.
Енді тәжірибелк Ai, (xi,yi) нүктелері мен y=ax+b түзуі бойындағы Bi
(xi), dxi +b) (i=1,2, ... ,n) нүктелері ординаталарының айырымын (axi +b)-yi
алайық. Бұл нөлге тең емес. Сондықтан y=ax+b параметрлерін (axi +b)- x
айырымдар квадраты ең аз болатындай етіп таңдауды қажет етеді, яғни
S=[(axi+b)-yi]

Мәні миннмум болуы керек (мұнда yi – мен ауыстырылды). Ал әрбір ауытқу
іздулінді параметрлерге байланысты болғандықтан, S-те a және b
параметрлерінің функциясы болады, яғни
S=S(a,b):
S(a,b)=(axi +b-yi)=min
(1)
болады.
Енді дифференциалдық есептеулердегі белгілі әдіс бойынша S-тің a және
b бойынша алынған дербес туындыларын нөлге теңестіреміз, сонда
=2(axi+b-yi)xi=0,
=2(axi+b-yi)=0,
(2)
Мұны ықшамдап теңдеулердің мынадай қалыпты жүйесін аламыз.
axi+bxi=xi, yi
axi+nb=yi,
(3)
Мұндағы xi, yi, мәндері тәжірибеден алынған мәліметтер бойынша
беріледі. Олай болса , , , yi, n мәндерін анықтау қиынға
соқпайды. Сондықтан бұл (1) жүйесін a және b бойынша шешіп, олардың
мәндерін анықтаймыз (бұдан былай қосындылау индексін қоймаймыз):
a=, b=. (4)
Ал ол қосындыларды есептеу үшін мына таблицаны пайдалану қолайлы.

6-таблица
xi yi xi xiyi
... ... ... ...


Сызықтық теңдеу орнына мына квадраттық теңдеуді
Y=ax+bx+c
(5)
алсақ, онда a, b, c параметрлерінің ең ықтималды мәндерін анықтау үшін
S=(ax1 +bx1+c-y1)=min
Шартын қанағаттандыруы қажет. a, b, c бойынша алынған дербес
туындыларын нөлге теңестіреміз, сонда
=2(axi+bxi+c-yi)=0,
=2( axi+bxi+c-yi)=0,
=2 (axi+bxi+c-yi)=0,
Мұндағы қалыпты жүйесі мынадай:
a+ b+c=yi,
a+ b+c=yi,
a+ b+nc=
(6)
Осы жүйені шешіп, a, b және c параметрлерін анықтаймыз. Бұл теңдеулер
жүйесі (6) коэффициенттерін мына таблица бойынша есептеуді ұсынамыз:

7-таблица
xi yi x x x xy[xy[
pic] pic]
... ... ... ... ... ... ...


Мұндағы ең соңғы қатары әрбір бағандағы мәндер қосындысын көрсетеді.
Бұл системаны жалпы түрде шешіп a, b және c мәндерін есептейді. Біз оны
жазып жатпай 7-таблицадағы мәндер бойынша коэффициенттері мен берілген
системаны үйреншікті тәсілмен шешу арқылы a, b және c мәндерін табамыз.

1.4. Жиі пайданылатын функциялар мен олардың қалыпты теңдеулері
Бақылау нәтижесінде алынған мәліметтерге сүйене отырып тәуелділікті
көрсететін сызықтардың түрлерін анықтау оңай емес. Дегенмен зерттеушілер
қойылған мәселенің қандай да ерекшелігін ескере отырып (мысалы максимум
және минимумдардың болуын, кейбір асимтоттарға жуықтауын) сызықтар типін
таңдайды, сөйтіп оның практикалық қажеттігін нақтылы мәліметтерде
көрсетеді. Жоғарыда қарастырған сызықты тәуелділікке байланысты және осы
түрге келетін сызықтар типін келтіріп, олардың сызықты түрлендірілуі мен
қалыпты теңдеуін 8-таблица күйінде жазайық. Бұл таблицада келтірілген схема
бойынша көптеген сызықты емес парлық регрессияларды сызықтық тәуелділікке
әкелуге болатынына көз жеткізу қиын емес. Шынында да, y=ax, y=ab,
y=a+bx т.т. теңдеулерін түзу сызықты корреляциялық теңдеу түріне келтіруге
және оның корреляциялық коэффициентін есептеуге болады. Мысалы, z=cd
теңдеуін түзу сызықты корреляцялық теңдеуге келтіру үшін мұның екі жағын
логарифмдейміз, сонда logz=logc+xlogd. Енді y=logz, a=logd, b=logc деп
белгілесек, y=dx+z теңдеуі түріне келеді. Басқасы да осылай түрлендіріледі
ол 8-таблицада айқын көрініп тұр.
Бұл таблицада практикада жиі қолданатын кейбір функциялар тізімі
келтірдік. Әрбір оқырман өз мұқтаждығына байланысты олардың ішінен
қажеттісін алып емес келтірілген схема бойынша басқасын алып әбден
пайдалануына болады. Біз y=ab типіндегі функциясын алып, оның
қаншалықты экономикалық ғылымдарда маңызды роль атқаруын Боярский
еңбегіннен көре аламыз.

8-таблица

1.5. Корреляция коэффициенті
Шамалар арасындағы байланыстың қаншалықты тығыз болуы корреляция
коэффициентімен анықталады. Корреляция коэффициентін табу үшін және оның
регрессия коэффициентімен қандай қатыста болуын анықтау үшін регрессия
теңдеуін мына түрде жазайық:
= - yx .
(1)

Мұны =yxx+ тендеуіне қойып мына регрессия теңдеуін
аламыз:
x - =yx (x-),
(2)
pyx – регрессия коэффициенті. Сызықтық регресия теңдеуіндегі а
параметірінің мәні мына формаға сияқты анықталады.
= yx =
(3)
немесе
yx =

немесе

yx = (3)
түрінде жазамыз.
мұндағы
=, =
=, =-(). (4)
- те қосынды x және y бойынша алынғанын көрсетеді. Ал x және y
мәндері 1-таблицадағыдай топтастырылған болса, онда (3) теңдік былай
жазылады:
.
Өйткені

.
y – тің x – ке қатысты сызықты регрессия теңдеуі

түрінде жазылса, x - тің y -ке қатысты регрессия теңдеуі түрінде
x=жазылады.
Мұндағы
(5)
немесе
(5)
мұнда =-()

Енді жалпыландыру үшін (5) теңдіктің екі жағын да санына
көбейтеміз. (5) орнына (3) – ті алғаннан нәтиже өзгермейді, сонда бұл
теңдіктің оң жағы коэффициентін мына түрде жазамыз:
=. (6)
(6) теңдіктің оң жағын r- мен белгілейік, мұны корреляция
коэффициенті деп атаймыз. Сонда
r= (7)
Ал xy мәндері топтастырылмаған жағдайда (7) формуласы (3) – тен былай
жазылады:
r= (8)
(7) мен (8) орнына бір формула жазуымызға болады. Ол үшін (7) – нің
алымын да бөлімін де n - ге бөлсек,
r= (9)
түіне келеді. Мұнда

десек, (7) формуланы аламыз, ал = десек, (8) формуланы
аламыз. Бұл жағдайда қосынды x және y бойынша алынған деп ұғамыз. (6)-дан
(10)
бұдан
(11)
-тың осы мәнін (2) теңдікке койсақ корреляция коэффициенті
арқылы жазылған түзу сызықты регрессия теңеуін аламыз:
-=r(x-). (12)
Дәл осы сияқты талқыласақ x- тің y -ке қатысты түзу сызықты регрессия
теңдеуі мынадай болады:
, (13)
Мұнда
(14)
Сызықт корреляциялық коэффициенті r - дің мына қасиеттерін атап
өтейік.
1. Корреляция коэффициенті r мәне -1 мен +1 аралығында яғни
немесе -1 .
Шамалар арасындағы сызықты байланыс болмаса r=0 болады (бұл жағдайда
басқа түрдегі байланыс болуы мүмкін).
Ал тура корреляциялық болса, r=+1 болады да дәл кері коррелияция
болса, r=-1 болады.
2. r Болса, онда регрессия түзулері біріне – бірі дәл келеді
(беттеседі).
3. Корреляция коэффициенті
(15)
Регрессия коэффициентініғ таңбасы бірдей болғандықтан түбір астындағы
өрнек таңбасы әруақытта оң болады. Сонымен (9) арқылы өрнектелген таңдама
корреляция коэффициенті бойынша есептеледі.
(16)
Корреляция коэффициентінің бағасы болуын байқау қиын емес. Берілген
корреляциялық таблица бойынша корреляция коэффициентінің мәндерін есептеп
табуымыз мүмкін.

1.6. Кез келген түдегі керреляциялық байланыс
Алдыңғы параграфтарда сызықты корреляциялық байланыс тығыздығын
бағладық. Енді кез келген корреляциялық байланыс тығыздығын қалай бағалауға
болатынын қарастырайық. Екі шама арасында статистикалық байланыс
болғанымен, олардың бірі кездейсоқ шама болмауы мүмкін немесе бұлардың
бірлескен үлестіруі нормаль үлестірудей болмауы мүмкін. Бұл жағдайда
өзгерудің жалпы толық дисперсиясына сүйенетін байланыстың жалпы көрсеткішін
пайдаланады. Белгінің толық дисперсиясы деп оның математикалық күтіміне
қатысты алынған дисперсиясын айтады. Мысалы, X белгісі үшін . Бұл
дисперсияны екі дисперсия арқылы беруге болады. Олардың бірі X факторының Y
–ке әсерін сипаттаса, екіншісі одан басқа факторлар әсерін көрсетеді.
Осы айтылғандардан тұжырым шығару үшін, бақылау нәтижесінде 1-
таблицадағы корреляциялық таблицаны алдық дейік. Бұл таблицадан Y-тің әрбір
мәні X-тің белгілі мәніне сәйкес келеді. Дәл осыны X-тің Y мәніне сәйкес
келуіне қайталауға болады. Сол таблица негізінде шартты орташаны (оны
топтық орташа деуімізге болады) алдық Y –тің барлық мәндері топтарға
бөлінгендіктен, белгінің жалпы дисперсиясын ішкі топ және топаралық
дисперсияларының қосындысы түрінде жазуға болады, яғни

немесе

бұл қатыстан, Y пен X функәионалдық қатыста болса,
болғандықтанDЖ=1 болуын, ал Y пен X корреляциялық байланыста
болса, болғандықтан, 1 болуын байқау қиын емес.
Бұл айтылғандардан байланыс қаншалықты функционалдыққа жақындаса
соншалық мәні азая туседі, яғни қатынас бірге жуықтай
түседі. Бұдан, корреляциялық байланыс тығыздығының өлшеміне топаралық
дисперсияның қатынасын алған жөн сиияқты, оны арқылы белгілесек,
болады. Бұл өрнектен дербес жағдайда Y -тің X-ке қатысты
корреляциялық қатынасын деп, ал X-тің Y-ке қатысты корреляцялық
қатынасын деп жазуымызға болады. Бұл корреляциялық қатынас
коэффициенті сызықты емес, оны корреляциялық байланыс тығыздығын бағалауға
пайдаланды. Мұнда мынадай қасиеттерін атауға болады.
1. Корреляциялық қатынас мәні арқашан оң таңбалы және оның
қабылдайтын мәндері 0 мен 1 аралығында жатады, яғни .
2. болса, Y белгісі X-пен функәионалдық байланыста емес.
3. болса, Y белгісі X-пен функционалдық байланыста болады.
Сонымен, қорыта келгенде байланыстың барлық түрі үшін
корреляциялық байланыс өлшемі болады, ал корреляциялық коэффициент r тек
байланыстың сызықты формасы үшін ғана байланыс өлшемі болатын. Бұл жағынан
корреляциялық қатынас корреляциялық коэффициентке қарағанда пайдалы болуын
байқаймыз. Бірақ, корреляциялық қатынас бойынша бақыланған нүктелер
қаншалықты белгілі қисыққа жақын жатуын айта аламыз, өйткені корреляциялық
қатынас коэффициентін анықтағанда байланыс формасына көңіл аударғанымыз
жоқ.

1.7. Корреляциялық коэффициент сенімділігі.
Корреляциялық қатынас
Бақылау саны n50 болғанда, корреляциялық коэффициент қатесі немесе
орташа квадраттық ауытқу мына формуласымен есептеледі. Ал бас
жиын корреляциялық коэффициентінен (r0) таңдама корреляция коэффициентінің
мүмкіндік ауытқуы теңсіздігімен анықталады. Жалпы r сенімділігін
тексеру r қатынасын есептеу арқылы орындалады. Егерде r3
болса, онда корреляция коэффициенті – зерттейтін белгілер арасындағы
байланыс мөлшерін толық сенімділікпен анықтайды. Ал егер r3 болса,
онда бұл байланыс жайында үлкен күмәндік туады. Мысалы,
N=9, r=0,96, =
Бұл 3-тен үлкен, олай болса, корреляция коэффициенті үлкен, ал

Қарастырып отырған белгілер арасындағы байланыс сенімділігі үлкен,
яғни бірге жуық ықтималдықпен бұл байланыс тығыздығын айта аламыз.

1.8. Көп шамалар арасындағы корреляциялық байланыс. Барлық корреляция
Практикада көрсетілген нәтижелік шама статистикалық тұрғыдан бір емес
бірнеше шамаларға (факторларға) тәуелді болуы мүмкін. Мысалы, қандай да
дақылдың өнімі (нәтижесі) сол өнімді алу үшін жұмсалған тыңайтқыш (фактор),
дақылдың (фактор) мөлшері не т.тт байланысты. Жалпы айтқанда бір факторға
байланысты нәтижесін ескертетін математикалық модельден бірнеше факторға
тәуелділігін ескертетін модельден бірнеше факторға тәуелділігін ескертетін
модельге өтуді қарастырамыз. Бұл айтылғанды математикалық тілде бір
аргументті функциядан бірнеше аргументті функцияға өту деп түсінеміз.
Мұндай байланысты шамаларды көпшамалы корреляциялық байланыс деп атайды.
Мұның мақсаты сол көптеген факторларың ізделінді шамаға (құбылысқа)
әсерінің сандық мөлшерін анықтау болады. Сондықтан, статистикалық
зерттеулер жүргізу алдында қарастыратын обьекті және оның нәтижелік
белгісін (шаманы) анықтауымыз қажет. Одан соң әсер ететін көптеген
факторлар ішінде алғашқы бірнешеуін таңдауға тиістіміз. Міне осыдан соң
ғана қажетті мәліметті алу үшін бақылаулар жүргізіп статистикалық
көрсеткіштерді жинастырады.
әрине мұндай көпшамлар байланыс сызықты да, сызықты емес те болуы
мүмкін. Мысалы, сызықтысын былай жазуға болады.

, (1)
, (2)
. . . . . . . . . . . . . . . .
(3)
Сондай–ақ қисық сызықты тәуелділіктің ең қарапайым екінші реттік
теңдеу, бұл модель түрі мынадай
.
Мұндағы , ,... – екі (x1x2), үш ()... факторларға
тәуелді нәтижелік белгі, a0, a1, a2 ... – корреляциялық теңдеулердің
белгісіз параметрлері, y – шамасы тәуелді болатын фактор.
Бұлардың ішіндегі ең қарапайымы да және көп қолданылатыны да екі (x,
z) факторларға тәуелді фортасы, яғни x1=x x2=z десек, (1) былай жазылады.
.
Мұның ең аз параметрлерін жоғарыда келтірілген квадраттар әдісін
пайдаланып табамыз. Сол көрсетілген қағид бойынша мұның қалыпты таңдеуі
мынадай болады:
,
,
, (4)
y, x, z – қарастырып отырған белгінің тәжірибеден алынған мәндері, n –
бақылаудың жалпы саны. Бұл теңдеулер жүйесін үйреншікті қалыптасқан
тәсілдермен шешіп, a0, a1, a2 параметрлерін табамыз. Шешу жеңіл болу үшін
мына таблицаны пайдаланған қолайлы:

9-таблица
n y x z yx yz
ti t1 t2 t3 ... tn

Осы қатардың өзгеру теңденциясын анықтауымыз керек болсын. Осылай
көріністегі мәселе – уақыт қатарын тегістеу есебі деп аталады. Бұл жерде
біз негізгі өзгеретін параметрді тренд деп атаймыз. Негізгі мәселе осы
трндтің уақытқа тәуелділігін анықтау болып есептеледі. Сондықтан тәуелділік
мынандай көріністе болады

Мұндағы a, в – мәндері есептеп табылуы қажет болған коэффиценттері;
ti, a, b коэффициенттерінің мәндері ең кіші кватраттар әдісін қолдану
жолымен табылады. Мұндағы t – аргумент6 ал (t) уақыт қатарының тренді
– жункция ролін атқарады. Зерттеу жұмыстарын біз модель құру ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Сызықты регрессиялық тәуелділік
Регрессиялық талдау
Регрессия коэффициентінің экономикалық түсіндірмесі
Регрессиялық динамикалық модельдер
Менеджменттегі ақпарат жүйелері
Экономика дәрістер кешені
Қазақстан Республикасындағы сүт өнімінің өзіндік құнын жүйелік талдау және болжау
Урбандалу процестерін моделдеудің ақпараттық жүйесін құру
БАСТАУЫШ МЕКТЕПТЕ АҒЫЛШЫН ТІЛІ САБАҚТАРЫНДА ИНКЛЮЗИВТІ БІЛІМ БЕРУДЕГІ ТИІМДІ ӘДІС-ТӘСІЛДЕР
Көпөлшемді талдау
Пәндер