(хи квадрат) критерийі және оны үлестірулерді пайдалануға салыстыруға пайдалану
Келісімдік критерий ұғымы туралы.
Статистикалық практикада екі үлестірудің бір-біріне жақын болуын анықтау мәселелері жиі кездеседі. Бұл сияқты есептерді шешу статистикалық гипотезаларды тексеру арқылы орын-далады. Мұндай есептерді шешудің жалпы схемасы мынадай болады: таңдаманың тәжірибелік (эмпирикалық) үлестірімі белгілі болғанда (бұл
\[f\colon f^{*},n,n^{*}\]
түрінде берілуі де мүмкін) . Сәйкес бас жиынтықтың теориялық үлестірімімен (бұл - жиіліктің математикалық күтімі, ықтималдықтарының үлестірімі, жиынтық жиіліктің математикалық күтімі немесе жиынтық ықти-малдықтар үлестіріміболуы мүмкін) салыстырылатын болады. Сөйтіп таңдаманың тәжірибелік үлестірімі мен теориялық үлестірімінің айырмашылығы маңызды емес деген нөлдік гипотеза
\[\textstyle H_{0}\]
ұсынылады. Ал үлестірімі заңы әр түрлі, мысалы үлестірімі тығыздығы
\[{\mathcal{F}}(x)\]
, интегралдық үлестірім
\[F({\boldsymbol{x}})\]
т. т. түрінде берілуі мүмкін.
Нөлдік гипотеза
\[\textstyle H_{0}\]
-ді қабылдау үшін немесе қабылдамау үшін кейбір статистикалық сипаттаманы құрады. Осы сипаттама арқылы тәжірибелік үлестірім айырмашылығы дәрежесінің қандай екенін анықтайды. Бұл сипаттама
\[\overline{{W}}\]
шамасын әр түрлі тәсілдермен алуға болады, мысалы, жиілік пен математикалық күтім айырымы квадратының қосындысы
\[W=\ \sum[F-M(F)]^{p}\]
немесе тәжірибелік интегралдық функция
\[F_{n}\left(x\right)\]
айырымы-ның ауытқуының максимум (ең үлкен) мәні алынуы мүмкін т. т.
Осы аталған тәсілдердің бірінен құрылған статистикалық сипаттама
\[\textstyle W\]
кездейсоқ шама болады және мұның үлестірім заңы кездейсоқ шама
Х-
ке (
\[X=f,f^{*},F,F^{*}\]
) және сынау саны
п-
ге байланысты. Сонымен
\[\textstyle H_{0}\]
гипотезасы дұрыс болса, онда статистикалық сипаттама
\[\overline{{W}}\]
заңы кездейсоқ шама
Х
пен
п
санының теориялық үлестірім заңымен анықталады.
Енді үлестірім заңы белгілі дейік жоғарыда айтылғандай тәжірибелік үлестірім мен теориялық үлестірім айырмашылығын көрсететін шекаралық мән
\[W_{\phi}\]
-мен анықталады дейік. Ол уақытта, егер
\[P(W
ықтималдық мәнгі үлкен болса, онда
\[\textstyle H_{0}\]
гипотезасын қабылдауға болады, ал ықтималдық мәні аз болса, онда тәжірибелік мәлімет
\[\textstyle H_{0}\]
гипотезасын қабылдауға қайшы келеді дейміз, сөйтіп
\[\textstyle H_{0}\]
-ді қабылдамай оның орнына альтернативті гипотеза
\[\textstyle H_{1}\]
-ді қабылдаймыз, яғни белгілі ықтималдықпен теориялық үлестірім мен тәжіри-белік үлестірім айырмашылығы маңызды дейміз.
Ендігі мәселе осы статистикалық сипаттама
\[\overline{{W}}\]
-ны қалай құруға болатынын анықтауда жатыр. Көп жағдайда
\[{\mathcal{F}}(x)\]
,
\[F({\boldsymbol{x}})\]
үлестірімдері белгісіз болып келеді, сондықтан
\[\overline{{W}}\]
-ның үлестірім заңы
\[{\mathcal{F}}(x)\]
,
\[F({\boldsymbol{x}})\]
үлестірімдері мен олардың параметрлеріне тәуелсіз деп алған қолайлы болады. Екінші сөзбен айтқанда, параметрлі емес (непараметрический) келісім критерийлерінің бірін алған қолайлы болмақ. Мұндай критерийлер ішінде көп қолданылып жүргендері К. Пирсонның
\[\chi^{2}\]
(хи квадрат) критерийі, Колмогоров критерийі, Колмогоров-Смирнов критерийі және реттік критерийлер. Енді біз осы Пирсонның
\[\chi^{2}\]
(хи квадрат) критерийін келтіріп, оны тәжірибелік және теориялық үлестірімдердің бір-біріне дәл келуін
\[\textstyle H_{0}\]
гипотеза тексеруде қолданайық.
Пирсонның
\[\chi^{2}\]
критерийі.
Бұл критерийді қолдану төмендегі талқылауға сүйенеді.
п
бақылау жүргізілгенде кездейсоқ шама
Х
қандай да бір анық мәндерді қабылдасын және олар
\[|\zeta|\zeta\]
интервалға топталсын делік.
Х
кездейсоқ шамасының үлестірім заңы белгілі болсын, ол интегралдық функция
\[F({\boldsymbol{x}})\]
немесе үлестірім тығыздығы
\[{\mathcal{F}}(x)\]
түрінде берілсін делік. Бұл заңды білген соң әрбір
\[|\zeta|\zeta|\zeta\]
-интервалда болатын
\[\mathbb{P}_{K}\]
ықтималдықты анықтауға болады.
Ендігі қарастыратын мәселеміз тәжірибеден алынған
\[{\overline{{\bigcap_{i}}}}\]
(не
жиілік
\[\chi^{2}\]
үлестірімі мен
\[\textstyle\bigcap_{1}\]
ықтималдықтардың) немесе сәйкес
\[\cap{\mathfrak{O}}\]
математикалық күтімінің теориялық үлестірімінің келісетінін мақұлдайтын
\[\textstyle H_{0}\]
гипотезасын тексеру болмақ.
Ақылға салатын болсақ, онда
\[{\overline{{\bigcap_{i}}}}\]
мен
\[\textstyle\bigcap_{1}\]
айырымы аз болса, онда
\[\textstyle H_{0}\]
гипотезасын дұрыс деуімізге болады. Ал бұл айырым үлкен болса, онда
\[\textstyle H_{0}\]
гипотезаны қабылдауымызға болмайды. Бұл айырым өлшеуі ретінде
. Тәжірибелік үлестірім мен теориялық үлестірім айырмашылы-ғын көрсететін бұл өрнектерді
Пирсонның
\[\chi^{2}\]
(хи квадрат) критерийі
деп атайды.
\[\chi^{2}\]
кездейсоқ шамасының үлестірімі,
\[\operatorname{f}\left(\mathbf{x}\right)\]
немесе
\[\mathbb{F}(\mathbf{x})\]
үлестірім заңы
п
-ге тәуелсіз, ол
\[\mathcal{V}\]
-ге ғана тәуелді. Олай болса,
\[\cap{\mathfrak{G}}\setminus\infty\]
\[\chi^{2}\]
үлестірімі
\[\mathrm{K}\!-\!1\]
еркін дәрежесі бар
\[\chi^{2}\]
үлестіріміне ұмтылады.
Сонымен
\[\chi^{2}\]
критерийінің үлестірімі мен
\[\chi^{2}\]
үлестірімінің бір-біріне жақындауы эмпирикалық үлестірім мен теориялық үлестірімнің сәйкес келуі жайлы гипотезаны тексеру үшін мәнділік деңгейдің берілуі бойынша критерий облысын құруға мүмкіндік береді. Еркіндік дәрежесінің саны
болады. Ал
болса, онда бұл байланыстан басқа тағы да бір байланысты көрсететін параметр бар дегенді білдірді. Мысалы, биномдық және Пуассон үлестіруінде
, өйткені біріншіде
\[\textstyle\bigcap\]
параметрі, екіншісінде
\[\mathcal{\Lambda}_{\Omega}\]
параметрі кездейсоқ шамалар арасындағы тәуелділіктің тағы да біреуінің бар екенін көрсетеді. Ал нормаль заңында болса,
\[\overline{{\chi}}\]
пен
\[\stackrel{\zeta}{\longrightarrow}\]
параметрлері бар.
\[\chi^{2}\]
қисығының формасы осы еркіндік дәрежесі
\[\setminus\backslash\backslash\]
-ге байланысты. Өйткені
\[\setminus\bigvee\]
қанша аз болса, қисық бір жағына қисая ауып, асимметрия кұшейе түседі де
қосылғыштарының барлығы да нөлге тең болады, яғни тәжірибелік жиілік пен ықтималдық бір-біріне дәл тең болып, эмпирикалық үлестірім мен теориялық үлестірім толық беттеседі. Басқа жағдайларда
\[\chi^{2}\]
мәні нөлге тең болмайды, сөйтіп
\[(\mathbf{f}_{i}-\mathbf{p}_{i})^{2}\]
айырымы үлкен болған сайын
\[\chi^{2}\]
мәні үлкен бола береді. Ал бұл айырым қандай да бір деңгецден арта бастаса, онда
Бұрын жүргізілген тәжірибеден алынған мәліметтерге сүйене отырып, кездейсоқ шамаХ-тің ұйғарылып отырған үлестірім заңы таңдалады.
Тәжірибеден алынған жиіліктер интервал бойынша топтастыры-лады, ал кейбір интервалдарға сәйкес жиіліктер аз болса (әдетте 5-тен кіші болса), олар бір интервалға біріктіріледі.
Таңдалынған үлестіру заңы бойынша ықтималдықты (математикалық күтімді) есептейді.
Берілген мәнділік деңгейімен еркіндік дәрежесі саны арқылы IV кестеденгипотезасын қабылдау облысынан ауытқудың критерийлік облысынан бөлектейтін шекаралықмәнін табамыз.
4-пунктте есептелген мәнді шекаралық мәнпен салыстырады: а) егерболса, ондагипотезасы қабылданады, яғни тәжірибелік үлестірім мен теориялық үлестірім айырмасы маңызды емес, демек Пирсон критерийінің мәні қабылдау облысында жатыр дейміз; б) егерболса, ондамәні критерийлік облыста болыпгипотезасы қабылданбайды, яғни тәжірибелік үлестірім мен теориялық үлестірім айырмасы маңызды делінеді.
\[\left\|{\mathcal{X}}\right\|_{0}\]
гипотезасын бағалауды тек
\[\chi^{2}\]
пен
\[\textstyle\chi\,{\overset{2}{\sigma}}\]
мәндерін салыстыру арқылы ғана емес,
\[\mathsf{P}(c^{2}\geq\chi_{\mathrm{{w}}},\lor)\]
ықтималдығы арқылы да орындалады.
а) егер
\[\mathsf{P}(c^{2}\geq\chi_{\alpha}^{2},\lor)\]
мәні кейбір алдын-ала берілген мәнділік деңгейінен (мысалы
\[\mathrm{Q}=0,05\]
-тен) төмен болса, бұл кездейсоқ ауытқулар ықтималдығы өте аз шама болады дегенді білдіреді. Ол уақытта
\[\chi^{2}\]
бағалауды тәжірибелік үлестірімнің теориялық үлестірімнен ауытқуы кездейсоқ емес дейміз. Себебі ықтималдығы өте аз бір рет орындалған құбылысты практикалық тұрғыдан пайда болуы мүмкін емес.
б) егер
\[\mathsf{P}(c^{2}\geq\chi_{\bullet}^{2},\lor)\]
ықтималдық мәні жеткілікті үлкен болса (мысалы біздің жайымызда
\[\mathrm{Q}=0,05\]
-тен үлкен), онда нөлдік гипотеза
\[\left\|{\mathcal{X}}\right\|_{0}\]
қабылданады, яғни бұл екі үлестірім бір-біріне тең (жақын) дейміз. Енді осы айтылған-дарды эмпирикалық үлестірімнің нормаль заңына жақындауын осы Пирсонның
\[\chi^{2}\]
келісімділік критериясымен тексеруді орындаймыз. Бұл критериймен басқа да теориялық үлестірімдерге, мысалы, биномдық, пуассондық т. т., тексеруге болады. Сондықтан алдымен бұл тексеру жалпы жағдайда қалай орындалу алгоритмін келтіреміз.
Пирсон критерийі мен эмпирикалық үлестірімді нормаль үлестіріммен тексеру.
\[\chi^{2}\]
критерийін пайдалану эмпирикалық үлестірімнің теориялық үлестірімге жуықтау дәрежесін бағалауға мүмкіндік береді. Сөйтіп тәжірибелік үлестірімнің нормаль үлестірімболуы туралы гипотезаны не қабылдау, не қабылдамауға мүмкіндік береді. Соны орындайық. Ол үшін алгорифмді нормаль заңның дифференциалдық және интегралдық формасының екеуін де тексереміз.
А.
Таңдамадан алынған кездейсоқ шама
Х-
тің дискретті мәндерін қиылыспайтын интервалдарға топтастырамыз, яғни үздіксіз кездейсоқ шама деп қарастырамыз. Бұлардың әр қайсына
жиілігі немесе
интервалдарда оқиғаның болу ықтималдығы
дейік. Бұл ықтималдықтар мәнін алу үшін кездейсоқ шаманың ықтималдық тығыздығын пайдаланамыз. Кездейсоқ шаманың интервалда қандай да мәнді қабылдау ықтималдығы осы интервал ұзындығы
\[b_{\mathrm{i}}\cdot a_{\mathrm{i}}=\Delta X\]
-ті осы интервалдың қандай да бір нүктесіндегі ықтималдық тығыздыққа көбейткенге тең. Мұндай нүктеге интервалдық орта нүктесі
1-мысал. 19-кестеден келтірілген оқушылардың класс бойынша тәжірибеден алынған орташа алынған бағаларының үлестірімі нормаль заң бойынша үлестірімінің нөлдік гипотезасын
\[\chi^{2}\]
критерийі бойынша тексеру керек.
Шешімі. Алдымен жоғарыдағы өрнектерде көрсетілген алгоритмдер бойынша тексерейік. Ол үшін айтылғандарды мына тәртіппен орындаймыз: 1)
\[Q_{\textrm{i}}\]
,
\[{\boldsymbol{\beta}}_{\downarrow}\]
- интервалының ұзындығы
\[\mathbf{D}\chi=b_{\mathrm{i}}-a_{\mathrm{i}}\]
-ді анықтаймыз; 2) әрбір
\[(a_{1},\beta_{1})\]
интервалының ортасы
\[{\mathcal{N}}_{\downarrow}\]
- ді табамыз; 3) 22-таблицада көрсетілген тәсілмен
\[\overline{{{\chi}}}\]
және
\[\stackrel{\zeta}{\longrightarrow}\]
мәндерін есептейміз; 4) қалғандары таблицада көрсетілген рет бойынша орындалады; 5)
\[\chi^{2}\]
мәнін анықтағанда бастапқы екі қатармен соңғы екі қатардың аз жиіліктері біріктіріліп 7 қатар орнына 5 қатар алынады.
Осы көрсетілген тәртіппен орындағанда
\[\chi^{2}=2.9\]
-ға тең болады. Ал еркіндік дәрежесі саны
\[\mathrm{V}=5-\,3=2\]
, өйткені қатар саны
\[\{\zeta\equiv\Im\]
, байланыста болған параметрлер саны 3, олар арифметикалық орта (
гипотезасын теріске шығара алмаймыз, яғни тәжірибелік үлестірім мен нормаль үлестірім айырымы маңызсыз. Бұл факт оқушылардың орташа үлгерімін сипаттайтын математикалық модель ретінде осы нормаль үлестірім заңын алуымызға болады деген нәтижені 95 пайыздық сенімділікпен айта аламыз.
Осы айтылған тексерулерді нормаль заңның интегралдық формасымен (функциясымен)
\[\chi^{2}\]
келісімділік критерийі арқылы тексеру таблицада көрсетілген рет бойынша орындалды. 23-таблицаның соңғы бағанасындағы
\[\textstyle{\left.{\frac{}{}}{}\right.}\]
мәндерінің қосындысы
\[\chi^{2}\]
мәнін береді, ол
\[\chi^{2}=3,28\]
болады. Еркіндік дәрежесі саны
\[\mathrm{V}=5-\,3=2\]
.
\[N_{0,\alpha\in Z}^{2}\]
-тің таблицалық мәні 5, 99-ға тең. Біздің есептен тапқан
\[\chi^{2}\]
мәні осы шекаралық мәннен кіші. Сондықтан эмпирикалық үлестірім мен нормаль үлестірімнің жақын болуы туралы
\[\left\|{\mathcal{X}}\right\|_{0}\]
гипотезасын теріс деп айта алмаймыз. Оқушылардың орта үлгерімінің нормаль заңдай болатыны туралы тексеруді көрдік.
Сонымен, бұл модель келешекте көптеген педагогика-психологиялық мәселелерді математикалық статистика әдістерімен сипаттап, талдауымызға үлкен мүмкіндік туғызады. Оның үстіне үлестірім заңы мәлім болғандықтан практикалық мәселелерді статистикалық талдауда нормаль үлестірім параметрлерін пайдалануға заңды жол ашады.
Көптеген педагогика-психологиялық эксперименттерде нормаль заңға тексерудің көбінесе ықшамдалған критерийлері пайдаланылады. Солардың ішінен өте қарапайымы Романовский критерийі. Эмпирикалық үлестірімнің нормаль үлестірімге жақындығын анықтау үшін «үш сигма» ережесіне сүйенілген критерийді Романовский ұсынды. Романовский