Деректер қорының моделі



Жұмыс түрі:  Курстық жұмыс
Тегін:  Антиплагиат
Көлемі: 29 бет
Таңдаулыға:   
Анықтама

Дипломдық жұмыста келесі анықтамалар мен терминдер қолданылды:

Терминдер мен қысқартулар

Деректер қоры - ақпараттар сақталатын қойма. Деректер қорынан керегiне қарай қажеттi мәлiметтер алу үшiн сақталады. Басқаша айтсақ, мұнда керектi ақпаратты iздеу ұйымдастырылады.
ДҚБЖ - деректер қорын басқару жүйелері.
Жасанды Интеллект- бұл адамдар мен жануарлар көрсеткен табиғи ақылға қарағанда, машиналар көрсеткен интеллект.
Machine Learning (ML) - бұл тәжірибе арқылы автоматты түрде жетілдірілетін компьютерлік алгоритмдерді зерттеу.
Big Data- талдауға, ақпаратты жүйелі түрде шығаруға немесе деректерді өңдеудің дәстүрлі қолданбалы бағдарламалық жасақтамасымен өңделуге үлкен немесе күрделі деретер жиынтығымен жұмыс істеуге арналған тәсіл.
Data Mining -адам қызметінің әр түрлі саласындағы керекті шешімдерді қабылдауға қажетті белгісіз мәліметтерден тәжірибеге пайдалы білімді меңгеруге арналған тәсілдерді қолдануды жүзеге асыратын жинақталған ұғым.

Кіріспе
Қазіргі заман талабына сай, соңғы жылдары ақпаратқа қол жетімділіктің жылдам дамуы үлкен деректер қоры мен Data Mining және жасанды интеллект үшін машиналық оқыту алгоритмі, болжамды моделді құру сияқты көптеген маңызды парадигмалық ауысуды белсендендірді.
Болжамдық моделдеу - бұл тиімділеу есебі ретінде құнды инвестициялаудың жүйелік сценарийлерін анықтау және шешудің әдіснамалық негізі [26]. Әр түрлі Data Mining технологиялары және машиналық оқыту алгоритмдері болжамдық талдау моделіне әсер ете алады, осы алгоритмдердің кейбір нақты бизнес-міндеттерін, медициналық мәселелерді шешу үшін әзірленген, сондай-ақ қолданыстағы алгоритмдерді жақсартып немесе олардың кейбірін мақсатты түрде неғұрлым қолайлы ете алатын жаңа мүмкіндіктерді ұсыну арқылы, әр түрлі ғылым саласындағы мәселелерге егжей-тегжейлі түсінік алуға мүмкіндік береді. Бұл зерттеуде ең алдымен ұсынылған алгоритмдерді салыстырып, қазіргі замандағы медицина саласында жүрек ауруына байланысты деректердің мәселелерін шешу үшін болжамды модель құрудың алгоритмдер үрдістері мен прогрестерін шолуға бағытталған.
Зерттеу мақсаты - теориялық және практикалық білімдерді машиналық оқыту әдісін Data Mining негізінде жүзеге асыру.
Зерттеу обьектісі - Үлкен деректер қоры, Data Mining, Машиналық оқыту технологиясынң мүмкіндіктері.
Mақсаттарды шешуді іске асырудың тәсілдері:
Үлкен Деректер қорын, Data Mining, машиналық оқыту технологиясын оқу;
Деректер жинағын дайындау және деректерді зияткерлік талдау (Data mining) құралын таңдау;
Бастапқы деректерді өңдеу;
Нормализациямен деректер жинағын өңдеу;
Машиналық оқыту әдістерін пайдаланып, оң нәтиже көрсетілімі жоғары алгоритмді талдау;
Болжамды модель құру.
Жүргізілген зерттеу нәтижесіне талдау жасау.

Зерттеу барысында келесі тәсілдер қолданылады:
ғылыми әдебиеттерді оқужәне талдау;
Отандық және шетелдік тәжірибелерді қарау және қортындылау;
салыстыру;
талдау;
синтез.
Зерттеу методологиялық және теоретикалық негізі - Data Mining технологиясымен анализ жасауға арналған отандық және шетелдік авторлар еңбегін оқу. Мысалы, Salha M. өзінің зерттеу жұмысында " Жүрек-қан тамырлары ауруларын диагностикалық болжамыды талдау әдістеріне шолу ". Ол өз зерттеуінде алдымен Data Mining технологиясына теориялық түсінігін беруге басты назар аударды. Содан кейін ол медицина ғылымындағы жүрке аурулары мәселесі үшін түрлі ұйымдық теориялар тұрғысынан үлкен деректер феноменін қарастырады. Сонымен қатар, жүйедегі әртүрлі алгоритмдерді салыстыра отырып, медицина ұйымдарының өз мақсаттары үшін үлкен деректерді пайдалануына қажетті негізгі архитектуралық ерекшеліктерін ашып көрсеткен. үлкен деректерде Data Mining технологиясымен талдау жасаудың барлық қолжетімді әдістерді пайдаланатын медициналық ұйымдар мен мекемелердің жүрекпен байланысты әртүрлі деректер жиынтығымен жұмыс істеу мүмкіндігін арттыру басты артықшылық болатыны нақты атап өткен.

Диплом жұмысының мақсаты. Data Mining әдістерін қолдана отырып, жүрек ауруларын болжау бойынша қажетті зерттеулерді қорытындылау, пайдаланылған машиналық оқыту (ML) алгоритмдерінің әртүрлі комбинацияларын талдап, болжамды модель жасаудағы тиімді әдісі екендігі туралы қорытынды жасау. Сонымен қатар, осы зерттеу нәтижесіне негізделіп, жүйе бойынша болашақ бағыттар қарастырылды.
Бұл жобаны іске асыру үшін мен Data Mining және машиналық оқыту (ML) әдістемесін және шешім ағаштары (decision trees) алгоритімін, SVM және нейрондық желілер классификациясын пайдаландым. Мәселенің шешімін Rapid Miner Studio - да орындадым, сондай-ақ жұмыстың талдау нәтижесінің өнімділігін нақта көрсету мақсатында болжамды модель құрылыды.
Қосымшада есептің шешімінің бағдарламасы және физикалық модел келтірілген.
Диплом жұмысының өзектілігі. Болжамды модеь мәселелері соңғы жылдары маңызды бола бастады, сол себептіде көптеген кәсіпорындар және әртүрлі салалар бойынша зерттеушілермен қарастырылды; бұл деректерді зерттеудің қадамдарының бірі ретінде оның кең ауқымдылығы мен пайдалылығын көрсетеді. Осы мақсатта жүрек қан-тамыр ауруының негізгі ақпараттарына талдау жасай отырып түрлі жүрек аурулары мен жүректің өкпе және цианоздық аурулары үшін болжамды модель құру, соған сәйкес жаңа классификацияның әзірлеуді жүзеге асыру.

Диплом жұмысының теориялық маңызы. Data Mining негізіндегі машиналық оқыту алгоритмін үлкен деректер қорына талдау жасаудың барлық мүмкіндіктерін арнайы зерттеу нысаны етіп алу. Сондықтан машиналық оқыту алгоритімі, классификациялау, сонымен қатар болжамды модель құруды теориялық және практикалық жағынан қарастырғанда, зерттеу нәтижесі болашақта жүзеге асатын аса маңызды бастама болары сөзсіз. Мұндай зерттеулердің нәтижелері машиналық оқытудағы озық классификацияның қолданысы мен артықшылықтарының жүйелік, мағыналық, функционалдық және т.б. сипаттарын анықтауда да өзекті мәселелердің бірі болып саналады.
Диплом жұмысының практикалық маңызы көптеген қолданбалы бағдарламалар мен утилиттерді және өзге ақпараттық технологияларды Data Mining , машиналық оқыту негізіндегі үлкен деректерге машиналық оқту техгологиясымен алгоритмдері арқылы талдау жасауды пайдаланып болжамды модель құру жүйені тиімді қолдануға мүмкіндік береді. Диплом жұмыста зеріттелген мәселелер ортасы - денсаулық сақтау ұйымдары мен мекемелеріне, медицина мамандарына, зерттеушілерге көмекші құрал бола алады.

Дипломдық жұмыстың тақырыбы Машиналық оқыту әдістері негізінде жүрек ауруына диагностика және болжау жасау.

Дипломдық жұмыстың көлемі және құрылымы.
Диплом жұмысының құрылымы: дипломдық жұмыс кіріспеден, бес бөлімнен, қорытындыдан, пайдаланылған әдебиеттер тізімінен тұрады.
Кіріспеде зерттеу диплом тақырыбына сай талдау жасалынды. Осының негізінде диплом жұмысының мақсаты, өзектілігі, объектісі, практикалық және теориялық маңызы көрсетіліп, зерттеу әдістері мен әдістемелік негізі сипатталып, дипломды қорғауға енгізілетін негізгі жағдайлар жасалды. Сонымен бірге мақсатты жүзеге асыруда қолданылытын технологияларға жалпы теориялық түсініктеме берілді.
Жұмыстың бірінші бөлімінде деректер қорына анықтама берілді. Сондай-ақ деректер қорыны моделінің түрлері және моделдау кезеңдері анықталды
Екінші бөлімде Data Mining - ның тарихы, ағымдағы жетістіктері және оның қолдануларі, сондай-ақ технологиясы мен алготитмінің теориялық негіздері зерттелді.
Үшінші бөлімде жасанды интеллект теориясына анықтама, машиналық оқытудың теориялық негіздері, машиналық оқытудың негізгі түрлері, қолданылатын алгоритмдері қарастырылды.
Төртінші бөлімде Python бағдарламалау тілінің қолданысы, артықшылығы, интерфейсі мен оның жұмыс жасау принциптері қарастырылды.
Бесінші бөлімде Болжамды модел жасауға талдау жасау, қолданылатын алгоритмдердің түрлері қарастырылып, зерттеу мәселесін Python бағдарламалық тілде жүзеге асырылды Data Mining технологиясы негізіндегі классификация мүмкіндігі қарастырылды. Машиналық оқыту алгоритмінің әдіс-тәсілдерін қолданудың тиімді жолдары қарастырылды және болжамды модель құрылып, жүйеге келтірілді.
Қорытындыда дипломдық жұмысты зерттеудің ұсыныстары мен негізгі қорытындылары, жұмысты жазу барысында қол жеткізген жетістіктер, сонымен қатар программаның мүмкіндіктері мен қолдану және пайдалану аймағы туралы баяндалған.
Дипломдық жұмыстың көлемі 44 бет, құрамында 21 сурет бар. Дипломдық жұмыстың соңында қорытынды, пайдаланылған әдебиеттер тізімі, қосымша берілген.

Деректер қоры
Деректер қоры- бұл әдетте компьютерлік жүйеде электронды түрде сақталатын құрылымдалған ақпараттың немесе деректердің ұйымдастырылған жиынтығы. Деректер қоры деректер қорын басқару жүйесімен (ДҚБЖ) басқарылады. Қазіргі уақытта жұмыс істеп тұрған деректер қорының ең көп таралған түрлеріндегі деректер өңдеу мен деректерді сұрауды тиімді ету үшін әдетте кестелер қатарындағы жолдар мен бағандарда моделденеді, содан кейін деректерге оңай қол жеткізуге, басқаруға, өзгертуге, жаңартуға, басқаруға және ұйымдастыруға болады. Дерекқорлардың көпшілігі деректерді жазу және сұрау үшін құрылымдалған сұрау тілін (SQL) пайдаланады.
Деректер қорының көптеген түрлері бар. Белгілі бір ұйым үшін ең жақсы дерек қоры оның деректерді қалай пайдаланғысы келетіндігіне байланысты айқындалады.
Реляциялық деректер қоры. 1980 жылдары реляциялық деректер қоры басым болды. Реляциялық деректер қорындағы элементтер бағандар мен жолдармен кестелер жиынтығы ретінде ұйымдастырылған. Реляциялық деректер қорының технологиясы құрылымдалған ақпаратқа қол жеткізудің тиімді және икемді тәсілін ұсынады.
Объектіге бағытталған деректер қоры. Нысанға бағытталған деректер қорындағы ақпарат объектіге бағытталған бағдарламалаудағыдай объектілер түрінде ұсынылады.
Таратылған деректер қоры. Таратылған деректер қоры әртүрлі сайттарда орналасқан екі немесе одан да көп файлдардан тұрады. Деректер бір физикалық жерде орналасқан немесе әр түрлі желілерде тармақталған бірнеше компьютерде сақталуы мүмкін.
Деректер қоймалары. Деректерге арналған орталық репозиторий, деректер қоймасы - бұл жылдам сұрау және талдау үшін арнайы жасалған деректер қорының түрі.
NoSQL деректер қоры. NoSQL немесе байланыссыз деректер қоры құрылымданбаған және жартылай құрылымдалған деректерді сақтауға және басқаруға мүмкіндік береді (реляциялық дерекқордан айырмашылығы, дерекқорға енгізілген барлық деректердің қалай құрылуы керектігін анықтайды). NoSQL деректер қоры кең таралды, өйткені веб-қосымшалар кең таралып, күрделене түсті.
Графикалық деректер қоры. Графикалық деректер қоры деректерді субъектілер мен қатынастар арасындағы қатынастарда сақтайды.
OLTP деректер қоры. OLTP дерекқоры - бұл көптеген пайдаланушылар жасаған көптеген транзакцияларға арналған жылдам, аналитикалық деректер қоры.
Жалпы деректер қорының даму кезеңдерінің арасында белгіленген шекара жоқ. Олар бір біріне байланысты болады , сонымен қатар параллелді түрде дамиды. Берілген кезеңдердің әр даму сатысындағы технологиялардың өзгеруі мен олардың ерекшеліктерін анықтауға мүмкіндік береді.
Деректерқоры жүйесі сызбасы 1-суретте көрсетілген. Онда жүйеніңнегізгі төрт компоненті көрсетілген: Деректер, аппараттық қамсыздандыру, бағдарламалъқ қамсыздандыру және қолданушылар.

1 Деректерқоры жүйесінің сызбасы
Деректер қорының моделі
Деректер қорының моделі-бұл деректер қорының қалай құрылымдалғанын және қолданылатынын сипаттайтын теория немесе ерекшелік. Осындай бірнеше модель ұсынылды.
Ең көп таралған модельдер қамтиды
Желілік модель-жылдам қатынауды қолдайтын кез келген сілтемелер.
Иерархиялық модель-байланыс, бірақ циклдарсыз (иерархия).
Реляциялық Модель-Деректердің Тәуелсіздігі.
Объектілі-Бағытталған Модель-Мәндердің Абстракциясы.

Желілік модель
Желілік деректер моделінің танымалдығы иерархиялық деректер моделінің танымалдылығымен сәйкес келеді. Осылайша, желілік модель деректерде "көптеген" қарым-қатынасын моделдеуге мүмкіндік берді. 1971 жылы деректер жүйелерінің тілдері бойынша конференция (CODASYL) желілік моделді ресми түрде анықтады. Желілік моделде деректерді моделдеудің негізгі конструкциясы - бұл жиынтық конструкциясы. Жиын иесінің жазба түрінен, теру атауынан және мүшенің жазба түрінен тұрады. Мүше жазбасының түрі бұл рөлді көп жиынтықта болуы мүмкін, сондықтан көп паренттілік тұжырымдамасы қолдау. Иесінің жазба түрі басқа жиынтықта мүше немесе иесі болуы мүмкін. Деректер моделі қарапайым желі болып табылады және сілтемелер мен қиылыстар жазбаларының типтері (IDMS қосылым жазбалары деп аталатын), сондай-ақ олардың арасындағы жиынтықтар болуы мүмкін . Осылайша, байланыстың толық желісі бірнеше қосарлы жиынтықпен ұсынылған; әр жиынтықта жазбаның кейбір (бір) түрі иесі болып табылады (желі көрсеткісінің соңында), ал жазбалардың бір немесе бірнеше түрі мүше болып табылады (байланыс көрсеткісінің басында). Әдетте жиынтық 1: M қатынасын анықтайды, бірақ 1: 1 қатынасы рұқсат етіледі. CODASYL желілік моделі математикалық жиын теориясына негізделген.
Иерархиялық модель
Деректердің иерархиялық моделі деректерді ағаш тәріздес құрылым түрінде ұйымдастырады. Ата-аналық және еншілес деректер сегменттерінің иерархиясы бар. Бұл құрылым жазбада, әдетте, еншілес деректер сегменттерінде қайталанатын ақпарат болуы мүмкін. Өрістер мәндерінің жиынтығы бекітілген жазбалар сериясындағы деректер. Ол жазба түрі түрінде нақты жазбаның барлық даналарын жинайды. Жазбалардың бұл түрлері реляциялық моделдегі кестелердің баламасы, ал жекелеген жазбалар-жолдардың баламасы болып табылады. Бұл жазба түрлері арасында байланыс жасау үшін иерархиялық үлгі ата-аналық еншілес қатынастарды пайдаланады. Бұл жазба түрлері арасындағы 1: N салыстыру. Бұл математикадан алынған реляциялық моделде қолданылатын жиын теориясы ретінде ағаштардың көмегімен жасалады. Мысалы, ұйым қызметкер туралы ақпаратты қызметкердің аты, нөмірі, бөлімі, жалақысы сияқты сақтай алады. Ұйым сондай-ақ қызметкердің балалары, мысалы, аты мен туған күні туралы ақпаратты сақтай алады. Қызметкерлер мен еншілес элементтер туралы деректер қызметкерлер туралы деректерді ата-аналық сегмент, ал еншілес деректер-еншілес сегмент ұсынатын иерархияны құрайды. Егер қызметкердің үш еншілес сегменті бар болса, онда олардың бірімен үш еншілес сегменті байланысты болады. Иерархиялық деректер базасында "ата-ана - ұрпақ" қатынасы-бұл "көпшілікке біреу"қатынасы. Бұл еншілес сегментті тек бір ата-аналық сегменттің болуымен шектейді. Иерархиялық ДББЖ 1960 жылдардың соңынан бастап, IBM Information Management System (IMS) ДББЖ пайда болуымен, 1970 жылға дейін танымал болды.

Реляциялық модель
(RDBMS-relational database management system) Э. Ф. Кодд әзірлеген реляциялық моделге негізделген деректер қоры. Реляциялық деректер қоры деректер құрылымын, сақтау және шығару операцияларын, сондай-ақ тұтастықты шектеуді анықтауға мүмкіндік береді. Мұндай деректер қорында деректер мен олардың арасындағы қатынастар кесте түрінде ұйымдастырылған. Кесте-бұл жазбалар жиынтығы және кестедегі әрбір жазба бірдей өрістерді қамтиды.
Реляциялық кестелердің қасиеттері:
Мәндер Атомдық
Әр жол бірегей
Бағандардың мәндері бірдей көрінеді
Бағандар тізбегі шамалы
Жолдар тізбегі шамалы
Әрбір баған бірегей атауы бар
Кейбір өрістер кілттер ретінде белгіленуі мүмкін, бұл өрістің нақты мәндерін іздеу оларды жылдамдату үшін индекстеуді қолданады. Егер екі түрлі кестедегі өрістер бір жиынтықтан алынған мәндерді қабылдаса, осы өрістердегі мәндерді салыстыру арқылы екі кестедегі байланысқан жазбаларды таңдау үшін Қосылым әрекетін орындауға болады. Жиі, бірақ әрдайым емес, өрістер екі кестедегі бірдей атқа ие болады. Мысалы, " тапсырыстар "кестесінде жұптар (клиенттің идентификаторы, өнім коды) болуы мүмкін, ал" өнімдер " кестесінде жұптар (өнім коды, бағасы) болуы мүмкін, сондықтан осы клиенттің шотын есептеу үшін Сіз екі кестенің өнім кодының өрісін біріктіре отырып, осы клиент тапсырыс берген барлық өнімдердің бағасын қосасыз. Бұл бірнеше кестелерді бірнеше өрісте біріктіргенше кеңейтілуі мүмкін. Бұл қатынастар тек ретривал кезінде ғана берілгендіктен, реляциялық деректер қоры динамикалық деректер қорын басқару жүйесі ретінде жіктеледі. Реляциялық деректер қорының моделі реляциялық алгебраға негізделген.

Объектілі-Бағытталған Модель
Объектілік ДББЖ деректер қорының функционалдығын бағдарламалаудың объектілік тілдеріне қосады. Олар бағдарламалау тілі объектілерін тұрақты сақтауға қарағанда әлдеқайда көп әкеледі. Объектілік ДББЖ c++, Smalltalk және Java программалаудың Объектілік тілдерінің семантикасын ана тілімен үйлесімділігін сақтай отырып, деректер қорын бағдарламалаудың толық функционалды мүмкіндіктерін қамтамасыз ету үшін кеңейтеді. Бұл тәсілдің негізгі артықшылықтарының бірі қосымшалар мен деректер базасын әзірлеуді бірыңғай деректер моделіне және тілдік ортаға біріктіру болып табылады. Нәтижесінде, қосымшаның талап етеді кем кодын пайдаланады көп табиғи моделдеу деректер, ал деректер кодын оңай ұстап, нысандарды әзірлеушілер қосымша күш-жігері аз деректер қоры үшін толық қолданбаларды жаза алады.
РАО (1994) сәйкес, " объектілі-бағытталған деректер қорының парадигмасы (ЖҚҰБ) объектілі-бағытталған бағдарламалау тілі жүйелерінің (ЖБПЛ) және персистентті жүйелердің комбинациясы болып табылады. ООДБ күші тұрақты деректерді жіксіз өңдеуден, бұл орындалатын бағдарламаларда орын алатындай деректер қорында, сондай-ақ өтпелі деректерді де туындайды."Күрделі деректер құрылымы кестелерге сай болу үшін тегістелуі тиіс реляциялық ДҚБЖ қарағанда, немесе жадтың құрылымын қалыптастыру үшін осы кестелерден біріктірілген, Объектілік ДҚБЖ веб-желіні немесе өзара байланысты объектілердің иерархиясын сақтау немесе алу үшін өнімділікке үстеме шығындар болмайды. Бұл Объектілік бағдарламалау тілі объектілерін деректер қоры объектілерімен өзара бір жақты салыстыру басқа сақтау тәсілдерімен салыстырғанда екі артықшылығы бар: ол объектілерді басқарудың жоғары өнімділігін қамтамасыз етеді және объектілер арасындағы күрделі өзара байланысты жақсы басқаруға мүмкіндік береді. Бұл объективті ДҚБЖ қаржы қоржынының тәуекелдерін талдау жүйесі, телекоммуникациялық қызметтердің қосымшасы, дүниежүзілік паутина құжаттарының құрылымы, жобалау және өндіріс жүйесі, сондай-ақ деректер арасындағы күрделі өзара байланыстары бар ауруханалардың пациенттерін есепке алу жүйесі сияқты қосымшаларды қолдау үшін неғұрлым қолайлы етеді.
Деректерді моделдеу
Деректерді моделдеу ( data Modeling) - деректер қорында деректерді сақтау үшін деректер моделін құру процесі. Бұл модель деректер объектілерін, әр түрлі деректер объектілері мен ережелер арасындағы қауымдастықтарды концептуалды ұсыну болып табылады. Деректерді модельдеу деректерді визуалды көрсетуге көмектеседі және деректерге қатысты бизнес-ережелерді, нормативтік талаптарды және мемлекеттік саясатты сақтауды қамтамасыз етеді. Деректер модельдері атау, әдепкі мәндер, семантика, деректер сапасын бір уақытта қамтамасыз ету кезінде қауіпсіздік келісімдерін қамтамасыз етеді.
Деректер моделі деректермен қандай операцияларды орындау қажет емес, қандай деректер қажет және олар қалай ұйымдастырылуға тиіс екендігіне назар аударады. Деректер моделі тұжырымдамалық модель құруға және деректер элементтері арасында байланыс орнатуға көмектесетін сәулетші ғимаратының жоспарына ұқсас.

Деректер моделін пайдаланудың негізгі мақсаты:

Деректер қоры талап етілетін барлық деректер объектілерін нақты ұсынуды қамтамасыз етеді. Деректерді жіберу қате есептерді жасауға және дұрыс емес нәтижелерді алуға әкеледі.
Деректер моделі деректер қорын тұжырымдамалық, физикалық және логикалық деңгейде жобалауға көмектеседі.
Деректер моделінің құрылымы реляциялық кестелерді, бастапқы және сыртқы кілттерді және сақталатын процедураларды анықтауға көмектеседі.
Ол базалық деректер туралы нақты түсінікті қамтамасыз етеді және физикалық деректер базасын құру үшін деректер қорын әзірлеушілер пайдалана алады.
Бұл сондай-ақ жетіспейтін және артық деректерді анықтау үшін пайдалы.
Деректер моделін бастапқы құру еңбекті қажет ететін және көп еңбекті қажет ететін процесс болса да, ұзақ мерзімді перспективада бұл ИТ-инфрақұрылымын жаңарту мен қызмет көрсетуді арзан әрі жылдам етеді.

Деректер үлгілерінің түрлері
Деректер үлгілерінің үш түрлі түрі бар:
Тұжырымдамалық: бұл деректер моделі жүйе бар екенін анықтайды. Бұл модель әдетте Бизнестің мүдделі тараптары мен сәулетшілерімен жасалады. Мақсаты бизнес-тұжырымдамалар мен ережелерді ұйымдастыру, қамту және анықтау болып табылады.
Логикалық: ДҚБЖ-ға қарамастан жүйе қалай іске асырылуы тиіс екенін анықтайды. Бұл модель әдетте деректер сәулетшілері мен бизнес талдаушылармен жасалады. Жұмыстың мақсаты ережелер мен деректер құрылымының Техникалық картасын әзірлеу болып табылады.
Физикалық: бұл деректер моделі нақты ДҚБЖ жүйесін пайдалану арқылы жүйе қалай іске асырылатынын сипаттайды. Бұл модель әдетте деректер қорын басқару және әзірлеушілер жасайды. Мақсаты деректер базасын нақты енгізу болып табылады.

Деректер қорының моделі

Тұжырымдамалық үлгі
Бұл моделдің негізгі мақсаты мәндерді, олардың атрибуттарын және қатынастарын орнату болып табылады. Деректерді моделдеудің осы деңгейінде деректер қорының нақты құрылымының қандай да бір детализациясы іс жүзінде жоқ.
3 деректер моделінің негізгі элементтері
Мәні: нақты нәрсе
Атрибут: объектінің сипаттамалары немесе қасиеттері
Байланыс: екі нысан арасындағы тәуелділік немесе байланыс
Мысалы
Клиент пен өнім-бұл екі нысан.
Клиенттің нөмірі мен аты-клиент мәнінің атрибуттары
Өнім атауы мен бағасы өнім мәнінің атрибуттары
Сату-сатып алушы мен өнім арасындағы қарым-қатынас

Тұжырымдамалық модель

Тұжырымдамалық деректер моделінің сипаттамалары
Бизнес-тұжырымдамалардың кең ұйымдастырушылық қамтылуын ұсынады.
Бұл түрі деректер үлгілерін әзірлейді және әзірлейді бизнес-аудитория үшін.
Тұжырымдамалық модель деректер қоймасының сыйымдылығы, орналасқан жері немесе ДҚБЖ жеткізушісі және технология сияқты бағдарламалық қамтамасыз етудің спецификациясы сияқты Жабдықтың техникалық сипаттамаларына қарамастан әзірленеді. Негізгі назар деректерді "шынайы әлемде"қандай пайдаланушы көре алатындай етіп ұсынуға бөлінеді."
Пәндік саланың моделі ретінде белгілі деректердің тұжырымдамалық модельдері барлық мүдделі тараптар үшін негізгі ұғымдар мен қолдану саласын белгілей отырып, ортақ сөздік жасайды.
Деректердің логикалық моделі
Логикалық деректер моделдері концептуалды модель элементтеріне қосымша ақпаратты қосады. Ол деректер элементтерінің құрылымын анықтайды және олардың арасындағы қатынастарды орнатады.

Логикалық модель

Логикалық деректер моделінің артықшылығы ол физикалық модель базасын қалыптастыру үшін негізді қамтамасыз етеді. Дегенмен, моделдеу құрылымы әмбебап болып қалады. Деректерді моделдеудің бұл деңгейінде бастапқы та, екінші да кілт та анықталмайды. Бұл деректер үлгілеу деңгейінде байланыс үшін бұрын берілген қосқыштың мәліметтерін тексеру және түзету қажет.
Логикалық деректер моделінің сипаттамалары
Бір жоба үшін деректердің қажеттілігін сипаттайды, бірақ жобаның көлеміне негізделген деректердің басқа логикалық моделдерімен интеграциялануы мүмкін.
ДҚБЖ-ға қарамастан әзірленеді және әзірленеді.
Деректер атрибуттары дәл және ұзындығы бар деректер типтері болады.
Моделді қалыпқа келтіру процестері әдетте үш қалыпты форма қолданылады.

Деректердің Физикалық Моделі
Физикалық Деректер моделі деректер қорындағы деректер моделінің нақты іске асырылуын сипаттайды. Ол деректер қорын абстракциялауды ұсынады және схеманы құруға көмектеседі. Бұл физикалық Деректер моделі ұсынатын метадеректердің байлығына байланысты болады. Бұл деректер моделінің түрі деректер қорының құрылымын визуализациялауға көмектеседі. Бұл деректер қоры бағандарының кілттерін моделдеуге көмектеседі, шектеулер, индекстер, триггерлер және басқа да ДҚБЖ функциялары.

Физикалық модель

Деректердің физикалық моделінің сипаттамалары:
Деректердің физикалық моделі бір жоба немесе қосымша үшін деректердің қажеттілігін сипаттайды, бірақ ол жобаның көлеміне негізделген басқа физикалық деректер үлгілерімен интеграциялануы мүмкін.
Деректер моделі осы қатынастардың күші мен нөлденуі туралы мәселені шешетін кестелер арасындағы қарым-қатынасты қамтиды.
ДҚБЖ-ның нақты нұсқасы, орналасу орны, деректерді сақтау немесе жобада пайдаланылатын технология үшін әзірленген.
Бағандар нақты деректер түрлері, тағайындалған ұзындығы және әдепкі мәндер болуы тиіс.
Бастапқы және сыртқы кілттер, көріністер, индекстер, кіру бейіндері, Рұқсаттар және т.б. анықталады.

Data Mining
Data Mining ақпараттық технология дамыған заманның әр түрлі саласындағы керекті шешімдерді қабылдауға қажетті деректерді тәжірибеге, пайдалы білімді меңгеруге арналған әдістердің қолданылуын жүзеге асыратын жинақталған ұғым. Графтарды, жасанды нейрондық желілерді, генетикалық алгоритмдерді, эволюциялық программалауды, ассоциативтік жадыны, көмескі логиканы қолжетімді классификация әдіс-тәсілдері, модельдеу мен болжау Data Mining - тәсілінің негізі болып табылады. Dta Mining технологиясында статистикалық әдістер (дескриптивтік талдау, коррелияцық және регрессиондық талдау, факторлық талдау, дисперциялық талдау, кешендік талдау, дискриминанттық талдау, уақытша қатарлық талдау,тіршілікке қабілеттілікті талдау, байланыстық талдау ) кіреді. Мұндай әдістер, көбіне, Data Mining мақсатына сәйкес деректерді талдаудың априорлық ұсынылымын( бұрыннан белгісіз тривиалсыз және тәжірибеге пайдалы білімдер) көрсетеді.
Шын мәнінде, деректерді табу - бұл әр түрлі кезеңдердегі деректерді алу процесі. сурет.2 де белгілі бір саладағы әр түрлі дерек көздерінен білім табу процесі көрсетілген. Data Mining - бұл деректердің үлкен көлемінен белгісіз, бірақ мәні құнды білімдерді анықтауға әкелетін негізгі қадам. Деректерді интеллектуалды талдау технологиясы пайдаланушыға массивті деректерден жаңа және маңызды мәліметтерді іздеу әдістерін ұсынады.

Деректердегі білімді анықтау процессі

Денсаулық сақтау саласында табылған білімді диагностикасының дәлдігін арттыру, хирургиялық операциялардың сапасын жақсарту және дәрілік препараттардың зиянды әсерін төмендету үшін денсаулық сақтау әкімшілері мен дәрігер-дәрігерлер пайдалана алады [2], [3]. Ол сондай-ақ қымбат емес терапевтік терапияны ұсынуға бағытталған [4]. Аурулардың диагностикасы-бұл күрделі, бірақ медицинада өте маңызды міндет. Жүрек ауруларын "әртүрлі факторлар немесе симптомдар" бойынша анықтау-бұл күтпеген салдарлармен жиі болатын жалған болжамдардан бос емес көп деңгейлі мәселе" [5]. Осылайша, диагностика процесін жеңілдету және аурулардың белгілі бір белгілерімен айналысатын көптеген мамандардың білімі мен тәжірибесін пайдалану үшін жиналған және жазылған пациенттердің деректерін пайдалана аламыз. Баға жетпес қызметтерді аз шығынмен ұсыну медициналық ұйымдар (ауруханалар, емханалар және медициналық орталықтар) тарапынан негізгі шектеулердің бірі болып табылады. Сонымен қатар, ауруханалардың клиникалық сынақ құнын төмендетуі өте маңызды. Машиналық оқыту және Data Mining әдістеріне негізделген кәсіби және сараптамалық компьютерленген жүйелерді пайдалану белгілі бір бағытта клиникалық сынақтарға немесе қауіп-қатерді төмендету кезінде диагностикаға қол жеткізуге көмектесе алады.
Денсаулық сақтау саласындағы Data Mining технологиялары
Пациенттердің ауру белгілері мен жазбалары функция ретінде пайдаланылуы мүмкін және мұндай ауқымды деректер көлемі денсаулық сақтау саласындағы ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Реляциялық модельге сәйкес Деректер Базасы
МӘЛІМЕТТЕР ҚОРЫНЫҢ ДАМУЫ
Мәліметтер қорының басқа да модельдері туралы ақпарат
Деректер қорының жіктелуі
Мәліметтердің ақпараттық модельдері: фактографиялық, реляциялық, иерархиялық, желілік.
Деректер қорының жобасын дайындау
Деректер қорын логикалық модельдеу
Ақпараттық технологиялар факультеті
Деректер базасының архитектурасы
ДЕРЕКТЕР ҚОРЫНЫҢ ТЕОРИЯСЫ
Пәндер