Қазақ тілінен орыс тіліне машиналық аударма жасайтын программалық кешенін өңдеуі (генератор)

КІРІСПЕ 5
1 АНАЛИТИКАЛЫҚ ШОЛУ 7
1.1 Машиналық аудармашының тарихы 7
1.2 Машиналық аудармашының сәулеті 9
1.3 Қазақ.орыс аудармашысының қазіргі күйі 9
2 ҚАЗАҚ.ОРЫС ТІЛДЕРІНДЕГІ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ 11
2.1 Машиналық аударманың талдауы 11
2.2 Қазақ тілінен орыс тіліне машиналық аудармашының концептуалдық моделі 14
2.3 Формальді грамматика 17
2.3.1 Формальді грамматиканың және тілдің анықтамасы 18
2.3.2 Формальды грамматиканың типтері 21
2.3.3 Қазақ тілінің формалды грамматикасы 24
2.4 Лексикалық талдау моделі 24
2.4.1 Сөз таптары 25
2.5 Синтаксистік талдау моделі 32
2.5.1 Қазақ тілі мен орыс тілінің жалғауларының арасындағы байланыс 33
3 ҚАЗАҚ ТІЛІНДЕГІ СӨЗДЕРДІ ТАЛДАУДЫҢ ӘДІСТЕРІ МЕН АЛГОРИТМДЕРІН ҚҰРУ 38
3.1 Лексикалық талдау 38
3.2 Синтаксистік талдау 40
3.3 Синтаксистік генератор 40
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ 42
4.1 Мәліметтер қорының құрылымы 42
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ 47
5.1 Қолданылған программалау тілі 47
5.2 Қолданылатын программалық процедура 48
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 50
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ 52
7.1 Машиналық аудармашының сапасын бағалау үшін әдістемені құру 52
7.2 Машиналық аудармашының сапасын бағалауға шолу 52
7.3 Машиналық аудармашы сапасының эксперттік бағалау методикасын құру 54
ҚОРЫТЫНДЫ 56
ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 57
А ҚОСЫМШАСЫ 58
Ә ҚОСЫМШАСЫ 62
Б ҚОСЫМШАСЫ 63
Бұл дипломдық жұмыс қазақ тілінен орыс тіліне машиналық аударма жасау технологиясына арналған. Қазіргі заманда мұндай технологияның қажеттілігі өте жоғарғы деңгейде.
Бұл программаны жасау үшін бірінші қазақ тілімен орыс тілінің грамматикасын терең зерттеп, олардың арасындағы байланысты қарастырып, келесі бөліктерге бөлдім:
• Сөздердің түбірлерінің және сәйкес аудармаларының қорын құру;
• Қазақ тілінің лексикалық (морфологиялық) талдауы;
• Қазақ тілінің синтаксистік талдауы;
• Орыс тілінің лексикалық және синтаксистік талдауы;
• Машиналық аудармашының көмегімен мәтіндерді өндіру.
Қазіргі күнде Қазақстан Ресубликасында барлық құжаттар мемлекеттік тілге аударылуда. Техникалық терминологияның аудармасы үлкен жағымсыздықтар алып келеді. Осы мәселені шешуде машиналық аудармашының тигізер көмегі өте зор. Мысалы, белгілі бір өндіріс саласындағы стандарттарды, бұйрықтарды, заңдардың барлығын аудару үшін сол саланың терминологиясы енгізілген машиналық аудармашыны қолдану жұмысты ондаған есе жеңілдетеді.
Тіпті көп жағдайларда мәтінді терудің де қажеті болмайды. Сканермен өткізіп, алынған мәтінді аудармашыға көшірген жеткілікті.
Қазіргі заманғы жүйелерді дұрыс қолдану үшін, машина сөйлемді қалай аударатынын түбегейлі білу секілді машиналық аудармашыны бағалау үшін өзінің бір стандарты қажет. Мұндай стандартты орнату туралы негізгі талқылаулар тек қазіргі уақытта басталды, бірақ келісімді қабыладу үшін көп уақыт кетпейді, себебі оларды қарастыратын болсақ, әсер ететін көптеген факторлар бар. Бағалау факторлары қолдану мақсатына қарай бөлінеді. Бағалауда қарастырылуы қажет факторлар:
1. Өнім, операция және қызмет көрсету бағасы; үйрету, мәтіндік енгізу, қарапайым сөздер және арнайы терминология үшін сөздікті жаңарту; өңдеу, қорытынды мәтіндік дайындық, аударма сапасы мен бағасы арасындағы қатынас.
2. Мәтінді енгізу жылдамдығы, алдын ала өңдеу (жұмыс үстелі мен сандарды, және т.с.с. өңдеулерді қоса алғанда), машиналық аудармашы, қорытынды мәтінді өңдеу келсімді форматтайды (жұмыс үстелі мен сандарды, және т.с.с. өңдеулерді қоса алғанда), алдын ала өңдеу мен кейінгі өңдеу қатынасы.
3. Дұрыстығы, түсініктілігі, және қарапайымдылығы көз қарасы бойынша алынған сапалылығы.
4. Сөздікті өзгертудің жетілідірілгендігі, жүйенің негізгі сөздігі мен тұтынушылық сөздігі деңгейін жоғарылату, әсіресе белгілі бір аумақтағы әлеуметтік диалект үшін грамматиканы жетілідіру, тұтынушыларға сөздік пен грамматиканы жақсартудың рұқсат етілген деңгейі, және жетілідірілгеннен кейін әдісті тексеруге болатын жүйе мүмкіндігі.
5. Жүйені бір мәтіндік аумақтан екіншісіне және бір тілден екінші тілге кеңейту мүмкіндігі.
1. Бектаев “Қазақ-орыс сөздігі”
2. Э.Д Сулейменова и др. “Анықтағыш.” Учебный курс по изучению казахского языка / Э.Д Сулейменова, К.К Кадешова, Д.Х Аканова – Асатана: Издательство «Арман-ПВ» 2007 г – 240 стр. 227-229
3. Бектұров Ш.К “Қазақ тілі: лексика, фонетика, морфология, синтаксис” / - Алматы: Атамұра, 2006.-336 бет.
4. “Build Your Own ASP.NET 3.5 Web Site Using C# & VB” by Cristian Darie and Wyatt Barnet, 3rd edition.
5. N.Kultin “C# in tasks and its solutions”, Saint-Petersburg, Science 2007, 241p.
6. Мырзатай Серғалиев “Қазақ тілі” оқыту методикасы / Алматы – Атамұра 1992, 80 бет.
        
        ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ
ӘЛ-ФАРАБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ
Механика-математика факультеті
Ақпараттық жүйелер кафедрасы
Кафедра меңгерушісінің ... ... ... ... ... ЖҰМЫС
«Қазақ тілінен орыс тіліне машиналық аударма жасайтын программалық
кешенін өңдеуі (генератор)»
050703 – “Ақпараттық жүйелер” мамандығы
Орындаған 4 курс ... ... ... ... ... ... Қожанова
Алматы 2012
РЕФЕРАТ
В данной дипломной работе иследовался перевод текста с казахского на
русский ... ... ... есть ... вариантов программ, переводящих текст с
казахского на русский язык. Но все эти ... еще не ... ... ... ... все ... ... присутствуют в ранних
версиях переводчиков, были разработаны новые ... ... ... ... ... 7 ... ... Список использованной
литературы и Приложение. Объем работы 52 страницы. На ... ... ... 19 ... ... ЭЕМ-де бір табиғи тілдегі мәтіннің мазмұны
жағынан эквивалентті басқа тілдегі мәтінге түрлендірілуі.Машиналық аударма
қазіргі ... ... ... бір ... ... ... ... семантикалық жүйе. Онын ең басты қызметі ақпарат ... ... және ... ... ... ... өмір туралы білімді сактаумен бірге, жаңа білімді ... ... ... процесін жетілдіріп қамтамасыз ететін қоғамдык сипаты
бар құбылыс. Сөз тіркесі ( орыс. словосочетание ) деп ... ... екі ... ... әрі мағыналық жағынан бағына байланысуын
атаймыз.
Сөйлем деп бір шама ойды ... бір ... я ... ... Тиянақталған ойды ауызша да, жазбаша да білдіруге болады. ... ... мен ... ... ... ... болады. Жазуда бір
сөйлем екінші сөйлемнен нүкте, сұрау және белгілерінің бірімен айырылады.
Лексика(грек. лексикос — сөздік) — тілдегі сөздердің жиынтығы, сөздік
құрам. ... ... ... сөздер кіреді. Сөздер қолданылуына қарай
актив және пассив болып бөлінеді. Актив ... ... ... ... сөздер жатады. Ал пассив сөздерге қолданылу өрісі шектеулі
көнерген сөздер, ... мен ... ... терминдер жатады.
Морфология (биология) - ағзаның пішіні мен құрылымы туралы ғылым.
Морфология (гр. morf — түр, тұлға, logos — сөз, ...... ... ... ... ... мен ... даму заңдылықтарын зерттейтін тіл
ғылымының бір сапасы.
Синтаксис ( гр. σύνταξις - құру, тәртіп, ... ) - сөз ... ... ... ... дағдысы бойынша сөздер өз ара белгілі
бір жүйемен тіркеседі. Сол тіркестердің де, сөйлемдердің де өз жүйелері, өз
заңдары ... ... ... зерттейді.
Семантика (көне грекше σημαντικός - танбалаушы, білдіруші) — тіл және
тіл бірліктері (сөз, грамматикалық тұлға, сөз тіркесі,сөйлем) ... ... ... мен ... ... ... саласы, семиотиканың негізгі бөлімдерінің бірі.
Грамматика (гр. 'grammatіke, γράμμα' – әріп, жазу) – тіл білімінің сөз
таптарын, сөздердің өзгеруі мен сөйлем құрылысын зерттейтін саласы.
МАЗМҰНЫ
КІРІСПЕ 5
1 АНАЛИТИКАЛЫҚ ШОЛУ ... ... ... ... 7
1.2 Машиналық аудармашының сәулеті ... ... ... ... күйі 9
2 ҚАЗАҚ-ОРЫС ТІЛДЕРІНДЕГІ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ ... ... ... ... ... Қазақ тілінен орыс тіліне машиналық аудармашының концептуалдық моделі
14
2.3 Формальді грамматика 17
2.3.1 Формальді грамматиканың және тілдің анықтамасы ... ... ... ... ... ... ... формалды грамматикасы 24
2.4 Лексикалық талдау моделі 24
2.4.1 Сөз таптары ... ... ... моделі 32
2.5.1 Қазақ тілі мен орыс тілінің жалғауларының арасындағы байланыс 33
3 ... ... ... ... ... МЕН АЛГОРИТМДЕРІН ҚҰРУ
38
3.1 Лексикалық талдау 38
3.2 ... ... ... ... ... 40
4 ... ... 42
4.1 Мәліметтер қорының құрылымы 42
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ ... ... ... тілі ... ... ... ... 48
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 50
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ ... ... ... сапасын бағалау үшін әдістемені құру 52
7.2 ... ... ... ... шолу ... ... аудармашы сапасының эксперттік бағалау методикасын құру
54
ҚОРЫТЫНДЫ ... ... ... 57
А ҚОСЫМШАСЫ 58
Ә ҚОСЫМШАСЫ 62
Б ҚОСЫМШАСЫ 63
КІРІСПЕ
Бұл дипломдық жұмыс қазақ тілінен орыс ... ... ... ... ... ... заманда мұндай технологияның қажеттілігі
өте жоғарғы деңгейде.
Бұл программаны ... үшін ... ... ... орыс ... ... зерттеп, олардың арасындағы байланысты қарастырып,
келесі бөліктерге ... ... ... және ... аудармаларының қорын құру;
• Қазақ тілінің лексикалық (морфологиялық) ... ... ... ... ... Орыс ... ... және синтаксистік талдауы;
• Машиналық аудармашының көмегімен мәтіндерді өндіру.
Қазіргі күнде Қазақстан Ресубликасында барлық ... ... ... ... ... ... үлкен жағымсыздықтар
алып келеді. Осы мәселені шешуде машиналық аудармашының ... ... ... ... ... бір ... ... стандарттарды, бұйрықтарды,
заңдардың барлығын аудару үшін сол ... ... ... ... ... ... ондаған есе жеңілдетеді.
Тіпті көп жағдайларда мәтінді терудің де қажеті болмайды. Сканермен
өткізіп, алынған мәтінді аудармашыға көшірген жеткілікті.
Қазіргі ... ... ... ... ... ... сөйлемді қалай
аударатынын түбегейлі білу ... ... ... ... үшін
өзінің бір стандарты қажет. Мұндай стандартты орнату туралы ... тек ... ... басталды, бірақ келісімді қабыладу үшін көп
уақыт кетпейді, себебі оларды қарастыратын болсақ, әсер ... ... бар. ... ... ... ... қарай бөлінеді.
Бағалауда қарастырылуы ... ... ... ... және ... ... ... үйрету, мәтіндік енгізу,
қарапайым сөздер және арнайы терминология үшін ... ... ... мәтіндік дайындық, аударма сапасы мен бағасы арасындағы қатынас.
2. ... ... ... алдын ала өңдеу (жұмыс үстелі мен
сандарды, және т.с.с. өңдеулерді қоса ... ... ... мәтінді өңдеу келсімді форматтайды (жұмыс үстелі мен сандарды,
және ... ... қоса ... ... ала ... мен ... ... Дұрыстығы, түсініктілігі, және қарапайымдылығы көз қарасы бойынша
алынған сапалылығы.
4. Сөздікті өзгертудің жетілідірілгендігі, жүйенің ... ... ... ... ... ... әсіресе белгілі бір аумақтағы
әлеуметтік диалект үшін грамматиканы жетілідіру, тұтынушыларға сөздік ... ... ... етілген деңгейі, және жетілідірілгеннен
кейін әдісті тексеруге болатын жүйе мүмкіндігі.
5. Жүйені бір мәтіндік ... ... және бір ... екінші
тілге кеңейту мүмкіндігі.
6. Операциялық штат саны, алдын ала ... ... ... және сөздікке
қызмет көрсететін адамдар көзқарасы жағынан тұтынушымен қойылатын күш салу
деңгейі, құжаттар жүйесі құрылымын машианлық аударуға ... үшін ... ... ... ... ... ... тілдің тұжырымдарын
басқаруға қажетті сынақтан өткізу мен ретке келтіру уақыты.
7. Грамматика, ... ... мен ellipsis қоса ... ... ... ... ... жылдамдығы,
мүмкіндігін зерттеу, интерактивтік аударма немесе кейіннен өңдеу, ауыспалы
мағыналылық шешімі, тек ең ... ... ... немесе сөйлемдер үшін
барлық мүмкін құрылымдар жасау үшін ... ... мен ... ... әрқашанда өзекті қазіргі заман талабына сай, және қажетті
екенін білдіреді.
1 АНАЛИТИКАЛЫҚ ШОЛУ
1.1 Машиналық аудармашының тарихы
Соңғы кездері шет ... білу тек ... ... шет ... ... ... алу кезінде ғана емес, өз үйіңнің ішінде де, мысалы,
танымал голливуд киноларын ... ... арғы ... ... ... арналған нұсқауларын немесе шаршамайтын браузер бүкіл
әлемнен іздеп шығатын Web-беттерін ... ... ... ... ... шықпай жатып–ақ бізге аудармашылар көмегі қажет екенін түсінеміз.
Алайда бізге қажетті көмекті үйде ... ... ... ... ... (МА) ... таң қаларлық нәрсе болудан қалған.
Олар өзінің балалық кезеңінен біртіндеп шығып, және де байланыспаған ... ... ... ... ... ... ... сөйлеуде. Аяққы
кезге дейін мұндай бағдарламалар, бағасы жағынан қуатты графикалық ... ... ... ... ... қана қоймай, олармен жұмыс ... қиын және ... ... ... ... жеке компьтерлерде қолдануға
жарамды ... ... ... ... ... ... танысып,
мүмкіндіктерін бағалайық. Бірақ, әрине алдымен МА тарихынан бастаймыз.
Биографтар айтуы бойынша, XIX ғасырдың өзінде атақты математик Чарльз
Бэббидж британдық ... оның ... ... ... бойынша
зерттеулерін қаражаттандыру керек екендігіне көз жеткізуге ... ... ... ... ... ол ... бір ... бұл машина автоматты түрде
сөздерді аударады деп уәде ... ... ... ... компьютер
жұмысының негізінде жатқан көптеген идеялар авторы болып саналғанмен, ол
өзінің машинасын да, уәде еткенің де іске ... ... ... Ал бұл ... күнге дейін айтарлықтай деңгейде жүзеге асырылмаған ... ... ... ... ... ... ... Интернеттің пайда болуына
байланысты бұл идея қайтадан ... ... мен ... ... МА-ның алғашқы бағдарламалары, компьютер пайда болғаннан кейін
бірнеше ғана ... ... соң, 50-ші ... ... бірақ ПК кең таралуына
дейін МА есептеуіш техниканы қолданудың ... ... гөрі ... ... объектісі ғана болды, оның негізгі екі себебі бар:
компьютердің жұмыс ... ... ... және оның ... ... қолдану. Соңғы жағдай, МА-ның оның ... ... ... ... ... көмекшіні
бірден қолдануға мұрсат бермеді.
МА-ның туылған күні болып (зерттеу ... ... 1947 ж ... бәрі ... ... Рокфеллеров фондының жаратылыстану ғылымы
бөлімінің директоры, Норберт ... сол ... ... ... ... басталды. Онда аудару мәселесі мәтінді дешифровка ... ... сол ... өзінде ақ электромеханикалық құрылғыларда
орындалатын. Бұл хаттың артынан көптеген талқылаулар жүргізілді, ... ... ... ... ж ... ... Бар Хиллелмен ұйымдастырылған ... ... Онда ... ... ... синтаксистік ережелерін
ұймдастыруға, семантиканы, морфологиялық ... ... ... үшін
сөздіктер құрылымын сипаттау әдістеріне қатысты өз ойларымен бөлісті.
Академиялық зерттеулердегі ... МА ... ... ... және IBM фирмасы АҚШ-тағы Джорджтаундық университетпен
бірге 1954 жылы 250 сөзден тұратын ... пен 6 ... ... және 49 ... ала ... сөйлемнің аудармасын қамтамасыз
ететін ... ... ... ... Бұл ... зерттеулер тізімін
көбейтті: келесі он жылда АҚШ үкіметі және ... ... МА ... 40 млн. ... жуық қаражат жұмсады.
Бірінші нәтижеден алынған эйфориядан МА іске аспауын толығымен ... ек ... жыл ... ... ... АҚШ ... ... қолданбалы лингвистика бойынша арнайы комитетінің ... ... ... Онда автоматты аудару жүйесі болашақта қажетті
сапаны қаматамасыз ете ... деп ... Бұл есеп беру МА ... ... тигізді, соның салдарынан АҚШ пен Европада қаражат болмағандықтан
қандай болмасын зерттеу ... ... Тек 70 ... ... ... іздеу мен жасанды интеллекттің ... ... мен ... ... артуына
байланысты МА зерттеулері қайта жандандырылды.
Тек 80 жылдардың басынан, ПК ... және ... ... әлемді жаулап
ала бастағаннан кейін, олардың жұмыс істеу уақыты арзандады және оны кез
келген ... ... ... бола ... ... МА ... ... пайдалы бола бастады. Сол ... және одан ... ... жетілдірілуі мәтіндердің көптеген ... тура ... бере ... алайда МА проблемалары осы күнге дейін шешілмей тұр.
90 жылдарды ... ... ... ... ... кезеңі деп
санауға болады, ол ПК мүмкіндігінің жоғары деңгейімен, сканерлер мен OCR
программасының ... ... ғана ... ... де ... ... ... Ол жеке инвесторлар мен
мемлекеттік құрылым үшін қаражат салудың ең ... түрі бола ... ... ... кемшіліктері болғанымен, көптеген ұйымдар
Бэббидждің берген уәдесін еске түсіре бастады. «Машиналық ... әлі ... ... ... оның ... құжаттың негізгі
мағынасын түсіне алады»,- МА-мен ... ... ... ... ... Alta Vista ... ... Луи Монье солй деп санайды.
Европалық Бірлестіктің Мемлекеттері соңғы 15 жылда осы мәселе бойынша
зерттеулерге 70 млн. доллардан ... ... ... ал ... ... - 200млн. доллардан артық. MT SUMMIT VI де ... өз елі ... ... ... ... баяндама жасаған Т.Р.Педтке айтуы
бойынша бұл бағыттың дамуындағы ... ... ... ... ... жоғарғы технологиялардың дамуындағы және АҚШ-тың ... ... ... ... ... ету ... ... мәселе болып тұр.
1.2 Машиналық аудармашының сәулеті
ПРОМТ ... ... ... ... үш ... ... ... , “базалық” қабат – бұл translation engines, сөздік ... ... ... ... ... ... ... және сөздік мәтінді
өңдеуге мүмкіндік беретін модульдер.
... kernel – ... ... ... ... ... Ол ... барлық объектілерін басқаратын,
мәліметтерді ... ... ... ... ... ... ... ішкі форматында көрсетуді қамтамасыз
ететін модульдер жиынынан тұрады. Бұл ... ... ... ... мен оңай жұмыс істейтін және құжаттарды жөнелту
функциялары бекітілетін қосымшаларға осы ... қол ... ... ... API ... жасаған архитектура функционалдылық пен тұтынушы интерфейсі
тұрғысынан ... жаңа ... ... ... ... және пайда
болған архитектураға жөнелтудің жаңа бағыттарын да ... ... ... қабат – шет тілдерде мәтіндерді өңдеу барысында тұтынушыларға
тиімді ... ... әр ... қызметтер көрсететін ... ... кең ... ... ... ... ... сұраныстарына оңтайлы жауап беруге, жаңа нарыққа тез
шығу, жаңа өнімдерге қол ... жаңа ... ... ... ... жөнелтудің жаңа бағыттарын шығаруға мүмкіндік береді.
Мысалы, әлемдік ... ERP/CRM ... ... осы компанияның
ішкі қажеттіліктері үшін Элертронды сөздікдың мамандандырылған жүйесі
жасалды. ПРОМТ компаниясының жөнелтудің тапсырылған ... үшін ... ... ... ... да, бұл тапсырма небәрі бірнеше ай ішінде жасап
шығарылды.
1.3 Қазақ-орыс аудармашысының қазіргі ... ... ... ... ... ... іске ... ал орысша-қазақша аудармаға келетін болсақ, оны
жүзеге асыру ... ... 10-15 жыл ... ... ... ... ... осы мәселемен айналысқан фирмалардың бұл ... ... ... ... ... тек идея ... ғана болып қала
берді. Жобаның іске асырылуы баяу дамыды, тек 2006 жылы ҚР ... ... ... ... ... ... ... қазақ тілін дамытуға байланысты бірнеше тендерлар өткізілді.
Соның ішінде компьютерлік ... және ... ... де ... ... ... таңда машиналық аударма идеясын іске асыруда әл-Фараби
атындағы ҚазҰУ, Л.Н. ... ... ЕҰУ, Абай ... АМУ және ... Қазақстанның ірі жоғарғы оқу орындарымен қатар бірнеше Қазақстандық
«Санасофт», ... ... және ... ... ... жұмыс атқарауда
және «электронды аудармашылары» бар сайттарда жетіп артылады. Мысалы, INDEX
GROUP интернет агенттігінің ... ... ... ... ... ... ... басшылығымен жасалған 4 бағытта аударма
жасайтын «ILK.KZ» онлайн-аудармашысы және ... ... 750 ... артық
сөз бен сөзтіркестерінен тұратын Каюпов ... ... ... «SOYLEM» аударма жүйесі.
Аталған автоматты аударма жасау жүйесінің басым бөлігі тек ... ғана ... ... Ал сөз ... сөйлемдерді аударатын
аударма программасын «Ізет» фирмасы «Тілмаш» ... ... ... ... фирма директоры Ізетәлі Тілешовтің: «Бағдарламада ... ... 120 мың ... оның бер ... ... саны 6127 жұрнақ-жалғау
топтастырылды деп ... бұл әлі ... ... ... ... ... тілі — бай тіл. Рас, “Тілмаштың” тіліміздегі тұрақты
тіркестер мен еркін тіркестерді аударуға шамасы жетпейді. Осы ... ... ... ... ... болғанымен, онымен бірдей
дәрежеде жұмыс істей алмайды. Сондықтан біз өз жұмысымызға  ... ... ... ... ... ... Сол ... бұдан да
жақсы нәтиже беретініне сеніміміз мол.» - деп ... ... ... ... ... ... қанағаттандыратын машиналық аударма құралы жоқ
деуге болады.
Машиналық аудармада қолданылатын ... ... екі ... ғана
(орысша-қазақша, ағылшынша-орысша, ағылшынша-қазақша, ... ... ... ... ... және ... ... аралық деңгейде немесе сөзбе-сөз аударма жасау деңгейінде ғана
қолданылады.
Дегенмен көп жұмысты қажет ететін машиналық аударма жүйесі кез ... ... ... ... Пайдаланушы тілді жақсы меңгермесе де
электронды аударма ... ... ... мәтінді» қарай отырып
мәтіннің жалпы мағынасын тезірек түсіне ... ... ... ... МОДЕЛІН ҚҰРУ
2.1 Машиналық аударманың талдауы
Машиналық аудармашы түрінде берілген программалық жабдықтармен ... ... ... ... қатысты көптеген ... ... ... мәтіндерді лексикалық талдау нәтижесі
көрсеткендей, көп мөлшердегі машиналық аудармашылар қарапайым сөз таптарын
дұрыс аударғанымен, ... сын ... ... ... ... ... келгенде қате жіберіп, сөйлемді мағынасына қарай
дұрыс құрастыра ... ... ... ... тұстары - бірнеше мағынаға ие болатын
сөздердің аудармасының нақты болмайтындығы. ... ... ... ... сөйлемнің әр түрлі сөз таптары мен олардың граммтикалық ... ... ... ... ... талдауын ұсынуға болады
және мамандандырылған мәтіндерді аудару ... ... ... ... ... талдау нәтижесі көрсеткендей, машиналық
аудармашы жекеше және көпше түрдегі сөздерді оңай аударғанымен, септіктер
мен ... ... ... ... ... қиындықтарға ұшырайды
екен.
Сонымен, әзірге компьютер көп жағдайда аударғышты алмастыра алмайды.
Жалпы алғанда ... ... ... ... қажет пе? Әрине, қажет.
Егер компьютер әдеби шығармаларды аударатын болса, онда ... ... ... ... ... деңгейде жақсы меңгермеген, бірақ
жақсы әдеби редактор - адамның өнер туындысы болатын шимайбет нұсқасы пайда
болады. Егер ... ... ... ... жататын болса, онда
бұл жағдайда мамандыққа байланысты сөздік (жиегіне мәтін ... ... онда ... ... ... ... ... қол
жеткіземіз деп айтуға болады. Жалпы алғанда компьютерлік аударманы ... ... ... ... ... ... ... мүмкін.
Ол үшін машиналық аударма ... ... ... механизмдер
міндетті түрде болуы тиіс.
Кейбір тұтынушылар үшін аударманың мұндай дәрежеде ... ... ... ... интражелісін құруға қатысушы Electronic
Data Systems ... ... ... ... жұмысшысы Линн Сешедри
«Машиналық аудармашы – ол аңыз!», - деп санайды.
— «Мүмкін, ол техникалық құжаттарға қолданылатын шығар, ... ... ... дерлік сіз 15% мағына мен 85% бос ... ... ... EDS ... мазмұнын аудартуда ол шарттық
негізде мамандандырылған аудармашылар көмегіне ... ... ... ... ... ... еш өкпесі жоқ, себебі оған
арналған шынайы альтернативалар жоқ. «Гуманизмнің даму ... ... фонд да өз ... ... ... ... ... еді: өз
бюджеттерінің көлемді мөлшерін аудармашыларға жұмсау немесе ... ... ... пайдаланып көру. Жекеше көздермен
қаржыландырылатын бұл ұйым экология, экономика және тағы ... ... ... ... ... ... ... оята білді.
Осы ұйымның таңдауы машиналық ... ... атап ... ... үшін ... және аса ... емес қызмет түрлерін
көрсететін Globalink фирмасының ... ... FPH әр ... сөйлейтін
мамандардың арақатынасы қарапайым және нәтижелі болсын ... ... ... ... ... ... FPH кеңесшісі Марина ... ... ... – деп ... - ... ... жұмысты ағылшын
тілінде емес, өздерінің туған тілдерінде істеуді қалайтын еді. Енді оларда
осыған мүмкіндік бар». ... ... ... кем ... ... де ол жоққа шығармайды, бірақ егер адам шынымен қаласа ... ... ... ... ... деп ... ... сіз аздап
ойланып көрсеңіз, онда сөйлем мағынасын да түсінуіңізге болады». Сонымен,
егер ... ... көп ... ... онда ... ... берген антының орындалып қалуы да мүмкін.
Машиналық аудармашыға - ол............ құрал. Мәтіннің ... – ол тек қана өнер ... ... қатар көп еңбекті қажет ететін
жұмыс. Айта кететін жайт, өте дұрыс жасалған аударманың өзі де ... ... ... Өнер ... ... болсақ, болашақтағы компьютер
мен адам арасындағы жарыста әрқашан «тірі» аудармашы ... ... ... көп ... қажет ететіндігін шешу мәселесіне
келсек, машиналық аударма ... ... ... ... ... ... ... түсіну үшін машиналық аудармашының негізгі ерекшеліктерін
атап өтейік (барлық машиналық аударма жүйелеріне және ... ... ... де ... ... ... жылдамдық. Небәрі бірнеше секунд ... сіз ... ... ала аласыз. Ол мәтін мағынасын тезірек түсінуге жол
ашады, ал егер жүйе ... ... ... аударуға арналған
болса, онда аз мөлшердегі редакторлық өңдеу ... ... ... Оны өте оңай ... ... егер сіз маманданған
аудармашыға жүгінетін болсаңыз, аударылған мәтіннің әрқайсы беті үшін ... ... ... ... отыратын орны мен аударма дәрежесіне
байланысты ол 5 доллар мен 20 доллар арасындағы төлем ... ... ... ... ... тиіс болатын штаттық аудармашыны жалдайсыз. Машиналық
аударғышты таңдайтын болсаңыз, сіз тек бір ...... ... ғана ақша ... Сіз ... таңдайсыз: бірреттік ақша төлеу
ме, жоқ әлде ... бір ... ... ақша ... ... келе ме?
ПРОМТ компаниясының қолданушылардың мәліметі бойынша, 50 ... ... ... ... ПРОМТ аударма-программасы айына 98 мәрте
айналым жасайды ... ... қол ... ... ... жүйелерінің сыншылары
назарға ала бермейтін аса қажетті емес қасиет. Аударма-программа ... қол ... ал ... ... ... көп ... ... пен күш шығындарын қажет етеді.
4. Құпиялық. Машиналық аударма жүйелеріне сіз кез-келген ... ... ... Жеке ... ... беру ... ... әсер
сыйлай ма? Өзіңіздің қаржылық істеріңізге ... ... ... ба? ... да бір эротикалық ... ... үшін ... ... ... ба? Егер иә болса, онда ... ... ... бұл ... ... ... көп тұтынушылардың қолдай қоймайтындығымен
келісетін боларсыз?! Көптеген тұтынушылардың біздің жүйемізді жеке хаттарды
аудару үшін де ... ... жүйе жеке бас ... ... берген тұтынушылар хаттарынан білеміз. Аударма – программа сіз сеніп
тапсырған кез-келген ақпаратты құпияда ... ... ... ... ... жақсы меңгерген
тақырыбы болады, және ол сол ... ... ... ... ... техникалық мәтіндерді аударатын болса, кедергілерден айналып
өтуге болмайды. Бір ғана мысал келтірсек:"Жалаңаш ... ... ... (түпнұсқасы "Naked conductor runs along the bus"). Бұл ... ... ... бұл ... мысал компьютердің аз кезінде қолданса
керек.
МА жүйелері абсолютті әмбебап екендіктерімен ерекшеленеді. Тек ... ... сай ... ... ... ... білу
қажет. Машиналық аударма жүйелерінің тағы бір айта кетерлік ерекше ... ... ... жаңа ... енуі полиграфикалық
толтырулар арқылы енгізілетін аналогтық сөздіктерге ... ... ... Өзіндік жеке жаңа ... мен ... ... ... ... да ... Бұл жағдайда сіз аударманың
кепілдендірілген түріне қол ... ... ... ... ... түрде машиналық аударма
жүйелерінің барлық қасиеттері ... ... ... ... ... , әрине егер сіз бірнеше тіл меңгермеген болсаңыз,
тек аударма-программалар арқылы ғана жүзеге ... Дәл осы ... ... ... ... ... ... сұранысты арттырды. Тек
онлайндық жүйелер ... ғана ... ... ... оларды
аударуда еш қиындық көрмей шетелдік сайттарға кіруге жол берілді. ... осы ... ... ... жүйелерінің жоғарыда аталған барлық
қасиеттері қатысады: кез-келген тақырыптағы мәтінді аудару тез және ... ... ... ... жүйелерін ұжымдарда қолдану оның ... ... ... мен қолданбалы терминологияның сәйкестілігі. Аудармашылар
ұжымында ... ... ... ... ... ... ... құнының
100-140 % құрайды. Машиналық аударма жүйелері жасаған аударманы өңдеу де
оңай, себебі ол бір стильде ... Егер ... жиі ... ... бір ... ... ... онда бұл қателіктерді қарапайым
автоауыстыру әдісімен түзетуге ... ... ... ... ... онда ... ... жіберген жеке-жеке қателіктерді іздеу
қажет ... Бұл ... ... «түзету» жұмыстары мен аударма стилі
қажет болады.
2. ... ... ... шығынның болмауы. Бұл ... ... ... ... ... Аударма-программа бастапқы
форматты толығымен сақтайды, ал ол өз кезегінде аударма кезінде ... ... ... ... ... аударма ұсынатын артықшылықтарды қолдану
орнына кейбір адамдар тапсырманы абсурдты ... ... ... ... ... мен тақпақтарды, яғни машиналық аударманың нағыз
бағытталмаған нәрселерін аудармақшы болады. Енді ... ... ... ... ... ... ... мәтінді банктік
істер сөздігімен аудармақшы ... ... ... ... тіркесін
көрісімен айқайға басып, бір мәз боп қалады. Дәл сол ... олар ... ... ... күресіп, бірінші кезекте компьютерден де
ақылды екендіктерін дәлелдемекші болғандай күй кешеді.
2.2 Қазақ тілінен орыс тіліне ... ... ... ... ... қарасақ, машиналық аудармашы өзінің ұзақ
тарихына қарамастан, дамып келе ... ... ... болып тұр. Машиналық
аудармашыға заттар саласы киын және біріңғай тәсілдің болмағандығы негізгі
мәселе ... ... ... ... құрып жатқан кезде, бір ... ... ... ... ... ... аудару, кемінде өте ... ... ... амалдарды қолдану(статистикалық, ережеге сүйене ... ... көп ... ... айтқанда дене) екі тілде
анализдеу және қалыптастыру барысында, үлкен жұмыс жасауды талап етеді. ... ... ... ... мен зерттеулер жоқ, және осы бағытта қолайлы
нәтижелер бар екені туралы айту өте қиын.
Салада амалдарды анализдеу, ... ... ... ең ... ... жазылғандай, моделдер мен ... ... амал ... ... шештік.
Машиналық аудармашының концептуалды моделі ... ... ... орыс ... ... ... келесі модульдер
орналасады:
• Қазақ тіліндегі сөйлемдегі, жай ... ... ... және олар ... ... ... Берілген модуль қазақ
тілінің агглютинативтікті және суффиктивті спецификаларын ескереді.
• Казақ тілінің жай сөйлемдегі грамматиканың синтаксистік ... ... ... бойынша талдау үдерісі. Берілген модуль
қазақ тілінің синтаксисін және оның ... ... ... ... ол грамматикалық байланыстардың
негізінде құрылған.
• Көпмағыналы сөздер мен сөзтіркестердің ... ... ... ... ... үшін қолданылады.
• Қазақ тілінен орыс тіліне жай сөйлемдерді аудару құрылымдардың модулі.
Берілген модуль екі тілдегі ... ... ... ... ... ... ... құрылымның баяндалуы бойынша, шығыс(орыс)
тілінде сәйкестікті табу.
• Орыс ... ... ... ... ... құру ... барлық жұмыстың нәтижелерін қолданады.
• Лексикалық деректер қорында, қазақ тілінен орыс тіліне сөзтіркестерді
аудару ... ... ... Пәндік облыстың тарихи мәтіні, ... ... ... ... ... ... ... анализ үшін
қолданылады.
• Статситикалық деректер қоры өзінде, екі тілдің сұлбаларымен олардың
сәйкестігі туралы ... ... ... тіліндегі жай сөйлемдерді орыс ... ... ... оның концептуалды моделін келесі этаптардан дұрады
деп ... 1. ... ... екі ... ... ... талдау модулінің
және мәліметтер қорындағы ақпараттың көмегімен әрбір сөз талданып,
оның барлық грамматикалық мінездемелері ... 2. ... ... ... негізінде сөйлемді синтаксистік
талдау жүргізіледі. Әрбір сөздің сөйлемдегі рөлі анықталады және қазақ
тіліндегі ... ... ... 3. ... тіліндегі сөйлемнің сұлбасына орыс тіліндегі сәйкес сұлба
келтіріледі.
• 4. ... ... ... ... рөлі мен ... ... отырып орыс тіліне аударылады. Көпмағыналы сөздерді
өңдеу оларды қолдану контекстін ескере отырып ... 5. ... ... формада тұрған аударма нәтижелері орыс
тіліндегі сөйлем сұлбасына қойылады.
2.2.1-сурет. Машиналық аудармашының концептуалды моделі
Бұл концептуалды ... ... 2 ... ... ... жалпы моделі көрсетілген. Аударма кезінде ... ... және ... 2 ... қоры болған ыңғайлы. Яғни, сөдің
түбірі бөлек және оның атрибуттары бөлек анықталады ... ... ... аудармашысының жалпы алгоритмі
2.3 Формальді грамматика
Жасанды тілдер ... ұлт ... ... нақты тілдерге
қарағанда негізі хат мәтіндерін ... ... ... ... ... қарағанда әлдеқайд қарапайым болып табылады. Себебі, олар тұрақты,
оларда синонимдер ... және ... мен ... Жасанды тілдердің негізгі мақсаты ... ... ... ... ... болып табылады. Мәтін басқару
құрылғысы немесе компьютер орындау тиіс тапсырма ... ... ... адам ... Сондықтан кіріс тілі деп аталатын тіл оны қолданатын
адамдарға түсінікті және ыңғайлы болып жазылады. ... ... ... ... ... түрімен сәйкес келмейді. Кіріс тіліндегі
мәтінді компьютерге түсінікті ... ... ... ... деп аталатын арнайы құрылғылар мен программалар қолданылады.
Трансляторды құрастыру жауапкершілігі көп және ... ... үшін ... ... оның ... ... ... Ал
трянсляторға негізгі талап – оның кіріс тіліндегі мәтіннің мазмұнын дәл
жеткізуі болып табылады. Осы айналдыруды ... ету үшін тіл ... ... ... ... құрастыру ережелерінің дәл сипаттамасы және
тіл семантикасы деп аталатын мәтіндердің мағынасын ... ... ... пен ... ... бірнеше құралдары бар. Осылай
тіл синтаксисінің сипаттамасы формальді грамматикалардың ... ал ... ... атрибутты грамматикалардың көмегімен орындалады.
Нақты тілге ұқсастыра отырып ... ... ... бір ... ... ретінде елестетсе болады. Формальді тілдегі
сөйлемдердің құрылу әдісін және ... ... ... ... ... ... ережелерінің көбін грамматика сүлбесі деп
атайды, ал ... реті ... ... ... ... ... көмегімен нәтижесі тіл сөйлемдерінің ережесі
болатын әртүрлі баспаларды ... ... ... ... жиі ... ... ал шығыс нәтижесін – ... ... ... ... ... ... ... алфавит, тізбек,
грамматика, шығыс нәтиже, тіл және т.б. Келесі материал осы ... ... соң ... ... ... бірі ... ... қарастырылады.
2.3.1 Формальді грамматиканың және тілдің анықтамасы
Формальді тілді және грамматиканы анықтаудың алғашқы және ең ... ... және ... сөз ... ... бөлінбейтін символдар жиыны сөдік немесе алфавит деп
аталады, ал оған ... ... ... ... деп ... A = {a, b, c, +, !} алфавиті 5 әріптен тұрады, ал B = {00, ... 11} ... ... екі ... ... 4 ... құралған.
Анықтама: Алфавит әріптерінің қатары сөз немесе сол алфавиттегі ... ... ... ... әріптердің саны, оның ұзындығы деп аталады.
Мысалы, A алфавитінде (=ab++c сөзіну ұзындығы l(() = 5, ал ... ... ... ... l(() = ... A ... ... онда A алфавитіндегі әріптерден құралған
мүмкін болатын тізбектер жиынын A* деп ... Және $ деп ... ... те ... ... ... Бос тізбек дегеніміз ... ... әріп жоқ ... ... ( ... бос ... жақтан немесе оң жақтан қосылғанынан ( тізбегі өзгермейді.
( $ = $ ( = (
А ... ... бос ... жоқ ... ... ... ... А+деп белгілейді. 
Анықтама : Г формальді грамматикасы деп келесі 4 ... ... = { VТ, VA, , R ... - ... ... (сөздік); бұл алфавиттің әріптері
терминалды символдар деп аталады; олар грамматикадан туындайтын
тізбектерді ... ... ... ... ... ... ... латын алфавитінің кіші әріптерімен белгілейік;
VA – терминалды емес, қосымша алфавит (сөздік); бұл ... ... ... ... қолданылады;
олар аралық тізбектерге кіруі мүмкін, бірақ құрылым нәтижесіне кіре
алмайды;
терминалды емес символдарды белгілеу үшін латын алфавитінің ... ... бас ... ... - ... бастапқы символы немесе аксиомасы ∈ VA.
R – α → β түріндегі шығыс ... ... α и β - VТ ( VA ... ... ... ... Г грамматикасының толық алфавиті (сөздігі) деп атайды.
Грамматика ережелерінің қатарына сонымен қатар → түріндегі оң жағы
бос ... кіру ... Оң жағы бос ... ... ... бос тізбек символын қолданайық. Оны мынадай түрде жазайық → $.
Грамматиканы шығару ережелері түзбектерді құру үшін қолданылады.
Анықтама: r = τ → γ - Г ... ... ... және α = χ' ... – символдар тізбегі болсын, сонымен қатар χ', ... ∪ VA) *. Онда β= ... χ" ... ... r ... ... ... алынуы мүмкін (яғни m-де
τ−тізбегін γ−ға ауыстыру ... ... ... ... ... және α ⇒β ... ... Егер Ω = ((0, (1,...,(n) тізбектер ... ... ... ... ... ⇒ (1, (1 ⇒ (2, ... ,(n-1 ⇒(n болса, онда ... ... ... (n-
ның шығысы деп атайды және Г грамматикасында (0 ⇒* (n деп ... ... ... шығарылатын Г грамматикасының Vт
терминалды алфавитінің ақырғы тізбектерінің көптігі, Г грамматикасынан
туындайтын тіл деп ... және L( Г) деп ... Г ) = {( ∈ VТ* | ⇒*( ... ... бірнеше мысал қарастырайық:
Мысал – 1:
Г1.1 грамматикасы берілген, осы грамматика арқылы пайда болатын, ... ... VТ = {a, b, c}, VА = {}, R = { → ... ... бір ... тұрады, сол үшін Г1.1 бір сөзден
тіл тудырады
L(Г1.1) = {abc}.
Мысал – 2:
Г1.2 грамматикасы берілген, және осы ... ... ... ... анықтау керек:
Г1.2 : VТ = {a, b, c}, VА = {, , }
R = { → a,
→ d,
→ dc,
... ... ... ... мәліметтерді құрастырайық. Осыны екі
мүмкіндік арқылы жасауға болады. Ең ... 1,2,4 ... ... ... 1 және 3 ... ... екінші шығатын мәліметтерді
құрастырайық. Нәтижесінде:
⇒ a⇒ ad ⇒ ad,
⇒ a ⇒ ... осы ... ... ... болатын тіл, екі байланыс тізбектен
тұрады
L(Г1.2) = {adc, ad}.
Мысал – 3:
Г1.3 грамматикасы берілген, және осы ... ... ... ... ... керек:
Г1.3 : VА = {, }, VТ= {0, 1},
R = { → 01,
...... ... ... 3 ... тұрады. Екінші ереже
терминалды емес белгіні сол жақ және оң жақ ... ... ... ... ... деп ... ... емес байланыс тізбегіне осы ережені қолдануы, жаңа
байланыс тізбектің пайда ... ... және оның ... ...
кіреді. Сонымен ереженің оң жақ бөлігімен терминал еместі бірнеше ... ... және ол ... шексіз ұзын байланыс ьізбектерді ... ... ... ... ... ... ... шексіз
болмау үшін, грамматика сұлбасында, кемінде белгісі сол жағында болу
керек. Егер -ны ... ... ... ... осы ереже
рекурсияны аяқтайды. Қарасытырылып жатқан грамматикада, шығаруды аяқтау
үшін →$ ... ... ... құрастыруды Г1.3 грамматика
ережелері арқылы қарастырайық. Бірінші және ... ... ... ⇒ 01 ⇒ ... екінші және үшінші ережелерді қолдану кезінде:
⇒ 01 ⇒ 0011 ⇒ 0011.
Екінші ережені k рет ... ... k ... және ... ... ... пайда болады. Соңдықтан Г1.3 грамматикасы
арқылы пайда болатын тіл, ... ... ... тізбектерден тұрады, соның
ішінде нолдер саны бірліктер санына тең.
Мысал – 4:
Г1.4 грамматикасы берілген, және осы ... ... ... ... ... ... : VТ= {a, b}, VА = {, },
R = { → a, → ... ... ... ... ... әрекеті, бізді мына
тізбекке алып келеді:
⇒ a ⇒ ab ⇒ abb ⇒ ... ... ... болып келеді. Карастырылып жатқан грамматикада
рекурсияны аяқтауға қажетті ереже жоқ, сол үшін осы грамматиканың ... бір ... ... мүмкіндік жоқ. Басқа сөзбен айтқанда,
Г1.4 бос тілді ... Егер тіл, Г ... ... ... болатын болса, және
ол бірде-бір аяқталмаған тізбектен тұратын болса(қорытынды сөз), сонда ол
бос деп аталады.
2.3.2 Формальды грамматиканың ... ... ... грамматиканың 4 типі бар, және оларға
тілдердің типі ... ... ... ... ... ... осы грамматикалар шыға бастайды.
0 типті грамматикалар, оларды грамматиканың жалпы түрі деп ... ... ... ... жоқ. Кез келген ереже
r = η → ψ
өзінің тізбектері көмегімен құрылуы мүмкін η, ψ ∈ (Vт ∪ Va)*. ... → или x b → x .
1 ... ... ... ... ... деп атайды, кез-келген ережені қолдануға мүмкіндік бермейді.
Осындай грамматикада мәліметтерді ... ... ... ... ... χ2 → χ1 ω ... χ1, χ2 – ... бос болуы мүмкін, көпшіліктен(Vт ∪ Va)*,
белгі ∈ Va және ω ∈ (Vт ∪ Va)* ... χ1 және χ ... ... ... ... қалады, соңдықтан оларды контексті
деп атайды(сол және оң), ал ... ... ... ... ... 1 ... грамматика практикада өте
ыңғайлы, өйткені сол жақта ереже әрқашанда терминалды емес ... және оны ... ... ... ... ... ... бірнеше символды алмастыруға болады, және соңын ішінде
терминалдыларды ... ... = {a, b, c, d}, VА = {, , }
R = { → a ,
→ ,
→ ,
→ b,
b → b c d ,
b → b a ... ... келеді, өйткені екінші және ... сол ... бос емес ... ... ал ... және ... екі ... құрады. Осы грамматиканың нәтижесі осындай түрде
болуы мүмкін:
⇒ a ⇒ a ⇒ ab ⇒ abb ⇒ ... ... ... ... деп ... және ... ... (КС-грамматикалар немесе ... ... ... ... келесі түрде болады:
→ α,
осында ∈ VА и α ∈ (VТ ∪ VА)*.
Әлбетте, осы ... 1 ... ... ... ... ... осы шарт
χ1 = χ2 = $ орындалса. Контексті грамматикалар болмағандықтан, 1 типті
грамматикаға қарағанда, КС-грамматикасы жеңіл құралады. ... ... үшін осы ... ... ... келесі түрде
болады:
Г1.6: VТ= {a, b}, VА = ... = { → aa,
→ bb,
→ aa,
... ... ... ... осы тіл ... ... және осы
тізбектердің әрқайсысы екі бөліктен тұрады, β ∈ VТ* ... және ... ... ... Г1.6 ) = { β β' | β ∈VТ+},
осында VТ+- бұл VТ* бос емес көпшілігі. Осы ... ... ... ... құрылуы мүмкін:
⇒ aa ⇒ abba ⇒ abaaba ⇒ ababbaba.
3 типті грамматиканы ... деп ... ... Осы ... шағару ережесі келесі түрде болады:
→ a или → a или → ... a ∈ VТ, и , ∈ VА, онда ... тек → a ... ... ... ... ... немесе тек - → a түрінде
көрсетілуі мүмкін.
Автоматты грамматика мысалына Г1.7 – ... ... және Г1.8 ... грамматика ретінде келтіруі мүмкін.
Г1.7: VТ = {a, b}, VА = {, },
R = { → a ,
→ a ,
→ b ,
→ b ,
→ $ ... {a, b}, VА = {, },
R = { → b,
→ b,
→ a,
→ a,
→ $ ... ... бір ... ... ... белгілесек, k
бірдей белгілерден тұратын x және xk, мысалы x4 = xxxx, онда осы грамматика
арқылы пайда ... ... ... ... анықтауға болады:
L(Г1.8) = { anbm | n,m > 0}.
Тілді құру, ... ... ... тілдің
классификациясың құру мүмкінбігі бар. Бір тіл, әртүрлі грамматикалар ... ... және олар ... ... ... ... ... Соңдықтан
тілдің типін, сол типтің ... ... ... және ол k+1
грамматика түрінде көрсетілуі мүмкін емес.
Мысалы, егер 2 типті грамматикада,келесі ереже түрі бар болса
( a1 a2 a3 ... оны ... ... айналдыруға болмайды. Соңдықтан, осы
грамматика арқылы пайда болатын тіл, 2 типті тілдерге жатады. Егер 2 ... ... ... ... бар ... ( a1 a2 a3 a4 ... ... грамматиканы 3 типті грамматикаға айналдыруға болады,
және осы грамматиканы қолдану ... ... ... тіл, 3 ... тілі болып келеді.
Егер k типті тілдің көбісін, ... ... ... онда әртүрлі
типті тілдердің арасындағы байланысты, келесі қосылу арқылы анықтауға
болады:
{ L ... } ( { L ... } ⊂{ L ... } ⊂ { L ... ... тілдер, 1 типті тіл болмайтыңдығы бар ... ... ... ... 1 ... ... бола ... және 3 типті тілдер, 2 типті тіл
бола алмайды.
2.3.3 Қазақ тілінің формалды грамматикасы
Бэкустың ... ... ... үшін ... ... әріп(L), сөз(W), сөйлем(S). Сонда рекурсивті ... W=W+L; ... ... алфавиті келесі әріптерден тұрады. А = { ... ’ ә’, ... ... ‘ғ’, ‘д’, ‘е’, ‘ж’, ‘з’, ‘и’, ‘й’, ‘к’, ... ... ... ... ... ‘р’, ‘с’, ‘т’, ‘у’, ‘ұ’, ‘ү’, ‘ф’, ‘х’, ‘һ’, ‘ц’, ‘ч’, ‘ш’, ‘ы’, ‘і’,
‘э’, ... ... Wα – ... Wβ - “үйге”, Wγ - ”келдім”.
Сөздердің ұзындықтары L(α) = 3, L(β) = 4, L(γ) = 6.
S = Wα + Wβ + ... ... L(S) = 3 ... ... құрылды.
2.4 Лексикалық талдау моделі
Морфология сөзді, сөздің тиісті бөлшектерің, олардың ... ... ... ... дағдысында әр сөз сөйлем ішіндегі өзге
сөздермен белгілі заң бойынша әр қилы ... ... де, ... ... әр ... қызмет атқарады (2.4.1-сурет).
Әрбір сөздің өзіне тән тұлғасы бар. Сол тұлға арқасында әрбір сөз ... ... ... ... ... Сөздің құрамының әр түрлі болуы ... ... ... ... ... ... ... кейде оларға
түрлі қосымшалар жалғану арқылы жұмсалады.
Сөздің лексикалық немесе грамматикалық мағыналарын ... ... деп ... ... да өзіне тән мағынасы және
өзіне тән сыртқы дыбыстық формасы болады. Морфема дегеніміз — сөздің ... ... бар ең ... ... ... жалаң түбір сөздер де (am, ac, із, жап), қосымша
арқылы ... ... ... де ... ... ... ізде) бар. Бұл
тұлғалармен қатар, екі ... ... ... де ... ... әкел,
алабота, сексен), екі түбірден бірігіп жасалған қос сөздер де (бала-шаға
көзбе-көз, кімде-кім) екі ... ... ... жасалған сөздер де
(темір жол, кемпір қосақ, ақ құба, он ... ... ... em ... ... қысқарып кұралған сөздерде (Каз TAГ, ТМД, КазМ¥У, E.K.)
бар. Осы ... ... ... қарай сөздер жалаң және күрделі сездер
деп екі ... ... ... ... Сөз ... сөздердің мағынасы алуан түрлі. Бір топ ... ... ... ... ... ... сындық, сандық белгілерін білдіретін сөздер
де бар: жақсы адам, қызық кітап, жасыл жапырақ, отыз үй, ... ... ... ... адам, кітап, жапырақ, үй, бала, жылқы — заттардың аты;
жақсы, қызық, жасыл — сындық белгілері; ... ... он — ... ... заттың қимылын, қимылдың болған ... ... ... ... де ... бар: Әкем кеше жоғары отырды дегендегі отырды
... ... кеше — ... ... ... жоғары қимылдың орнын
білдіріп тұр.
Осындағы әкем деген сөздің ... ол ... ... ... ... ... ... отырды. Мұндай сөздер езінше бір топ құрайды.
Сонымен бірге адамның ... ... ... ... ... ... ... алақай, қап, әттеген-ай, үһ т. б.
Тілдегі сөздердің мағынасы ғана мұнда түрліше болып қоймайды. Олардың
түрленуінде де ... ... бар, ... ... де ... сөйлемдегі орны мен қызметі де түрлі-түрлі.
Осы ерекшеліктеріне қарай, ... ... ... ... эат ... сан ... сын ... есімдік, етістік, үстеу, еліктеуіш
сөздер, шылау, одағай.
Зат есім, сын есім, сан есім, есімдіктерді жалпы атаумен есім ... деп ... ... ... атын ... ... зат есім дейміз. Мысалы:
ағаш, күн, кітап, жел, дауыл, үміт, қайғы, ... Зат есім кім? не? ... ... ... ... кім? деген сұрау адамға қойылады. Оған кісі аттары,
адамның кәсібімен байланысты ... ... ... ... Болат, Куміс,
Әлия, Белжан, нағашы, жиен, ата, ана, құда, құдаша, әке, ... ... ... малшы, ұшқыш, т. б.
Не? деген сұрау адамнан басқа заттардың бәріне қойылады. Оған ... ... ... ... ... ... ... өсімдік, көше,
ауыл, қой, мал, ешкі, құс т. б.
Зат есімнің құрамында көзбен ... ... ... ... деректі
заттардың атаулары да, оймен танылатын дерексіз ... ... да ... қол, көз, үй, қала, тау, орман, ақыл, сана, ой, зейін, ... ... ... ... бір ... ... ... жинақты атауы болады. Мал,
қүс, тамақ, өсімдік, жеміс, мүлік ... ... ...... ... аты. Мал — ... сиыр, түйе, қой, ешкі дегендерді камтитын
жинақтау мәнді зат есім болса, құс, ... ... ... ... ... ... Жинақтау мәнді зат есім қамтитын түрлі заттардың бір түрінің я
жеке ... аты ... ... зат есім ... ... қой, ... ... б.
Сын есім 
Заттың түрін, түсін, сапасын, белгісін білдіретін сөз табын сын есім
дейміз. Мысалы: қызық (кітап), өнерлі (адам), жақсы (хабар), ... ... есім ... ... ... пысықтауыш болады. Мысалы: Ол
жақсы оқып, жақсы жүреді.
Сын есім сөйлемнің баяндауышы да болады. Мен ... сен ... ... сын есім ... және туынды болып бөлінеді.
Негізгі сын есім: қызыл, кәрі, жұмыр, ... ... ... сұр, ... сын ... ұялшақ, үлгілі, әсемпаз, өнерлі, күзгі, таулы.
Туынды сын есім сын есім тудырушы жұрнақтар арқылы жасалады. 
Сан есім 
Заттың санын, қатарын, мөлшерін, ... ... сөз ... ... ... Мысалы: он, отыз, алты, бес, елу, бесінші, жүздеген, мыңдаған.
Сан есім ... ... ... ... ... ... жауап береді,
сөйлемнің барлық мүшесі болады. Сан есім мағынасына қарай 6 түрге бөлінеді:
олар — ... ... ... ... ... бөлшектік сандар.
Есімдік
Басқа сөз таптарының орнына колданылатын сөздерді есімдік дейміз.
Мысалы: Асқар кітапты көп оқиды ... ... Ол ... көп ... деп ... ... ... қолдануға болады. Ол жоғарыда тұр деудің орнына
сонда тұр дегенде үстеудің орнына сонда ... ... ... өте ... ... сөз, ... ол ... мағыналы
сөздердің орнына журе алады.
Есімдік мағынасына карай ... ... 1) ... ... ... ... 3) ... есімдігі, 4) өздік есімдігі, 5) белгісіздік
есімдігі, 6) болымсыздық ... 7) ... ... ... амалын, жай-күйн білдіретін сөздерді етістік дейміз.
Мысалы: Ол ән салды. Сен домбыра тарт.
Етістік не істеді? не істейді? не ... ... ... ... СөйлемнІң баяндауыш, пысықтауыш қызметін атқарады.
Тұлғасына қарай етістік негізгі, туынды түбір болып бөлінеді.
Негізгі ... ...... ... ... ... тұратын сөздер. Мысалы: ал, кел, бар, оқы, жүр, тұр, көр, ... т. ... ... ... сөз ... ... арқылы жасалатын құрамы
ең кемі екі морфемадан тұратын сөздер. Мысалы: ақта (ақ-та), жасар ... азай ... ... ... сана ... т. ... сөз ... жұрнақтары Етістіктің жұрнақтары есімнен
етістік тудыратын жұрнақтар және ... ... ... ... екі топқа бөлінеді.
А. Есім сөзден етістік жасайтын жұрнақтар
1.      -ла, -ле, -да, -де- -та, ... ... ... ... ақта, көкте.
2.     -лан, -лен, -дан, -ден, -тан, -тен: көңілден, ... ... -лас, -лес, -дас, -дес, -тас, -тес: ... ... -лат, -лет, -дат, -дет, -тат, -тет: думандат, өлеңдет,
желдет.
5.     -а, -е: сана, жаса, теңе, түне, орна, мөлдіре, қина,   ойна,
6.     -ар,  ... -р:   ... ... суар,   ескір,  тазар.
7.     -ай, -ей, -й: азай, көбей, қарай,   мұқай, ... -ық, -ік: ... ... тарық, бірік, толық.
9.     -сы, сі:   шешенсі,   адамсы, менменсі, еркінсі.
10.  -сын,-сін: жерсін, көпсін, азсын, ... т. ... ... етістік жасайтын жұрнақтар
Етістіктен етістік жасайтын өнімді жұрнақтарға етіс жұрнақтары жатады.
1. -ын, -ін, -н:   жуын,  киін, ... -ыл, -іл, -л:   ... ... (-ды), ... (ді), ... -дыр, -дір, -тыр, -тір: ... ... киіндІр, күлдір, айттыр.
4.     -т: сөйлет,  келтірт,  тарат,  қарат.
5.     -қыз, -кіз, -ғыз, -гіз:  айтқыз, бергіз,   жүргіз,   барғыз,
өткіз.
6. -ыс, -іс, -с: ... ... ... ... және салт ... Заттың, кісінің ісін, әрекетін, қимылын
білдіретін етістіктерді сабақты етістік дейміз. Сабақты етістіктің ... ... ... де, ол ... табыс септікте тұруын керек
етеді. Мысалы: Мен бұл ... ... ... ... кімді?   нені? (не?)   деген сұрақ ... ... ... ... ... нені ... нені ... кісінің күйін білдіретін, табыс септеудегі тура толықтауышты
меңгере алмайтын етістікті салт етістік дейміз. Мысалы: ... күл, ... және ... ... ... ... ... етістіктер
болымды, болымсыз болып бөлінеді.
Болымсыз етістіктер болымды етістіктердің түбіріне ма, -ме, (-ба, ... -пе) ... ... арқылы жасалады. Мысалы: бар — барма, көтер ... ...... ...... шық — шықпа, шығар — шығарма,
жаз — жазба, жалғыз — жазғызба.
Болымсыз етістіктің жұрнағы сұрау ... ... ... Сен
бүгін келдің бе? Ол осыны түсіне ме? Суретті ол салған ба? Бұл мысалдарда
сұрау шылауы көсемше, есімше, ... ... ... ... кейін
келіп тіркесіп, сөйлемге сұрау мағынасын беріп түр.
Етістіктің болымсыздық жұрнағы — сөзде көсемше, ... ... ... жалғаудан бұрын қолданылатын қосымша. Мысалы: көрме-й-
дІ, кел-ме-ген, айт-па-й-мын, ал-ма-ғай-сың, бер-ме-се. Етістіктің ... ... ... ... ... ... ... объекті мен субъектіге қатысын ... ... етіс ... ... Олар ... ... етіс ... бірнеше
субъектіге ортақ екенін білдіріп тұр. Ол таранды    дегенде,  етіс қимылдың
объектісі мен ... бір зат ... ... төрт ... 1. ... етіс. 2. Ырықсыз етіс. 3. Өзгелік етіс. 4.
Ортақ етіс.
Етістіктің шақтары Қимыл, амал-әрекеттің ... ... ... ... ... ... ... ішкі мәнін анықтауда
сөйлеушінің хабарлау кезі негізгі тірек нүкте қызметін атқарады. ... ... ... ... ... ... не одан бұрынғы,
не хабарлап тұрған ... ... ... ... Осы ... ... ... үшке бөлінеді. Олар: осы шақ, келер шақ, өткен шақ.
Тілде қимылдың жасалуының осы ... ... әр ... арнаулы
морфемалары бар.
Етістіктің райлары Рай категориясы ... ... ... ... түсінігін, көзқарасын білдіреді. Қазақ тілінде 4 түрлі рай бар:
1. ... рай. 2. ... рай. 3. ... рай. 4. Ашық ... ... ... мекенін, мезгілін, мөлшерін, түрлі
белгілерін ... сөз ... ... ... ... Оқты ... ... жаңбырша деген үстеу қимылдың қалай жасалғанын білдіріп
тұр. Мен бағана келдім дегендегі бағана қимылдың ... ... ... шық ... ... ... ... білдіреді.
Үстеулер қимыл-әрекеттің түрлі белгісін білдіріп сөйлемнің пысықтауыш
мүшесі болады.
Үстеулер түрленбейді, ... ... сөз ... қосымшалары
жоқ. Үстеудің кейде заттанып, зат есім сияқты түрленуі кездеседі, бірақ ол
өте сирек. Мысалы: Ертеңді қой, ... ... ... ... негізгі, туынды үстеу болып бөлінеді.
Негізгі үстеулер: кеше, ертең, былтыр, қазір, бағана, әуелі, әлі,
енді, кеше, әрі, ... ... ... төмен, әрмен, әрең, үнемі, ... ... аса, ... орасан әбден, нағыз, кілең, сәл, мүлде т. б.
Туынды үстеулер: ... ... ... шикілей, күздей, қырандайын,
жоққа, текке, әлгінде, қапыда, шынымен, ежелден, зорға-зорға, осыншалық,
соншалық т. б.
Сөздің бірігуі арқылы ... ... ... ... ... ... қыстыгүні, таңертең т. б.
Сөздердің  қосарлануы арқылы   жасалған үстеулер: бостан-босқа, әлсін-
әлі, ... ... т. ... ... қарай 7 топқа бөлінеді: 1. Мезгіл үстеуі. 2. Мекен
үстеуі. 3. Мөлшер үстеуі. 4. Сын-қимыл ... 5. ... ... 6. Себеп-
салдар үстеуі. 7. Күшейткіш үстеу.
Еліктеуіш сөздер
Табиғаттағы сан ... ... мен ... ... ... болатын дыбыстарға еліктеумен немесе олардың кимыл-
әрекеттерінің ... ... ... ... сөздер дейміз. Мысалы:
тарс-тұрс, сарт-сұрт, жалт-жұлт, салп-салп, кірш-кірш, пыр-пыр, шыр-шыр т.
б.
Еліктеу сөздер сөйлемде пысықтауыш қызметін атқарады.
Еліктеу сөздер екі ... ... ... және ... ... ... ... сөздер. Табиғаттағы сан алуан құбылыстар мен
заттардың қақтығысуынан туатындыбыстарға еліктеу   арқылы ... ... ... ... дейміз. Олар: сырт-сырт, тық-тық, шіңк-
шіңк, дар-дар,   ... ... ... қаңқ, дыр, сақ, бақ, тарс,
шаңқ, бырт, қарқ т. б.
2. Бейнелеуіш сөздер. Табиғаттағы түрлі-түрлі құбылыстар ... ... ... ... ... ... Олар: жарқ, жарқ-
жарқ, жарқ-жұрқ,  жалт-жалт, жалп-жұлп, ... ... ... ... едірең-едірең, маң-маң, митің-митің, жылт-жылт, желп-желп т. б.
Көмекші сөздер. Шылау
Көмекші сөздерге өзінің лексикалық мағынасынан айрылған сөздер жатады.
Бұлардың біразы тұлғасы, яғни дыбыстық ... ... да ... ... ... сөздер — негізгі сөздерден грамматикалық қызметке
ауысқан сөздер. Мысалы: Мені де қамауға отырғызуға болмас па екен ... (А. ... Осы ... де, па, ... едім дегендер толық мағыналы
сөздерге түрлі   грамматикалық мағына ... ... ... көмекші сөздер мағынасына, тіркесетін сөз ... ... үш ... ... ... етістіктер.
2. Көмекші есімдер.
3. Шылау.
Қөмекші етістік сөзге грамматикалық мағына үстейді. ... Ол ... ... ... ... етістігі етістікке осы шақтық мағына беріп
тұр.
Көмекші ... ... ... ... колданылады, беретін
мағынасы да, атқаратын кызметі де етістікпен байланысты. ... ... ... ... ... ... грамматикалық қызметке ауысқан
басқа сөздермен ортақ белгісіне байланысты көмекші сөздер тобына кіреді.
Көмекші есімдер ... есім ... ... зат есімнің мекендік,
мезілдік мағынасын дәлдеп көрсететін грамматикалық кызметке ... ... есім ... ... 'Цымыз ішіп болған соң, үнсіз үй
ішінде Абай екін-ші бір сөзін бастады (М. Ә.). Бұл ... ... ... есім ... ... ... дәлдеп керсетіп тұр.
Қөмекші есімге мына сөздер жатады: алды, арты, асты, үсті, ... ... ... іші, аузы, жағасы, төбесі, бойы, сырты, қасы, басы,
тұсы, беті.
Шылау Көмекші сөздердін, ендігі бір түрі — ... ... ... ... тіркесіп, грамматикалық мағына қосу үшін, сөз бен ... мен ... ... үшін ... Мысалы: 1. Жел барған
сайын үдей түсті. 2. Бүл батылдьщты қала да, ауыл да күтпеген еді (С. ... ... ... ... ... толык. мағыналы сезге тіркесіп,
онық мағынасын толыктырады. Мысалы: үйге дейін, кешеден бері,  сенен бұрын,
үйге қарай.
Септеулік шылаулар мыналар: дейін, ... ... ... әрі, ... ... соң, ... жуық, басқа, шақты, шамалы, туралы, арқылы, тыс,
бөтеп, ... ... ... ... ... катар, бойы, тәрізді, құр лым,
түгіл, ... т. ... ... өзі кдтысты сөздін белгілі септік жалғауда тұруын
керек етеді.
Атау септіктегі сөзбен тіркесетін ... ... ... ... ... тәрізді түгіл, құрлым, үшін, сайын, сьшақ, сынды.
Барыс жалғаулы сөзбен тіркесетін септеулік шылаулар: дейін, ... ... ... сәйкес, қарсы.
Шығыс жалғаулы сөзбен тіркесетін септеулік шылаулар; әрі, бері, бұрын,
басқа, соң, бөтен, ілгері, кейін, тыс, шет, ... аса, ... ... ... ... сөзбен тіркесетін септеулік шылаулар мыналар: бірге,
қатар. Мысалы:
Алматы қызылға бөленіп, тумен бірге толқып тұрған тәрізді (Ғ. Мүст.).
2. Демеулік шылаулар Сөздің мағынасын ... оған әр ... ... ... ... ... мәніне әсер етіп, оған түрлі ... ... ... ... ... ... ... Қазір ше?Оны кейін
айтамын ғой (Б. М.).
Демеулік ... ... ... ... ... демеуліктер: ма, ме, ба, бе, па,пе, ше. Мысалы:
Жүдеген жоқсың ба? (Б. ... ... ... ... ... Қеле ғой, күнігешім,-—деді әжем
өзеуреп (С. М.).
3. Тежеу мағыналы ... ғана ... Тек қана әкем ... ... ... (Б. ... ... мағыналы демеуліктер; ақ, да, де, ды, ді, ты, ті, ғой: Бұл
сөзді Мариямның аузынан естуі--ақ мұң ... ... ұшып ... (Б. ... екі күндей жайдан-жай отырды да қойды (Б, М.),— Ауылды көрейін,көп
жыл ... ... ... деп, ... (Б. М.).
5. Қөңіл күйді білдіретін демеуліктер: -ай, -ау: ... ет ... деді (Б. ... ... ... ... демеуліктер: мыс,міс (мыш);
сарымсақтың көзінен бүршіктеген жас шығыпты-мыс (Б. М._).
3. Жалғаулық шылаулар Сөз бен ... ... мен ... ... ... ... ... Мысалы: Бұл Ероканға
да, өзіне де, өзгелерге де риза болып кеткеннің белгісі еді (Т. ... ... ... ... ... ... Ыңғайлас жалғаулықтар: және, мен, бен, пен, тағы, әрі, да, де, та,
те.
2. ... ... ... ... ... сонда да,
әйткенмен, онда да, болмаса, әйтпегенде,ал, дегенмен, әйтсе де, ... ... ... ... я, не, ... әлде, неболмаса, біресе,
кейде.
4.Себептік жалғаулықтар, өйткені, себебі.
5. Салдарлық жалғаулықтар: ... ... ... ... ... ... жалғаулық: егер, егер де.
Одағай
 Одағайлар адамның шаттану, куану, ренжу, ... ... ... ... ... көңіл күйін білдіреді. Мысалы: Кап, не ... сен ... Ә.). ... одағай (қап) сөйлемге өкіну мәнін қосып тұр. ... ... (М, Ә.). ... ... ... ... риза болу ... тұр. Одағай сөйлем мүшесі болмайды, ... ... ... ... ... ... ... мағынасына қарай мынадай түрлері бар:
1. Көңіл күйі одағайлары: алақай, әттең, қап, әттегенай, бәрекелде,
пәлі, ойпырмай, туу, уһ, аһ, еһе, оһа,, ой, беу, уа, ... т. ... ... одағайлары: тәйт, тек, жә.
3.Шақыру одағайлары: шөре-шөре, моһ-моһ, қос-қос, сорап-сорап, ... ... т. ... ... ... моделі
Синтаксистік талдау жүргізу үшін, сөздің құрылымын дұрыс анықтай білу
өте қажет. Алғашында сөздің түбірінен бөлек бөлігі ... сөң оның ... ... ... ... ... ... сұлба түрінде түсіндіріп
кетсек (2.5.1-сурет):
2.5.1-сурет. Концептуалды сұлба
2.5.1 Қазақ тілі мен орыс тілінің жалғауларының арасындағы байланыс
Бұл машиналық аудармашының талдау бөлімінің алгоритмі ... ... ... соң жалғаулары мен жұрнақтары бойынша оның атрибуттары
анықталады.
Енді осы параметрлері ... соң оның ... ... екі ... ... атибуттары бір-біріне сәйкес келмейді. Сол
себепті екі тілдің ережелерін зерттеп келесі сәйкестіктерді құрастырдым.
2.5.1.1-сурет. Қазақ орыс ... ... ... ... ... айтып кеткендей, жанды-жансыздық (2.5.1.1-
сурет ) зат есімге қойылатын ... ... және орыс ... ... ... жалғаулар зат есімдерге қосылады. Септік жалғаулар екі тілде
әртүрлі формаларда келуі мүмкін (2.5.1.2-сурет).
2.5.1.2-сурет. Қазақ тіліндегі зат ... ... ... ... ... ... есімдікті анықтау
Тәуелдік жалғаулар зат есімнің меншіктігін анықтау үшін ... ... ... ... ... орыс ... сәйкестендіру
Етістік шақтар бойынша өзгереді (2.5.1.3-сурет).
3 ҚАЗАҚ ТІЛІНДЕГІ СӨЗДЕРДІ ... ... МЕН ... ... ... ... машиналық аудармашының талдау бөлімінде сөйлемді сөдерге бөліп,
олардың ... ... ... және ... ... Генератор бөлімінің морфологиялық талдауының алгоритміне
толығырақ тоқталып кететін болсақ.
Бізге words_kaz[] жиымында сөйлемдегі ... ... ... ... сөң ... ... әрқайсысын МҚ-нан тексеріп words_rus[] жиымына
оның аудармаларын жазады.
Келесі chlen_predlozheniya_kaz[] жиымында әрбір сөздің сөйлемнің ... ... ... ... ... ... 0 – сөйлем мүшесі емес
// 1 – бастауыш
// 2 – ... 3 – ... 4 – ... 5 – ... сөз ... қай мүшесі екені өзінің және жақын тұрған
сөздердің сөз таптарына байланысты анықталыды.
lev1_chast_rechi[]
// 0 – ... 1 – зат ... 2 – сын ... 3 – сан есім
// 4 – есімдік
// 5 – ... 6 – ... 7 – ... ... ... ... ... бойынша (3.1.1-кесте)
сәйкесінше сhlen_predlozheniya_rus[] жиымына толтырады.
// 0 – не член предложения
// 1 – ... 2 – ... 3 – ... 4 – ... 5 – ... ... тілі және орыс ... сөйлем мүшелерінің
байланысы
|Егер chlen_predlozheniya_kaz[]={} болса|онда chlen_predlozheniya_rus[]={} ... |1,2 ... |1,2 ... |3,2 ... |1,2,3 ... |1,4,2 ... |1,2,5 ... |3,2,1 ... |4,1,2 ... |1,2,3,5 ... |1,5,2,3 ... |1,2,4,3 ... |2,4,1,3 ... |1,4,3,2 ... |3,1,2,5 ... ... ... ... көмегімен жұмыс істейді:
string struct_kaz="";
for (i = 0; i < words_kaz.Length; i++)
{struct_kaz += ... }
if ... == ... = new int[] { 1, ... ... == ... = new int[] { 1, 2
};}else
if (struct_kaz == "32"){chlen_predlozheniya_rus = new int[] { 3, ... ... == "132"){ ... = new int[] { 1, 2,
3 }; }else
if (struct_kaz == "142"){ chlen_predlozheniya_rus = new int[] { 1, 2,
4 }; ... ... == "152"){ ... = new int[] { 1, 2,
5 }; ... ... == "312"){ ... = new int[] { 3, 2,
1 }; ... (struct_kaz == "412"){ chlen_predlozheniya_rus = new int[] { 4, 1,
2 }; }else
if (struct_kaz == "1352") { ... = new int[] { ... 3, 5 }; ... ... == "1532") { ... = new int[] { ... 2, 3 }; ... (struct_kaz == "1432") { chlen_predlozheniya_rus = new int[] { 1,
2, 4, 3 }; ... ... == "3412") { ... = new int[] { ... 1, 3 }; }else
if (struct_kaz == "4312") { chlen_predlozheniya_rus = new int[] { 1,
4, 3, 2 }; ... ... == "3152") { ... = new int[] { ... 2, 5 ... ... ... деген бос айнымалыны алады да, оның ішіне
қазақ ... ... ... мүшелерін жазады. Содан кейін
chlen_predlozheniya_rus жиымына сәйкес орыс ... ... ... Синтаксистік талдау
Сөйлемді сөзедрге бөлгеннен кейін, ... ... үшін ... табу ... ... ... ... сөздің түбірінен бөлек
бөлігінің, яғни жұрнақ-жалғауларының көмегімен табылады. Олар: етістіктің
шағы (lev1_shak жиымы), зат есімнің ... ... ... ... ... және lev2_padezh жиымдары), сонымен қатар
көпттік жалғау (lev1_chislo жиымы).
lev1_shak[] – ... ... 0 – ... 1 – ... ... 2 – осы ... 3 – келер шақ
lev1_zhiktik[] – жіктік жалғаудың түрі
// 0 –жоқ
// 1 – жіктік жалғаудың 1-ші жағы
// 2 – жіктік жалғаудың 2-ші ... 3 – ... ... 3-ші ... – орыс ... ... 0 – ... 1 – мужской
// 2 – женский
// 3 – средний
lev1_chislo[] – көптік жалғау
// 0 – ... 1 – ... 2 – ...... ... 0 – ... 1 – атау септік
// 2 – ілік септік
// 3 – барыс септік
// 4 – табыс септік
// 5 – ... ... 6 – ... ... 7 – көмектес септік
3.3 Синтаксистік генератор
Келесі айнымалыларда орыс тіліндегі сөздердің бөліктері жазылған. ... ... ... ... және оны ... ... шарт қою үшін қажет.
string[] strings1 = new string[] { "га", "ка", "нь", ... ... strings2 = new string[] { "р", "к", ... ... strings3 = new string[] { "а" };
string[] strings4 = new string[] {"ь"};
string[] strings5 = new string[] {"ть"};
string[] strings6 = new string[] ... strings7 = new string[] { "ать" ... strings8 = new string[] ... strings9 = new string[] {"м"};
string[] strings10 = new string[] { "о" ... ... = new string[] { "е" ... код етістік өзгеруін көрсетеді:
if (lev1_chast_rechi[i] == 5)
{
if (lev1_shak[i] == 1)
{
if ... - ... ... == 1)
{
if (lev1_rod[i] == 1 || lev1_rod[i] == 0) { words_rus[i] =
words_rus[i].Substring(0, words_rus[i].Length - 2) + "л"; ... ... == 2) { ... = ... - 2) + "ла"; ... ... == 3) { ... = words_rus[i].Substring(0,
words_rus[i].Length - 2) + "ло"; }
}
else if(lev1_chislo[i]==2)
{ words_rus[i] = ... ... - 2) ... }
}
else if (strings8.Contains(words_rus[i].Substring(words_rus[i].Length
- 3, 3)))
{
if (lev1_chislo[i] == 1)
{
if (lev1_rod[i] == 1) { words_rus[i] = words_rus[i].Substring(0,
words_rus[i].Length - 3) + "шел"; }
if ... == 2) { ... = ... - 3) + ... }
if ... == 3) { words_rus[i] = words_rus[i].Substring(0,
words_rus[i].Length - 3) + "шло"; }
}
else if (lev1_chislo[i] == 2) { ... ... ... - 3) + ... ... бұл ... өткен шақтағы етістіктің ... ... Ол ... анықталған сөздің бөліктерін тексеріп, оны сәйкес ереже
бойынша өзгертеді. Мысалы, түбірі -йти деп ... ... ... ... ... ... -шёл, -шла, -шло, ал көпше ... ... ... ... шақта, жекеше түрде – пошел, ал көпше түрде – пошли.
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ
4.1 Мәліметтер қорының ... ... ... ... ... аудармасының мәліметтер қоры SQLite программасында
құрастырылған. Барлығы 10 ... ... ... ... сөз
таптарына байланысты және 1 кесте белгісіз жаңа сөдерген арналып бөлінген.
Олар: "Noun" (зат ... "Pril" (сын ... "Chisl" (сан ... "Mest"
(есімдік), "Gl" (етістік), "Narech" (үстеу), "Soiuz" (шылау), "Mezhdometie"
(одағай), "New_w" ... ... ... ... ... ... алдымен программа толығымен енгізілген сөзді МҚ іздейді. Егер сөз
МҚ табылса, онда программа сөзді және оның ... ... ... ... анықтап береді. Егер ондай сөз жоқ болса, онда цикл ... ... ... алып ... отырады. Цикл сөзде бір әріп ... Егер ... ... ... сөз МҚ ... онда ... оны МҚ
жаңа сөздердің кестесіне енгізеді.
Программаны МҚ-на қосу үшін ... ... ... ... ... sqlite ... МҚ-мыз дайын болса, онымен байланыстыратын
кодты енгіземіз:
{
string mySelectQuery = "SELECT * FROM `" + table + ... + ... + ... ... = new ... ... = new ... SQLite программасының жалпы көрінісі
4.1.3-сурет. Noun кестесі
4.1.4-сурет. Pril кестесі
4.1.5-сурет. Chisl кестесі
4.1.6-сурет. Mest ... Gl ... New_w ... ... ... ... ... тілі
C# (си-шарп деп оқылады) — программалаудың объектті-бағдарланған тілі.
1998—2001 жылы, Microsoft .NET ... үшін ... ... тілі ... Microsoft компаниясында Андерс Хейлсберг басшылығымен
бір топ инженерлер жасап шығарған. C# компиляторы .NET ... ... ... ... ... ... да ... жабдықсыз,
мысалы Visual Studio секілді, жасауға және компиляциялауға болады.( 10-
сурет)
C# ... ... ... ... ... оның ішінде ол
синтаксис C++ және Java жақын болып келеді. Бұл тіл ... ... ... ... ... қайта іске қосу (соның ішінде айқын
және айқын емес типті келтіру ... ... ... қасиеттер, жалпыланған типтер мен әдістер, ... ... бар ... ... LINQ, ережеден тыс қосымшалар, XML
форматындағы пікірлер бар. ... ... ... ... C# ... интерфейсі
Оған дейінгі программалау тілдерінен, мысалға C++, Java, ... және ... С# ... қасиеттерін алып, оларды қолдану
практикасына негізделіп, программалық ... ... ... кейбір моделдерді алып тастайды, мысалға С# кластардың көптеген
із қалдыру жоқ ( C++ ке ... CLR ге ... ... ... программалау тілі секілді
жасалған болатын, сондықтан CLRдің мүмкіндіктеріне ... ... ... ... BCL ... C# типті жүйелерге қатысты. Тілдің айрықша
ерекшеліктерінің бар болуы немесе ... ... бір ... ... ... ... ауыса алу мүмкіндігімен анықталады. Осылайша,
CLR 1.1. нұсқасынан 2.0 нұсқасына дейін дамуынан C#тың өзі байытылды, ... ... ... ... да ... болады. (Алайда бұл
заңдылықтар, .NET платформасының кеңейуіне сүйенбейтін тілдің ... C# 3.0 ... ... CLR ... да .NET – ... ... C#қа да «классикалық» программалау тілінде жоқ көптеген
мүмкіндіктерді ұсынады. Мысалы, C#тың өзінде қоқыс жинау іске ... CLR, VB.NET, J#та және тағы ... ... ... ... C#та да жазылған программалар үшін орындалады.
# (октоторп) символы тілдер атауында, ... ... ... ... ... ... тілдің дамуындағы жаңа қадмады меңзейтін ... қосу ... ... және С әрпімен бірге ағылшын тілінде нота атауы
болып табылатын до-диез, диез музыкалық символы секілді ... ... # ... оның ... # ... «шарп» деп
атайды (sharp деген ағылшын сөзінен), ... оның «Си ... ... ... ... C #пен ... ... жазылған өзінің белгілі
бір программасы бар. Енді сідерге бұл программа жайлы ақпарат бере кетейін,
және ол үшін ... ... ... қолданатын боламын.
Машина aspx файлдан С# кодексін жасап шығарды деп түснейік. Кодекс тек
қателік анықталған кезде ғана анық ... ... ол ... ... ... ескермеуге болады, себебі олар, онсыздан айқын
көрініп тұрғандай, ешқандай да адам ... ... ... ... ... ... жай ғана ... Алайда, программа аты айтылмаған.
Программа әрқашанда тұжырымдардан басталады, және де ... 13 ... ... бұл namespaces шегіндегі класстар сыйлығы, енді ешқашан
namespaces бастамасымен қамтамасыз ... ... ... ... ... басқа namespacesдің кластарына қарағанда көбірек
қолдануыңызды күтеді.
5.2 ... ... ... дипломдық жұмысымның барысында негізгі қолданған операторлаым
мыналар:
If – else;
For;
Себебі, программаның коды толығымен ... ... ... – else ... ... операторлары болып табылады. Белгілі бір шарт
орындалған кезде қажетті операциалар іске ... ал кері ... ... ... жазылған код іске асырылады.
Мысалы, бір бөлігін қарастыратын болсақ:
if (lev2_padezh[i] == 2)
{if(strings1.Contains(words_rus[i].Substring(words_rus[i].Length-
2,2)))
{words_rus[i] = words_rus[i].Substring(0, ... - 1) ... if ... - 1, ... ... = ... words_rus[i].Length - 1) +
"ы"; }
else if (words_rus[i].Substring(words_rus[i].Length - 1, 1) == "о")
{words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 1) +
"а"; }else if ... 1, ... = ... + "а"; } else ... - 1,
1))){words_rus[i] = words_rus[i] + "а"; }}
Бұл септік Ілік септігіне тең болған ... ... ... ... ... ... ... бөлігі.
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ
Жоғарыдағы айтылып, көрсетілген алгоритмдерді, сұлбаларды және барлық
ережелерді ескере отырып аудармашы программасын құрастырдық. Ол 6.1-суретте
көрсетілген:
6.1-сурет. ... ... ... ... ... айтып кетсек, олар: RichTextBox1 –
үстіндегі, ... ... ... ... ... ...
нәтижені, яғни сөйлем сөздерінің анализін және толық ... ... ... Button1 ... яғни ... батырмасын басқан кезде
орындалады (6.2-сурет).
6.2-сурет. Аудару процесі.
7 ЖОБАНЫҢ ... ... ... ... ... ... бағалау үшін әдістемені құру
Нақты тілде мәтіндік ақпараттың сапаны бағалау жүйесінің критериін
өндеп ... ... ... ... ... процедурасы жоқ. Сонымен
критериді құруда көп программистермен мамандар қызығушылық білдіреді, және
осы бар ... ... ... Машиналық аудармашының сапасын бағалауға шолу
Бағалау кез келген технологияда негізгі компонент болып келеді.
Жүйенің ... ... ... ... ... ... ... кезеңде өлшенуі мүмкін. Осы салыстырмалы бағаны вертикальді деп
атаймыз. Алтернатива ретінде бірнеше жүйенің сапасы, ... бір ... ... Осы ... ... ... түрін горизонтальді
деп атап кетейік. Вертикальді ... ... ... ... ... ... және сервистік қызмет көрсетуге
арналған.
Горизонтальді бағалау бірінғай ... және ... бар. ... – қарсыластардың жүйесіне қарағанда, өз
жүйесінің тиімді сапасын анықтау үшін, ал ... ... ... олардың талаптарын орындауға ең тиімді мүмкіндік береді.
Соңғы кездері машиналық аудармашыға теориялық және ... ... ... ... Машиналық аудармашы техникалық
мүмкіндіктерге карай, механизациялау, ... және ... ... ... ... әртүрлі техникалық мүмкіндіктер
алдын ала болады, олар ... ... ... ... жүйе ЭСК және басқа техниканы қолданып, нақты әрекеттер
арқылы ақпаратты өндейді, және адам мен техниканың минималды мүмкіндіктерін
қолданады. ... ... ... немесе әрекет деп ойлайды,
осыда адамның ешқандай әрекеті болмайды.
Осы ... ... ... бар ...... ... – оның ... кезеңдері болып
келеді. Біріңғай жүйеде барлық бар ... ... ... ... ... ... екі ... жағдайда
ақпаратты өндеуге болады. Толық автоматты жүйе тек ... ... ... ... сол үшін ... ... термині өзіннің толық
және тікелей мағынада, машиналық аудармашының жүйесіндегі әлі жетпеген ең
үлкен ... ... ... ... ... ... ... келесі түрдегі параметрлер
арқылы өткізу керек: ... ... ... ... ... ... баяндама; ұйымдық мәні; бағалы
тиімділік.
Жүйелік баяндама:
• аударманы жасай уақыт пен жылдамдық;
• өзгертудің ... ... ... ... ... ... бас тарту;
• ақпаратты көрсетудің ыңғайлығы;
• бағасы.
Шығыс мәтіннің бағалау критерийі:
... ... ... ... ... ... және аударманы
тұтастыру:
◦ аударманың нақтылығы;
◦ терминологияның ... ... ... ... ... ... ... айқындық;
◦ түсініктілік;
• мінездеме сапасы ретінде аударма тіліндегі ... ... ... ... ... ... ... бағалау әдістері:
• кері аударма;
• аударманың эталонымен салыстыру;
• трансформациялық әдіс;
• денотативтік әдіс;
• қолданушыларды ... ... ... қаталерді анализдеу (лексика, грамматика).
Программалық компелкстің сенімділік процедурасын ... ... ... ... ... жабдықтаманың модульдерінің
сенімділігі бағаланады. Осы кезеңде кіріс мәліметтер ретінде әдебиетте
машиналық ... және ... ... ... ... ... Осы ... үлкен көлемдегі статистикалық мәліметтерді
өндеу арқылы көрсетіледі және практикамен дәлелденеді. Графтың бұтақтарын
немесе модульдер арасындағы ... ... ... ... ... ... ... жолмен анализдеу арқылы жасалынуы
мүмкін, немесе гипотезаның тең ... ... ... ... нұктесінен барлық жолдарды қолдану. Соңғы нұсқаны қолдану бізді
программалық жабдықтаманың сенімділігінің төменділігіне алып ... ... осы ... максималды дәлсіздікте болады.
Толық программалық комплекстің көрсеткіштің сенімділігін бағалауы, ... ... ... ... ... ... ... кейін
жасалынуы мүмкін, және модульдердің көрсеткіштерін ... ... ... ... ... керек.
Нақты тілдің мінездемесі, обьективті және формальді бағалау әдістеріне
толық әсер ... ... ... жене ... ... оның
ішінде әрқашанда субьективтің бөлігі болады. ... ... ... және адам ... ... ... керек,
финанстық көзқараста практикалық және жетімділік шешімді табу.
7.3 Машиналық аудармашы сапасының эксперттік бағалау методикасын құру
Берілген жұмыста ең алдымен шығыс ... ... ... ... тұр. ... айтқанды есепке алғанда, машиналық аудармашының сапасын
тексеру үшін, үстіде көрсетілген модельдер қолданылған, және алгоритмдер
үшін эксперттік ... ... ... ... сөйлемнің сапасы 3 параметрмен анықталады: шығыс сөйлемнің
лексикасы қаншалықты дұрыс аударылғаны, аударманың ... ... ... және ... ... ... ... нақты беретінің
көрсетеді. Әр параметр 1-ден 5-ке шкаласы арқылы бағаланады. ... ... ... ... көрсетілген.
Анализден кейін барлық бағалар соммаланады, және алынған сан машиналық
аударманың сапасын көрсетеді (7.3.1-кесте). Максимумға жақын болса(15 ... ... ... ... ... ... бағасын ыңғайлы қабылдау үшін,
оны пайызға аударуға болады. Аударманың анализынан ... көп ... ... орта мәнін есептеуге болады, жалпы ... және ... ... Алынған мәліметтер аудармашы
программаның жұмысының сапасын көрсетеді.
7.3.1-кесте. Аударманы ... ... ... ... ... |
|1 ... сөздер дұрыс |Сөйлемнің құрылымы |Аударманың мәні жоқ |
| ... ... ... емес ... ол дұрыс емес |
|2 |1-2 ... ... ... ... ... ... |
| | ... емес, бірақ 1-2|түсінікті |
| | |сөз ... | |
| | ... ... |
| | ... ... | |
| | ... тұр | |
|3 ... ... ... ... ... ... мәні |
| |дұрыс ... ... емес ... |
| | ... формада| |
| | ... ... | |
| | ... реті | |
| | ... | |
|4 |1-2 қате бар ... ... |Аударманың мәні |
| | ... ... 1-2 ... ... |
| | ... емес ... ... |
| | ... ... |
| | ... ... |
| | |1-2 ... реті | |
| | ... | |
|5 ... сөздер дұрыс |Сөйдемнің құрылымы |Аударманың мәні |
| ... ... ... және ... ... ... ... келе, орындалған тапсырманың өзектілігі
жөнінде және ... ... ... ... ... ... әдістерді қолданғанымды қорытындылап кеткім келеді.
Машиналық аударманың тарихына шолу жасап, талдаудың алгоритмдерін ашып
көрсеттім. Екі тілдің ... ... ... ... ... қажетті барлық
атрибуттарды анықтадым.
Нәтижесінде жай сөйлемдерді мағынасына сай және ... ... өнім ... ... жұмыс барысында келесі сәйкессіздіктер
кездесті: септік жалғаулардың ... ... және ... келіспеушілігі және т.б. Бұл мәселені шешуде қажетті сұлбалар
құрып, барлық түрдегі жалғаулар мен жұрнақтардың ... ... ... ... жабдықтаманы сипаттап кететін болсақ, ... Visual Studio 2010 ... ... С# ... ... Ал ... базасы SQLite МҚБЖ-нің көмегімен басқарылды.
Жұмыстың нәтижесі алынып, оның ... мен ... ... баға ... ... ТІЗІМІ
Кітаптар:
1. Бектаев “Қазақ-орыс сөздігі”
2. Э.Д Сулейменова и др. “Анықтағыш.” Учебный курс по ... ... / Э.Д ... К.К ... Д.Х ...... ... 2007 г – 240 стр. 227-229
3. Бектұров Ш.К “Қазақ тілі: лексика, ... ... ... /
- ... Атамұра, 2006.-336 бет.
4. “Build Your Own ASP.NET 3.5 Web Site Using C# & VB” by Cristian Darie
and Wyatt Barnet, 3rd ... N.Kultin “C# in tasks and its ... ... ... ... ... Серғалиев “Қазақ тілі” оқыту методикасы / ...... 80 ... ... семантический NLPTM www.cognition.com
8. Определения машины и статистического перевода www.wikipedia.com
9. Насколько большой рынок ... ... ... Языковые Прогнозы Ткача http://www.imakenews.com
12. Британская Группа Специалиста по Переводу Естественного языка Общества
13. эпохи компьютеризации ... ... ... для ... ... ... ... программада қолданылған атрибуттар
// 0 - неизвестно
// 1 - зат есім
// 2 - сын есім
// 3 - сан ... 4 - ... 5 - ... 6 - ... 7 - ... int lev1_sushestvitelnoe_mesto_vremya;
// 0 - не важно
// 1 - время
// 2 - ... int ... 0 - не ... 1 - ... 2 - ... 3 - ... 4 - өздік
// 5 - белгісіздік
// 6 - болымсыздық
// 7 - ... int ... 0 - не ... 1 - ... ... int lev1_chast_usteu;
// 0 - не важно
// 1 - мезгiл
// 2 - ... 3 - ... 4 - ... 5 - ... 6 - ... 7 - ... int lev1_chast_shylau;
// 0 - не важно
// 1 - септеулiк
// 2 - ... 3 - ... ... int ... 0 - не важно
// 1 - атау септік
// 2 - ілік септік
// 3 - барыс ... 4 - ... ... 5 - ... ... 6 - ... септік
// 7 - к?мектес септік
public int lev2_taueldik;
// 0 - не важно
// 1 - 1 жак
// 2 - 2 жак
// 3 - 2 жак ... 4 - 3 ... int ... 0 - не ... 1 - 1 ... 2 - 2 жак
// 3 - 2 жак сыпайы
// 4 - 3 ... int ... 0 - не ... 1 - ... ... 2 - ... число
public int lev2_etistik;
// 0 - не важно
// 1 - етiстiк
// 2 - өзгелік етіс
// 3 - бұйрық рай
// 4 - ... ... 5 - ... ... 6 - болымсыз етістік
// 7 - үздік етіс
// 8 - ... ... 9 - ... етіс
public int lev2_kosemshe;
// 0 - не важно
// 1 - косемше
public int lev2_esimshe;
// 0 - не ... 1 - ... int ... 0 - не ... 1 - ... 2 - ... 3 - жинактау
// 4 - болжалдык
// 5 - ... ... 6 - ... ... int ... 0 - не ... 1 - жай ... 2 - салыстырмалы шырай
//==================================================
public int lev3_chlen_predlozheniya;
// 0 - не член предложения
// 1 - ... 2 - ... 3 - ... 4 - ... 5 - пысықтауыш
//==================================================
public int lev4_chlen_predlozheniya_na_rus;
// 0 - не член ... 1 - ... 2 - ... 3 - ... 4 - ... 5 – ... ҚОСЫМШАСЫ
Қолданылған айнымалылар
Сөзді бөлу символдары:
char[] delimiterChars = {' ', ',', '.', ':', '\t'};
string[] words_kaz = new string[3];
Қазақ тіліндегі ... ... ... ... = sentence_kaz.Split(delimiterChars);
string[] words_rus=new string[3];
Қазақ тіліндегі сөйлемнің мүшелерінің жиымы:
int[] chlen_predlozheniya_kaz={1,3,2};
int[] chlen_predlozheniya_rus = new int[3];
Орыс тіліндегі сөйлемнің мүшелерінің жиымы:
int[] lev1_chast_rechi = new int[] { 1,1,5 ... ... ... ... = new int[] { ... ... жіктік жалғауларының жиымы:
int[] lev1_zhiktik = new int[] { 0,0,3};
int[] lev1_rod = new int[] { 0,0,1};
Көптік жалғаулардың жиымы:
int[] lev1_chislo = new int[] { ... ... ... lev2_padezh = new int[] { 0,3,0};
Сөзді өзгерту кезінде тексерілген жұрнақ-жалғаулар:
string[] strings1 = new string[] {"га","ка","нь","ня","дь"};
string[] strings2 = new string[] ... strings3 = new string[] ... strings4 = new string[] ... strings5 = new string[] ... strings6 = new string[] ... strings7 = new string[] {"ать"};
string[] strings8 = new string[] {"йти"};
string[] strings9 = new string[] ... ... = new string[] ... ... = new string[] {"е"};
Б ҚОСЫМШАСЫ
Алгоритмдер
for (i = 0; i < words_rus.Length; i++)
{if (lev1_chast_rechi[i] == 5)
{if (lev1_shak[i] == 1)
{if (strings5.Contains(words_rus[i].Substring(words_rus[i].Length -
2, ... ... == ... ... == 1 || ... == 0) { words_rus[i] =
words_rus[i].Substring(0, words_rus[i].Length - 2) + "л"; }
else
if (lev1_rod[i] == 2) { ... = ... - 2) + "ла"; ... ... == 3) { ... = ... - 2) + "ло"; }
}
else if(lev1_chislo[i]==2)
{ words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 2)
+ "ли"; ... ... - 3, ... ... == ... ... == 1) { words_rus[i] = words_rus[i].Substring(0,
words_rus[i].Length - 3) + "шел"; }
if (lev1_rod[i] == 2) { words_rus[i] = ... - 3) + ... }
if ... == 3) { words_rus[i] = words_rus[i].Substring(0,
words_rus[i].Length - 3) + "шло"; ... if ... == 2) { ... ... ... - 3) + "шли"; }
}
}
if (lev1_shak[i] == 2)
{
if (lev1_zhiktik[i] == 1)
{
if (strings8.Contains(words_rus[i].Substring(words_rus[i].Length - 3,
3))) {words_rus[i] = "иду";}
if ... -
3, ... = ... ... - 3) ... ... - 3, ... = words_rus[i].Substring(0, words_rus[i].Length - 2) +
"ю";
}
}
else if ... == ... ... -
3, 3))) { ... = ... }
if (strings6.Contains(words_rus[i].Substring(words_rus[i].Length -
3, 3)))
{
words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 2) +
"ишь";
}
else if
(strings7.Contains(words_rus[i].Substring(words_rus[i].Length - 3, 3)))
{
words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 2) ... if ... == ... ... -
3, 3))) { ... = ... }
if ... -
3, 3)))
{
words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 2) +
"ит";
}
else if
(strings7.Contains(words_rus[i].Substring(words_rus[i].Length - 3, 3)))
{
words_rus[i] = words_rus[i].Substring(0, ... - 2) ... ... == ... ... -
3, ... ... = words_rus[i].Substring(0,
words_rus[i].Length - 2) + "ду";}
else if (lev1_zhiktik[i] == 2) { words_rus[i] =
words_rus[i].Substring(0, words_rus[i].Length - 2) + "дешь"; ... if ... == 3) { ... ... ... - 2) + ... }
}
}
}
// 0 - не важно
// 1 - атау септік
// 2 - ілік ... 3 - ... ... 4 - ... ... 5 - ... септік
// 6 - шы?ыс септік
// 7 - к?мектес септік
for (i = 0; i < words_rus.Length; i++)
{
if (lev2_padezh[i] == ... ... = ... ... - 1) ... if (words_rus[i].Substring(words_rus[i].Length - 1, 1)=="а")
{ words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length - 1)
+ "ы"; ... if ... - 1, 1) == ... ... = ... ... - 1)
+ "а"; ... if (strings2.Contains(words_rus[i].Substring(words_rus[i].Length
- 1, 1)))
{words_rus[i] = words_rus[i] + "а"; }
else if
(strings9.Contains(words_rus[i].Substring(words_rus[i].Length - 1, 1)))
{ words_rus[i] = words_rus[i] + "а"; ... if ... == ... (words_rus[i] == "дом") { words_rus[i] = "домой"; }
if (strings2.Contains(words_rus[i].Substring(words_rus[i].Length -
1, ... += ... ... -
1, ... = "в ... words_rus[i].Length - 1)
+ "у";
}else
if (strings4.Contains(words_rus[i].Substring(words_rus[i].Length -
1, 1)))
{
words_rus[i] = "в "+words_rus[i].Substring(0, words_rus[i].Length -
1) ... if ... - 1, 1) == ... ... = "в ... words_rus[i].Length
- 1); }
}
else if (lev2_padezh[i] == 4)
{
if (strings3.Contains(words_rus[i].Substring(words_rus[i].Length -
1, 1)))
{
words_rus[i] = words_rus[i].Substring(0, words_rus[i].Length -
1)+"у";
}
else if
(strings2.Contains(words_rus[i].Substring(words_rus[i].Length - 1, 1)))
{
words_rus[i] += ... if ... == ... ... == "дом") { words_rus[i] = "дома"; }
else
if (strings3.Contains(words_rus[i].Substring(words_rus[i].Length -
1, 1)))
{
words_rus[i] = "в " + words_rus[i].Substring(0, ... 1) + ... ... - 1, ... += "в "+words_rus[i] + "е";
}
}
else if (lev2_padezh[i] == 6)
{
if (strings9.Contains(words_rus[i].Substring(words_rus[i].Length -
1, ... = "из " + ... ... 1) + ... ... - 1, ... += "из " + ... - 1) + "и";
}
else if
(strings10.Contains(words_rus[i].Substring(words_rus[i].Length - 1, 1)))
{
words_rus[i] += "из " + words_rus[i].Substring(0,
words_rus[i].Length - 1) + ... if ... == ... ... - ... ... words_rus[i].Length) + "ом";
}
else if
(strings3.Contains(words_rus[i].Substring(words_rus[i].Length - 1, 1)))
{
words_rus[i] +=words_rus[i].Substring(0, words_rus[i].Length - 1) ... ... - 1, ... ... ... - 1) ... ... - 1, 1)))
{
words_rus[i] += words_rus[i].Substring(0, words_rus[i].Length -1) +
"ем";
}
}
}
for(i=0;i

Пән: Информатика
Жұмыс түрі: Дипломдық жұмыс
Көлемі: 48 бет
Бұл жұмыстың бағасы: 1 300 теңге









Ұқсас жұмыстар
Тақырыб Бет саны
AVR тегінденгі микроконтроллерларды пайдалану ерекшеліктері4 бет
Жерді есепке алу19 бет
"Өндірістік цех ауданын есептеу"14 бет
Болат және болаттан жасалған бұйымдар9 бет
Жануарлардың тістеуі, жылан, жәндіктердің шағуы. бөгде заттың түсуі. жасанды тыныс алдыру – жалпы ережелер. инъекция – жалпы ережелері, түрлері14 бет
Жобаны жоспарлағанда қызметкерлер құрамын басқару алгоритмін құру34 бет
Педагогикалық ұжымдағы қарым – қатынастардың әлеуметтік психологиясы10 бет
Ұлттық сана-сезім – шексіз дүние (Өзбекстандағы қазақтар жайында)4 бет
1.Түркітануға байланысты алғашқы зерттеулер. 2.Орыс ғалымдарының түркітануға байланысты зерттеулері. 3.ХХ ғасыр басындағы түркітану тарихы5 бет
17 ғ-дың соңы — 18 ғ-дың басында Қазақстанды орыс ғалымдарының зерттей бастауы10 бет


Исходниктер
Пәндер
Көмек / Помощь
Арайлым
Біз міндетті түрде жауап береміз!
Мы обязательно ответим!
Жіберу / Отправить


Зарабатывайте вместе с нами

Рахмет!
Хабарлама жіберілді. / Сообщение отправлено.

Сіз үшін аптасына 5 күн жұмыс істейміз.
Жұмыс уақыты 09:00 - 18:00

Мы работаем для Вас 5 дней в неделю.
Время работы 09:00 - 18:00

Email: info@stud.kz

Phone: 777 614 50 20
Жабу / Закрыть

Көмек / Помощь