Қазақ тілінен орыс тіліне машиналық аударма жасайтын программалық кешенін өңдеуі (генератор)


ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ

ӘЛ-ФАРАБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ

Механика-математика факультеті

Ақпараттық жүйелер кафедрасы

Кафедра меңгерушісінің міндетін атқарушы

У. А. Тукеев

(қолы)

рұқсатымен қорғауға жіберілді

(күні)

ДИПЛОМДЫҚ ЖҰМЫС

«Қазақ тілінен орыс тіліне машиналық аударма жасайтын программалық кешенін өңдеуі (генератор) »

050703 - “Ақпараттық жүйелер” мамандығы

Орындаған 4 курс студенті М. А. Ильжанов

Ғылыми жетекшісі Ж. М. Жұманов

к. ф. -м. н. ., доцент

Норма бақылаушы А. Қожанова

Алматы 2012

РЕФЕРАТ

В данной дипломной работе иследовался перевод текста с казахского на русский язык.

В данный момент есть несколько вариантов программ, переводящих текст с казахского на русский язык. Но все эти труды еще не разработаны в достаточной степени. Учитывая все минусы, которые присутствуют в ранних версиях переводчиков, были разработаны новые способы смыслового перевода.

Работа содержит Введение, 7 глав, Заключение, Список использованной литературы и Приложение. Объем работы 52 страницы. На работе применились 2 таблицы, 19 рисунков.


ГЛОССАРИЙ

Машиналық аудармашы - ЭЕМ-де бір табиғи тілдегі мәтіннің мазмұны жағынан эквивалентті басқа тілдегі мәтінге түрлендірілуі. Машиналық аударма қазіргі жүйелеріне адам (редактор) қатысады.

Тіл - адамзат қоғамының белгілі бір кезенінде туып, заңды түрде дамыған семантикалық жүйе. Онын ең басты қызметі ақпарат хабарлардың жасалу, сақталуымен және оларды таратумен байланысты. Тіл адамды коршаған шындык өмір туралы білімді сактаумен бірге, жаңа білімді кабылдайтын, сөйтіп, адамның ойлау процесін жетілдіріп қамтамасыз ететін қоғамдык сипаты бар құбылыс. Сөз тіркесі ( орыс. словосочетание ) деп толық мағыналы екі я бірнеше сөздің бір-біріне тұлғалық әрі мағыналық жағынан бағына байланысуын атаймыз.

Сөйлем деп бір шама ойды білдіретін бір сөзді я бірнеше сөз тіркесін атаймыз. Тиянақталған ойды ауызша да, жазбаша да білдіруге болады. Ауызекі сөйлеуде сөйлем мен сөйлемнің арасында кідіріс (пауза) болады. Жазуда бір сөйлем екінші сөйлемнен нүкте, сұрау және белгілерінің бірімен айырылады.

Лексика (грек. лексикос - сөздік) - тілдегі сөздердің жиынтығы, сөздік құрам. Лексикаға тілдегі барлық сөздер кіреді. Сөздер қолданылуына қарай актив және пассив болып бөлінеді. Актив сөздерге күнделікті өмірде жиі қолданылатын сөздер жатады. Ал пассив сөздерге қолданылу өрісі шектеулі көнерген сөздер, диалектілер мен кәсіби сөздер, терминдер жатады.

Морфология (биология) - ағзаның пішіні мен құрылымы туралы ғылым. Морфология (гр. morf - түр, тұлға, logos - сөз, ілім) - дербес сөздердің грамматикалық мағыналарын тексеретін, грамматикалық сөз тұлғалардың қызметі мен қалыптасу, даму заңдылықтарын зерттейтін тіл ғылымының бір сапасы.

Синтаксис ( гр. σύνταξις - құру, тәртіп, амал-тәсіл ) - сөз тіркесі туралы, сөйлем туралы ғылым. Сөйлеу дағдысы бойынша сөздер өз ара белгілі бір жүйемен тіркеседі. Сол тіркестердің де, сөйлемдердің де өз жүйелері, өз заңдары болады. Синтаксис сөйлеудің калыптасу ережелерің зерттейді.

Семантика (көне грекше σημαντικός - танбалаушы, білдіруші) - тіл және тіл бірліктері (сөз, грамматикалық тұлға, сөз тіркесі, сөйлем) арқылы білдірілетін хабарды, заттар мен құбылыстардың мән-мазмұның зерттейтін тіл білімінің саласы, семиотиканың негізгі бөлімдерінің бірі.

Грамматика (гр. ' grammatіke, γράμμα' - әріп, жазу) - тіл білімінің сөз таптарын, сөздердің өзгеруі мен сөйлем құрылысын зерттейтін саласы.

МАЗМҰНЫ

КІРІСПЕ5

1 АНАЛИТИКАЛЫҚ ШОЛУ7

1. 1 Машиналық аудармашының тарихы7

1. 2 Машиналық аудармашының сәулеті9

1. 3 Қазақ-орыс аудармашысының қазіргі күйі9

2 ҚАЗАҚ-ОРЫС ТІЛДЕРІНДЕГІ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ11

2. 1 Машиналық аударманың талдауы11

2. 2 Қазақ тілінен орыс тіліне машиналық аудармашының концептуалдық моделі14

2. 3 Формальді грамматика17

2. 3. 1 Формальді грамматиканың және тілдің анықтамасы18

2. 3. 2 Формальды грамматиканың типтері21

2. 3. 3 Қазақ тілінің формалды грамматикасы24

2. 4 Лексикалық талдау моделі24

2. 4. 1 Сөз таптары25

2. 5 Синтаксистік талдау моделі32

2. 5. 1 Қазақ тілі мен орыс тілінің жалғауларының арасындағы байланыс33

3 ҚАЗАҚ ТІЛІНДЕГІ СӨЗДЕРДІ ТАЛДАУДЫҢ ӘДІСТЕРІ МЕН АЛГОРИТМДЕРІН ҚҰРУ38

3. 1 Лексикалық талдау38

3. 2 Синтаксистік талдау40

3. 3 Синтаксистік генератор40

4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ42

4. 1 Мәліметтер қорының құрылымы42

5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ47

5. 1 Қолданылған программалау тілі47

5. 2 Қолданылатын программалық процедура48

6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ50

7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ52

7. 1 Машиналық аудармашының сапасын бағалау үшін әдістемені құру52

7. 2 Машиналық аудармашының сапасын бағалауға шолу52

7. 3 Машиналық аудармашы сапасының эксперттік бағалау методикасын құру54

ҚОРЫТЫНДЫ56

ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ57

А ҚОСЫМШАСЫ58

Ә ҚОСЫМШАСЫ62

Б ҚОСЫМШАСЫ63

КІРІСПЕ

Бұл дипломдық жұмыс қазақ тілінен орыс тіліне машиналық аударма жасау технологиясына арналған. Қазіргі заманда мұндай технологияның қажеттілігі өте жоғарғы деңгейде.

Бұл программаны жасау үшін бірінші қазақ тілімен орыс тілінің грамматикасын терең зерттеп, олардың арасындағы байланысты қарастырып, келесі бөліктерге бөлдім:

• Сөздердің түбірлерінің және сәйкес аудармаларының қорын құру;

• Қазақ тілінің лексикалық (морфологиялық) талдауы;

• Қазақ тілінің синтаксистік талдауы;

• Орыс тілінің лексикалық және синтаксистік талдауы;

• Машиналық аудармашының көмегімен мәтіндерді өндіру.

Қазіргі күнде Қазақстан Ресубликасында барлық құжаттар мемлекеттік тілге аударылуда. Техникалық терминологияның аудармасы үлкен жағымсыздықтар алып келеді. Осы мәселені шешуде машиналық аудармашының тигізер көмегі өте зор. Мысалы, белгілі бір өндіріс саласындағы стандарттарды, бұйрықтарды, заңдардың барлығын аудару үшін сол саланың терминологиясы енгізілген машиналық аудармашыны қолдану жұмысты ондаған есе жеңілдетеді.

Тіпті көп жағдайларда мәтінді терудің де қажеті болмайды. Сканермен өткізіп, алынған мәтінді аудармашыға көшірген жеткілікті.

Қазіргі заманғы жүйелерді дұрыс қолдану үшін, машина сөйлемді қалай аударатынын түбегейлі білу секілді машиналық аудармашыны бағалау үшін өзінің бір стандарты қажет. Мұндай стандартты орнату туралы негізгі талқылаулар тек қазіргі уақытта басталды, бірақ келісімді қабыладу үшін көп уақыт кетпейді, себебі оларды қарастыратын болсақ, әсер ететін көптеген факторлар бар. Бағалау факторлары қолдану мақсатына қарай бөлінеді. Бағалауда қарастырылуы қажет факторлар:

1. Өнім, операция және қызмет көрсету бағасы; үйрету, мәтіндік енгізу, қарапайым сөздер және арнайы терминология үшін сөздікті жаңарту; өңдеу, қорытынды мәтіндік дайындық, аударма сапасы мен бағасы арасындағы қатынас.

2. Мәтінді енгізу жылдамдығы, алдын ала өңдеу (жұмыс үстелі мен сандарды, және т. с. с. өңдеулерді қоса алғанда), машиналық аудармашы, қорытынды мәтінді өңдеу келсімді форматтайды (жұмыс үстелі мен сандарды, және т. с. с. өңдеулерді қоса алғанда), алдын ала өңдеу мен кейінгі өңдеу қатынасы.

3. Дұрыстығы, түсініктілігі, және қарапайымдылығы көз қарасы бойынша алынған сапалылығы.

4. Сөздікті өзгертудің жетілідірілгендігі, жүйенің негізгі сөздігі мен тұтынушылық сөздігі деңгейін жоғарылату, әсіресе белгілі бір аумақтағы әлеуметтік диалект үшін грамматиканы жетілідіру, тұтынушыларға сөздік пен грамматиканы жақсартудың рұқсат етілген деңгейі, және жетілідірілгеннен кейін әдісті тексеруге болатын жүйе мүмкіндігі.

5. Жүйені бір мәтіндік аумақтан екіншісіне және бір тілден екінші тілге кеңейту мүмкіндігі.

6. Операциялық штат саны, алдын ала өңдеу, кейін өңдеу, және сөздікке қызмет көрсететін адамдар көзқарасы жағынан тұтынушымен қойылатын күш салу деңгейі, құжаттар жүйесі құрылымын машианлық аударуға бейімдеу үшін және авторлар негізіг мәтінді дайындау кезінде бастапқы тілдің тұжырымдарын басқаруға қажетті сынақтан өткізу мен ретке келтіру уақыты.

7. Грамматика, семантикамен, анафора мен ellipsis қоса алғандағы сөздік ақпараты- әңгімелесу, программалық жабдықтаудың жылдамдығы, мүмкіндігін зерттеу, интерактивтік аударма немесе кейіннен өңдеу, ауыспалы мағыналылық шешімі, тек ең жақсы аударма өнімін немесе сөйлемдер үшін барлық мүмкін құрылымдар жасау үшін жүйенің қуаттылығы мен шектеулері.

Бұл мәселе әрқашанда өзекті қазіргі заман талабына сай, және қажетті екенін білдіреді.

1 АНАЛИТИКАЛЫҚ ШОЛУ

1. 1 Машиналық аудармашының тарихы

Соңғы кездері шет тілін білу тек саяхаттау немесе шет елден келген қонақтарды күтіп алу кезінде ғана емес, өз үйіңнің ішінде де, мысалы, танымал голливуд киноларын көргенде, теңіздің арғы жағынан келген өнімдердің қолдануға арналған нұсқауларын немесе шаршамайтын браузер бүкіл әлемнен іздеп шығатын Web-беттерін оқыған кезде қажет болады. Осылайша, үйімізден шықпай жатып-ақ бізге аудармашылар көмегі қажет екенін түсінеміз. Алайда бізге қажетті көмекті үйде тұрған компьютер көрсете алады.

Машиналық аударма (МА) жүйелері таң қаларлық нәрсе болудан қалған. Олар өзінің балалық кезеңінен біртіндеп шығып, және де байланыспаған бала былдыры орнына жеткілікті түрде түсінікті «адамзат» тілінде сөйлеуде. Аяққы кезге дейін мұндай бағдарламалар, бағасы жағынан қуатты графикалық және баспалық жүйлермен бірдей қымбат болып қана қоймай, олармен жұмыс істеу өте қиын және күрделі болатын. Міне, үйдегі жеке компьтерлерде қолдануға жарамды алғашұқы аудармашылар пайда болды. Олармен жақынырақ танысып, мүмкіндіктерін бағалайық. Бірақ, әрине алдымен МА тарихынан бастаймыз.

Биографтар айтуы бойынша, XIX ғасырдың өзінде атақты математик Чарльз Бэббидж британдық үкіметті оның «есептеуіш машинаны» жасау бойынша зерттеулерін қаражаттандыру керек екендігіне көз жеткізуге тырысқан. Басқа да жақсы жақтарының ішнде, ол әйтеу бір кезде бұл машина автоматты түрде сөздерді аударады деп уәде еткен. Қазіргі кезде Бэббидж компьютер жұмысының негізінде жатқан көптеген идеялар авторы болып саналғанмен, ол өзінің машинасын да, уәде еткенің де іске асыра алмай қалды. Ал бұл идея қазіргі күнге дейін айтарлықтай деңгейде жүзеге асырылмаған болып тұр. Алайда бүкіләлемдік байланыс негізі болып тұрған Интернеттің пайда болуына байланысты бұл идея қайтадан инвестициялар тарту мен қызығушылық тудыруда.

Жалпы, МА-ның алғашқы бағдарламалары, компьютер пайда болғаннан кейін бірнеше ғана жылдар өткен соң, 50-ші жылдары шықты, бірақ ПК кең таралуына дейін МА есептеуіш техниканы қолданудың маңызды саласынан гөрі ғылыми зерттеулердің қызықты объектісі ғана болды, оның негізгі екі себебі бар: компьютердің жұмыс істеу уақытының қымбаттығынан және оның ресурстарымен ұжымды түрде қолдану. Соңғы жағдай, МА-ның оның қарапайым, оперативтілігінен маңызды артықшылықтарын жойып электрондық көмекшіні бірден қолдануға мұрсат бермеді.

МА-ның туылған күні болып (зерттеу саласы ретіндегі) 1947 ж саналады, оның бәрі Уоррен Уивердің, Рокфеллеров фондының жаратылыстану ғылымы бөлімінің директоры, Норберт Винерге сол жылдың наурыз айында жазған хатынан басталды. Онда аудару мәселесі мәтінді дешифровка мәселесімен салыстырылған. Соңғысы сол кездің өзінде ақ электромеханикалық құрылғыларда орындалатын. Бұл хаттың артынан көптеген талқылаулар жүргізілді, және зерттеу жұмыстарына қаражат бөлінді.

1952 ж атақты математик Бар Хиллелмен ұйымдастырылған бірінші конференция өтті. Онда зерттеушілер тілдің көптеген синтаксистік ережелерін ұймдастыруға, семантиканы, морфологиялық құрылымды, аудару жүйесі үшін сөздіктер құрылымын сипаттау әдістеріне қатысты өз ойларымен бөлісті. Академиялық зерттеулердегі жетістіктер МА мәселесіне коммерциялық қызығушылық тудырды, және IBM фирмасы АҚШ-тағы Джорджтаундық университетпен бірге 1954 жылы 250 сөзден тұратын сөздік пен 6 синтаксистік ережеге негізделген және 49 алдын ала таңдалған сөйлемнің аудармасын қамтамасыз ететін бірінші жүйені көрсете алды. Бұл тәжірибе зерттеулер тізімін көбейтті: келесі он жылда АҚШ үкіметі және әскери мекемесі МА саласын зерттеуге 40 млн. долларға жуық қаражат жұмсады.

Бірінші нәтижеден алынған эйфориядан МА іске аспауын толығымен жойылуы арасында ек сегіз жыл өтті. Мұндай шешімге АҚШ ғыллымының Ұлттық Академисының қолданбалы лингвистика бойынша арнайы комитетінің (ALPAC) шолуына сүйеніп келді. Онда автоматты аудару жүйесі болашақта қажетті сапаны қаматамасыз ете алмайды деп жазылды. Бұл есеп беру МА дамуына кері әсерін тигізді, соның салдарынан АҚШ пен Европада қаражат болмағандықтан қандай болмасын зерттеу жұмыстары тоқтатылды. Тек 70 жылдардың соңында, ақпаратты компьютерлік іздеу мен жасанды интеллекттің лингвистикалық мәселесін проектілеушілер мен зерттеушілердің қызығушылығы артуына байланысты МА зерттеулері қайта жандандырылды.

Тек 80 жылдардың басынан, ПК сенімді және қуатты түрде әлемді жаулап ала бастағаннан кейін, олардың жұмыс істеу уақыты арзандады және оны кез келген уақытта қолдану мүмкін бола бастады. Демек, МА әйтеуір экономикалық жағынан пайдалы бола бастады. Сол жылдары және одан кейін де бағдарламлардың жетілдірілуі мәтіндердің көптеген түрін тура аударуға мүмкін бере бастады, алайда МА проблемалары осы күнге дейін шешілмей тұр.

90 жылдарды МА-ның дамуының қайта жандануының негізігі кезеңі деп санауға болады, ол ПК мүмкіндігінің жоғары деңгейімен, сканерлер мен OCR программасының пайда болуымен ғана емес, Интернет/интранет (Internet/intranet) де пайда болуымен байланысты. Ол жеке инвесторлар мен мемлекеттік құрылым үшін қаражат салудың ең тартымды түрі бола бастады.

МА технологиясының көптеген кемшіліктері болғанымен, көптеген ұйымдар Бэббидждің берген уәдесін еске түсіре бастады. «Машиналық аудармашы жетілдірулерден әлі алыс, бірақ кез-келген оның көмегімен құжаттың негізгі мағынасын түсіне алады», - МА-мен экспериментті онлайн режимде бастаған. ірі Web-узелдің Alta Vista технологиялық директоры Луи Монье солй деп санайды.

Европалық Бірлестіктің Мемлекеттері соңғы 15 жылда осы мәселе бойынша зерттеулерге 70 млн. доллардан артық қаражат жұмсады, ал жапон мемлекеттік ұйымдары - 200млн. доллардан артық. MT SUMMIT VI де МА-ның өз елі үшін стратегиялық маңыздылығы туралы қызықты баяндама жасаған Т. Р. Педтке айтуы бойынша бұл бағыттың дамуындағы маңызды рөлді үкімет атқарады. МА проблемасы жоғарғы технологиялардың дамуындағы және АҚШ-тың бүкіләлемдік ақпараттық кеңістікте бәсекелестікке жарамдылығын қамтамасыз ету үшін негізгі қарастырылатын мәселе болып тұр.

1. 2 Машиналық аудармашының сәулеті

ПРОМТ машиналық аударма жүйесінің архитектурасы үш қабатты болады:

  • Бірінші, “базалық” қабат - бұл translation engines, сөздік тіркесті бір тілден екінші тілге аударуға мүмкіндік беретін және сөздік мәтінді өңдеуге мүмкіндік беретін модульдер.
  • Translation kernel - біздің программалық қамтамасыз етуіміздегі ортаңғы деңгей. Ол жүйенің барлық объектілерін басқаратын, мәліметтерді бірдейлестіретін, құжат форматтарын өңдейтін және бастапқы құжаттарды жүйенің ішкі форматында көрсетуді қамтамасыз ететін модульдер жиынынан тұрады. Бұл қабаттың жүйенің күрделі байланысты объектілері мен оңай жұмыс істейтін және құжаттарды жөнелту функциялары бекітілетін қосымшаларға осы объектілерге қол жеткізуге мүмкіндік беретін қуатты API болады.

Біз жасаған архитектура функционалдылық пен тұтынушы интерфейсі тұрғысынан қарағанда жаңа программалар жасауға мүмкіндік береді, және пайда болған архитектураға жөнелтудің жаңа бағыттарын да енгізе алады.

  • Үшінші қабат - шет тілдерде мәтіндерді өңдеу барысында тұтынушыларға тиімді болуы мүмкін әр түрлі қызметтер көрсететін қолдану моделдеріне арналған кең көлемдегі қосымшалар жиынтығы.

Ол бізге нарық сұраныстарына оңтайлы жауап беруге, жаңа нарыққа тез шығу, жаңа өнімдерге қол жеткізу, жаңа операциялық жүйелерге өнімдер даярлау немесе жөнелтудің жаңа бағыттарын шығаруға мүмкіндік береді.

Мысалы, әлемдік деңгейдегі ERP/CRM тапсырысы бойынша осы компанияның ішкі қажеттіліктері үшін Элертронды сөздікдың мамандандырылған жүйесі жасалды. ПРОМТ компаниясының жөнелтудің тапсырылған бағыты үшін қандай да бір өнімі болмаса да, бұл тапсырма небәрі бірнеше ай ішінде жасап шығарылды.

1. 3 Қазақ-орыс аудармашысының қазіргі күйі

Машиналық аудармашылардың арасында ағылшын-орыс, орыс-неміс сөздіктері әлдеқашан іске асырылған, ал орысша-қазақша аудармаға келетін болсақ, оны жүзеге асыру идеясы кемінде 10-15 жыл бұрын пайда болған. Бірақ 1990-1995 жылдары осы мәселемен айналысқан фирмалардың бұл істеріне мемлекет тарапынан ешқандай қолдау болмағандықтан тек идея түрінде ғана болып қала берді. Жобаның іске асырылуы баяу дамыды, тек 2006 жылы ҚР мәдениет және ақпарат Министерлігінің жанындағы тілдер Комитетінде, компьютерлік технологияда қазақ тілін дамытуға байланысты бірнеше тендерлар өткізілді. Соның ішінде компьютерлік қазақша-орысша және орысша-қазақша сөздіктерін өңдеуге де тендерлар жарияланған болатын.

Қазіргі таңда машиналық аударма идеясын іске асыруда әл-Фараби атындағы ҚазҰУ, Л. Н. Гумилев атындағы ЕҰУ, Абай атындағы АМУ және тағы басқа Қазақстанның ірі жоғарғы оқу орындарымен қатар бірнеше Қазақстандық «Санасофт», «Алтон», «Бимаш» және «Ізет» сияқты фирмалар жұмыс атқарауда және «электронды аудармашылары» бар сайттарда жетіп артылады. Мысалы, INDEX GROUP интернет агенттігінің қолдауымен жасалған «SOZDIK. KZ» орысша-қазақша сөздік жобасы, Ербол Панабердиевтің басшылығымен жасалған 4 бағытта аударма жасайтын «ILK. KZ» онлайн-аудармашысы және сөздік көлемі 750 мыңнан артық сөз бен сөзтіркестерінен тұратын Каюпов Табылды Қайсағалиұлының басшылығымен жасалған «SOYLEM» аударма жүйесі.

Аталған автоматты аударма жасау жүйесінің басым бөлігі тек жалғыз сөзді ғана аударуға арналған. Ал сөз тіркестерін, сөйлемдерді аударатын аударма программасын «Ізет» фирмасы «Тілмаш» деген атпен ұсынған болатын. Бірақ фирма директоры Ізетәлі Тілешовтің: «Бағдарламада қазақ тіліндегі сөздер 120 мың шамасында, оның бер жағында нақты саны 6127 жұрнақ-жалғау топтастырылды деп айтқанымызбен, бұл әлі толықтыруды, жетілдіруді қажет етеді. Өйткені, қазақ тілі - бай тіл. Рас, “Тілмаштың” тіліміздегі тұрақты тіркестер мен еркін тіркестерді аударуға шамасы жетпейді. Осы тұрғыдан алғанда, бағдарлама аудармашыға көмек құралы болғанымен, онымен бірдей дәрежеде жұмыс істей алмайды. Сондықтан біз өз жұмысымызға жоғары оқу орындарының жүздеген ғалымдарын жұмылдырсақ дейміз. Сол кезде бұдан да жақсы нәтиже беретініне сеніміміз мол. » - деп айтуына қарағанда қазіргі уақытқа дейін барлық талапты қанағаттандыратын машиналық аударма құралы жоқ деуге болады.

Машиналық аудармада қолданылатын қазіргі жүйелер екі тілге ғана (орысша-қазақша, ағылшынша-орысша, ағылшынша-қазақша, немісше-ағылшынша т. с. с. ) бағытталған, сонымен қатар енгізілетін және аударылған тілдер арасындағы аралық деңгейде немесе сөзбе-сөз аударма жасау деңгейінде ғана қолданылады.

Дегенмен көп жұмысты қажет ететін машиналық аударма жүйесі кез келген қоданушыға жақсы жәрдем болмақ. Пайдаланушы тілді жақсы меңгермесе де электронды аударма нәтижесінде алынған «алғашқы мәтінді» қарай отырып мәтіннің жалпы мағынасын тезірек түсіне алады.


2 ҚАЗАҚ-ОРЫС ТІЛДЕРІНДЕГІ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ

2. 1 Машиналық аударманың талдауы

Машиналық аудармашы түрінде берілген программалық жабдықтармен жұмыс істеу барысында мәтіннің аудармасына қатысты көптеген олқылықтарды кездестіруге болады. Аударылған мәтіндерді лексикалық талдау нәтижесі көрсеткендей, көп мөлшердегі машиналық аудармашылар қарапайым сөз таптарын дұрыс аударғанымен, септіктерді, сын есімге қатысты сөздерді, сөз айналымдарын аударуға келгенде қате жіберіп, сөйлемді мағынасына қарай дұрыс құрастыра алмайды екен.

Кейбір аударғыштардың ақсайтын тұстары - бірнеше мағынаға ие болатын сөздердің аудармасының нақты болмайтындығы. Негізінен дұрыс аударма алу үшін сөйлемнің әр түрлі сөз таптары мен олардың граммтикалық ережелеріне сай келетін грамматикалық құрылуының эвристикалық талдауын ұсынуға болады және мамандандырылған мәтіндерді аудару кезінде сөздіктер келіспеушіліктерін ескермеуге болады.

Мәтіндерді грамматикалық талдау нәтижесі көрсеткендей, машиналық аудармашы жекеше және көпше түрдегі сөздерді оңай аударғанымен, септіктер мен етістіктерді қажетті мөлшерде қолдануға келгенде қиындықтарға ұшырайды екен.

... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау
«қазақ тілінен ағылшын тіліне машиналық аударудың лингвистикалық сөздіктерін apertium платформасының негізінде жасау»
Қазақ тілінен ағылышын тіліне машиналық аудару жүйесін жетілдіру
Лексикография
Ғылыми-техникалық мәтінді аудару амалдары
Программалық жабдықталу
Қазақ тілі түсіндірме сөздігінің тарихы
Көркем мәтінді аударудың стилистикалық ерекшеліктерін зерттеу
Электронды сөздік және қағаз сөздіктердің салыстырмалы мінездемесі
Ағылшын тіліндегі неологизмдердің аудармада берілуі (техникалық лексиканың негізінде)
Пәндер



Реферат Курстық жұмыс Диплом Материал Диссертация Практика Презентация Сабақ жоспары Мақал-мәтелдер 1‑10 бет 11‑20 бет 21‑30 бет 31‑60 бет 61+ бет Негізгі Бет саны Қосымша Іздеу Ештеңе табылмады :( Соңғы қаралған жұмыстар Қаралған жұмыстар табылмады Тапсырыс Антиплагиат Қаралған жұмыстар kz