Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау


ӘЛ-ФАРАБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ
МЕХАНИКА-МАТЕМАТИКА ФАКУЛЬТЕТІ
АҚПАРАТТЫҚ ЖҮЙЕЛЕР КАФЕДРАСЫ
«Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау» тақырыбына жазылған
ДИПЛОМДЫҚ ЖҰМЫС
(қолы)
Ғылыми жетекші,
ф. -м. ғ. к., доцент
(қолы)
(қолы)
Қорғауға жіберілді:
Кафедра меңг. м. а, PhDдоктор
(қолы)
Алматы 2015
Реферат
Дипломдық жұмыс 67 беттен, 25 суреттен, 6 кестеден, 16 әдебиеттен тұрады.
Кілттік сөздер: МАШИНАЛЫҚ АУДАРМА, APERTIUM ПЛАТФОРМАСЫ, БІР ТІЛДІК СӨЗДІК, ЕКІ ТІЛДІК СӨЗІК, НЕГІЗГІ ТІЛ, МАҚСАТ ТІЛ, МАШИНАЛЫҚ АУДАРМА ЖҮЙЕСІ, МОРФОЛОГИЯЛЫҚ СӨЗДІК, ПАРАДИГМАЛАР, СӨЗДІК МАҚАЛАСЫ, СӨЗ ТАПТАРЫ.
Дипломдық жұмыстың зерттеу нысаны: қазақ-орыс тілі бағытындағы машиналық аударманың лингвистикалық сөздіктері.
Дипломдық жұмыстың мақсаты: қазақ-орыс тілі бағытындағы машиналық аударманың лингвистикалық сөздіктерін дайындау.
Дипломдық жұмыстың зерттеу әдістері: морфологиялық сөздіктерді құру әдісі, сөз таптарын тәгтеу.
Дипломдық жұмыс нәтижесі: сөздік құрамы толықтырылды, екі тілдік сөздіктерде қазақ-орыс бағытындағы және кері бағыт үшін жазылған ережелерде қолданылатын парадигмалар анықталды.
Дипломдық жұмыстың негізгі мінездемелері: дипломдық жұмыста келтірілген ақпараттар арқылы лингвистикалық сөздікті құру тәсілі, сөздіктерге сөздерді енгізу тәсілі, машиналық аударма жайлы жалпы түсінік келтірілді.
Дипломдық жұмыстың ендірілу деңгейі: Математика және механика ғылыми-зерттеу институтының «Интеллектуалдық ақпараттық жүйелер» зертханасында «Apertium платформасының негізінде қазақ тілінен ағылшын және орыс тілдеріне (және кері бағытта) тегін/ашық кодты машиналық аударма жүйесін құру» жобасы аясында Аликанте Университетінің профессоры Микель Форкада мен механика-математика факультетінің профессоры Тукеев Уалшер Ануарбековичтің жетекшілігімен жұмыс жүргізілуде.
Дипломдық жұмыстың қолдану аймағы: машиналық аударманың сөздіктермен жұмыс жасау аймағы.
Дипломдық жұмыс зерттеулерінің болашақта даму барысы: Сөздік қорын әр сала бойынша термин сөздермен толықтыру керек, жаңа сөздермен толықтыру керек, қазақ тілінен орыс тіліне және орыс тілінен қазақ тіліне сөздерді аудару үшін қолданылатын парадигмаларды оңтайландыру керек.
Реферат
Дипломная работа состоит из 67 страниц, 25 рисунков, 6 таблиц, 16 источников.
Ключевые слова: МАШИННЫЙ ПЕРЕВОД, ПЛАТФОРМА APERTIUM, ОДНОЯЗЫЧНЫЙ СЛОВАРЬ, ДВУЯЗЫЧНЫЙ СЛОВАРЬ, ВЫБОРАННЫЙ ЯЗЫК, ЯЗЫК ПЕРЕВОДА, СИСТЕМА МАШИННОГО ПЕРЕВОДА, МОРФОЛОГИЧЕСКИЙ СЛОВАРЬ, ПАРАДИГМЫ, СЛОВАРНАЯ СТАТЬЯ, ЧАСТИ РЕЧИ.
Объект исследования дипломной работы: Лингвистические словари машинного перевода казахско-русского направления.
Цель дипломной работы: Разработка лингвистических словарей машинного перевода казахско-русского направления.
Методы исследования дипломной работы: Метод разработки морфологических словарей, тэгирование частей речи.
Результаты дипломной работы: Было дополнено словарь, определены парадигмы, которые используется в правилах написанных для казахско-русского и наоборот русско-казахского направления в двуязычных словарях.
Основные характеристики дипломной работы: Приведено общее понятие о машинном переводе, способ создания лингвистического словаря, способ ввода слов в словари с помощью информаций которые приведены в дипломной работе.
Степень внедрения дипломной работы: ведутся работы в рамках проекта «Разработка свободной/открытой системы машинного перевода с казахского языка на английcкий и русский языки (и обратно) на базе платформы Apertium» на лаборатории «Интелектуальных информационных систем» научно-исследовательского института математики и механики под руководством профессора из Университета Аликанте Микелем Форкада и профессора механика-математического факультета Тукеев Уалшер Ануарбековича.
Область применения дипломной работы: Область работы со словарями машинного перевода.
Дальнейшее развитие исследований дипломной работы:
Необходимо дополнить словарный ресурс словами терминов разной сферы, необходимо дополнить новыми словами, необходимо адаптировать парадигмы которые используются для перевода слов с казахского языка на русский язык и с русского языка на казахский язык.
Abstract
Diploma work consists of 67 pages, 25 figures, 6 tables, 16 sources.
Кeywords: MACHINE TRANSLATION, PLATFORM APERTIUM, MONOLINGUAL DICTIONARY, BILINGUAL DICTIONARY, SELECT LANGUAGE, TERGET LANGUAGE, SYSTEM OF MACHINE TRANSLATION, MORPHOLOGICAL DICTIONARY, PARADIGMS, DICTIONARY ENTRIES, PARTS OF SPEECH
The object of research of the diploma work: Linguistic dictionaries for machine translation from Kazakh into Russian
The aim of the diploma work: Development of linguistic dictionaries for machine translation from Kazakh into Russian
The methods of research of the diploma work: Method development of morphological dictionaries, parts of speech tagging.
The results of the diploma work: It was supplemented by a dictionary, defined the paradigm, that is used in the rules written for the Kazakh-Russian and Russian-Kazakh contrary directions in bilingual dictionaries.
Main characteristics of the diploma work: A general concept of machine translation, linguistic way to create a dictionary entry method of words in the dictionary with the information given in the diploma work.
The degree of implementation of the diploma work: work is underway within the framework of the project “The development of free/open system of machine translation from Kazakh into English and Russian (and vice versa) based on platform Apertium” on laboratory of “Intellectual Information Systems” of the Research Institute of Mathematics and Mechanics led by Professor of the University of Alicante Mikel L. Forcada and by Professor of the faculty of Mechanics and Mathematics Tukeyev Ualsher Anuarbekovich.
Scope of the diploma work: Scope of work with machine translation dictionaries
Further development of research of the diploma work: It is necessary to supplement the vocabulary resource with terms words of different areas, must be supplemented by new words, it is necessary to adapt the paradigms which are used to translate the words of the Kazakh language into Russian and from Russian into Kazakh language.
МАЗМҰНЫ
КІРІСПЕ7
1 Машиналық аударма8
1. 1 Машиналық аударманың даму тарихы8
1. 2 Машиналық аударманың түрлері11
2 Apertium машиналық аударма жүйесі16
2. 1 Apertium платформасының құрылымы16
2. 2 Жүйені құрудағы дәстүрлі модельдері25
2. 3 Eсeптердің қойылымы25
3 Жаңа тілдік жұп құру26
3. 1 Бір тілді орыс тілі сөздігі28
3. 2 Екі тілді сөздіктерді құру33
3. 3 Трансферлік ережелер33
3. 4 Екі тілдік сөздіктерге етістіктерді қосу ерекшеліктері36
3. 5 Жіктеу есімдіктерін сөздіктерге қосу барысы41
3. 6 Қазақ тілі сөздігін құру ерекшеліктері43
3. 6. 1 Зат есімдерді енгізейік43
3. 6. 2 Қосымшаларды сөздіктерге енгізу барысы45
3. 6. 3 Сын есімдерді сөздіктерге енгізу ерекшелігі46
3. 6. 4 Сан есімдерді сөздікке енгізу48
3. 6. 5 Есімдік сөз табын сөздікке енгізу49
3. 6. 6 Етістік сөз табын сөздікке енгізу50
3. 6. 7 Үстеу сөз табын сөздікке енгізу52
3. 6. 8 Еліктеу сөздерді сөздікке енгізу55
3. 6. 9 Шылауларды сөздікке енгізу55
3. 6. 10 Одағай сөз табын сөздікке енгізу57
4 Сөз таптарын тәгтеу - part-of-speech tagging59
4. 1 Сөз таптарын тәгтеу59
4. 2 Сөз таптарын тәгтеу ережелері негізінде60
4. 3 Сөз таптарын тәгтеуде жасырын Марков моделін қолдану62
4. 4 ЖMM тәгтеу үшін өзекті алгоритм64
ҚОРЫТЫНДЫ66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ67
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР
МА - машиналық аударма
МАЖ - машиналық аударма жүйесі
SMT - статистикалық машиналық аударма
RBMT - ережелерге негізделген машиналық аударма
HMT - гибридті машиналық аударма
ТМ - аудармалардың жады
ADJ - сын есім
DET - детерминитив
LR - солдан оңға бағыттау
N - зат есім
NP - зат есімдік фраза
NUM - сан есім
POST - шылау
PP - жалғаулық фраза
PRN - есімдік
ADV - үстеу
IDEO - еліктеу сөз
SL - негізгі тіл (source language)
TL - мақсат тіл (target language)
VP - етістіктік фраза
ЖММ - жасырын Марков моделі
КІРІСПЕ
Машиналық аударма жаңа ақпараттық технологиялар жиегінде мәтіндерді автоматты өңдеудің өзекті мәселесі болып табылады. Ғаламторда қол жетімді, заманауи машиналық аударма жүйелерінде орын алатын аударманың төмен сапасы, машиналық аудармадан бас тартудың себебі болып табылмайды. Қазіргі таңда қол жетімді қазақ тілі орыс бағытындағы және кері бағыттағы аударма жүйелері жетерлік. Аударма жүйелері көпшілік жағдайларда қанағаттанарлықсыз нәтиже береді. Аударылатын мәтіндердің көпшілігі ғылыми-техникалық болып табылатындықтан, және олардың аудармасы ғылыми-техникалық үрдіске септігін тигізетіндіктен, сапалы машиналық аударма адамзат өркениетінің дамуында өзекті.
Кейбір аударма жүйелері мәтіндерді өңдейді қажетсінбей жеткілікті жақсы аударады, дегенмен басқа мәтіндер сол пәндік аймаққа қатысты болғанымен, қайта өңдеуді талап ететін қолайсыз аудармалар алынады.
Дипломдық жұмыстың тақырыбының өзектілігі сөздердің тиянақты және тура аудармасына қол жеткізу үшін қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін құру.
Дипломдық жұмыстың зерттеу пәні: қазақ тілінен орыс тіліне машиналық аудармадағы екі тілдік және бір тілдік сөздіктер.
Дипломдық жұмыстың мақсаты - аpertium платформасының негізінде қазақ-орыс тілі бағытындағы машиналық аударманың лингвистикалық сөздіктерін дайындау болып табылады.
Дипломдық жұмыстың мақсаты бойынша анықталған міндеттер:
- Қазақ-орыс тілі бағытындағы екі тілді сөздіктердің құрылуы;
- Қазақ-орыс тілі бағытындағы бір тілді сөздіктердің құрылуы;
- Сөз таптары бойынша сөздердің енгізілуі.
Зерттеудің ғылыми мәні: аpertium платформасы негізінде қазақ-орыс тілі бағытында бір тілді және екі тілді сөздіктер құрылды.
Зерттеудің тәжірибелік мәні: бір тілді және екі тілді сөздіктердегі сөздер енгізілуіне байланысты жеке-жеке аударылады.
Зерттеу жұмыстарында қолданылған кіріс деректері: екі тілді сөздік және бір тілді сөздіктер.
1 Машиналық аударма
1. 1 Машиналық аударманың даму тарихы
Аударманың ұзақ тарихы бар. Оның бастауы ата тіл жеке тілдерге ыдырай бастаған және әртүрлі тіл қауымдар өкілдерімен қарым-қатынаста түсуде арашашылардың рөлдеріндегі адамдардың бірнеше тілде сөз сөйлеу қажеттілігі туындаған кезде жатыр.
Аударма ең басынан, адамдардың тіл-аралық қарым-қатынасына мүмкіндік беретін ең маңызды әлеуметтік функцияны орындады. Жазбаша аудармалардың таралуы басқа халықтардың мәдени табыстарын білуде кең мүмкіндік ашты. Әдебиеттер және мәдениеттердің өзара әрекеттесуіне ықтимал жасады. [1]
Биографтардың куәлігі бойынша, XIX ғасырдың атақты математигі Чарльз Бэббидж британдық үкіметті өзінің “есептеуіш машина” атты зерттеуін қаржыландыру қажеттілігіне сендіруге тырысты. Ол бұл машинаның кейін ауызша сөздерді автоматты түрде аудара алатынына уәде берді. Бэббидж компьютер жұмысының негізінде көптеген идеялардың авторы болып танылғанымен, МА қатысты уәдесін орындай және машинаны құрастыра алмады. Бүгінде бұл идея қандай да бір дәрежеде іске аспаған болып саналады. Бірақ жаһандық байланыс платформасы болып табылатын Internet-тің пайда болуына байланысты, қайтадан көпшіліктің кең ықыласын және инвестицияларды қызықтырып отыр. [2]
Компьютерлер дүниеге келгеннен соң, бірер жылдардан кейін, 50-ші жылдары МА бірінші бағдарламалары пайда бола бастады. ДК кең таралуына дейін, МА есептеуіш техникада маңызды сала ретінде емес, ғылыми зерттеулердің қызықты объектісі болып табылды. Ол екі себеп бойынша: компьютерлік жұмыстар уақытының қымбатшылығы және оны қорлармен ұжымдық пайдалану. Соңғы жағдай МА ең маңызды артықшылығы - жедел қимылдаушылық қасиетін жоққа шығарып, дереу электронды көмекшіге жүгіне алмады.
МА дүниеге келуін 1947 жыл деп санау қабылданған, және бәрі Рокфеллеров қорының жаратылыстану ғылымдары бөлімінің директоры Уоррен Уивердің хатынан басталған. Сол жылдың наурыз айында Норберт Винерге жолдаған хатында, аударманың мақсаты дешифрлеудің мақсатымен салыстырылған болатын. Сол кезде соңғысы электромеханикалық құрылымдарда орындала бастаған еді.
Бұл хат артынан көптеген пікірталастар жиыны ерді, мақсаттар туралы меморандум пайда болды, және әйтеуір, зерттеулерге қаражаттар бөлінген еді. 1952 ж. атақты математик Бар-Хиллел ұйымдастырған бірінші конференция өтті. Конференцияда зерттеушілер семантиканы сипаттау тәсілдері, морфологиялық құрылым, аударма жүйесі үшін сөздіктер құрылымы, тілдің семантикалық ережелерінің жиынына қатысты ойлармен өзара бөлісті.
Академиялық зерттеулердегі табыстар МА мәселесіне коммерциялық жағдай жасады, және 1954 жылы АҚШ-тағы Джорджтаун университетімен бірге IBM фирмасы бірінші GAT жүйені көрсете алды. GAT(Джорджтаун автоматтандырылған аудармасы) жүйесі 250 сөздерден және 6 синтаксистік ережелерден тұратын сөздікке негізделген және 49 алдын ала таңдап алынған сөйлемдердің аудармасын қамтамасыз ете алады. Бұл тәжірибе зерттеушілік шудың бастамасы болды: келесі 10 жылда АҚШ үкіметі мен әскери мекемелері МА облысындағы зерттеулерге 40 млн. доллар шамасында қаражат жұмсады. [3]
GAT жүйеcі кеңестік физиктер мен ядерщиктердің мәтіндерін орыс тілінен ағылшын тіліне аудару үшін арналған болатын.
50-ші жылдардың аяғында Америка үкіметінің өтініші бойынша Й. Бар-Хиллел «Толық автоматты жоғарғы сапалы аударма» машиналық аудармасының мүмкін еместігне дәлелдер келтірген еді. Дәлел тұжырымның екі мәнділігінде негізделген болатын. Келесі сөйлемді қарастырайық: Little John was looking for his toy box. Finally he found it. The box was in the pen.
Pen сөзі 2 мағынаға ие болуы мүмкін: біріншісі - біз жазу үшін қолданылатын нәрсе, екіншісі - нақты түрдегі бөлме. Адамға мағынасы, әрине, түсінікті. Бірақ зерттеуші «әмбебап анықтама» көмегінсіз машина қойылған есепті шеше алмайды деп тұжырымдады. Қазір мұндай семантикалық дәлсіздікті машиналық аударма үшін, тек бір мағыналы сөздерден тұратын басқарылатын тілде негізгі мәтінді жазу арқылы шешуге болады.
60-шы жылдары КСРО және АҚШ жүргізілген зерттеулер, орыс-ағылшын тілдік жұбына негізделген болатын. Аударманың негізгі объектісі ретінде ғылыми және техникалық құжаттар болды, мысалы ғылыми журналдардағы мақалалар. Аударманың кедір-бұдір тұстары мақаланың негізгі көрінісіне кедергі жасамады. Егерде мақалада қауіпсіздік жайлы сұрақтар талқыланса, онда мақаланы аудармашыға дәл аударма үшін жіберетін болатын, егер қажеттілігі жоқ болса, лақтырылатын болған.
1966 жылы ALPAC есептеу нәтижесі жарияланғаннан соң, машиналық аударма облысында зерттеулерде үлкен соққы болды. Есепті АҚШ үкімет комиссиясы құрған болатын және АҚШ ғылымдарының Ұлттық академиясы қолданбалы лингвистика бойынша арнайы комитетімен (ALPAC) ұсынылған болатын. Оның құрамына 1964 жылы АҚШ үкіметімен құрылған жеті ғалым кірді. АҚШ үкіметін прогресс көлемі жобаны әзірлеу барысында жұмсалған шығындар көлемімен тең келуі мазалады. Нәтижесінде машиналық аударманы адам арқылы жасалатын аудармамен салыстырғанда, бағасы, жылдамдығы және дәлділігі жағынан артта қалатынын айтты. Жақын арада машиналық аударма адам арқылы жасалатын аударманың сапасына жете қоймас деп тұжырымдады.
Бірақ есептеу нәтижесі аудармашылар үшін қосалқы бағдарламалардың дамытуы жайлы кеңес берді - мысалы, автоматты сөздіктерді - және компъютерлік лингвистика облысында зерттеулерді қолдауды.
Есептеу нәтижесінің жариялануы Ресей мен Ұлыбританияға қарағанда үлкен дәрежеде АҚШ машиналық аудармасының зерттеуіне әсерін тигізді. АҚШ зерттеулері асып кетсе, он жылға тоқтатыла тұрды. Канада, Франция және Германияда зерттеулер жалғаса берді. АҚШ-та Systran компаниясының негізін салушылар(Питер Том) ғана зерттеулерін жалғастыды. [4]
Егер 60-шы жылдары нақты тілдік жұптар және енгізу міндетті болса, 70-ші жылдары негізгі талаптар ретінде техникалық және коммерциялық бағыттардағы мәтіндерді аудару қабілетіне ие, аз шығынды жүйелер болды.
Тек 80-ші жылдардың басынан бастап, ДК сенімді және қуатты түрде әлемді жаулап ала бастағанда, олардың жұмыс уақытысы арзандады, әрине, оларды кез келген уақытта қол жеткізуге болды. Ал бұл өз кезегінше МА экономикалық түрде тиімді бола бастағанын білдіреді. Келесі жылдары бағдарламалардың әбден жетілдіруі көптеген мәтіндерді айнытпай аударып бере алатын болды, дегенмен МА байланысты кейбір мәселелер қазіргі таңда да шешілмеген болып табылады.
80-ші жылдарда машиналық аударма үшін бағдарламалар саны да алуан түрлілігі де үлкейді. Metal сияқты, әмбебап есептеуіш машиналар технологияларына негізделген аудармашылық жүйелер қолданды.
Микрокомпьютерлер жарамдылығының үлкею нәтижесінде, машиналық аударманың бюджеттік бағдарламалары нарықта пайда болды. Еуропа, Жапония және АҚШ көптеген серіктестіктері осы мүмкіндікті пайдаланды. Жүйелер КСРО, Шығыс Еуропа, Корея және Қытай нарықтарында көрсетілген еді.
80-ші жылдары Жапонияда машиналық аудармамен байланысты үлкен шу болды. Бесінші ұрпақтың компьютерлері пайда болумен Жапония техника және программалау облысында улкен мақсаттарды жоспарлады, ағылшын тіліне және ағылшын тілінен аудару негізінде программаларды құрастыруға байланысты көптеген компанияларды (Fujitsu, Toshiba, NTT, Brother, Catena, Matsushita, Mitsubishi, Sharp, Sanyo, Hitachi, NEC, Panasonic, Kodensha, Nova, Oki) қызықтырды.
80-ші жылдардағы зерттеулер морфологиялық, синтаксистік және семантикалық талдаулар көмегімен лингвистикалық бірліктердің аудармасына негізделген болатын.
80-ші жылдардың соңында машиналық аудармада қолданылатын әдістердің сандары өсті. IBM компаниясы құрастырған жүйе статистикалық аудармасына негізделген болатын. Басқа топтар кқптеген аудармалардың мысалдарына негізделген әдісті қолданды, мұндай әдістер мысалдар негізіндегі машиналық аударма деп аталады. Екі әдісті де анықтайтын сызығы семантикалық және синтаксистік ережелердің жеткіліксіздігі болды.
90-шы жылдарды МА дамуының қайта туу дәуірі деп санауға болады, ол тек ДК жоғары деңгейдегі мүмкіндіктерімен байланысты емес, сонымен қатар сканерлердің және OCR бағдарламаларының пайда болуы, Интернет/интранет (Internet/intranet) кең таралуы МА деген нақты сұраныстардың артуына себеп болды. Ол инвесторлар үшін капитал салатын салада, және де мемлекеттік құрылымға да тартымды облысқа айналды.
МА технологиясы көптеген кемшіліктерден азап шегіп жатқандықтан, көптеген ұйымдар Бэббидждің уәдесіне байыппен қарай бастады. «Машинаық аударма әбден жетілген жоқ, дегенмен әрбір қалаушы оның көмегімен құжаттыі негізгі мағынасын түсіне алады», - деп, Alta Vista технологиялық директоры Луи Монье санайды, ауқымды Web-түйінді іздестіруін, МА-мен тәжірибені онлайндық режимде бастаған.
МА мәселелері АҚШ глобалді ақпараттық кеңістікте бәсекеге түсе алатынын қамтамасыз етуде және жоғарғы технологиялардың дамуында кілттік сұрақ ретінде қарастырылады. [5]
XXI ғасыр адамзаттың ақпараттық кеңістігінде жаңа есептерді қойып жатыр. Жаппай ақпараттың арқасында аударманың адамзаттың өміріне деген ролі артып келеді. Бүгінде аудармалық байланыстар адамзат қызметтерінің бүкіл дерлік аумағын қамтып жатыр. Ақпараттық ағынның қозғалысы шекараны, не уақытты, не кеңістікті білмейді.
Қазіргі заманның шексіз алуан түрлілігі ақпарат құралдарының және халықаралық ақпараттық процесстердің көптеген қатысушыларының- журналисттердің, корреспонденттердің, комментаторлардың, телеоператорлардың көмегімен беріліп отыр. Сондықтанда аудармашылық қызметтердің мәні тұрақты өсіп жатыр, және олармен бірге аудармашылық мәселелер пайда болып жатыр. Тіл мәселелердің асқынуы жаңа шешімдерді іздестіруге салады. Егер бұрын аудармашылық қызмет тек көркем әдебиет аудармасымен байланыста қаралса, енді қазір арнайы - ақпараттық, экономикалық, заң, техникалық және жарнамалық сипаттағы мәтіндердің аудармасы көлемі және әлеуметтік мәні бойынша маңызды орында тұр.
Кибернетиканың дамуы машиналық аударманың дүниеге келуіне септігін тигізді. Қазіргі таңда аудармашының еңбегін жеңілдететін арнайы бағдарламалардың кең түрлері бар.
1. 2 Машиналық аударманың түрлері
Қазіргі уақытқа машиналық аударма жүйесінің үш түрі бар:
- Грамматикалық ережелерге негізделген жүйелер (Rule-Based Machine Translation, RBMT) ;
- Статистикалық жүйелер (Statistical Machine Translation, SMT) ;
- Гибридты жүйелер(Hybrid Machine Translation, HMT) ;
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.

Ақпарат
Қосымша
Email: info@stud.kz