Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау

КІРІСПЕ 7
1 Машиналық аударма 8
1.1 Машиналық аударманың даму тарихы 8
1.2 Машиналық аударманың түрлері 11
2 Apertium машиналық аударма жүйесі 16
2.1 Apertium платформасының құрылымы 16
2.2 Жүйені құрудағы дәстүрлі модельдері 25
2.3 Eсeптердің қойылымы 25
3 Жаңа тілдік жұп құру 26
3.1 Бір тілді орыс тілі сөздігі 28
3.2 Екі тілді сөздіктерді құру 33
3.3 Трансферлік ережелер 33
3.4 Екі тілдік сөздіктерге етістіктерді қосу ерекшеліктері 36
3.5 Жіктеу есімдіктерін сөздіктерге қосу барысы 41
3.6 Қазақ тілі сөздігін құру ерекшеліктері 43
3.6.1 Зат есімдерді енгізейік 43
3.6.2 Қосымшаларды сөздіктерге енгізу барысы 45
3.6.3 Сын есімдерді сөздіктерге енгізу ерекшелігі 46
3.6.4 Сан есімдерді сөздікке енгізу 48
3.6.5 Есімдік сөз табын сөздікке енгізу 49
3.6.6 Етістік сөз табын сөздікке енгізу 50
3.6.7 Үстеу сөз табын сөздікке енгізу 52
3.6.8 Еліктеу сөздерді сөздікке енгізу 55
3.6.9 Шылауларды сөздікке енгізу 55
3.6.10 Одағай сөз табын сөздікке енгізу 57
4 Сөз таптарын тәгтеу . part.of.speech tagging 59
4.1 Сөз таптарын тәгтеу 59
4.2 Сөз таптарын тәгтеу ережелері негізінде 60
4.3 Сөз таптарын тәгтеуде жасырын Марков моделін қолдану 62
4.4 ЖMM тәгтеу үшін өзекті алгоритм 64
ҚОРЫТЫНДЫ 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 67
Машиналық аударма жаңа ақпараттық технологиялар жиегінде мәтіндерді автоматты өңдеудің өзекті мәселесі болып табылады. Ғаламторда қол жетімді, заманауи машиналық аударма жүйелерінде орын алатын аударманың төмен сапасы, машиналық аудармадан бас тартудың себебі болып табылмайды. Қазіргі таңда қол жетімді қазақ тілі орыс бағытындағы және кері бағыттағы аударма жүйелері жетерлік. Аударма жүйелері көпшілік жағдайларда қанағаттанарлықсыз нәтиже береді. Аударылатын мәтіндердің көпшілігі ғылыми-техникалық болып табылатындықтан, және олардың аудармасы ғылыми-техникалық үрдіске септігін тигізетіндіктен, сапалы машиналық аударма адамзат өркениетінің дамуында өзекті.
Кейбір аударма жүйелері мәтіндерді өңдейді қажетсінбей жеткілікті жақсы аударады, дегенмен басқа мәтіндер сол пәндік аймаққа қатысты болғанымен, қайта өңдеуді талап ететін қолайсыз аудармалар алынады.
Дипломдық жұмыстың тақырыбының өзектілігі сөздердің тиянақты және тура аудармасына қол жеткізу үшін қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін құру.
Дипломдық жұмыстың зерттеу пәні: қазақ тілінен орыс тіліне машиналық аудармадағы екі тілдік және бір тілдік сөздіктер.
Дипломдық жұмыстың мақсаты – аpertium платформасының негізінде қазақ-орыс тілі бағытындағы машиналық аударманың лингвистикалық сөздіктерін дайындау болып табылады.
Дипломдық жұмыстың мақсаты бойынша анықталған міндеттер:
• Қазақ-орыс тілі бағытындағы екі тілді сөздіктердің құрылуы;
• Қазақ-орыс тілі бағытындағы бір тілді сөздіктердің құрылуы;
• Сөз таптары бойынша сөздердің енгізілуі.
Зерттеудің ғылыми мәні: аpertium платформасы негізінде қазақ-орыс тілі бағытында бір тілді және екі тілді сөздіктер құрылды.
Зерттеудің тәжірибелік мәні: бір тілді және екі тілді сөздіктердегі сөздер енгізілуіне байланысты жеке-жеке аударылады.
Зерттеу жұмыстарында қолданылған кіріс деректері: екі тілді сөздік және бір тілді сөздіктер.
1 Ванников Ю.В. Языковая сложность текста как фактор трудности перевода. – М.: Всесоюзный центр переводов, 1988.
2 Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы с ангилийского языка на русский. – Минск, 1997.
3 Nirenburg S., Wilks Y. Machine Transition in 50 ,1986 г. стр. 3
4 Melby, Alan. The Possibility of Language. – Аmsterdam:Benjamins, 1995. – С. 27-41.
5 Васильев А. Компьютер на месте переводчика // Подводная лодка. – 1998, № 6.
6 Молчанов А. Статистические и гибридные методы перевода в технологиях компании PROMT // Control Engineering Россия. – 2013.
7 Матенова Г.Д. Қазақ тілі мен орыс тіліндегі айырмашылықтыр және оны салыстыра оқыту [Электрон. ресурс]. – 2015. – URL: http://worldofteacher.com/7641-bayandama-aza-tl-men-orys-tlndeg-ayyrmashylytyr-zhne-ony-salystyra-oytu.html (қаралған күні: 12.02.2015)
8 Аханов К. Тіл білімінің негіздері. – Алматы: Санат, 1993. – 542 б.
9 Исаев С. Қазіргі қазақ тіліндегі сөздердің грамматикалық сипаты. – Алматы: Рауан, 1998. – 303 б.
10 Нысанбаев Ә. “Қазақстан”: Ұлттық энцклопедия. – Алматы: Қазақ энциклопедиясы,1998.
11 Ortiz-Rojas S., Forcada M.L., Ramírez-Sánchez G. Construccion y minimizacion eficiente de transductores de letras a partir de diccionarios con paradigmas // Procesamiento del Lenguaje Natural. – 2005. – № 25. – P. 51-57.
12 Garrido А., Iturraspe А., Montserrat S. A compiler for morphological analysers and generators based on finite-state transducers // Procesamiento del Lenguaje Natural. -1999. – № 25.P. 93–98.
13 Jurafsky D., Martin J.H. Speech And Language Processing,1999.
14 Францис Таерз. Знакомство с системой Apertium [Электрон. ресурс]. – 2012. – URL: https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/ session0a.pdf (қаралған күні: 20.02.2015)
15 Руководство по созданию новой языковой пары [Электрон. ресурс]. – 2015.– URL: http://wiki.apertium.org/wiki/Руководство_по_созданию_новой_ языковой_пары (қаралған күні: 12.01.2015)
16 Машинный перевод [Электрон. ресурс]. – 2015.– URL: http://www.promt.ru/company/technology/machine_translation/(қаралған күні: 20.01.2015)
        
        ӘЛ-ФАРАБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ
МЕХАНИКА-МАТЕМАТИКА ФАКУЛЬТЕТІ
АҚПАРАТТЫҚ ЖҮЙЕЛЕР КАФЕДРАСЫ
«Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін
Apertium платформасының негізінде жасау» тақырыбына жазылған
ДИПЛОМДЫҚ ЖҰМЫС
|Орындаған ... ... А.Ж. |
| ... | ... ... |____________________ |Сапакова С.З. ... ... ... | ... ... ... |Жуманов Ж.М. |
| ... | ... ... | | ... меңг.м.а, |____________________ ... Ж.С. ... ... | ... 2015
Реферат
Дипломдық жұмыс 67 беттен, 25 суреттен, 6 кестеден, 16 әдебиеттен
тұрады.
Кілттік сөздер: ... ... APERTIUM ... БІР ... ЕКІ ... СӨЗІК, НЕГІЗГІ ТІЛ,МАҚСАТ ТІЛ, МАШИНАЛЫҚ АУДАРМА ЖҮЙЕСІ,
МОРФОЛОГИЯЛЫҚ СӨЗДІК, ПАРАДИГМАЛАР, СӨЗДІК МАҚАЛАСЫ, СӨЗ ТАПТАРЫ.
Дипломдық жұмыстың зерттеу нысаны: ... тілі ... ... лингвистикалық сөздіктері.
Дипломдық жұмыстың мақсаты: қазақ-орыс тілі ... ... ... сөздіктерін дайындау.
Дипломдық жұмыстың зерттеу әдістері: морфологиялық сөздіктерді ... сөз ... ... жұмыс нәтижесі: сөздік ... ... екі ... қазақ-орыс бағытындағы және кері бағыт үшін жазылған ережелерде
қолданылатын парадигмалар анықталды.
Дипломдық жұмыстың негізгі мінездемелері: ... ... ... ... ... сөздікті құру тәсілі, сөздіктерге сөздерді
енгізу тәсілі, машиналық аударма жайлы жалпы ... ... ... ... ... ... және ... ғылыми-
зерттеу институтының «Интеллектуалдық ақпараттық ... ... ... ... қазақ тілінен ағылшын және орыс
тілдеріне ... кері ... ... ... ... ... жүйесін
құру» жобасы аясында Аликанте Университетінің профессоры Микель Форкада мен
механика-математика факультетінің профессоры Тукеев ... ... ... ... ... қолдану аймағы: машиналық аударманың сөздіктермен
жұмыс жасау ... ... ... ... даму ... ... қорын әр
сала бойынша термин сөздермен толықтыру керек, жаңа сөздермен ... ... ... орыс ... және орыс ... қазақ тіліне сөздерді
аудару үшін қолданылатын парадигмаларды ... ... ... ... из 67 ... 25 ... 6 ... 16
источников.
Ключевые слова: МАШИННЫЙ ПЕРЕВОД, ... ... ... ... СЛОВАРЬ, ВЫБОРАННЫЙ ЯЗЫК, ЯЗЫК ... ... ... ... СЛОВАРЬ, ПАРАДИГМЫ, СЛОВАРНАЯ СТАТЬЯ,
ЧАСТИ РЕЧИ.
Объект исследования дипломной работы: Лингвистические словари машинного
перевода казахско-русского направления.
Цель дипломной работы: Разработка ... ... ... казахско-русского направления.
Методы исследования дипломной работы: Метод разработки морфологических
словарей, тэгирование частей речи.
Результаты ... ... Было ... словарь, определены
парадигмы, которые используется в ... ... для ... ... ... ... в двуязычных словарях.
Основные характеристики дипломной работы: Приведено общее понятие о
машинном переводе, способ создания лингвистического ... ... ... в ... с ... ... ... приведены в дипломной работе.
Степень внедрения дипломной работы: ведутся работы в ... ... ... ... машинного перевода с казахского
языка на английcкий и русский языки (и обратно) на базе платформы ... ... ... ... ... ... ... математики и механики под ... из ... ... ... Форкада и профессора механика-
математического факультета Тукеев Уалшер Ануарбековича.
Область применения дипломной работы: ... ... со ... перевода.
Дальнейшее развитие исследований дипломной работы:
Необходимо дополнить словарный ресурс словами ... ... ... ... ... ... ... адаптировать парадигмы
которые используются для перевода слов с казахского языка на русский язык и
с русского языка на казахский ... work consists of 67 pages, 25 figures, 6 tables, 16 ... MACHINE ... PLATFORM ... ... ... ... SELECT LANGUAGE, TERGET LANGUAGE, SYSTEM
OF MACHINE TRANSLATION, MORPHOLOGICAL ... ... ... PARTS OF SPEECH
The object of research of the diploma work: ... ... ... ... from Kazakh into Russian
The aim of the diploma work: Development of linguistic dictionaries for
machine translation from Kazakh into ... methods of research of the diploma work: Method ... ... ... parts of speech ... results of the diploma work: It was supplemented by a dictionary,
defined the paradigm, that is used in the rules written for the ... and ... contrary ... in bilingual dictionaries.
Main characteristics of the diploma work: A general concept of ... ... way to create a ... entry method of words ... ... with the ... given in the diploma work.
The degree of implementation of the diploma work: work is ... the ... of the project “The ... of ... system ... translation from Kazakh into English and Russian (and vice ... on platform ... on ... of “Intellectual Information
Systems” of the Research Institute of Mathematics and ... led ... of the ... of Alicante Mikel L. Forcada and by ... the faculty of ... and Mathematics Tukeyev Ualsher Anuarbekovich.
Scope of the diploma work: Scope of work with machine ... ... of research of the diploma work: It is ... ... the ... resource with terms words of ... ... be supplemented by new words, it is necessary to adapt the paradigms
which are used to ... the words of the Kazakh language into ... from Russian into Kazakh ... 7
1 ... ... 8
1.1 Машиналық аударманың даму тарихы 8
1.2 Машиналық аударманың түрлері 11
2 Apertium ... ... ... ... Apertium ... құрылымы 16
2.2 Жүйені құрудағы дәстүрлі модельдері 25
2.3 Eсeптердің қойылымы 25
3 Жаңа тілдік жұп құру ... Бір ... орыс тілі ... ... Екі ... ... құру ... Трансферлік ережелер 33
3.4 Екі тілдік сөздіктерге етістіктерді қосу ерекшеліктері 36
3.5 Жіктеу есімдіктерін сөздіктерге қосу барысы 41
3.6 Қазақ тілі ... құру ... ... Зат ... ... 43
3.6.2 Қосымшаларды сөздіктерге енгізу барысы 45
3.6.3 Сын есімдерді сөздіктерге енгізу ерекшелігі ... Сан ... ... енгізу 48
3.6.5 Есімдік сөз табын сөздікке енгізу 49
3.6.6 Етістік сөз табын сөздікке енгізу ... ... сөз ... ... енгізу 52
3.6.8 Еліктеу сөздерді сөздікке енгізу 55
3.6.9 Шылауларды сөздікке енгізу ... ... сөз ... ... енгізу 57
4 Сөз таптарын тәгтеу – part-of-speech tagging 59
4.1 Сөз таптарын тәгтеу 59
4.2 Сөз ... ... ... ... ... Сөз ... ... жасырын Марков моделін қолдану ... ЖMM ... үшін ... алгоритм 64
ҚОРЫТЫНДЫ 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 67
БЕЛГІЛЕУЛЕР МЕН ҚЫСҚАРТУЛАР
МА – ... ...... аударма жүйесі
SMT – статистикалық машиналық аударма
RBMT – ережелерге ... ... ...... машиналық аударма
ТМ – аудармалардың жады
ADJ – сын есім
DET – детерминитив
LR – солдан оңға бағыттау
N – зат ... – зат ... ... – сан есім
POST – шылау
PP – жалғаулық фраза
PRN – есімдік
ADV – үстеу
IDEO – еліктеу сөз
SL – негізгі тіл (source ...... тіл (target ...... ... – жасырын Марков моделі
КІРІСПЕ
Машиналық аударма жаңа ақпараттық технологиялар жиегінде мәтіндерді
автоматты өңдеудің өзекті ... ... ... ... қол жетімді,
заманауи машиналық аударма жүйелерінде орын алатын ... ... ... ... бас ... себебі болып табылмайды. Қазіргі таңда
қол ... ... тілі орыс ... және кері ... ... ... Аударма жүйелері көпшілік жағдайларда қанағаттанарлықсыз
нәтиже береді. Аударылатын ... ... ... ... және ... аудармасы ғылыми-техникалық үрдіске септігін
тигізетіндіктен, сапалы машиналық аударма адамзат ... ... ... жүйелері мәтіндерді өңдейді қажетсінбей жеткілікті жақсы
аударады, дегенмен басқа мәтіндер сол пәндік аймаққа қатысты болғанымен,
қайта өңдеуді ... ... ... ... ... ... тақырыбының өзектілігі сөздердің тиянақты және тура
аудармасына қол жеткізу үшін ... ... орыс ... машиналық аударудың
лингвистикалық сөздіктерін құру.
Дипломдық жұмыстың зерттеу пәні: қазақ тілінен орыс ... ... екі ... және бір ... ... жұмыстың мақсаты – аpertium платформасының негізінде қазақ-
орыс тілі бағытындағы машиналық ... ... ... болып табылады.
Дипломдық жұмыстың мақсаты бойынша анықталған міндеттер:
• Қазақ-орыс тілі бағытындағы екі ... ... ... Қазақ-орыс тілі бағытындағы бір тілді сөздіктердің құрылуы;
• Сөз таптары ... ... ... ... мәні: аpertium платформасы негізінде қазақ-орыс тілі
бағытында бір тілді және екі тілді сөздіктер құрылды.
Зерттеудің тәжірибелік мәні: бір ... және екі ... ... ... ... жеке-жеке аударылады.
Зерттеу жұмыстарында қолданылған кіріс деректері: екі тілді сөздік және
бір тілді сөздіктер.
1 Машиналық аударма
1.1 ... ... даму ... ұзақ ... бар. Оның бастауы ата тіл жеке тілдерге ыдырай
бастаған және ... тіл ... ... ... ... ... ... бірнеше тілде сөз сөйлеу қажеттілігі
туындаған ... ... ең ... ... ... қарым-қатынасына мүмкіндік
беретін ең маңызды әлеуметтік функцияны орындады. Жазбаша аудармалардың
таралуы басқа халықтардың ... ... ... кең ... ... және мәдениеттердің өзара әрекеттесуіне ықтимал жасады. [1]
Биографтардың куәлігі бойынша, XIX ғасырдың атақты математигі Чарльз
Бэббидж британдық ... ... ... ... атты ... ... ... тырысты. Ол бұл машинаның кейін ауызша
сөздерді автоматты түрде аудара ... уәде ... ... ... ... көптеген идеялардың авторы болып танылғанымен, МА
қатысты уәдесін орындай және ... ... ... ... бұл ... да бір ... іске аспаған болып саналады. Бірақ жаһандық байланыс
платформасы болып табылатын Internet-тің пайда болуына байланысты, қайтадан
көпшіліктің кең ... және ... ... ... ... ... ... соң, бірер жылдардан кейін, 50-ші
жылдары МА бірінші бағдарламалары ... бола ... ДК кең ... МА ... техникада маңызды сала ретінде ... ... ... ... ... Ол екі ... бойынша:
компьютерлік жұмыстар уақытының қымбатшылығы және оны қорлармен ұжымдық
пайдалану. ... ... МА ең ... ... – жедел қимылдаушылық
қасиетін жоққа шығарып, дереу ... ... ... ... ... ... 1947 жыл деп ... қабылданған, және бәрі Рокфеллеров
қорының жаратылыстану ғылымдары бөлімінің директоры Уоррен Уивердің хатынан
басталған. Сол ... ... ... ... Винерге жолдаған хатында,
аударманың мақсаты дешифрлеудің мақсатымен салыстырылған болатын. Сол ... ... ... ... бастаған еді.
Бұл хат артынан көптеген пікірталастар жиыны ерді, мақсаттар туралы
меморандум пайда болды, және ... ... ... ... ... ж. ... ... Бар-Хиллел ұйымдастырған бірінші конференция өтті.
Конференцияда зерттеушілер семантиканы сипаттау тәсілдері, ... ... ... үшін ... құрылымы, тілдің семантикалық
ережелерінің жиынына қатысты ... ... ... зерттеулердегі табыстар МА мәселесіне коммерциялық жағдай
жасады, және 1954 жылы АҚШ-тағы ... ... ... ... ... GAT ... көрсете алды. GAT(Джорджтаун автоматтандырылған
аудармасы) жүйесі 250 сөздерден және 6 ... ... ... ... және 49 алдын ала ... ... ... ... ете ... Бұл тәжірибе зерттеушілік шудың бастамасы
болды: келесі 10 жылда АҚШ үкіметі мен әскери мекемелері МА ... 40 млн. ... ... ... ... ... ... кеңестік физиктер мен ядерщиктердің мәтіндерін орыс тілінен
ағылшын тіліне аудару үшін арналған болатын.
50-ші жылдардың аяғында Америка үкіметінің өтініші ... ... ... жоғарғы сапалы аударма» машиналық ... ... ... ... еді. ... тұжырымның екі мәнділігінде
негізделген болатын. Келесі сөйлемді қарастырайық: Little John was looking
for his toy box. Finally he found it. The box was in the ... сөзі 2 ... ие ... ... ... – біз жазу ... нәрсе, екіншісі – нақты түрдегі бөлме. Адамға мағынасы, әрине,
түсінікті. Бірақ зерттеуші «әмбебап ... ... ... ... шеше ... деп ... ... мұндай семантикалық дәлсіздікті
машиналық аударма үшін, тек бір мағыналы сөздерден тұратын ... ... ... жазу ... ... ... жылдары КСРО және АҚШ жүргізілген зерттеулер, орыс-ағылшын тілдік
жұбына негізделген болатын. Аударманың негізгі объектісі ретінде ... ... ... ... ... ... ... мақалалар.
Аударманың кедір-бұдір тұстары мақаланың негізгі көрінісіне ... ... ... ... ... ... талқыланса, онда
мақаланы аудармашыға дәл аударма үшін жіберетін болатын, егер ... ... ... ... жылы ALPAC ... ... жарияланғаннан соң, машиналық аударма
облысында зерттеулерде үлкен соққы болды. Есепті АҚШ үкімет ... ... және АҚШ ... ... ... қолданбалы
лингвистика бойынша арнайы комитетімен (ALPAC) ұсынылған болатын. ... 1964 жылы АҚШ ... ... жеті ... ... АҚШ үкіметін
прогресс көлемі жобаны әзірлеу барысында жұмсалған шығындар көлемімен тең
келуі мазалады. ... ... ... адам ... ... ... бағасы, жылдамдығы және дәлділігі жағынан артта
қалатынын айтты. Жақын ... ... ... адам арқылы жасалатын
аударманың сапасына жете қоймас деп ... ... ... ... үшін ... ... ... кеңес берді – мысалы, ... ...... ... облысында зерттеулерді қолдауды.
Есептеу нәтижесінің жариялануы Ресей мен Ұлыбританияға қарағанда үлкен
дәрежеде АҚШ ... ... ... ... тигізді. АҚШ
зерттеулері асып кетсе, он жылға тоқтатыла ... ... ... ... ... ... берді. АҚШ-та Systran компаниясының негізін
салушылар(Питер Том) ғана зерттеулерін жалғастыды. ... 60-шы ... ... ... ... және ... міндетті болса, 70-
ші жылдары ... ... ... ... және коммерциялық
бағыттардағы мәтіндерді ... ... ие, аз ... ... ... 80-ші жылдардың басынан бастап, ДК сенімді және қуатты түрде әлемді
жаулап ала бастағанда, олардың жұмыс ... ... ... оларды кез
келген уақытта қол жеткізуге болды. Ал бұл өз кезегінше МА ... ... бола ... ... Келесі жылдары бағдарламалардың
әбден жетілдіруі көптеген мәтіндерді айнытпай аударып бере алатын болды,
дегенмен МА байланысты ... ... ... ... да шешілмеген болып
табылады.
80-ші жылдарда машиналық аударма үшін бағдарламалар саны да ... де ... Metal ... ... ... машиналар
технологияларына негізделген аудармашылық жүйелер қолданды.
Микрокомпьютерлер жарамдылығының үлкею ... ... ... бағдарламалары нарықта пайда болды. Еуропа, Жапония
және АҚШ көптеген серіктестіктері осы ... ... ... ... ... ... және ... нарықтарында көрсетілген еді.
80-ші жылдары Жапонияда машиналық аудармамен байланысты үлкен шу ... ... ... ... болумен Жапония техника және
программалау ... ... ... ... ... ... және
ағылшын тілінен аудару негізінде программаларды құрастыруға байланысты
көптеген компанияларды (Fujitsu, Toshiba, NTT, Brother, Catena, ... Sharp, Sanyo, Hitachi, NEC, ... ... Nova, ... ... зерттеулер морфологиялық, синтаксистік ... ... ... ... ... аудармасына
негізделген болатын.
80-ші жылдардың соңында машиналық аудармада ... ... ... IBM компаниясы құрастырған жүйе статистикалық аудармасына
негізделген болатын. Басқа ... ... ... ... әдісті қолданды,мұндай әдістер мысалдар негізіндегі машиналық
аударма деп аталады.Екі ... де ... ... ... ... ... ... болды.
90-шы жылдарды МА дамуының қайта туу дәуірі деп санауға болады, ол тек ДК
жоғары ... ... ... ... ... ... және OCR бағдарламаларының пайда болуы, Интернет/интранет
(Internet/intranet) кең ... МА ... ... ... ... ... инвесторлар үшін капитал салатын салада, және де ... да ... ... ... ... көптеген ... азап ... ... ... уәдесіне байыппен қарай бастады.
«Машинаық аударма әбден жетілген жоқ, дегенмен ... ... оның ... ... ... ... ... - деп, Alta Vista технологиялық
директоры Луи Монье ... ... ... ... ... ... режимде бастаған.
МА мәселелері АҚШ глобалді ақпараттық кеңістікте бәсекеге түсе алатынын
қамтамасыз етуде және жоғарғы ... ... ... ... ... ... ... адамзаттың ақпараттық кеңістігінде жаңа есептерді қойып
жатыр. Жаппай ақпараттың ... ... ... ... ... ... ... Бүгінде аудармалық байланыстар адамзат қызметтерінің бүкіл
дерлік аумағын қамтып жатыр. Ақпараттық ағынның қозғалысы ... ... не ... ... ... ... алуан түрлілігі ақпарат құралдарының және
халықаралық ақпараттық ... ... ... корреспонденттердің, ... ... ... отыр. Сондықтанда аудармашылық
қызметтердің мәні тұрақты өсіп жатыр, және ... ... ... ... ... ... Тіл ... асқынуы жаңа шешімдерді
іздестіруге салады. Егер ... ... ... тек ... ... ... қаралса, енді қазір ...... заң, ... және ... ... мәтіндердің
аудармасы көлемі және әлеуметтік мәні бойынша маңызды орында тұр.
Кибернетиканың дамуы ... ... ... келуіне септігін
тигізді. Қазіргі ... ... ... жеңілдететін арнайы
бағдарламалардың кең ... ... ... ... ... ... машиналық аударма жүйесінің үш түрі бар:
• Грамматикалық ережелерге негізделген жүйелер (Rule-Based ... ... ... ... ... Machine Translation, SMT);
• Гибридты жүйелер(Hybrid Machine Translation, HMT);
Ережелерге негізделген машиналық аударма (RBMT, Rule - based Machine
Translation) ...... ... ... ... және сөздіктік ақпаратқа негізделген технология. Мұндай жүйелер
екі ... ... ... грамматикалық және семантикалық
мәліметтерден тұратын екі тілдік сөздіктер және ... ... ... ... ... ... және ... негізінде құрылады. Аударма сапасы лингвистикалық деректер
қорының және табиғи тілдерді ... ... ... ... ... тілдерінің грамматикалық құрылымдары ерекшеліктерінің максималды
санын есепке алу қажет. [16]
Rule – based ... екі типі ... Transfer түрі ... ...... ... мәтінінің морфологиялық,
синтаксистік және семантикалық талдауын болжайды;шығыс тілдің құрылымын
өрнектейді (TRANSFER); шығыс тіл мәтінінің ... ... түрі ... ...... ... ... тілдің
талдауын болжайды және шығыс тілде мәтін ... ...... ... Синтаксистік және морфологиялық дәлдік;
• Нәтиженің тұрақтылығы мен болжалдылығы;
• Пәндік аймақты күйге келтіру мүмкіндігі.
RBMT – жүйесінің кемшіліктері:
• Құрастырудың қиындығы мен ... ... ... ... ... және ... қажеттілігі.
Rule – based технологиясына негізделген машиналық аударма жүйесін
өндірушілер-серіктестіктеріне PROMT, Systran, ... ... ... ... аударма (Statistical Machine Translation, SMT)
дегеніміз – технология екі тілді мәтіндер жиынтығынан ... ... ... жасалған сөйлемнің ең ықтимал болатын аудармасын
іздестіруінде негізделген. Мұндай ... ... ... ... ... корпустарын салыстыру негізінде құрылады. Параллелді
мәтіндердің корпусы – бұл бір ... ... бар және ... ... ... ... ... Статистикалық машиналық аударма
«өздігінен үйрету» қасиетіне ие: параллелді ... ... және ... ... болса, статистикалық машиналық аударманың ... ... ... - ... ... ... ... Параллелді корпустардың жеткілікті санында құрастыру жеңілдігі;
• Технологиялардың кез келген тілдік жұптарға тасымалданғыштығы.
SMT - жүйесінің кемшіліктері:
• Табиғатта параллелді корпустардың шектеулігі;
... және ... ... ... ... бұрмалау(қайталау, рұқсатнама, мәліметті ауыстырып
жіберуі).
Статистикалық ... ... ... ... PROMT, Google, SDL Language Weaver, ... IBM ... ... Machine Translation (Гибридті машиналық аударма, HMT) дегеніміз
– SMT және RBMT технологиялары өзіндік кемшіліктері мен ... ... ... ... ... ... ... шегіне жеткендіктен, МА
қатысты шешімдер құрастырушылары аударманың ... ... ... ... жарып шығуға үміт артып жатыр. [16]
Бұл технология RBMT және SMT ... ... ... . ... екі ... ... тұстарын алуғы мүмкіндік береді. (RBMT
бойынша аударуда грамматикалық дәлдік және SMT ... ... ... ... ... аударма жүйелерінің
өндірушілер-серіктестіктері: Systran PROMT.
Гибридті жүйе статистикалық жүйе сияқты параллелді деректерге ... ... ... үш ... ... ... Параллелді корпустың бастапқы бөлігінің аудармасы негізгі тілде базалық
RBMT-модулі арқылы орындалады;
• «Машиналық» ... ... ... ... ... моделі
келтіріледі;
• Аударма тілінің корпусы негізінде статистикалық модел келтіріледі.
Гибридті жүйелерді үйрету схемасы 1.1 суретінде көрсетілген.
Сурет 1.1 – ... ... ... ... ... ... ... екі негізгі компоненттен тұрды: аударманың
базалық RBMT – ... және ... ... ... ... ... моделі, мақсатты тілдің статистикалық
моделі) теріп-түзетудің статистикалық модулі. Аударма ... ... ... ... ... ... ... алынған аударма
статистикалық компонент арқыла өңделеді, іс жүзінде бұл кезеңде машиналық
аударманың ... ... ... ... ... ... тілге
аударма жүзеге асырылады. Гибридті жүйенің аударма үдерісі 1.2 суретінде
көрсетілген.
Сурет 1.2 – ... ... ... ... ... ... жүйелерінен басқа, жұмыстар қағидасы Translation
Memory технологиясына ... ... бар. ... жады ... Memory, TM) ...... ... екі тілді базалар. Технология негізінде «бір мәтінді екі ... ... ... ... ала ... ... ... сақталған
деректерден аудару керек құжаттарды салыстыруда негізделеді. ... ... жүйе ... ... ... ... және Translation
Memory аудармалар базасынан аударманы алады.
ТМ  жүйeci мәтіннің ұқcac бөліктерің ... ... ... ... ... тек қана бір рет ... іске асады, ал
содан соң әрбір келесі сегмент мәліметтер қорымен (толық ... ... ... ... тексереді, eгeр ұқсас не сәйкес сегмент табылса
онда ол аударма түпнұсқасы ретінде ұсынылады.
Қaзiргi ... ТМ ... ... ... ... ... Мысaлы, Transit жүйесінің өзeгi Star фирмасының нейрондық желілер
технологиясы негізінде жүзеге асырылған.
ТМ ... өз ... мен ... бар, және өзінің
қолдану аймағы бар. ... TM ... ... ... ... ... ... жүйелерінің өндірушілер-серіктестіктері : PROMT, SDL Trados, Atril
(Déjà Vu жүйелері), OmegaT.
Бір үлгідегі құжаттаманың үлкен көлемдерін аудару үшін TM және ... ... ... ... ... олардың әрбірі ортақ
есептер шеңберінде ... ... ... ... TM ... алдын
аударылған контентті алмастыру және шығаруды қамтамасыз етеді, ал ... жаңа ... ... ... ... ... және ... аударманың ерекше белгілері 1-кестеде
келтірілген. [16]
Кесте 1 – ... ... және ... ... ... ... |Кемшіліктері ... Memory ... ... |1. ... ... ала|
| ... ... ... ... |
| ... |2. ... ... |
| ... ... контент |
| ... ... ... ТМ ... |
| | ... тәуелді; |
| | ... ... ... |
| | ... ... ... аударма(МТ)|1.Жаңа контентте |1.Жоғары тиімділік |
| ... ... ... |
| ... ... ... ... үшін |
| | ... ала ... |
| | ... |
| | |2. ... ... мен |
| | ... ... ... |
| | ... ... |
|TM + MT ... ең | |
| ... ... кез | |
| ... ... | |
| ... жоғары | |
| ... | |
2 Apertium ... ... ... – бұл ... аударма жүйесі. Дәлірек айтсақ, Apertium – бұл
машиналық аударма платформасы. Ол өзіндік машиналық аударма ... ... ... құралдардан тұрады. Базалық деңгейде жүйе үш
сөздіктен және ережелерден тұрады, олар ... ... ... ... ... ... трансформацияны қамтамасыз етеді. Бұл ... ... ... және ол ... ... GNU GPL ... әзірленеді. [14]
Apertium OpenTrad жобасының көлемінде машиналық аударма құралы ... ... ... ... тек қана тектес тілдерді аударуға ... ... өте келе ... ... ... ... емес тілдерді
арасында мәтіндер аударыла бастады. Жаңа автоматты аударма жүйесін жасау
кезінде XML форматында ... ... ... ережелер) құру
керек. [14]
2004 жылы қазанда Испанияның өнеркәсіп министрлігі Испания тідері үшін
машиналық аударманың ... ... ... ... ... қаржы бөледі:
• EHU, UA, UPC, UVigo университеттері;
• Eleka, Elhuyar, Imaxin Software ... сөз ... ... ... ... болса, сөзбе сөз аударма жиі 80% ... ... ... ... сөз аудармаға сүйене аламыз:
• Толық лексикалық өңдеу (мысалы, символдар және сөз ... Көп ... ... дәрежесі (мысалы, маркалаушы сөз таптары);
• Жергілікті құрылымдық өрнектеулер (мысалы, келісу, сөздердің орналасу
ретінің ... емес ... үшін біз ... ... ... ... беретін
ұқсас үлгіны құрастыра аламыз.
Машиналық аударманың бір қозғағышын «движок» бірнеше тілдік ... ... ... ... тілдерін білу қажет емес;
• Жүйе лингвистикалық ережелердің жай сипаттамалары арқылы құрылуы мүмкін
(сөздіктер,маркерлеу ережелері, тасымалдау ережелері);
• Мәліметтер өзара ... ... ... ... (XML). ... Apertium ... құрылымы
Apertium платформасының құрылымы 2.1 суретінде көрсетілген.
Сурет 2.1 – Apertium платформасының құрылымы
Форматқа келтіруді басқару:
• Форматқа келтіруге ... ... ... ... алу;
• Қазіргі таңда HTML, RTF, ODF, ... DocX және т.с.с ... ... ... жұмысы үшін:
$ echo ”köpek” | apertium-deshtml []köpek.[][< n/em>]
Деформатор жұмысы үшін:
$ echo ... | ... ... келтіруді басқару 2.2 суретінде көрсетілген. [14]
Сурет 2.2 – Форматқа келтіруді басқару
Морфологиялық талдау:
• Түпкі мәтінді беттік формаларға ... ... ... ... ... бір ... бірнеше лексикалық форманы қосымша
жазып береді.
Морфологиялық анализатордың (hfst-proc) ... ... echo ... | ... ... анализатордың (lt-proc) жұмыстарының орындалуы
$ echo ”саду” | lt-proc ru-sh.automorf.bin
ˆсаду/сад/сад$
Морфологиялық талдау 2.3 суретінде көрсетілген. [14]
Сурет 2.3 – Морфологиялық талдау
Морфологиялық бір ... ... ... ... ... ... сай бір лексикалық форма таңдайды;
• Марковтың жасырын модельдер және қолдан жазылған ... ... ... комбинациясын қолданады.
(cg-proc) маркалаушының жұмыстарының орындалуы:
$ echo ”Все эти ... ... ... ... ... | ... | cg-proc ru-sh.rlx.bin
ˆВсе/Весьdetindmfnplnom$
ˆэти/этотdetdemmfnplnom$
ˆрегионы/регионnmnnplnom$ …
Морфологиялық бір мәнді еместіктердің шешімі 2.4 ... 2.4 – ... бір ... ... ... ... Әрбір лексикалық форманы лайықты аударма тілдің ... ... ... екі ... ... ақырғы түрлендіргіштерді өрнектейді.
Лексикалық тасымалдаудың орындалуы:
$ echo ”Әхмәт һәм Гөлнара бакчада.” | hfst-proc tt-ba.automorf.hfst | cg-
proc
tt-ba.rlx.bin | apertium-tagger -g tt-ba.prob | lt-proc ... ... 2.5 ... ... 2.5 – Лексикалық тасымалдау
Лексикалық іріктеу:
• Контекст бойынша әр тілдік жұпқа сай аударманы таңдайды;
• XML формада жазылған ... ... ... ... ... ... ... echo ”Minä pidän sinusta.” | hfst-proc
fin-sme.automorf.hfst | cg-proc fin-sme.rlx.bin ... -g ... | lt-proc ... | ... fin-sme.lrx.bin
ˆMinä/Mun$
ˆpitää/liikot$
ˆsinä/don$
Лексикалық іріктеу 2.6 суретінде көрсетілген.
Сурет 2.6 – Лексикалық іріктеу
Құрылымдық тасымалдау:
... ... ... ... ... ... оңға қарай фразаларды талдау стратегиясын қолдана отырып, өңдеу
қажет, маңызды лексикалық формалардың үлгілерін айқындайды;
... ... сай ... ... ... шаблондық әрекет
ережелерін бұйрық берілген файлдармен орындайды.
Сурет 2.7 – Құрылымдық тасымалдау
Құрылымдық тасымалдың орындалуы:
$ echo ... тиз генә иске зур бер ... ... аның ... ... | …| apertium-transfer -b
apertium-tt-ky.tt-ky.t1x tt-ky.t1x.bin |
apertium-interchunk apertium-tt-ky.tt-ky.t2x tt-ky.t2x.bin
| apertium-postchunk apertium-tt-ky.tt-ky.t3x tt-ky.t3x.bin
ˆАкмат$ ˆэски$ ˆчоң$
ˆбир$ …
Морфологиялық генерация:
• Беттік форманы ... ... сөз ... ... ... соң, ... ... морфологиялық сөздікке жүктейді.
Сурет 2.8 –Морфологиялық генерация
2.2 Жүйені құрудағы дәстүрлі модельдері
Apertium-да жүйені әзірлеудің әртүрлі тұрғылары көрсетілген, бірақ ... және ... – ол ... ... ... ... модельдерді қарастырайық:
• Коммерциялық: Компания жүйені құрады және ... ... ... ... ... ... қауымдастық немесе өңдеушілердің тобы жүйені құрып
және оның қолданысы үшін ақша алып отырады;
• Кішігірім зерттеу: ... ... тобы ... ... және оны
университет сайтына қойып қояды. Олар мұны зерттеуші бірақ коммерциялық
емес жоба екенін ... ... ... ... не ... ... қызыққан адам жүйені құрып және оны
коммерциялық емес ... ... ... ... бұл модель айырмашылығы келесі сипаттамаларға ие:
• Клиентк бағытталғын: ... ... ... ... ... / ... өңдеушілер, ұйымдар; оқу мекемелер;
студенттер. [14]
2.3 Eсeптердің қойылымы
Аpertium платформасының негізінде қазақ-орыс тілі ... ... ... сөздіктерін дайындау барысындағы есептердің
қойылымы:
• Қазақ-орыс тілі бағытындағы екі ... ... ... ... тілі ... екі ... ... құру барысында
трансферлік ережелермен танысу;
• Қазақ-орыс тілі бағытындағы екі тілді сөздіктерге ... сөз ... ... тілі ... екі ... ... жіктеу есімдігін
енгізу;
• Қазақ-орыс тілі бағытындағы бір тілді сөздіктерді құру;
• Қазақ-орыс тілі бағытындағы бір тілді орыс тілі сөздігін ... ... құру ... ... және парадигмаларды сипаттау;
• Қазақ-орыс тілі бағытындағы бір тілді қазақ тілі сөздігін құру;
• Бір ... ... тілі ... құру ... сөз ... ерекшеліктері
бойынша енгізу.
3 Жаңа тілдік жұп құру
Біздің жүйемізде сөздіктердің 3 түрі бар: әрбір тіл үшін морфологиялық
(бір ... ... әр ... қос ... үшін екі ... ... және
әрбір тіл үшін пост-генераторлық сөдіктер (пост-генераторлық сөздіктер
әдеттегі леммалар мен морфологиялық ... ... ... ... өзара әрекеттесуі кезінде туындайтын орфографиялық өзгерістері
бар кішкене сөздік ... ... ... ... морфологиялық талдаушыларды құру ...... ... ... ... үшін ... ... барлық
лексикалық формаларды алу қолданылатын аударма жүйесінің модулі; және де
морфологиялық ...... ... әр сөздің лексикалық
формаларынан сыртқы формалар ... ... Бұл екі ... ... сөздіктен бағыт бойынша генерацияланады: солдан оңға
(талдаушыларды ... және ... ... құрғанда).
Бұл сөздіктердің типтік блок-құрылымы келесідей:
• Әліпбиді анықтау. Бұл анықтама морфологиялық ... құру ... ... ... ол ... ... ... және де
сөздіктің шартты бөлімдерінде орналасқан сөздерді лексемаларға бөуге
мүмкіндік береді; ... ... бұл ... ... ... Ол ... мақалаларында қолданылатын грамматикалық
символдар декларациясынан тұрады;
• Парадигмаларды анықтау. Парадигмалар сөздіктердің бөлімдерінде немесе
басқа парадигмаларда алғышартпен қолданысы ... ... ... ... бір ... ... бөлімдері.
Сөздіктен сөздердің көпшілігін бүркеуі;
• Сөздіктің шартсыз токенизациясымен бір немесе ... ... ... ... сөздерді немесе тікелей олардан кейін мәтінді
есепке алусыз токенизациялануға тиісті ... қосу ... ... ... ... ... трансферлер процессін
көрсетедеі, яғни мақсатты ... ... ... ... тілдің
лайықты лексикалық формасына тағайындау. [11]
Жүйемен оқылған сөздікте екі тілді сөздіктен бағытқа байланысты екі
өнімде ... ... ... оңға ... бір бағытты аударма үшін
лексикалық трансферлердің модулін, ал оғнан солға оқылған ... ... үшін ... ... ... ... келесідей:
• Символдарды анықтау. Ол сөздік мақалаларында қолданылатын грамматикалық
символдар декларациясынан тұрады;
• Жалғыз меншікті сөздік ... Онда ... ... көрсетіледі.
Пост-генераторлық сөздіктер мақсатты тілде сыртқы формалар жасалған соң
және олардың өзара әрекеттесуі басталған соң кейбір өрнектеулерді орындау
үшін қолданылады ... ... ... қосу және т.б.).
Бұл қызмет символдық жолдардың трансляциясы ретінде бейнеленуі мүмкін
болғандықтан,сол сөздіктің түрін қолдану шешілді.
Бұл ... ... ... сөздердің өзара әрекеттесу
құбылыстарында жүйелі өзгерістерді өрнектеу үшін ... ... ... ... олар ... ... себебі тек қана сыртқы формаларды түрендіреді. Пост-генераторлық
сөздіктердің құрылымы келесідей:
• Парадигмаларды анықтау. Оларды сөздік мақалаларында ... ... ... ... ... ... ... үлгілері сипатталады.
[11]
Апертиум машиналық аударманың беттік-трансферлік типіне жататын жүйе.
Демек, негізі ... ... және ... ... ... беттік трансфердің тереңнен ... ... ... ... ... орындалмайды, ал ережелердің
синтаксистік талдау ағашындағы оперциялардан айырмашылығы, ол ... ... ... операцияларды көрсетеді. Бұл сөздіктер үшеу:
Қазақ тілі үшін ... ... ... ... сөздерді
өзгерту(септеу немесе жіктеу) жайындағы ақпарат:
• (apertium-kaz.kaz.lexc)
Орыс тілі үшін ... ... ол өз ... орыс ... өзгерту(септеу немесе жіктеу) жайлы ақпарат қамтиды:
• (apertium-rus.rus.dix)
Қазақ-орыс екітілді сөздігі: екі ... ... және ... ... ... ... тілінен орыс тіліне трансферлік ережелері: бұл ережелер ... орыс ... ... ... өзгерістерге ұшырайтынын
сипаттайды.Біздің мысалда бұл келесі файл:
• apertium-kaz-rus.kaz-rus.t1x
Орыс тілінен қазақ тіліне трансферлік ережелері: бұл ережелер уу ... ... ... ... ... ... ... бұл келесі файл:
• apertium-kaz-rus.rus-kaz.t1x
Көптеген тілдік жұптарда басқа да файлдар бар. Олар функционалды жүйе
құру үшін қажет.
Жалғастырмас ... ... ... ... ... алған жөн.
Лемма– бұл сөздің канондық формасы. Мысалы, был ... ... ... ... Ал, орыс тіліндегі етістіктер үшін сөз леммасы – инфинитив
формасы болады. Мысалы, был ... ...... ... Орыс ... ... зат есімнің леммасы сол сөздің ... ... ... ... сәйкес келеді.
Екінші тоқталатын терминіміз – символдар. Apertium модулінде символдар
бұрыштық жақшаларға алынады. ... — зат ... ...... түр үшін;
• — жекеше түр үшін,
• — бірінші жақ;
• — ашық райдың осы шағы.
Символдар тәгтерінде анықталады және ... ... ... ... деп ... Apertium жүйеі контестінде
парадигмаар сөздер тобының ... ... ... табылады.
Морфологиялық сөздікте леммалар парадигмаларға сілтеме жасап отырады, бізге
мүмкін болатын қосымшалардың барлығын жазу ... бұл ... ... ... ... ... қолданудың мысалы ретінде келесі
қызмет көрсете алады. Имбирь және кисель сын есімдерін сөздікке ... ... ... ... имбирь, имбир;
• кисель, кисел;
біз имбирь сөзінің қосымшаларын ... ... " ... сөзі ... ... ... деп, ...  "щавель сөзі имбирь сөзі секілді өзгереді ",
"ревень сөзі ... сөзі ... ... ", ... сөзі ... ... өзгереді " және т.с.с.. Бұл мысалда имбирь парадигма, яғни басқа
сөздер үшін ... ... ... ... < pardef> тегтерінде
анықталады және тегтерінде қолданылады. ... Бір ... орыс тілі ... тілдің бірінші сөздігін құрудан бастайық. Сөздік XML-файл болып
табылады:



Сөздіктің элементі. Бұл түбірлік элемент, және ол ... ... ... Ол алфавиттық символдардың анықтамасынан, сөздердің
морфологиялық тәгтері болып табылатын ... ... ... және ... бір ... бірнеше бөлімдердің
анықтамаларынан тұрады. Олар лексикалық формалы (сыртқы ... ... ... ... ... ... [11]
Енді файл біздің сөздік жасауды бастағымыз келгенін анықтап жатыр. Бұл
файл көп пайдалы болу үшін, біз оған әлі бірнеше ... ... ... ... бастаймыз. Ол орыс тіл үшін сөздікте ... ... ... ... Ол ... ... орыс ... балық
сөздерін қамтиды. [15]
АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъы
ьэюя
Сөздіктің элементі. Ол әліпбидің символдар спецификациясы
үшін қолданылады. Бұл ... ... ... ... ... ... және ... сөздерді токенизациялауға
мүмкіндік беру. [11]
dictionary тегінен соң әліпбиді қосамыз.Бұдан әрі ... ... ... қажет. Жекеше (sg) және көпше (pl) түрдегі зат есім (n)
сияқты қарапайымдардан бастайық.





символдарды анықтау бөлімі үшін ... ... ... () ... ... ... біріктіреді. [15]
Символды анықтау үшін арналған элементі. Ол бос элемент боп
келеді:n атрибутының мәні ... ... ... ... белгілеу үшін сөздікте қолданылатын грамматикалық символдардың
атауын нұсқау үшін ... ... ... ... ... ... ... тиіс емес, оларды
тіпті толық жазуға болады, ... мұны көп ... ... болған
соң,қысқартудың мәні бар.
Өкінішке орай, барлығы оңай емес, орыс тілінде сөздердің көптік ... ... ... анықтап қана қоймай, сонымен қатар, септік және род
санаттары бар. ... ... үшін ... ... род –та тұрған атау
септігіндегі зат есім деп ... ... ... ... ... сөздік бөлімін:


Сөздік бөлімі үшін арналған элементі
Ол сөздікпен айырылып танылатын сөздерді қамтиды. Сөздікті ... ... ... ... - ... ... регулярлы
құрылымдардың идентификациялануынан кейін түсетін ... ... ... (ерекше) өңдеуді қажетсінеді. [11]
Сөздікте бөлімдерді қолдану мәселесінің шешімі ... ... ... ... ... ... ... көпшілігі
шартты белгі бойынша токенизацияланады: ... ... соң ... яғни ... символ болса, идентификациялау жүреді.
type атрибутының мағынасы сөздіктің әрбір секциясы үшін қолданылатын
токенизация ... ... үшін ... Бұл атрибуттың мүмкін болатын
мәндері: standard, ... ... ... үшін ... ... режимі), postblank, шартсыз токенизацияны және бос орынды қойдыруды
талап ететін формалар үшін, және inconditional қалған шартсыз ... ... ... ... ... ... бөлімдеріне атау тағайындау үшін қолданылады.
Бөлімдердің екі түрі бар. ...... ... ол сөздерді,
энклитикаларды қамтиды және т.б. Екіншісі — тыныс ... және ... ... ... Біздің бөлімде сөзсіз бөлім жоқ.
Біздің файлымыз осылай көрінетін болады:












Бізде енді сөздіктің ... бар, зат ... ... ... ... сөзін енгізейік. Алдын ала анықталған парадигмалар жоқ болған соң,
бірінші парадигманы анықтау қажет.
мужской род – та ... атау ... зат ... түрі ... ал ... түрі ... (эквивалент ) конструкциясы негізге жекеше ... ... ... [15]
Сөздік мақаласы үшін арналған элементі
• Сөздік мақаласы ... ... ... ... ... болып табылады.
• Сөздік мақалалар тізбектік p жұптардың кез ... ... i ... ... par ... ... re ... өрнектерінен тұрады.
• Бұл элементпен бірге екі факультативті атрибуттар ... r ... онда ... ... ... оқылғанда
тек солдан оңға (СО), немесе ... ... ... ... ... көрсетіледі. Егер де ештеңе берілмесе мақала екі бағытта
қарастырылуы керек.
• Морфологиялық сөздіктерде СО шектеуі лексикалық формалардың талдауына
алып ... ... ... ОС ... сөздің
генерациялануына, бірақ талданбауына алып келеді.
• Екі тілді сөздіктерде СО және шектеулері аударманың тек бір ... ... ... ... екі ... kaz-rus ... СО шектеуі
лексикалық форманың қазақ тілінен орыс тіліне, ал ОС – тек орыс тілінен
қазақ тіліне ... ... ... ... ... екі ... ... сөз, сан, род
анықтау үшін қажет.
• Сөздік мақалаларының басқа опциональді атрибуты ... ... lm ... ... ... сөз өзгертулерінде заңдылықтарды
ұсыну үшін парадигманы қолдану мақсатымен,морфологиялық сөздіктердегі
мақалалар ... ... ... формалар үшін арналған
бөлігін қамтиды. Яғни ол ... ... ... ... дейінгі лемманың "кесіндісін" қамтиды.
• Бұл дерек сөздікті түсіну қиындатады. Сондықтан жазбалар ... ... ... ... ... ... оңай болу ... лингвисттер мәселені тезірек шешу үшін осы атрибутқа ие. Екі тілді
сөздіктерде парадигмаларға сілтемелері жок атрибуттар қолданылмайды.
[11]
Қатарлық жұп үшін ... ... ... мақалаларының кез келген түрлерінде екі ... ... үшін ... ... ... элементі. Бұл
эквиваленттілік ақырғы түрлендіргіштен алынған өткелдермен іске асатын
лексикалық өзгерулерді анықтайды. ... Ол жұп ішкі сол жақ () және оң жақ () ... ... жұбы екі бөлікті де қамту керек, дегенмен олардың бірі бос ... бұл ... жою ... ... ... және ... бір ішкі ... және реквизиттерге ие. ... ... ... мен ... ... ...
және тәгтерінен ... ... жұп ... ... ештеңе
қамтымайды. [11]
Неліктен солға және оңға? Морфологиялық сөздіктер ... ... ... ... Олардың солдан оңға компиляциясы
сөздердің талдауларын, ал оңнан ... ... ... ... Мысалы :
сапоги (слева направо) сапог (талдау)
сапог (справа налево) сапоги (генерация)
Біз ... ... енді оны — ... ... ... керек. Бұл
әрекет алдын нақтылы (section) бөлімде іске асып жатыр.
section-ге қосатын жазбамыз келесі болып табылады:
сапог
Бұл жазба ... ... ... ... түбірі сапог және бұл
сөздің септелі парадигмасы сапог_n. Түбір мен лемма арасындағы айырмашылық
—лемма сөздің ... ... ... лемманың жұрнақ пен жалғау
жалғанатын бөлігі болып табылады. [15]
Сәйкес ... үшін ... ... Бұл ... сол және оң ... сәйкес жазу тәсілі. Бұл тәсілдің артықшылығы
нәтиже ыңғайлы және ықшамды болып табылады.
Парадигмаларды анықтау бөлімінің ... Бұл ... ... ... ... ... ... бөлек
анықтамасы элементі болып табылады. [11]
Парадигмаларды анықтау үшін арналған ... Ол ... ... ... ... ... сөздердің бөлігіне жалғанатын,
мүмкін болатын форманттардан тұратын ... ... деп ... ... ... ... өңдеуде заңдылықты анықтау үшін қызмет етеді,
мысалы, сияқты сөздік бөлімі; демек, парадигма мақалалары ... және оң () ... ... () ... Бұл ... ... грамматикалық символдардан тұрады.
Символдардың анықтамасы секілді парадигма ... ... ... ... ... ... үшін атау беретін n атрибутынан
тұрады. Сөздік мақаласында сөздің мүмкін болатын формаларын ... ... ... ... ... ... жеткілікті. [11]
Парадигмаға сілтеме үшін арналған элементі. Ол мақала ішінде
парадигманың сөз ... ... үшін ... ... арқасында морфологиялық сөздіктің мақалаларында лексемалардың
барлық сөз формаларын көрсетуді қажетсінбейді. n атрибуты ... ... ... болса қолданылады [11].
Енді сөздігімізді тексере аламыз. Оны сақтап, командалық жолға қайтып
ораламыз. Бірінші біз оны компиляциядан (lt-comp ... ... ... оны ... (lt-proc ... ... lt-comp lr ... kaz-rus.automorf.bin
Келесіні беруге тиісті:
main@standard 12 12
Солдан оңға компиляциямен ... соң, біз ... ... ... ... lt-comp rl ... ... тура сондай хабарлама шығаруы тиіс. Енді біз оларды тестілей
аламыз. Анализаторда lt-proc-ты іске ... lt-proc ... ...... ... енгізіңіз, және нәтижені қараңыз :
^сапоги/сапог$
Папкада енді екі файл болуы тиісті:
apertium-rus.rus.dix, орыс тілінің ... ... ... ... тілінің морфологиялық сөздігі. [15]
3.2 Екі тілді сөздіктерді құру
Екі тілді сөздік сөздердің сәйкестіктерін сипаттайды. Барлық сөздіктер
бір форматты алып ... ... ... ... ... жаңа файл ... және сөздіктің
келесі "қаңқасын" қойамыз :











Енді екі сөз аудармасын жүзеге асыру үшін (section-ге) жазба енгізуіміз
керек:
етіксапог
Мұндай жазулар сөздікте өте көп, ... ... үшін ... бір ... ... → орыс ... үшін солдан оңға қарай компиляция жасаймыз,
және орыс → ... ... құру үшін ... ... қарай компиляция жасаймыз.
[15]
Барлығы жасалынған кезде, келесі ... ... :
$ lt-comp lr ... ... lt-comp rl apertium-rus.rus.dix kaz-rus.autogen.bin
$ lt-comp lr apertium-rus.rus.dix kaz-rus.automorf.bin
$ lt-comp rl apertium-kaz.kaz.lexc rus-kaz.autogen.bin
$ lt-comp lr apertium-kaz-rus.kaz-rus.dix kaz-rus.autobil.bin
$ lt-comp rl ... ... ... (automorf), морфологиялық генераторлар
(autogen) және сөз ... ... ... үшін, "bil" ... яғни «екі ... ... ... ... [15]
3.3 Трансферлік ережелер
Енді бізде екі морфологиялық сөздік және бір екі ... ... ... зат есімдер үшін трансферлік ... ... ... ... бар файлдар өздерінің меншікті Apertium пакетінде ... ... ... ... трансферлік ереже жазу керек болса, көптеген
ережелер әртүрлі тіл ... ... ... ... басқа тіл
жұптары үшін ережелері бар ... ... ... ... бұл ... ... қолдануға болады. Мысалы, төменде келтірілген ереже,
барлық нөл-субъектілі тілдер үшін қолданыла алады. ... ... ... ... (аударма барысында септіктердің
өзгеру мүмкіндігі), бізге грамматикалық символдарды кіріс кезінде «алып»,
өз кезегінде беріп ... ... ... ... ... ... ... және атрибуттарды анықтап шығу керек. Дәрежелер
және атрибуттар грамматикалық символдарды бірлестіруге мүмкіндік береді.
Категориялар көмегі ... біз ... ... ... барлық зат есімдерді біріктіреді). Атрибуттар бізге символдарды
біріктіруге мүмкіндік береді, олардан ... ... ... ... 'sg' және 'pl', 'number' ... ... ... бөлімдерді қосамыз :




Мысалдағы зат есімдер сандық формасы бойынша ғана өзгереді, сондықтан
зат есімдерге және сандық ... ... ... ... ... жеткілікті:
section-def-cats  бөліміне келесіні қосамыз:



Категория барлық зат есімдерді ... ... , және ... әлі ... ... «жасырып» және "nom" сияқтыларға сілтеп тұр.
section-def-attrs бөліміне келесіні қосамыз:




Ал сонымен бірге



Бірінші жазба жекеше (sg), немесе (pl) ... ... бола ... ... = сан) ... анықтайды.
Екінші жазба a_nom (зат есім атрибуты) атрибутын анықтайды.
Глобалді айнымалылар үшін бөлім қосу қажет:


Бұл айнымалылар ... ... ... ... ... ережелер
арасында берілісі үшін қолданылады.

Енді зат есімді қабылдай алатын және оны дұрыс формада шығара алатын ереже
енгізу қажет.
















Бірінші тег ... — ол ... ... тұр. ... тег, ... бұл үлгі көрсетілген болса,онда осы ... ... ... ... білдіреді). Бұл мысалда үлгі бір зат есімнен ... ... ... Үлгілер "ең ұзын дәл келетін" тәртіпте таңылып жатыр. Егер
бізде үш ... ... ... ... ... сай, сөздерді
біріктіруге ал, екіншісі—"prnvblex" және үшіншісі — "n" үлгісіне қатысты.
Үлгілерді қойып ,бірінші (егерде ... ... осы ... сай ... қолданамыз.
Әрбір үлгіге лайықты, сәйкесінше шығыс мәліметтерді ... бар. ... ... (lu, lexical unit) ... ... ... табылады.
Сlip тегі кіріс (side="sl") немесе шығыс (side="tl") тілдің лексикалық
бірліктің ... ... ... ... таңдау және басқару
мүмкіндігін бере алады.
Компиляция жасаймыз және файлды тексереміз. Трансферлік ережелер осылай
құрастырылып ... ... ... ... ... ... ... сөз бастапқыда талдаймыз :
$ echo "етіктер" | lt-proc ... сөз ... ... дұрыс нұсқаны (дұрыс сөз ... ... ... ... ... болмағандықтан, gawk-скриптті қолданамыз.
$ echo "етіктер" | lt-proc ... | ... ... FS="/";}{nf=split($1,COMPONENTS,"^"); for(i = 1; i%{I%}р%{A%}%{K%} CLITICS-INCL-COP ; !# ... ... ... таптым
%%%:%>%{I%}р%{A%}%{K%} FULL-NOMINAL-INFLECTION ;!#
ұзынырақты таптым
%%: CLITICS-NO-COP ; ... ... ... ;!# ... ... соғұрлым тоқ жақсырақ өтеді."
Мұндағы:
% — сын есім % — негізгі, % — ... ... ... ... ... деп ... Ал атрибуттар
сын есімдерде қолданылмайды. % — сын есімдерді салыстыру деңгейі
(шырайы).
Сурет 3.3 – A1 ... ... ... ... аудармасы
А2 лексиконы:
• Туынды / толық лексиколизацияланбаған;
• Пысықтауыштық (үстеу) мағынасы жоқ сын есімдер;
• және ... ... ... бар.
Мысалы:ескі,арық.
%: CLITICS-INCL-COP ; !# ескі ... ... ; !# ... ... ;
!# "Ол ескіні ертеден есінде сақтаған, жаңаның жалынды жаршысы болған
ақын."
%%%:%>%{I%}р%{A%}%{K%} FULL-NOMINAL-INFLECTION ;
Сурет 3.4 – A2 лексиконы бойынша енгізілген сөздердің аудармасы
А3 ... ... / ... ... ... ... жоқ сын есімдер;
• Ешқандай салыстыру деңгейлері жоқ;
• "Предикативтер" деп аталатындар(бар, жоқ).
Мысалы: көктемгі, басты
%: ... ; !# ... ... ... ; !# "Аты ... бар."
Сурет 3.5 – A3 лексиконы бойынша енгізілген сөздердің аудармасы
А4 лексиконы:
• "Таза" сын ... ... ... ... мағынада қолданылатын;
• Ешқандай салыстыру деңгейлері жоқ.
Мысалы: ұлттық, әдеби.
%: CLITICS-INCL-COP ; !# ... ... 3.6 – A4 ... ... ... ... ... лексиконы:
• Туынды / толық лексиколизацияланбаған;
• Салыстыру мағыналары жоқ сын есімдер;
• Ешқандай салыстыру деңгейлері жоқ;
Мысалы: біржақты, ... ... ... FULL-NOMINAL-INFLECTION ;
%%: CLITICS-NO-COP ;
Сурет 3.7 – A6 лексиконы бойынша енгізілген сөздердің аудармасы
3.6.4 Сан есімдерді сөздікке енгізу
Сан ... ... ... ... ... шамасын білдіретін сөз табы.
Сан есім жеке айтылғанда абстракт ... ... ... ... ... ... сөздермен қарым-қатынасқа түсу кезінде, оларды сан
жағынан анықтау барысында айқындалады. Семантикалық-морфологиялық тұрғыдан
есептік, реттік, болжалдық, жинақтық, топтық, ... ... ... NUM ; ! ... NUM ; ! "one"
Реттік сан есімдер есептік сандарға -ыншы (-інші) жұрнақтарын қосу
арқылы жасалады да, ... бір ... мен ... сандық ретін
білдіру үшін қолданылады.
LEXICON NUM
NUM-COMMON ;
%%:%>%{I%}нш%{I%}#;
%%%:%>%{I%}нш%{I%} FULL-NOMINAL-INFLECTION ;
Мұндағы: % — сан ... % — ... сан ... сан есімдер бірден жетіге дейінгі есептік сан есімдерге -ау (-
еу) жұрнақтарын қосылуы арқылы жасалады. Бұндай сөздердің ... ... сан ... білдіргендіктен, олар үнемі субстантивтеніп ... ... NUM-COLL ... ... ... ;
%%%: # ;
Мұндағы: % — Жинақтық(Collective) сан есімді білдіреді.
Сандарды белгілеу үшін қолданылатын римдік таңбалау ... ... ... ... # ... ... ; ! ... NUM-ROMAN ; ! ""
3.6.5 Есімдік сөз табын сөздікке енгізу
Есімдіктер - заттың атын, сынын, санын,олардың ... ... ... (зат ... ... есімдердің) орнына жұмсалатын сөз
табы. Есімідіктер белгілі бір түсінікті я ойды жалпылама түрде ... ... ... ... мағыналары өздерінен бұрын айтылған
сөйлемге немесе жалпы сөйлеу аңғарына қарай айқындалады.
LEXICON PRON-PERS
мен%%%%:м PRON-P12SG-CASES ;
LEXICON PRON-ITG-INFL
%%: ... ... ... GER-INFL ... PRON-IND
%%: CASES ;
LEXICON PRNNEG
%%: CASES ;
LEXICON PRON-RECIP
%%: GER-POSSESSIVES ;
LEXICON PRON-REF-ADV
%%%:%>%{I%}м PRON-REF-ADV ;
бұл%%%:бұл CLITICS-INCL-COP ;
Мұндағы:
%— ...... ...... (Reciprocal)
% — Сілтеу (Demonstrative)
% — Белгісіздік (Indefinite)
% — Сұрау (Interrogative)
% — Жалпылау (Quantifier)
% — Болымсыздық ... ... ... ... да ...... ... PRON-ITG-QAYSI ;
әр:әр PRON-IND ; ! !"either" Use/MT
Сурет 3.8 – PRON-ITG лексиконы бойынша енгізілген сөздердің аудармасы
3.6.6 Етістік сөз ... ... ... ... ... ... жай-күйді білдіріп қана
қоймайды, сонымен бірге сол кимылдың, іс-әрекеттің, ... ... ... ... я ... ... ... жағынан, ол пікірдің
ақикат шындыққа қатысын білдірумен байланысты болып отырады.
LEXICON V-TV
%%: V-COMMON ;
%%: V-DER ;
%%%:%>%{I%}%{l%} V-COMMON ... ... V-COMMON ... V-DER ... Етістік;
% — Сабақты (Transitive) етістік.
Сабақты етістік — табыс септігіндегі сөзді керек ететін етістік түрі.
Табыс ... ... ... ... ... ... ... салт және сабақты болып бөлінеді. Салт және ... ... ... ... Оның субъекті мен ... ... ... ішкі ... ... ... Мысалы:
ки:ки V-TV ; ! "wear"
кес:кес V-TV ; ! "cut"
%— Салт(Intransitive) етстік;
Салт етістік — табыс септікті сөзді қажет ... ... ... ... келетін етістік түрі. Салт және сабақты етістіктердің
тұлғалық жағынан айырмасы жоқ, негізгі ... ... ... ... ... ... Салт ... етістікке,
керісінше, сабақты етістік салт етістікке айнала алады. Салт ... ... -тір, -дыр, -дір, -ғыз, -гіз, -қыз, -кіз, ... ... ... етіс жұрнақтары (ағаш өсті — ағашты өсір; орындықта
тұр — ... ... т.б.), ... ... ... -іл, -л, ... ырықсыз, өздік етіс жұрнақтары
(сабақты оқы — сабақ оқылды; кітапты ал — кітап алынды, т.б.) ... ... [8]. ... ... қосымшаларды сөзжасам қосымшалары дейді,
ал салт және ... ... ... ... ажырататын шарт ретінде ұсынады. Яғни бірдей
айтылатын етістіктер әр уақытта тек салт не тек ... ... ... онда
ол көп мағыналы етістік те, бірде салт, ... ... ... [9]. Салт және сабақтылық қасиет түбір етістікке ғана емес,
туынды, күрделі етістіктерге де тән [10].
Мысалы:
абай% ... бол V-IV ; ! ... ... ... ...... ... — Қалау (Optative /jussive)
% — Дәлелдеушілік, ... ... ... сөздерге ұқсас белгілері бар түрі. Ол түбір
етістіктен арнайы жұрнақтар арқылы жасалады. Мысалы, “-ған, -ген”, ... ... ... ... ... ... ... “жазылған
хат”, “келген адам”, “ол кеткен”, “сен бергенсің”, ... ... ... ... ... ... атқарады. 
%! -{G}{A}н ! past verbal adjective
!# келген адам; оқылмаған кітап;
Ал “-атын, -етін”, “йтын, йтін” жұрнағы қимылдың келешекте жасалу ... ... ... “ол ертең келетін ... ... ... ... шақ мәнінде де қолданылады: “ол бұрын бізге жиі
келетін”.
%! -{E}{T}{I}н ... verbal ... ... = ... ... ... “-р”, “-с” жұрнағы қимылдың келешекте ... ... да ... екенін білдіреді: “айтылар сөз”, “бермес ас”, “келер
күн”, т.б. Осымен байланысты бұл жұрнақ тілде ... ... шақ ... “ол ... ... ! -{I}р ! future verbal ... ... жерің Балкан тау, ол да біздің көрген тау";
% ! ... ! ... verbal ... ... ... ... _тырысушы_ саясаткер...";
% ! -{A}рл{I}{K}
!# сүйсінерлік ерлік;
Көсемше де етістіктің ерекше ... ... ... ... де сөйлемде
екі түрлі мәнде, екі ... ... ... ... ... ... күрделі етістіктің негізгі етістік сыңары көсемше тұлғасында келіп,
көмекші етістік жіктеліп, қимылды, іс-әрекетті ... ... ... ... ... ... атқарады.
-Ып, -іп, -п жұрнақты көсемшелер ашық райдың ... шақ, -а, -е, ... ... ауыспалы осы шақ, келер шақ категорияларын тудырады. 
% ! -{I}п
!#мен айтыппын;
 -Қалы, - келі, -ғапы, ... -ып, -іп, ... ... жүр, тұр ... етістіктері тіркәсіп, келер шақ, осы шақ формапары
жасалады.
% ! -{G}{A}л{I}
! (NOTE: ambiguous with prc_plan)
!# "Сабақ ... екі ... ... Ол кеткелі біз
жұмыс істемейдік;
Мезгілді ... ша, ... ... ... күрделі қосымшалар
арқылы көрінеді.
% ! -{G}{A}нш{A}
!# "Мен кеткенше ол жауап ... ... сөз ... ... ... әр қилы қимылы мен ісінің (етістіктің) әр түрлі сындық,
бейнелік, мекендік, мезгілдік, шарттық, мөлшерлік және ... ... ... білдіретін сөз табы:
ерте:ерте ADV ; ! "early"
еріксіз:еріксіз ADV ; ! ""
LEXICON ADV
%: CLITICS-NO-COP ... ... ;
%: KI ... ... ! Used for бері/бергі 'right
now' and similar
:%{I%} ADV ;
%: KI ;
LEXICON ADV-ITG
%%: CLITICS-INCL-COP ... ... ... мағынасына қарай таптастырғанда мынадай сегіз топқа
бөлінеді.
Мезгіл үстеуі қашан? қашаннан? деген сұраққа жауап беріп, қимылдың, іс-
әрекеттің мезгілін, мерзімін, ... ADV ; ! ... ... ; ! "a while ... 3.9 – Мезгіл үстеуі бойынша енгізілген сөздердің аудармасы
Мекен үстеуі қимылдың, іс-әрекеттің ... ... ... ... ... ... жауап береді.
Мысалы:
бері:бер ADV-WITH-KI-I ; ! "on the near side"
жоғары:жоғар ... ; ! ... 3.10 – ... ... ... енгізілген сөздердің аудармасы
Мөлшер үстеуі қанша? қаншама? қаншалық? қаншалап? деген сұрақтарға
жауап ... ... ... ... дәрежесін,
мөлшерін, шама-шарқын білдіреді.
Мысалы:
сонша:сонша ADV ; ! ""
Сурет 3.11 – ... ... ... ... ... аудармасы
Сын-қимыл (бейне) үстеуі іс-әрекеттің, ... ... ... ... ... қалайша? қалай? кімше?
Мысалы:
ақырын:ақырын ADV ; !"Use/MT"
бекер:бекер ADV ; ! ""
Сурет 3.12 – Сын-қимыл (бейне) үстеуі бойынша енгізілген сөздердің
аудармасы
Күшейткіш үстеуі ... ... ... ... ... ... не ... Сұрағы: қалай? 
Мысалы:
өте:өте ADV ; ! "very"
орасан:орасан ADV ; ! ""
Сурет 3.13 – Күшейткіш үстеуі бойынша енгізілген сөздердің аудармасы
Мақсат үстеуі не ... ... ... ... ... ... ... A1 ; !"Use/MT"
әдейілеп:әдейілеп ADV ; ! ""
Сурет 3.14 – Мақсат ... ... ... сөздердің аудармасы
Себеп-салдар үстеуі қимылдың, іс-әрекеттің болу себебін білдіреді. Себеп-
салдар үстеуі не себепті? қалай? неге? деген сұрақтарға жауап береді.
Мысалы:
амалсыздан:амалсыздан ADV ; ! ... ADV ; ! ... 3.15 – ... үстеуі бойынша енгізілген сөздердің аудармасы
3.6.8 Еліктеу сөздерді сөздікке енгізу
Еліктеу сөздер — табиғат құбылыстары мен жан-жануарларда болатын әр
алуан дыбыстарға және олардың сын-сипат, ... ... ... ... # ;
Мұндағы:
% — Еліктеу сөз
Қазақ тілінде еліктеу сөздердің екі түрі бар:
• Еліктеу есту қабілеті арқылы пайда болған еліктеуіш ... ... IDEO ; ! ... Еліктеу көру қабілеті арқылы пайда болған бейнелеуіш сөздер. Мысалы,
жарқ:жарқ IDEO ; ! ... ... ... ... ... мағынасы жоқ, бірақ басқа сөз таптарымен
тіркесіп, сол сөз таптардың ... ... және ... сөз ... және ... ... сөз табы.
Шылаулар сөйлем мүшесі бола алмайды.
Атқару қызметіне байланысты ... 3 ... ... ... ... ... ... бір септікте тұрған сөзбен ғана тіркесіп
қолданылады. ... ... ... ... ... ... және ... мағыналарын айқындап, сөзден кейін
қолданылады. Зат есім, сын есім, сан ... ... ... ... ... ... POST
%: CLITICS-NO-COP
Мұндағы:
% — Септеулік шылау
Атау септікті меңгеретін септеуліктерге мысал:
туралы:туралы POST ; ! "about, concerning" + NOM
арқылы:арқылы POST ; ! "through, via, by means of" + ... ... ... мысал:
тарта:тарта POST ; ! "about, приблизительно" + DAT
жуық:жуық POST ; ! "about, ... + ... ... ... ... POST ; ! "since" + ... POST ; ! "after, ... then" + ABL
Көмектес септікті меңгеретін септеуліктерге мысал:
бірге:бірге POST ; ! "with" + INS
қатар:қатар POST ; ! "along with" + ... ... сөз ... ... ... ... # ... CS
%: # ;
LEXICON CA
%: CLIT-GHANA-ETC ;
Мұндағы:
% — Cалаластырғыш жалғаулық
% — Cабақтастырғыш жалғаулық
% — "Үстеу-жалғаулық"
Cалаластырғыш жалғаулықтар түрлері:
Ыңғайластық:
да:да CC ; ! "" ... CC ; ! ... CC ; ! ... CC ; ! ... CC ; ! "то ... , то ... ... CC ; ! ... ... түрлері:
Шарттық:
егерде:егерде CS ; ! "if"
Себеп-салдарлық:
өйткені:өйткені CS ; ! ... CS ; ! "that is, то ... CA ; ! ... CA ; ! ... ... # ... ... POSTADV ; ! "only" Dir/LR
тегіс POSTADV ; ! ... ... ... сөз табын сөздікке енгізу
Одағай –  толық мағынасы болмайтын, адамның түрлі ... ... ... сөздер.
 Одағайға тән негізгі белгілер:
• Лексикалық мағынасы болмайды;
• Сөйлемдегі басқа сөздермен грамматикалық байланысқа түспейді;
• Сөйлем мүшесінің қызметін атқара алмайды.
LEXICON INTERJ
%: # ... ... ... ... күй ... таңырқау, ренжу, өкіну, қуану мәнінде
қолданылады: 
әттеген%-ай:әттеген%-ай INTERJ ; ! ... INTERJ ; ! ... ... ... ... жекіру, көрсету я нұсқау, ұсыну мәнінде
айтылады: 
мә:мә INTERJ ; ! "here you go / take"
міне:міне INTERJ ; ! "here is, ... ... ... ... қуу, ... %-моһ:моһ %-моһ INTERJ ; ! ""
Қосымша қажетті тегтерді қарастырайық:
%— Детерминатив
%— Көмекші етістік
%— Копула
Тыныс белгілері келесі символдармен сипатталады:
%— Sentence ... ... ... үтір ... ... ... оң ... таңбасы (Quote marker)
%— сол жақтағытырнақша таңбасы (Quote marker)
%— оң жақтағыжақша таңбасы (Parenthetical marker)
%— сол жақтағыжақша таңбасы (Parenthetical marker)
4 Сөз ... ...... ... Сөз ... тәгтеу
Сөз таптарын тәгтеу (немесе жай ғана қысқарту үшін ... ... ... tagging) – сөз ... немесе басқа таңбалаудың
лексикалық класын қордағы әрбір ... ... ... ... ... ... ... қолданылады. Табиғи тілдерді тәгтеу бұл
компьютерлік тілдердің токенизация ... ... ... ... ... табиғи тілдегі тәгтеу әлдеқайда көпмағыналы болып табылады.
Таңбалаушылар яғни маркерлер таптарды ... ... және ... ... рөл ... ... 4 – Penn Treebank бойынша сөз таптарының тәгтері (тыныс белгілерін
қоса алғанда)
Мысалға, ATIS ... ұшақ ... ... ... ... ... әр ... тегтері көрсетілген, тегтер 1 ... DT NN ... that flight ... DT NN VB NN ... that flight serve dinner ?
Тіпті мұндай жай мысалдарда тәгтеу тривиальды болып табылмайды. Мысалы,
мұндағы book көпмағыналы сөз. Яғни оның ... сөз табы ... ... бар. Ол ... (book that Flight сияқты немесе to book the
suspect) ... зат есім ... ... (hand me that book ... a book of ... Тап сол ... that( as in Does that ... dinner ... ... ... ... немесе (I thought that your
flight was earlier сөйлемінде секілді) толықтыра алады. ... ... үшін ... ... осы ... ... табылады. [13]
Тәгтеу мәселесі қаншалықты қиын?
Ағылшын тілінде көп сөздер бір мағыналы болып табылады, яғни олар бір
ғана тегке ие. Бірақ ең көп ... ... көп ... болып табылады.
(мысалы, can көмекші +сөз (‘to be ... зат есім (‘a metal ... ... (‘to put ... in such a metal ... ... мүмкін.
Шын мәнінде Дероз 1988 ж. ... ... ... сөздерінің 40 %
көпмағыналы екенін хабарлайды. Франциска мен Кучердің 1982 ж. негізінде ол
көпмағыналықтың ... ... ... 5 – ... қорындағы көпмағыналық дәрежесі бойынша сөз ... ... 1988 ж. ... орай ... ... 40 %-ын көпмәнділік қасиетінен оңай
арылтуға болады. Себебі бір ... ... ... ... ... ... Мысалы, ағылшын тіліндегі а детерминант ... әріп ... ... немесе негізгі сөз бөлігі). Бірақ детерминант мәнінің
ықтималдылығы жоғары.
Тәгтеу алгоритмдерінің көбісі екі түрлі ... ... ... ... тегтер негізінде.
Тәгтер ережесі негізін деректер ... ... ... ... қасиетінен айыратын ережелер құрайды. Мысалы, а детерминантынан
кейінгі сөздің етістікке қарағанда зат есім болу ықтималдығы.
Ықтималды тәгтер ... ... ... ... ... ... өлшеуді үйретеді. Бұл әдіс максималды шындыққы ұқсас тәгтер
немесе Марков моделі деп ... ... Сөз ... ... ... ... сөз ... тағайындау алгоритмдері екі ... ... ... 1962 ж.; ... және ... 1963 ж.;
Грин және Рубин, 1971 ж.. Бірінші кезеңде сөздерді мүмкін болатын ... ... ... қоданылады.
ENGTWOL тәггері (Вутилайнен, 1995 ж.) екі кезеңді архитектураға
негізделген, алгоритм басына ... және ... ... ENGTWOL ... екі кезеңдік морфологияға негізделген. [13]
Кесте 6 – Воутилайнен (1995 ж.) және ... (1995 ж.) ... ... ... ... ... кестедегі көптеген функциялар салыстырмалы түрде өздеріне түсіндірме
болып келеді: SG-ерекше, SG3 үшінші жақтағы ... ... ... ... ... ... және ... шырайлары жоқтығын, NOMINATIVE атау
септігіндегі сөз екенін және PCP2 өткен шақтағы есімшені білдіреді (She
showed her the ... CENTRAL, және POST ... үшін ... ... а ... ... мағынасын білдіреді. SV, SVO, ... ... ... және е толықтырылған үлгілерін көрсетеді.
SV етісітктің тек ... ... (nothing ... SVO ... ... арқылы жасалады (I showed the film); SVOO субъект және ... ... ... ... ... кезеңінде, әр сөз екі-деңгей арқылы іске асырылады:
сөз түрлендіргіштер және мүмкін болатын барлық сөз таптарының ... ,Pavlov had shown that ... . . ... келесі тізімді
береді:
Pavlov PAVLOV N NOM SG ... HAVE V PAST VFIN ... PCP2 ... SHOWPCP2 SVOO SVO ... ... DEM ... CENTRAL DEM ... N NOM SG
. . .
1100 жуық шектеулер жиыны ... ... ... сөз ... шығару үшін
қолданылады, толықтаулау(CS) шектеулері контекстпен сай келмейтін тегтерді
шектетіу үшін қолданылады. ... бір ... ... күшейткіш)
мағынасынан басқаларды шектейді. Шектеулердің жеңілдетілген түрі:
ADVERBIAL-THAT RULE
Given input: ”that”
if
(+1 A/ADV/QUANT); /* if next word is adj, adverb, or ... ... ... /* and ... which is a sentence ... */
(NOT -1 SVOC/A); /* and the previous word is not a verb like ... ... which allows adjs as ... ... eliminate non-ADV tags
else eliminate ADV tag
Ереженің бірінші екі ... ... ... сын есім, үстеу, немесе
болуын болжайды. Басқа жағдайларда үстеу мағынасы аластаған. Соңғы ... есім не зат есім ... ... ... ... ... ... үшін устеу сияқты келесі дана болуы қажет:
I consider that odd.
Тағы бір ... ... ... ... ... ... толықтауышты
қажет етсе қоданылады. Бұл сипаттама ENGTWOL ... ... ... ... ... ... ықтималдығы бар. [13]
4.3 Сөз таптарын тәгтеуде жасырын Марков моделін қолдану
Тәгтерде ықтималдықты пайдалану өте ескі ... ... ... ... рет ... және т.б., 1965 ж.) ... толық
ықтималдылық тәггері Витерби дешифрлеуімен Бал және Мерсерде(1976 ... ... және ... ... тәггерлер 1980 жылдары
(Маршалл, 1983 ж.; ... 1987 ж.; ... ж.; ... 1988 ... ... ... ... үшін не сөздер тізбегі үшін, жасырын Марков ... ... ... ... ... ... n ... ... ... ... ... ... бір сөз үшін емес, толық сөйлем үшін
таңдайды. ЖMM тәггердің сөзді ... ... ... теңдеуді
келтірейік, сосын мысал қарастырайық.
ЖMM теггер-биграммасы wi сөзі үшін , ... тәг ti-1 ... ең ... ... ti ... таңдайды.
(2)
Төменде келтірілетін бірнеше жеңілдетілген Марков болжамдарынан соң,
ЖMM теггерінің бір тәг үшін арналған негізігі теңдеуін (2) ... ... ... ... мысал
Мысал ретінде, келесі сөйлемдерді қолданамыз:
«Теледидардан кешегі жарысты көре алмадым.»
«Таңертең балалар жарысты.»
Бірінші мысалда «жарысты» сөзі ... зат есім ... ... сөйлемде етістік болып табылады. Мысалдың мақсаты ретінде,
сөйлемдегі ... ... ... ... ... деп ... тәггердәі мақсаты келесі тізбек үшін ең ықтимал болатын ... ... ... ... теңдеудің біздің мысалда қалай қолданылатынын қарастырсақ. Егерде ... үшін ... ... ... пайдаланатын болсақ, онда бізге екі
нұсқадан ... ... ие ... ... ... ... ... ... |ЗАТ ... ... ... және оның үлгілері (4) және (5) теңдеулерінің ... ... ие: ... ... ... тәгі және ... ... Жарысты үшін, P(ЕТІСТІК|ҮСТЕУ) және P(ЗАТ ЕСІМ|ҮСТЕУ)
ықтималдылықтар тізбегінің тәгтері ... ... зат есім не ... ... қандай?» деген сұраққа жауап береді. Үстеуден кейін етістікке
қарағанда, зат есім келу ықтималдығы жоғары:
P(ЕТІСТІК|ҮСТЕУ) = ... ... = ... теңдеуінің екінші бөлігі және оның үлгілері (4) пен (5) теңдеулері
лексикалық ықтималдылық болып ... ... зат ... ... ... және ... |ЗАТ ЕСІМ) тәгтерін
тағайындайды. Назар аударсаңыз бұл ықтималдылық ... ... тәгі ... не ... болу ... ... ... сұраққа жауап бермейді.
Яғни ықтималдылық P(ЕТІСТІК|жарысты) ... ... ... ... ... ... Ықтималдылық сәл парадоксты,
«Егерде тәг зат есім не етістік болады деп ... онда бұл ... ... ықтималдылығы қандай?» деген сұраққа жауап береді:
P(жарысты |ЕТІСТІК) = 0,00003
P(жарысты |ЗАТ ... = ... біз ... ... пен ... ... ... онда ЖMM тәггердің жай ғана биграмма нұсқасы жарысты ... ... ... дұрыс тәгтейтініне куәміз.
P(ЕТІСТІК|ҮСТЕУ)P(жарысты ... = ... ... |ЗАТ ... = 0,00001
4.4 ЖMM тәгтеу үшін өзекті алгоритм
Нақты ЖMM ... ... үшін ... тәгті таңдау жай ғана
емес,бірақ бүкіл сөйлем үшін ... ... ... ЖMM ... ... теңдеуді қарастырайық, Витерби тепе-теңдігін жасаймыз және әр сөйлем
үшін ықтималдылығы жоғары тәгтер тізбегін таңдаймыз. [13]
Бұл тәсілдеме, біздің әр ... үшін ең ... T ... tn ... (W) ... ... ... есептемек болғанымызды болжайды.
(6)
Байес заңы бойынша келесіні білдіреді:
(7)
Осылайша, арттыратын тәгтер ретін таңдауға ... ... ... тізбегін ескере отырып, сөйлем үшін ықтималдығы жоғары
тәгтер тізбегін іздейміз, P(W) сөз ... ... әр ... үшін ... және оны ... ... ... тізбегінен:
(10)
Сөздер тізбегінің ықтималдылығын модельдеу үшін N-грамм болжамын
жасаймыз. Триграмма моделі жиі ... ... ... ... оның тәгіне тәуелді екеніне жеңілдетілген болжам жасаймыз:
(11)
Келесіде, біз тәг ... ең ... екі ... ... ... деген болжам жасаймыз.
(12)
Осылайша, біз арттыратын тәг ретін таңдаймыз:
(13)
Әдеттегідей, біз осы ... ... үшін ... ... ... бағасын қолдана аламыз.
(14)
(15)
Бұл модель, сондай-ақ нөлдік ықтималдықты болдырмау үшін тегістелген
бола алады.
Ең ықтимал тәг ретін табу ... ... ... мүмкін. Уэйшедель
соавт. (1993 ж.) және Дероз (1988 ж.) бұл алгоритм үшін дәлдігі 96% жоғары
екенін хабарлады. ... ... ... ... ... ... ... түрлері
мен жүйелері, олардың жұмыс істеу принциптері, машиналық ... ... ... ... ... түрде аналитикалық талдау жасалды.
Қазіргі уақыттағы машиналық аударма жүйесінің түрлері келтіріліп, машиналық
аударма және аударма жады түсініктері ... ... ... жүйесі жайлы жалпы түсінік қалыптастырылды.
Apertium платформасының ... ... Әр ... жұмысына
сипаттама берілді.
Жаңа тілдік жұп сөздіктер негізінде ... сол ... ... қарастырылды. Сөздіктер түрлері:
• Морфологиялық сөздіктер
• Екі тілді ... ... ... ... ... ... ... құрылымы анықталып,
талданды.
Дипломдық жұмыста сөздік құрумен байланысты туындайтын ... ... ... құру ... ... бір ... және
екітілдік сөздіктерге енгізу, олардың мінездемесін талдау, тексеру және ... ... ... ... ... ... ... тигізетін
парадигмаларды құру және т.б. үдерістер.
Сөздіктерге қатысты ... ... ... ... ... тілді орыс тілі сөздігін құру алгоритмі келтірілді. Сөздікті
құрайтын элементтер мен тәгтерге сипаттама мен ... ... ... ... құру ... ... ... және есімдік сөз
таптарын енгізу ерекшеіктері талқыланды, мысалдар ... тіді ... тілі ... құру ... ... ... ... жаңа сөздер сөз таптары бойынша енгізілді. Әр сөз таптары бойынша
сөздерді енгізу ерекшеліктері қарастырылды. Мысалдар ... ... ... сөз ... ... мәселесі қарастырылды.
Сөз таптарын тәгтеу және тәгтеу ережелері қарастырылды. ЖММ бойынша тәгтеу
алгоритмі келтірілді.
Apertium платформасының негізінде қазақ-орыс тілі ... ... ... ... әр сала бойынша термин ... ... жаңа ... ... ... қазақ тілінен орыс тіліне және
орыс тілінен қазақ тіліне сөздерді аудару үшін қолданылатын ... ... ... ... ... Ю.В. ... сложность текста как фактор ... – М.: ... ... ... 1988.
2 Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы
с ангилийского языка на русский. – ... ... ... S., Wilks Y. Machine ... in 50 ,1986 г. стр. 3
4 Melby, Alan. The Possibility of ...... – С. ... ... А. ... на ... переводчика // Подводная лодка. –
1998, № 6.
6 Молчанов А. ... и ... ... ... в технологиях
компании PROMT // Control Engineering Россия. – 2013.
7 Матенова Г.Д. Қазақ тілі мен орыс тіліндегі айырмашылықтыр және ... ... ... ... – 2015. – ... (қаралған күні: 12.02.2015)
8 Аханов К. Тіл білімінің ...... ... 1993. – 542 ... ... С. ... қазақ тіліндегі сөздердің грамматикалық сипаты. –
Алматы: Рауан, 1998. – 303 б.
10 ... Ә. ... ... ...... Қазақ
энциклопедиясы,1998.
11 Ortiz-Rojas S., Forcada M.L., Ramírez-Sánchez G. ... ... ... de ... de letras a partir de ... ... // Procesamiento del Lenguaje Natural. – 2005. – № 25. – ... Garrido А., ... А., ... S. A compiler for ... and generators based on finite-state transducers // Procesamiento
del Lenguaje Natural. -1999. – № 25.P. ... Jurafsky D., Martin J.H. Speech And Language ... ... Таерз. Знакомство с системой Apertium [Электрон. ресурс]. –
2012. – ... ... ... ... Руководство по созданию новой языковой пары [Электрон. ресурс]. –
2015.– URL: ... ... ... ... Машинный перевод [Электрон. ... – 2015.– ... ... ... ... ... ... корпусы
Аударма тілдің корпусы
Мақсатты тілдің корпусы
Базалық RBMT-жүйенің аудармасы
Аударманың статистикалық моделі
Мақсатты тілдің статистикалық моделі
Аударманың статистикалық моделі
Мақсатты ... ... ... ... теріп-түзетудің модулі
Негізгі сөйлемнің RBMT-аудармасы
Гибридті аударма
Негізгі сөйлем
Source text
de-formatter
separates text to be translated from any ... ... the format ... ... by the ... ... text in surface forms and delivers one or more lexical forms ... one
postgenerator
perfoms orthographical operations such as contractions and apostrophations
part-of-speech tagger
chooses one lexical form for those words having more than ... ... a ... surface form for each ... ... transfer
delivers for each source-language lexical form the corresponding target-
language lexical form
structural transfer
detects fixed-length patterms of lexical ... them ... ... ... the most ... translation in a given context out of the
possible translations
Target text
de-formatter
кез келген форматталған ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ... ... ... ... нысандарда мәтінді белгілермен жабдықтайды және әрқайсысы үшiн бiр
немесе одан көп лексикалық формаларын береді
postgenerator
қысқарту сияқты орфографиялық операцияларды орындайды
part-of-speech ... ... ... ... бар ... ... таңдайды
morphological generator
әрбір мақсатты тілдің лексикалық формасы үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің ... ... ... ... ... тіркелген-ұзыныдығын анықтап,оларды бөлімдерге
жіктейді,қайта өңдеуді орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең ... ... ... ... ... ... форматталған ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ақпаратты қалпына келтіреді
morphological ... ... ... ... ... және әрқайсысы үшiн бiр
немесе одан көп лексикалық формаларын береді
postgenerator
қысқарту сияқты орфографиялық операцияларды орындайды
part-of-speech tagger
бірден астам лексикалық формасы бар сөздерге ... ... ... ... тілдің лексикалық формасы үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына ... ... ... ... ... формалардың тіркелген-ұзыныдығын анықтап,оларды бөлімдерге
жіктейді,қайта өңдеуді орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең ... ... ... ... ... келген форматталған ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ақпаратты қалпына келтіреді
morphological analyser
беттік нысандарда мәтінді белгілермен ... және ... үшiн ... одан көп ... ... ... ... орфографиялық операцияларды орындайды
part-of-speech tagger
бірден астам лексикалық формасы бар сөздерге біреуін таңдайды
morphological generator
әрбір мақсатты тілдің ... ... үшін ... ... ... қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің лексикалық
формасын сәйкесінше ... ... ... ... ... бөлімдерге
жіктейді,қайта өңдеуді орындайды т.б.
lexical selection
мүмкін болатын ... ... ең ... ... ... ... мәтін
de-formatter
кез келген форматталған ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ақпаратты қалпына келтіреді
morphological analyser
беттік нысандарда мәтінді белгілермен жабдықтайды және ... үшiн ... одан көп ... ... ... ... орфографиялық операцияларды орындайды
part-of-speech tagger
бірден астам лексикалық формасы бар ... ... ... ... ... ... ... формасы үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің лексикалық
формасын сәйкесінше ... ... ... ... ... ... өңдеуді орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең ... ... ... ... келген форматталған ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу ... ... ... ... ... ... analyser
беттік нысандарда мәтінді белгілермен жабдықтайды және әрқайсысы үшiн бiр
немесе одан көп лексикалық формаларын береді
postgenerator
қысқарту сияқты орфографиялық операцияларды орындайды
part-of-speech tagger
бірден ... ... ... бар ... ... ... ... мақсатты тілдің лексикалық формасы үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің лексикалық
формасын ... ... ... ... ... ... ... өңдеуді орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең қолайлы аударманы таңдайды
Негізгі ... ... ... ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ақпаратты ... ... ... ... ... ... жабдықтайды және әрқайсысы үшiн бiр
немесе одан көп лексикалық формаларын береді
postgenerator
қысқарту сияқты орфографиялық ... ... ... астам лексикалық формасы бар сөздерге біреуін таңдайды
morphological generator
әрбір ... ... ... формасы үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің лексикалық
формасын сәйкесінше береді
structural ... ... ... анықтап,оларды бөлімдерге
жіктейді,қайта өңдеуді орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең ... ... ... ... ... ... ... ақпараттан аудару үшін мәтінді анықтайды
reformatter
де-пішімдеу арқылы қамтылған форматты ақпаратты қалпына келтіреді
morphological analyser
беттік нысандарда мәтінді ... ... және ... үшiн ... одан көп ... формаларын береді
postgenerator
қысқарту сияқты орфографиялық операцияларды орындайды
part-of-speech tagger
бірден астам лексикалық формасы бар сөздерге ... ... ... ... ... ... ... үшін мақсатты тілдің беткі
формасын қамтамасыз етеді
lexical transfer
әрбір негізгі-тілдің лексикалық формасына мақсатты-тілдің лексикалық
формасын сәйкесінше береді
structural transfer
лексикалық формалардың тіркелген-ұзыныдығын ... ... ... орындайды т.б.
lexical selection
мүмкін болатын аудармалар тұрғысынан ең ... ... ... мәтін
Мақсат
мәтін

Пән: Тілтану, Филология
Жұмыс түрі: Дипломдық жұмыс
Көлемі: 57 бет
Бұл жұмыстың бағасы: 1 300 теңге









Ұқсас жұмыстар
Тақырыб Бет саны
«қазақ тілінен ағылшын тіліне машиналық аударудың лингвистикалық сөздіктерін apertium платформасының негізінде жасау»33 бет
1.Түркітануға байланысты алғашқы зерттеулер. 2.Орыс ғалымдарының түркітануға байланысты зерттеулері. 3.ХХ ғасыр басындағы түркітану тарихы5 бет
17 ғ-дың соңы — 18 ғ-дың басында Қазақстанды орыс ғалымдарының зерттей бастауы10 бет
VII-XI ғ Оңтүстік және Батыс славяндар.Ежелгі орыстар мемлекетінің құрылуы. Киевская Русь. Крест жорықтары. Қалалардың дамуы.Крестшілердің мемлекеті8 бет
XIX ғасыр тіл біліміндегі лингвистикалық мектептер мен бағыттар4 бет
XVI-XVIII ғасыр лингвистикасы. в.ф.гумбольдтың лингвистикалық көзқарастары12 бет
XVI-XVIII ғғ. Қазақ-Орыс қарым-қатынастарының зерттелуі мен елшіліктер тарихы10 бет
Xvi-xviіі ғғ. қазақ-орыс елдері арасындағы дәстүрлі елшілік байланыстар тарихы10 бет
XVIII ғ Қазақ-орыс қатынасы9 бет
XVIII ғасырдың соңы мен XX ғасырдың басындағы Қазақстанды еуропа және орыс ғалымдарының зерттеуі37 бет


+ тегін презентациялар
Пәндер
Көмек / Помощь
Арайлым
Біз міндетті түрде жауап береміз!
Мы обязательно ответим!
Жіберу / Отправить


Зарабатывайте вместе с нами

Рахмет!
Хабарлама жіберілді. / Сообщение отправлено.

Сіз үшін аптасына 5 күн жұмыс істейміз.
Жұмыс уақыты 09:00 - 18:00

Мы работаем для Вас 5 дней в неделю.
Время работы 09:00 - 18:00

Email: info@stud.kz

Phone: 777 614 50 20
Жабу / Закрыть

Көмек / Помощь