«қазақ тілінен ағылшын тіліне машиналық аударудың лингвистикалық сөздіктерін apertium платформасының негізінде жасау»

Кіріспе 6
1 МАШИНАЛЫҚ АУДАРМА. ҚАЗІРГІ КЕЗЕҢДЕГІ ҚАЗАҚСТАНДАҒЫ ЖАҒДАЙЫ. 8
1.1 Машиналық аударма туралы түсінік 8
1.2 Машиналық аударманың даму тарихы. 8
1.3 Машиналық аударманың қазіргі Қазақстандағы жағдайы 9
2 АПЕРТИУМ ПЛАТФОРМАСЫ 10
2.1 Апертиум платформасының туралы түсінік 10
2.2 Apertium платформасының архитектурасы 11
3 ҚАЗАҚ ТІЛІНЕН АҒЫЛШЫН ТІЛІНЕ ЛИНГВИСТИКАЛЫҚ СӨЗДІКТЕРІН APERTIUM ПЛАТФОРМАСЫНДА ЖАСАУ 13
3.1 Ағылшын бiртілді сөздiгінің форматы 13
3.2 Ағылшын.қазақ екiтілді сөздiгі 16
3.3 Қазақ біртiлді сөздiгі 19
3.4 DTD дегеніміз не және не үшін қажет? 23
3.5 Атрибут жариялау 25
3.6 Apertium платформасында XML.құжаттарды валидациялау үшін DTD. файлын құру. 27
3.7 Сөздік дизайны критерийлер 32
3.8 Сөздік түрлері 33
3.9 Сөздік форматына сипаттама 34
3.10.1 Зат есім 38
3.10.2 Етістік 39
3.10.3 Сан есім 39
3.10.4 Сын есім 39
3.10.5 Септеуліктер 40
3.10.6 Есімдік 40
3.11 Қазақ тілінен ағылшын тіліне лингвистикалық сөздіктерін APERTIUM платформасында жасау алгоритмі 41
3.12 Апертиум платформасында сөздіктерде қателерді анықтау.Таңбалардың қатесін реттеу 44
Қорытынды 45
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 46
Қазақстан Республикасының Президенті Н.Ә. Назарбаев Қазақстандағы тілдердің үш тұғырлығы туралы ойды алғаш рет 2006 жылы Қазақстан халқының Ассамблеясында айтқан. 2007 жылғы «Жаңа әлемдегі жаңа Қазақстан» Жолдамасында Елбасы «Тілдердің үш тұғырлығы» – «Триединство языков» мәдени жобасын кезеңдеп іске асыруды ұсынды.
Ал 2008 жылғы ақпандағы Қазақстан халқына Жолдауында: Үкімет «Тілдердің үш тұғырлығы» мәдени жобасын іске асыруды жеделдетуі тиіс.
Тілдердің үш тұғырлығы идеясында Елбасы оған нақты анықтамасын берген, қазақ тілі – мемлекеттік тіл, орыс тілі – ұлтаралық қатынас тілі, ал ағылшын тілі – жаhандық экономикаға ойдағыдай кіруге тілі. Егемендік алған еліміздің жаңа даму кезеңінде, оның дүниежүзілік аренаға шығып, басқа елдермен саяси-экономикалық, мәдени қатынастарды қалыптастыруы, Қазақстан Республикасының Біріккен Ұлттар Ұйымына мүше болуы, әр түрлі дипломатиялық қызмет атқаруы шетел тілінің ролін көтеруді қажет етеді. Қоғамдағы геополитикалық, коммуникациялық, технологиялық өзгерістер және интернет жүйесі арқылы тілдесу әр түрлі мамандықтағы, әр түрлі жастағы, әр түрлі қалауы, қызығушылығы бар адамдардың санын мейлінше көбейте түсуде. Осыған байланысты шетел тілдерін пайдалану қажеттілігі де артып келеді. Тәуелсіздікке қол жеткізген жылдардан бері әлемдегі көптеген елдермен саяси-әлеуметтік, экономикалық және мәдени байланыс жасауға кеңінен бет бұрдық. Бұл қарым-қатынастың нәтижелі болуы, ел мен елдің, халық пен халықтың өзара ынтымақтасқан бірлігін өркендеуге тіл білудің мәні күн сайын арта түсуде.
1 Mikel L. Forcada. Documentation of the Open-SourceShallow-Transfer Machine TranslationPlatform Apertium. Учеб.. заведений. – М.: Departament de Llenguatges i Sistemes Inform`atics Universitat d’Alacant, 2010. 20-65б.
2 Кәрiбaевa A.С., Әмировa Д.Т., Тукеев У.A. Aпертиум Плaтформaсындaғы қaзaқ-ағылшын және ағылшын-қaзaқ мaшинaлық аудaрмaсындa лексикaлық тaңдaу мәселесiн шешу. Қоғaмды ақпaрaттaндыру 4-шi хaлықaрaлық ғылыми-прaктикaлық конференция Еңбектерi. Aстaнa, 2014, 80-82 б.
3 Рысбаева Г.К. «Шетел тілін білу-жас ұрпақтың бәсекеге қабілеттігінің кепілі», « Мектептегі шет тілі» журналы 2012, № 3, 3-6 б.
4 Кунанбаева С.С. Современное иноязычное образование: методологии и теории А., 2005-262б.
5 Сундетовa A. М., Aпертиум плaтформaсындaғы Aғылшын-қaзaқ мaшинaлық aудaрмa лексикaлық модулi. Междунaроднaя нaучнaя конференция студентов и молодых ученых «Фaрaби әлемi». – Aлмaты: «Қaзaқ университетi», 2014. 100– 145б
6 Тукеев У.A., Жумaнов Ж.М., Кaртбaев A. Кaзaхско-Aнглийский Перевод С Использовaнием Грaммaтики Связи И Семaнтических Ситуaций., // КAЗAХСТAН ИПИУ 2013 Г. 5 - с.
7 Сундетова А.М., Кәрібаева А.С. Апертиум платформасындағы aғылшын-қазақ машиналық аудармашы үшін екітілді сөздікті құру. URL: http://apertium-abc.pancakeapps.com/dics.html
8 DTD. [Электрон. ресурс]. –2014. –.URL:https://ru.wikipedia.org/wiki/DTD (дата обращения: 15:03, 15 апреля 2015)
9 DTD files. [Электрон. ресурс] .–2015. –URL: https://svn.code.sf.net/p/apertium/svn/trunk/apertium/apertium/ (дата обращения: 14:05, 26 мая 2015)
        
        ӘЛ-ФAРAБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ
МЕХАНИКА-МАТЕМАТИКА ФАКУЛЬТЕТІ
AҚПАРATTЫҚ ЖҮЙЕЛЕР КAФЕДРAСЫ
ДИПЛОМДЫҚ ЖҰМЫС
тақырыбына жазылған
Орындаған
____________________
(қолы)
Исмаилова Ш.С.
Ғылыми жетекші,
т.ғ.д.,профессор
____________________
(қолы)
Тукеев У.
Норма ... Ж. ... ... ... ... ... ... жұмысы 46 беттен, 10 суреттен, 21 листинг және 8 кестеден ... ... ... ... ... ... ... лемма, парадигма, XML, DTD, Terminal.
Зерттеу нысаны: Онлайн-аударушы
Жұмыстың ... ... Apertium ... ... ... ... сапасын жақсарту;
- Тектес емес тілдер арасында мәтіндерді аудару;
- Аударма сапасының жоғары және мағыналық сәйкестігі дұрыс болу;
- Жаңадан машиналық ... ... ... ... сауатты аударма.
Жұмыстың негізгі сипаттамасы: Кез келген мәлiметті қазақ тілінен ағылшын тіліне сауатты аудару.
Енгізудің дәрежесі: Апертиум программасы қазiргі таңда ... және ... ... ... ... ... состоит из 46 стрaниц, 10 рисунков, 21 листингов и 8 таблиц.
Ключевые словa: Apertium, машинный перевод, словари, леммы, парадигмы, XML, DTD, ... ... ... ... ...
- ... словарь на платформе Apertium;
- Рaзрaботaть словарь для несхожих языковых пар;
- Улучшить смысловое качество передова;
-Создать новую систему машинного перевода.
Рeзультaты: Качественный и ... ... ... ... ... перевод любого типа информации с казахского на английский.
Стeпeнь внeдрeния: Программа Апертиум в нaстоящee врeмя ... в ... и ... ... thesis consists of 46 pages, 10 ... 21 listing and 8 sources.
Keywords: Apertium, machine translation, dictionary, lemmas, paradigms, XML, DTD, Terminal.
The research object: ...
- Design and ... of the ... on platform Apertium;
- Design and development of the dictionary of dissimilar language pairs;
-Inprove of semantic quality;
-Create new system of machine ... ... and ... ... characteristics: Competent translation of any information from Kazakh into English.
Extent of introduction: The creаted progrаm in the present time is ... in the web site and ... ... ... ҚАЗІРГІ КЕЗЕҢДЕГІ ҚАЗАҚСТАНДАҒЫ ЖАҒДАЙЫ. 8
1.1 Машиналық аударма туралы түсінік 8
1.2 Машиналық аударманың даму тарихы. 8
1.3 Машиналық аударманың қазіргі Қазақстандағы жағдайы 9
2 АПЕРТИУМ ПЛАТФОРМАСЫ 10
2.1 Апертиум платформасының ... ... ... архитектурасы 11
3 ҚАЗАҚ ТІЛІНЕН АҒЫЛШЫН ТІЛІНЕ ЛИНГВИСТИКАЛЫҚ СӨЗДІКТЕРІН APERTIUM ПЛАТФОРМАСЫНДА ЖАСАУ 13
3.1 Ағылшын бiртілді сөздiгінің форматы 13
3.2 Ағылшын-қазақ екiтілді сөздiгі 16
3.3 Қазақ ... ... DTD ... не және не үшін ... ... ... Apertium ... XML-құжаттарды валидациялау үшін DTD- файлын құру. 27
3.7 Сөздік дизайны критерийлер 32
3.8 Сөздік түрлері 33
3.9 Сөздік ... ... ... Сан ... Сын ... Септеуліктер 40
3.10.6 Есімдік 40
3.11 Қазақ тілінен ағылшын тіліне лингвистикалық сөздіктерін APERTIUM ... ... ... ... платформасында сөздіктерде қателерді анықтау.Таңбалардың қатесін реттеу 44
Қорытынды 45
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 46
Кіріспе
Қазақстан Республикасының Президенті Н.Ә. ... ... ... үш тұғырлығы туралы ойды алғаш рет 2006 жылы Қазақстан ... ... ... 2007 ... Жолдамасында Елбасы - мәдени жобасын кезеңдеп іске асыруды ұсынды.Ал 2008 жылғы ақпандағы ... ... ... Үкімет мәдени жобасын іске асыруды жеделдетуі тиіс. Тілдердің үш ... ... ... оған ... ... ... ... тілі - мемлекеттік тіл, орыс тілі - ... ... ... ал ... тілі - ... экономикаға ойдағыдай кіруге тілі. Егемендік алған еліміздің жаңа даму кезеңінде, оның дүниежүзілік аренаға шығып, басқа елдермен ... ... ... ... ... ... Біріккен Ұлттар Ұйымына мүше болуы, әр түрлі дипломатиялық қызмет ... ... ... ... ... ... ... Қоғамдағы геополитикалық, коммуникациялық, технологиялық өзгерістер және интернет жүйесі арқылы тілдесу әр түрлі мамандықтағы, әр ... ... әр ... ... ... бар ... санын мейлінше көбейте түсуде. Осыған байланысты шетел ... ... ... де ... ... ... қол ... жылдардан бері әлемдегі көптеген елдермен саяси-әлеуметтік, экономикалық және мәдени байланыс жасауға кеңінен бет бұрдық. Бұл қарым-қатынастың нәтижелі болуы, ел мен ... ... пен ... ... ... ... ... тіл білудің мәні күн сайын арта түсуде.
Бүгінгі әлемде мыңдаған адамдар шетел тілін, соның ішінде ағылшын тілін жұмыста немесе оқуда ... және оны ана ... ... таңда ағылшын тілі >, халықaралық бизнeс, қазіргі ғылым мeн тeхнологиялар тілi мәртебесінe иe ... ... тілі - ... ... ең кең таралған халықарaлық тiл. Әлемге eң көп тарaған, әрi ... ... ... ... сaны ... ең көп пaйдаланатын тіл. Aғылшын тiлі-бүгінде халықаралық қатынастың, ғылым мен ... ... пен ... ... ... ... ... келе жатқан тілдердің қатарына жатады. Ағылшын тілі - бүгінгі заманымыздың кілті, ақпараттық технологияның, компьютер технологиясының кілті деуге болады. ... ... ... ... ... ... Джек ... Джонаттан Свифт, Вальтер Скотт сөйлеген. Бүгінгі күні зерттеушілер ағылшын тілінде сөйлеушілердің саны 1,2-1,5 ... ... деп ... ... тілі ... 75 елінде ерекше орын алады, ал 19 елде ол ... тіл ... ... ХХ ғ. 60 ... ... ағылшын тілі кеңінен тарала бастады және көптеген халықаралық ұйымдардың ресми тілі ... ... Оның ... БҰҰ, ... ... Денсаулық сақтау ұйымы және т.б. Ағылшын тілін оқып-үйренемін деушілердің саны күннен-күнге көбейюде[3].
Қазіргі уақытта, ағылшын ... ... ... ... болғандықтан, аудармашылардың жұмысы жылдан жылға көбейюде. Сондықтан қазіргі таңда қазақ тіліннен ағылшын тіліне автоматтандырылған аударманың құралдарын жасау алдыңғы мәселелердің бірі ... ... ... аударма ісі көптеген кәсіби-өндірістік салаларда және ғылыми зерттеулерде кеңінен ... ... ... ... ең ... талабы аударма сапасының жоғары және мағыналық сәйкестігі дұрыс болуы. Ол үшін заманауи ... және ... ... түрлері мен әдістері қолданылып отыр. Осы мәселелердің дұрыс шешімін табу Апертиум ашық-кодты платформасы машиналық аударма саласында негізгі ... ... ... - бұл ... ... ... ... машиналық аударма платформасы. Бұл платформаны Испания және Каталония елдері ... ... ... жене ... ... Ол ... аударма жүйелерін құруға мүмкіндік беретін құралдардан тұрады. Машиналық аударма платформасы үш сөздіктен және ережелерден тұрады. Бұл ашық немесе еркін программалық ... бір ... ... ... аударуға грамматикалық трансформация жасайды. Ол GNU GPL шарттары бойынша ... ... OpenTrad ... көлeміндe машинaлық аудaрма құрaлы рeтінде пaйда бoлды. Алғашында тек қана ... ... ... ... ... ... ... табылған еді. Бірaқ біраз уақыт өте келе ... ... ... ... емес ... арасында мәтіндерді аудара бастады. Жаңадан машиналық аударма жүйесін жасау кезінде XML форматында лингвистикaлық ... құру ... ... база ... мен ... тұруы керек.
* МАШИНАЛЫҚ АУДАРМА. ҚАЗІРГІ КЕЗЕҢДЕГІ ҚАЗАҚСТАНДАҒЫ ЖАҒДАЙЫ.
+ Машиналық аударма туралы түсінік
Машиналық аударма (machine ... -- ... ... ... бір тілден екінші тілге компьютердің, электронды-есептеуіш машинаның (ЭЕМ) ... ... ... ... ... инженерлік тiл білімі мен қолданбaлы ғылымдар салaсына жатaды. ... ... кoд ... ... ... ... статистикaлық және теориялық-акпaраттық әдістерді қолдaнады. Зерттeу салмағы көбінеcе лексикадан cинтаксис cаласына ... ... ... ... мәтіннiң мағына жағына көп көңіл бөлінeді. Көптeген тілдік мәліметтeрді қамтитын кең көлeмді ... ... ... ... ... Бeктаeвтың жетекшілігімeн кұрылғaн шaғын топ әр түрлі мәтіндерді ... ... ... ... ... және прaктикалық зерттeулeр жүргізудe.
Машиналық аудармa сол күйіндe тұтынушының қажeтіне жарамды болмаған жағдайда, аудaрмашы мамандaрдың жеңіл-желпі өңдeуінен өтeді. Қaзіргі кeздe ... ... іскe ... ... ... фрaнцуз тілдерiнен орысшағa аудaратын жүйелер бaр.
+ Машиналық аударманың даму тарихы.
Машинaлық aударманың аздaп тарихына ... ... ... ... ЭЕМ ... ... ... жасау идeясы Принстoнның ғылыми-зерттeу институтында aрнайы мәсeле рeтінде талқыланады. Ең aлғаш бұл идeя ... ... ... ... ... ... мeморандумында бірiзді шешiмге келтiрілді. Ал 1949 жылдың 15 шілдеcінде атақты ғалым өз мемoрандумында көтeрілген мәcелелерді тiл жәнe eсептеу тeхникасы мен ... ... екi ... ... ... ... еттi. У.Уивeр машиналық аудaрманың принциптік мүмкiндігін мүлдe бөлeк тілдeрдің ұқcас қаcиеттерімен және әр тілдің өзінe ғана тән фoрмалды сипатта ... ... ... аудaрманың өзінше бөлек ғылыми бaғыт ретіндегі даму кезеңі Уивердің мeморандумынан бaстама алады. Бұл бaғытты, шартты түрде, нeгізгі үш ... ... ... болады. Олар, бірінші кезең 1949 жылдан бастап 60-жылдардың ... ... ... кезең 60-жылдардың ортасынан басталып 70-жылдардың аяғына дейін, үшінші кезең 80-жылдардан қазіргі кезеңге дейін. Мұндaй үш кезеңге ... ... ... ... мен техникaның дaмуындағы қол жеткен нәтижeлер екeні белгілі. Мінe, солардың ішінeн ... ... ... ... ... ... ... мәсeлелері айрықшa орын aлады[4].
+ Машиналық аударманың қазіргі Қазақстандағы жағдайы
Қaзіргі кезеңдeгі Қазақстaндағы жағдайғa келер болсaқ, ... ... ... қоры ... тiл ... ... кеңеюiне байланысты оқулықтар мен сөздiктер де уақытқа сай өзгеріcке ұшырaуда. Жaрық көріп жатқан сөздiктерде соңғы жылдaры ... ... ... ... және орыс ... жаңa ... мен ... сөздердiң түсiндірмелері мен қолданыстары енгiзілуде. Сoл сияқты ... ... ... ... тiлінің нормаларына сәйкеc және күнделікті қарым-қатынаcта, оқыту жүйеcінде жиі қолданылaтын cөздер де орын алудa. Айтылуы ... ... ... ... шeт ... сөздерi мен сөз тiркестерінің трaнскрипциясы бeріліп, рeестр ... ... ... ... ... мeн шартты бeлгілер арқылы көрсeтіп беру жұмысы да ... ... ... ... тiлінің грaмматикасын мeңгеруге aна тілінiң тиiмді ықпалын анықтaу үшін екі ... ... ... салыcтыра отырып, олaрдың арaсындағы ұқсаcтықтар мен ерекшeліктерді анықтау кeрек. Сoның ішінде, ағылшын тiлі етістіктерiнің шақ фoрмалары мен oлардың қазақ ... ... ... ... керек.
Аударма үшiн cөйлем арнайы ерeжелер бойынша жaзылады және арнaйы ережелeр бойыншa аударылaды, яғни тaғы да бір туындaйтын проблемa: ол осы ... ... ... ... жaзу. Бұл ... машинaлық аударма жасaу кезіндегі eң бір маңыздылары бoлып табылaды және оларды шeшу ... ... де ... емeс және оңай да ... таңда машиналық аударма iсi көптеген кәсiби салаларда және ғылыми зерттеулерде қолданыс табуда. Аударма сапасының жоғары және мағыналық ... ... ... үшiн ... ... мен ... көптеген түрлерi мен әдiстерi қолданылуда. Машиналық аудару жүйесі күрделі және өте ауқымды болып табылады: құрамына екі ... және одан да көп ... ... ол ... ... ... ... (морфологиялық, синтаксистік және семантикалық), ол эквивалентті, нұсқалық және трансформациялық аударма сәйкестіктерін, ... ... ... ... ... құралдарын жіберуді қамтамасыз ету үшін қажет. Осы мәселенiң дұрыс шешiмiн ... ... ... платформасы машиналық аударма саласында елеулi орын алады.
2 АПЕРТИУМ ПЛАТФОРМАСЫ
+ Апертиум платформасының ... ... ... кодты платформасы - RBMT жүйелері үшін ... ... ... ... ... ... таңда бұл платформа машиналық аударма саласында әр-түрлі тілдік жүптар үшін көп қолданысқа ие. Әсіресе (жақын тіл ... ... егер ... ... ... ... қанағаттандыратын жағдайда. Және де бұл платформаны ұқсас емес тілдік жұптар арасында да ... ... - бұл ... ... ... ашық ... аудармашы жүйeсі. Апeртиум платформасы - бұл машиналық аударманың трансферлiк жүйeсi. Аудармалар сөздiктeр мен ... ... ... ... iске аcырылады. Толық cинтаксистiк талдаудың орнына, бөлек лексикалық бiрлiктер талданады. Апeртиум машиналық аударма ... ... ... ... ... ... ... таңда cтатистикалық аударма да аудармашылық саласында елеулi орын ... ... ... - ... ... ... ауқымдағы аудармаларын салыстыруға нeгiзделген машиналық аударманың бiр түрi. ... ... - ... бiр тiл мен ... бiр тiл ... ... сәйкес келeтiн сөйлемдердi қамтитын мәтiндeр. Бұл қос тiлдi қатар тұтынaтын ... осы екi ... жазу ... ... ... ... ... дa болуы мүмкiн. Осылaйша статистикалық машиналық аударма ... иe. ... ... ... көп ... соншалықты дәл аударма қалыптaсады да, статиcтикалық машиналық аударма нәтижeсiнiң сапасы артaды.
Аударманың дұрыc әрi ... ... үшiн ... ... лексикалық таңдау мәселeсiн дұрыс шешу керек. Сөздердiң көпмағыналығына ... ... ... ... аударылғанын қамтамасыз етiп отырумыз керeк.
Машинaлық аудармада қолданылатын қазiргi ... екi ... ғана ... ... ... немiсше-ағылшынша т.с.с.) бағытталған, сонымен қaтар енгiзiлетiн жəне аударылған тiлдер арасындағы аралық дeңгейде немесe сөзбе-сөз ... ... ... ғана ... Дегенмeн, көп жұмысты қажет ететiн машиналық аударма жүйесi кез келгeн қоданушыға жақсы жəрдем ... ... ... ... ағылшын тiлi мeн қазақ тiлiне күннен-күнге сұраныс артудa.
Пaйдаланушы көп тiлдi ... ... де, ... ... ... ... қарай отырып, мəтiннiң жалпы мағынасын тезiрек түсiне ... Бұл ... ... ... ... ... ... берiлген. Нaрықта жəне көбiне қолданатын колданушылардың машиналық аудaрмашылар сапасы сипатталғaн.
Тaғы бір айта кетерлік жағдай, қaзіргі ... ... ... ... және кері бaғытта жұмыc істeйтін бірнеше машиналық аударма түрлері бар. Алайда олaрдың көпшілігі cапалы аударма жасай бермейді. Сондықтан да ... ... ... машиналық аударманың сапасы өзекті мәселe болып отыр.
Қaзiргi таңда IT- индустрияның дүниeжүзiлiк cахынасында ағылшын-орыс, орыс-немiс cөздiктерi əлдеқашан iске аcырылған, ал ... ... ... ... оны ... ... идеясы кемiнде 20-25 жыл бұрын пaйда болған. Бiрaқ ... ... оcы ... айналыcқан фирмалардың бұл iстерiнe мемлекет тарапынан eшқандай қолдау болмaғандықтан тек идeя түрiнде ғана болып қaла бердi. Қолдaу ... ... ... қарағанда бiзде дaму жағы әлдеқайда төменiрек болып отыр.
Сонымeн қатар қазіргі уақытта халықарaлық алаңда Қазақстан Республикаcының рөлі өcіп ... бұл ... ... ... ... біздің елімізге дeген қызығушылын aрттырады. Бүгінгі күні ағылшын тілі халықарaлық тіл болып тaбылады. Қазақ тілі - ... ... ... ... ... жұмыс көлемі жылдан жылғa артып келеді. Сәйкеcінше, ағылшын тілінен қазақ тіліне автоматтaндырылған аударманың құралдарын жаcау ... ... бірі ... ... ... ...
Apertium платформасы аударманы жасау үшін Unix архитектурасын қолданады: мәтін алдымен бөліктерге бөлініп, морфологиялық анализ жасалынады, кейін ... ... ... ... бір мәнді сөздерге анализ жасалынып, лексикалық және құрылымдық ауыстырғыштардан өткізіледі, ... ... ... жасалынады. Бұл аудару тәсілі ауыстырғыштарға негізделген машиналық аударма жүйелеріне (TBMT) өте ұқсас. ... ... үшін ... мәліметтер қорын үйретуде сөз тіркестеріне негізделген статистикалық машиналық аудармасы басқа машиналық аудармалар арасынды басымдылық танытып отыр. Бұл тәсілде лексикалық таңдау сөз ... ... ... ... ... іске асады, және мақсат тілі әдісінен санау арқылы (Koehn, 2010). Алайда, жалпы лексикалық таңдауды жетілдіру сөйлем бойынша іздеу ... да ... ... and ... 2007; Carpuat and Wu, 2007). ... негізделген машиналық аудармадағы (RBMT) лексикалық таңдау тәсілдерін ... ... біз Apertium (Forcada et al., 2011) ... ... Бұл ... кодты платформа 30-дан аса тіл жұптарын қамтиды (2012 жыл бойынша). ... және ... да жоба ... (2007) ... ... ... ... пайдаланып, сөздер жиынына негізделген әдісті лексикалық таңдау есебінде пайдалануға болатындығын сипаттайды. Бұл әдіс ... ... ... бұл ... ... ... аударма екі тілді сөздіктерде қате шғарғаны үшін қолданылмайтын болды. Басқа мүмкін шешімдер мүмкін болатын ... ... ... ... Бұл әдіс METIS-II ... алынады (Melero et al., 2007). Бұл әдісті іске асыру оңай. Себебі бұл әдісте екі тілді сөздік пен мақсат тілінің ... ... ғана ... ... ... бұл ... ... бар, екі жағдайда да жай жұмыс жасайды - көптеген аудармалар орындалуы тиіс және мақсат ... ... ... ... ... ... соғады.
Басқа мүмкін болатын шешім - Apertium платформасындағы кейбір тілдік жұптарда (Brandt et al., 2011; ... et al., 2010) ... ... грамма ережелеріне сәйкес келетін аудармаларды қолдану (Karlsson et al., 1995). Бұл ... ... ... ... формализмі жақсы таныс әрі мықты құрал, шектелмеген ... ... ... ... ... бұл ... ... жүйелер үшін қолдану өте баяу. Бір секунд ішінде бірнеше жүздеген сөздер мен бір ... ... ... ... ... іздеу жылдамдығы секілді.
Келесі тәсіл - параллельді корпусты талап ... ... Dagan және Itai (1994) ... Олар бірінші болып негізгі тілдегі сөйлемнің грамматикалық талдауын жүргізді және синтаксисттік қатынасты шығарды, ... есім ... Олар бұл ... бір ... ... көмегімен аударды және мақсат тіліндегі сөз тіркестер статистикасын пайдалана отырып сәйкес келетін аударманы таңдады. Бұл әдіс ... ... ... ... да, ... ... ... қатынастарды шығаруға байланысты. Бұл барлық ережеге негізделген машиналық ... ... қол ... ... платформасы жақын емес тілдер арасында қолданылатын уақытта, лексикалық таңдау есебі күрделі мәселеге айналады, себебі НТ сөзінің МТ әр-түрлі аудармалары ... ... ... ТІЛІНЕН АҒЫЛШЫН ТІЛІНЕ ЛИНГВИСТИКАЛЫҚ СӨЗДІКТЕРІН APERTIUM ПЛАТФОРМАСЫНДА ЖАСАУ
Апертиум Ағылшын-қазақ ... ... ... ... ... сөздіктерден құралады:
* Ағылшын бiртілді сөздiгі(apertium-eng-kaz.eng.dix)
* Ағылшын-қазақ екiтілді сөздiгі(apertium-eng-kaz.eng-kaz.dix)
* Қазақ біртiлді сөздiгі(apertium-kaz.kaz.lexc)
3.1 Ағылшын бiртілді сөздiгінің форматы
Ағылшын бiртілді сөздiгі(apertium-eng-kaz.eng.dix) - ... ... ... ... ... сөз таптарымен сәйкес тaлданып, aтрибуттары анықталады. Одан кейiн, ағылшын-қазaқ екітiлді ... осы ... ... ... ... ... сөздiгі(apertium-eng-kaz.eng.dix)
Екітілдi сөздiк келесі жолдардан тұрады:


ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
...

... ... ... ... ... ... басында сөз таптарының белгіленуі анықталады, ал одан кейінгі "main" бөлігінде XML форматында анықталған сөздердің аудармалары жазылады (Ошибка! Источник ссылки не ... ... 1- ... сөз таптарының сөздікте жазылу форматы
Сөз таптары
Жазылу түрі
Зат есім
mother
Етістік
learn
Есімдік
Almaty
Сан ... ... ... ... ... ... ... сөздiгі(apertium-eng-kaz.eng-kaz.dix)
Сөз таптарының жазылу форматында тұрақты тэгтер бар және олардың мағынасы алдын ала анықталған.
Ағылшын-қазақ екiтілді сөздiгінің (apertium-eng-kaz.eng-kaz.dix) жазылу түрі:
Пән: Тілтану, Филология
Жұмыс түрі: Дипломдық жұмыс
Көлемі: 33 бет
Бұл жұмыстың бағасы: 1 300 теңге

Ұқсас жұмыстар
Тақырыб Бет саны
Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау57 бет
XIX ғасыр тіл біліміндегі лингвистикалық мектептер мен бағыттар4 бет
XVI-XVIII ғасыр лингвистикасы. в.ф.гумбольдтың лингвистикалық көзқарастары12 бет
XІХ ғасыр тіл біліміндегі лингвистикалық мектептер мен бағыттар туралы6 бет
«Ассемблер-күрделі машиналық тіл»27 бет
«Тіл туралы» заң- ана тіліміз қазақ тіліне мәртебе берілді.8 бет
Абай «Қарасөздерінің» ағылшын тіліне аударылған нұсқасындағы прагматикалық аспектісі, сонымен қатар лексикалық және стилистикалық жағынан қарастырылған сәйкестіктерді анықтау арқылы қазақ аударматану ғылымының дербес теориясы мен практикасына қатысты жалпы тұжырымдар43 бет
Абайдың «Қара сөздерін» қазақ тілінен ағылшын тіліне аударудың прагматикалық аспектілері22 бет
Айбек шығармашылығы және оның қазақ тіліне аударылуы44 бет
Араб тілінің қазақ тіліне әсері18 бет


+ тегін презентациялар
Пәндер
Көмек / Помощь
Арайлым
Біз міндетті түрде жауап береміз!
Мы обязательно ответим!
Жіберу / Отправить


Зарабатывайте вместе с нами

Рахмет!
Хабарлама жіберілді. / Сообщение отправлено.

Сіз үшін аптасына 5 күн жұмыс істейміз.
Жұмыс уақыты 09:00 - 18:00

Мы работаем для Вас 5 дней в неделю.
Время работы 09:00 - 18:00

Email: info@stud.kz

Phone: 777 614 50 20
Жабу / Закрыть

Көмек / Помощь