Қазақ тілінен ағылышын тіліне машиналық аудару жүйесін жетілдіру
КІРІСПЕ 3
1 АНАЛИТИКАЛЫҚ ТАЛДАУ 6
1.1 Машиналық аударудың тарихы 6
1.2 Машиналық аударудың проблемалары мен перспективалары 8
1.3 Машиналық аудару программаларын салыстыру 11
1.4 Машиналық аударудың экономикалық эффектісі
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы 16
2.2 Формальды грамматика 20
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ
3.1 Статистикалық машиналық аударма
3.2 Жалпы құрылымдық схеманы құру
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ 27
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ 31
5.1 Қолданылатын программалық тілі
5.2 Қолданылған жұрнақ.жалғаулар
5.3 Қолданылатын программалық процедура
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 44
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ 47
ҚОРЫТЫНДЫ 49
ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ
ҚОСЫМША А 51
1 АНАЛИТИКАЛЫҚ ТАЛДАУ 6
1.1 Машиналық аударудың тарихы 6
1.2 Машиналық аударудың проблемалары мен перспективалары 8
1.3 Машиналық аудару программаларын салыстыру 11
1.4 Машиналық аударудың экономикалық эффектісі
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы 16
2.2 Формальды грамматика 20
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ
3.1 Статистикалық машиналық аударма
3.2 Жалпы құрылымдық схеманы құру
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ 27
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ 31
5.1 Қолданылатын программалық тілі
5.2 Қолданылған жұрнақ.жалғаулар
5.3 Қолданылатын программалық процедура
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 44
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ 47
ҚОРЫТЫНДЫ 49
ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ
ҚОСЫМША А 51
Бұл дипломдық жұмыс қазақ тілінен ағылышын тіліне машиналық аудару мәселесіне арналған. Бұл аумақтағы зерттеулер жұмыс нөлдік деңгейде тұр.
Бұл проблеманы шешу үшін, біз екі тілдің грамматикасын терең зерттедік және оны негізгі бөліктерге келесі түрде бөлуге шештік:
• Сөздің бастапқы формасынан мәліметтер базасын құру;
• Қазақ тілінің лексикалық (морфологиялық) талдауы;
• Қазақ тілінің синтаксистік талдауы;
• Машиналық аударма көмегімен өнім тілінде мәтіндерді өндіру;
• Ағылшын тілінің лексикалық және синтаксистік талдауы.
Терең зерттеулер жүргізгеннен кейін біз әр бөлік үшін программалық жабдықтау жасауды ұйғардық, себебі бұл нақты болып, және грамматиканың көптеген ерекшеліктеріне назар аудар керек. Содан кейін, біз олардың барлығын бір толық программалық жабдықтауға біріктіреміз.
Егер жұмысымыз сәтті шықса, онда оны көптеген салаларда қолдануға болады. Әсіресе, біздің мемлекет Еуропа Одағы Үштігінің құрамына және ВТО құрамына енейін деп жатқан уақытта өте маңызды болып отыр. Онда бүкіл әлем бойынша ғылыми –техникалық құжаттардың аудармасына қойылатын талаптар зор. Заңда көрсетілгеннен басқа, барлық құжаттар Қазақ тілінде жазылған болу керек. Ағылшын тілі әрқашанда халықаралық тіл болып саналған, және жоғарғы мақсаттарға жетемін деген адамдардың барлығы ол тілді үйренуде. Мемлекеттер арасындағы кездесулердің, талқылаулардың, конференциялардың және т.с.с. көпшілігі осы тілде өтеді. Бұрынғы Кеңес Одағының құрамында болған мемлекеттердің көпшілігі орыс тілін қолданатыны барлығына мәлім, сонлықтан біздің программалық жабыдқтау, тілді үйрену кезінде уақыт пен ақшаны зая кетірмей барлығына да көмектеседі.
Бұл программалық жабдықтау барлық сөйлемдерді тек тура аудармай, семантикалық түрде де аудару қажет. Біз техникалық сөздерден бастадық және тек қарапайым өйлемдерді қолдандық. Бірақ өте қажет болған жағдайда, біз мәліметтер базасын кеңейтіп, көркем әдебиет сөздерін де қолдана аламыз. Менің ойымша, бірінші деңгейде жетістікке жетсек, біз одан да жоғары деңгейлерде, күрделі сөйлемдерді аудара алатындай деңгейге жетеміз.
Бұл проблеманы шешу үшін, біз екі тілдің грамматикасын терең зерттедік және оны негізгі бөліктерге келесі түрде бөлуге шештік:
• Сөздің бастапқы формасынан мәліметтер базасын құру;
• Қазақ тілінің лексикалық (морфологиялық) талдауы;
• Қазақ тілінің синтаксистік талдауы;
• Машиналық аударма көмегімен өнім тілінде мәтіндерді өндіру;
• Ағылшын тілінің лексикалық және синтаксистік талдауы.
Терең зерттеулер жүргізгеннен кейін біз әр бөлік үшін программалық жабдықтау жасауды ұйғардық, себебі бұл нақты болып, және грамматиканың көптеген ерекшеліктеріне назар аудар керек. Содан кейін, біз олардың барлығын бір толық программалық жабдықтауға біріктіреміз.
Егер жұмысымыз сәтті шықса, онда оны көптеген салаларда қолдануға болады. Әсіресе, біздің мемлекет Еуропа Одағы Үштігінің құрамына және ВТО құрамына енейін деп жатқан уақытта өте маңызды болып отыр. Онда бүкіл әлем бойынша ғылыми –техникалық құжаттардың аудармасына қойылатын талаптар зор. Заңда көрсетілгеннен басқа, барлық құжаттар Қазақ тілінде жазылған болу керек. Ағылшын тілі әрқашанда халықаралық тіл болып саналған, және жоғарғы мақсаттарға жетемін деген адамдардың барлығы ол тілді үйренуде. Мемлекеттер арасындағы кездесулердің, талқылаулардың, конференциялардың және т.с.с. көпшілігі осы тілде өтеді. Бұрынғы Кеңес Одағының құрамында болған мемлекеттердің көпшілігі орыс тілін қолданатыны барлығына мәлім, сонлықтан біздің программалық жабыдқтау, тілді үйрену кезінде уақыт пен ақшаны зая кетірмей барлығына да көмектеседі.
Бұл программалық жабдықтау барлық сөйлемдерді тек тура аудармай, семантикалық түрде де аудару қажет. Біз техникалық сөздерден бастадық және тек қарапайым өйлемдерді қолдандық. Бірақ өте қажет болған жағдайда, біз мәліметтер базасын кеңейтіп, көркем әдебиет сөздерін де қолдана аламыз. Менің ойымша, бірінші деңгейде жетістікке жетсек, біз одан да жоғары деңгейлерде, күрделі сөйлемдерді аудара алатындай деңгейге жетеміз.
Кітаптар:
1. Э.Д Сулейменова и др. “Анықтағыш.” Учебный курс по изучению казахского языка / Э.Д Сулейменова, К.К Кадешова, Д.Х Аканова – Асатана: Издательство «Арман-ПВ» 2007 г – 240 стр. 227-229
2. Бектұров Ш.К “Қазақ тілі: лексика, фонетика, морфология, синтаксис” / - Алматы: Атамұра, 2006.-336 бет.
3. “Build Your Own ASP.NET 3.5 Web Site Using C# & VB” by Cristian Darie and Wyatt Barnet, 3rd edition.
4. N.Kultin “C# in tasks and its solutions”, Saint-Petersburg, Science 2007, 241p.
5. Мырзатай Серғалиев “Қазақ тілі” оқыту методикасы / Алматы – Атамұра 1992, 80 бет.
Интернет-сайттар:
1. Познание семантический www.cognition.com
2. Машиналық және статикалық аударманың анықтамасы www.wikipedia.com
3. Машиналық аудару рыногының көлемі http://tandibusiness.blogspot.com
4. Ткачтың тілдік жорамалдары http://www.imakenews.com
5. Британская Группа Специалиста по Переводу Естественного языка Общества
эпохи компьютеризации www.bcs-mt.org.uk
6. Европейская Ассоциация для Машинного перевода www.eamt.org/mt.php
1. Э.Д Сулейменова и др. “Анықтағыш.” Учебный курс по изучению казахского языка / Э.Д Сулейменова, К.К Кадешова, Д.Х Аканова – Асатана: Издательство «Арман-ПВ» 2007 г – 240 стр. 227-229
2. Бектұров Ш.К “Қазақ тілі: лексика, фонетика, морфология, синтаксис” / - Алматы: Атамұра, 2006.-336 бет.
3. “Build Your Own ASP.NET 3.5 Web Site Using C# & VB” by Cristian Darie and Wyatt Barnet, 3rd edition.
4. N.Kultin “C# in tasks and its solutions”, Saint-Petersburg, Science 2007, 241p.
5. Мырзатай Серғалиев “Қазақ тілі” оқыту методикасы / Алматы – Атамұра 1992, 80 бет.
Интернет-сайттар:
1. Познание семантический www.cognition.com
2. Машиналық және статикалық аударманың анықтамасы www.wikipedia.com
3. Машиналық аудару рыногының көлемі http://tandibusiness.blogspot.com
4. Ткачтың тілдік жорамалдары http://www.imakenews.com
5. Британская Группа Специалиста по Переводу Естественного языка Общества
эпохи компьютеризации www.bcs-mt.org.uk
6. Европейская Ассоциация для Машинного перевода www.eamt.org/mt.php
Пән: Информатика, Программалау, Мәліметтер қоры
Жұмыс түрі: Дипломдық жұмыс
Тегін: Антиплагиат
Көлемі: 49 бет
Таңдаулыға:
Жұмыс түрі: Дипломдық жұмыс
Тегін: Антиплагиат
Көлемі: 49 бет
Таңдаулыға:
МАЗМҰНЫ
КІРІСПЕ 3
1 АНАЛИТИКАЛЫҚ ТАЛДАУ 6
1.1 Машиналық аударудың тарихы 6
1.2 Машиналық аударудың проблемалары мен перспективалары 8
1.3 Машиналық аудару программаларын салыстыру 11
1.4 Машиналық аударудың экономикалық эффектісі 14
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ 16
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы 16
2.2 Формальды грамматика 20
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ 22
3.1 Статистикалық машиналық аударма 22
3.2 Жалпы құрылымдық схеманы құру 24
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ 27
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ 31
5.1 Қолданылатын программалық тілі 33
5.2 Қолданылған жұрнақ-жалғаулар 36
5.3 Қолданылатын программалық процедура 42
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 44
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ 47
ҚОРЫТЫНДЫ 49
ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 50
ҚОСЫМША А 51
КІРІСПЕ
Бұл дипломдық жұмыс қазақ тілінен ағылышын тіліне машиналық аудару
мәселесіне арналған. Бұл аумақтағы зерттеулер жұмыс нөлдік деңгейде тұр.
Бұл проблеманы шешу үшін, біз екі тілдің грамматикасын терең зерттедік
және оны негізгі бөліктерге келесі түрде бөлуге шештік:
• Сөздің бастапқы формасынан мәліметтер базасын құру;
• Қазақ тілінің лексикалық (морфологиялық) талдауы;
• Қазақ тілінің синтаксистік талдауы;
• Машиналық аударма көмегімен өнім тілінде мәтіндерді өндіру;
• Ағылшын тілінің лексикалық және синтаксистік талдауы.
Терең зерттеулер жүргізгеннен кейін біз әр бөлік үшін программалық
жабдықтау жасауды ұйғардық, себебі бұл нақты болып, және грамматиканың
көптеген ерекшеліктеріне назар аудар керек. Содан кейін, біз олардың
барлығын бір толық программалық жабдықтауға біріктіреміз.
Егер жұмысымыз сәтті шықса, онда оны көптеген салаларда қолдануға
болады. Әсіресе, біздің мемлекет Еуропа Одағы Үштігінің құрамына және ВТО
құрамына енейін деп жатқан уақытта өте маңызды болып отыр. Онда бүкіл әлем
бойынша ғылыми –техникалық құжаттардың аудармасына қойылатын талаптар зор.
Заңда көрсетілгеннен басқа, барлық құжаттар Қазақ тілінде жазылған болу
керек. Ағылшын тілі әрқашанда халықаралық тіл болып саналған, және жоғарғы
мақсаттарға жетемін деген адамдардың барлығы ол тілді үйренуде. Мемлекеттер
арасындағы кездесулердің, талқылаулардың, конференциялардың және т.с.с.
көпшілігі осы тілде өтеді. Бұрынғы Кеңес Одағының құрамында болған
мемлекеттердің көпшілігі орыс тілін қолданатыны барлығына мәлім, сонлықтан
біздің программалық жабыдқтау, тілді үйрену кезінде уақыт пен ақшаны зая
кетірмей барлығына да көмектеседі.
Бұл программалық жабдықтау барлық сөйлемдерді тек тура аудармай,
семантикалық түрде де аудару қажет. Біз техникалық сөздерден бастадық және
тек қарапайым өйлемдерді қолдандық. Бірақ өте қажет болған жағдайда, біз
мәліметтер базасын кеңейтіп, көркем әдебиет сөздерін де қолдана аламыз.
Менің ойымша, бірінші деңгейде жетістікке жетсек, біз одан да жоғары
деңгейлерде, күрделі сөйлемдерді аудара алатындай деңгейге жетеміз.
Менің бітіру жұмысымның негізі, техникалық мәтіндерді қазақ тілінен
ағылшын тіліне аударылуын тексерген машиналық аудару жүйесін зерттеу. Менің
бітіру жұмысымның мақсаты, ағылшын тіліндегі схемаларға сәйкес келетін,
қазақ тіліндегі схемасы бар болатын программалық жабдықтау құру.
Аудармалық эквиваленттік түсінігі, бір бірінің нақты аудармасы ретінде
қабылданған кіріс пен шығыс тілі мағынасы арасындағы қатынас. Аудармалық
эквиваленттік қалыпты уақыт аралығындағы эквиваленттік қатынасы емес:
арнайы мамандандырылған тұтас тұжырымды негізігі тіліне аударсақ та, бұл
аударманың бастапқы мағынасы қажетті нәтижеге әкелмейді. Схема жасамастан
бұрын біз қазақ тілі мен ағылшын тілін жетік меңгерген болуымыз керек.
Біріншіі қадамым, алтыншы сыныптан осы уақытқа дейінгі грамматиканы
қайталадым және оқыдым. Екінші қадам, бір- біріне семантикалық әдіспен тең
екі тілдегі барлық мүмкін схемаларды біліп алдым.
Машиналық аударма – мәтінді бір тілден екінші тілге аударуға қажетті
программалық жабыдқтауды қолданатын компьютерлік лингвистиканың астыртын
жағы. Оның бастапқы деңгейінде МА тек сөздерді бір тілден екінші тілге
алмастырып отырады. Ертеден информатикадағы қол жетпей келе жатқан
мақсаттардың бірі машиналық аудару болған, бірақ көптеген белгілі бір
салаларда пайдалы, жеткілікті сапаға ие өнімді шығаратын жүйелер қолдану
мүмкін болып отыр.
Егер біз сөйлемнің жақсы аударылғанын қалайтын болсақ, біз оны алдымен
орыс тіліне, кейіннен ағылышын тіліне аударуымыз қажет. Оған бізідің көп
уақытымыз кетеді және біз орыс тілін өте жақсы білмейтін адамдарды ескерген
жоқпыз. Ендігі бір қиындық құжаттарды толтыруда болып тұр, себебі белгілі
бір сөздерді, терминдерді халықтың көп бөлігі түсінбейді. Бірақ үкімет ол
құжаттардың ұлттық тілде болған талап етеді. Бұл мәселелердің барлығы, бұл
саланы өте терең зерттеп, қазақ тілінен ағылшын тіліне аудару мәселесін
шешуге алып келіп отыр. Егер біз алдыға қойған мақсаттарымыздың негізіг
бөлігін өтетін болсақ, онда бізідің мемлекеттегі екі тілдің алдыға дамуы
деп есептеуге әбден болады. Қазіргі уақытта қазақ тілін үйрену мәселесі
Қазақстанда өзекті болып тұр. Біздің үкімет ұлттық тілді дамыту үшін
көптеген шаралар ұйымдастырды және олар бұл аумақта басқа да бағдарламалар
ұйымдастыруды жоспарлап отыр.
Қазіргі заманғы жүйелерді дұрыс қолдану үшін, машина сөйлемді қалай
аударатынын түбегейлі білу секілді машиналық аударманы бағалау үшін өзінің
бір стандарты қажет. Мұндай стандартты орнату туралы негізгі талқылаулар
тек қазіргі уақытта басталды, бірақ келісімді қабыладу үшін көп уақыт
кетпейді, себебі оларды қарастыратын болсақ, әсер ететін көптеген факторлар
бар. Бағалау факторлары қолдану мақсатына қарай бөлінеді. Бағалауда
қарастырылуы қажет факторлар:
1. Өнім, операция және қызмет көрсету бағасы; үйрету, мәтіндік енгізу,
қарапайым сөздер және арнайы терминология үшін сөздікті жаңарту; өңдеу,
қорытынды мәтіндік дайындық, аударма сапасы мен бағасы арасындағы қатынас.
2. Мәтінді енгізу жылдамдығы, алдын ала өңдеу (жұмыс үстелі мен
сандарды, және т.с.с. өңдеулерді қоса алғанда), машиналық аударма,
қорытынды мәтінді өңдеу келсімді форматтайды (жұмыс үстелі мен сандарды,
және т.с.с. өңдеулерді қоса алғанда), алдын ала өңдеу мен кейінгі өңдеу
қатынасы.
3. Дұрыстығы, түсініктілігі, және қарапайымдылығы көз қарасы бойынша
алынған сапалылығы.
4. Сөздікті өзгертудің жетілідірілгендігі, жүйенің негізгі сөздігі мен
тұтынушылық сөздігі деңгейін жоғарылату, әсіресе белгілі бір аумақтағы
әлеуметтік диалект үшін грамматиканы жетілідіру, тұтынушыларға сөздік пен
грамматиканы жақсартудың рұқсат етілген деңгейі, және жетілідірілгеннен
кейін әдісті тексеруге болатын жүйе мүмкіндігі.
5. Жүйені бір мәтіндік аумақтан екіншісіне және бір тілден екінші
тілге кеңейту мүмкіндігі.
6. Операциялық штат саны, алдын ала өңдеу, кейін өңдеу, және сөздікке
қызмет көрсететін адамдар көзқарасы жағынан тұтынушымен қойылатын күш салу
деңгейі, құжаттар жүйесі құрылымын машианлық аударуға бейімдеу үшін және
авторлар негізіг мәтінді дайындау кезінде бастапқы тілдің тұжырымдарын
басқаруға қажетті сынақтан өткізу мен ретке келтіру уақыты.
7. Грамматика, семантикамен, анафора мен ellipsis қоса алғандағы
сөздік ақпараты- әңгімелесу, программалық жабдықтаудың жылдамдығы,
мүмкіндігін зерттеу, интерактивтік аударма немесе кейіннен өңдеу, ауыспалы
мағыналылық шешімі, тек ең жақсы аударма өнімін немесе сөйлемдер үшін
барлық мүмкін құрылымдар жасау үшін жүйенің қуаттылығы мен шектеулері.
Бұл мәселе әрқашанда өзекті қазіргі заман талабына сай, және қажетті
екенін білдіреді.
1 АНАЛИТИКАЛЫҚ ТАЛДАУ
1.1 Машиналық аударудың тарихы
Соңғы кездері шет тілін білу тек саяхаттау немесе шет елден келген
қонақтарды күтіп алу кезінде ғана емес, өз үйіңнің ішінде де, мысалы,
танымал голливуд киноларын көргенде, теңіздің арғы жағынан келген
өнімдердің қолдануға арналған нұсқауларын немесе шаршамайтын браузер бүкіл
әлемнен іздеп шығатын Web-беттерін оқыған кезде қажет болады. Осылайша,
үйімізден шықпай жатып–ақ бізге аудармашылар көмегі қажет екенін түсінеміз.
Алайда бізге қажетті көмекті үйде тұрған компьютер көрсете алады.
Машиналық аудару (МА) жүйелері таң қаларлық нәрсе болудан қалған. Олар
өзінің балалық кезеңінен біртіндеп шығып, және де байланыспаған бала
былдыры орнына жеткілікті түрде түсінікті адамзат тілінде сөйлеуде. Аяққы
кезге дейін мұндай бағдарламалар, бағасы жағынан қуатты графикалық және
баспалық жүйлермен бірдей қымбат болып қана қоймай, олармен жұмыс істеу
өте қиын және күрделі болатын. Міне, үйдегі жеке компьтерлерде қолдануға
жарамды алғашұқы аудармашылар пайда болды. Олармен жақынырақ танысып,
мүмкіндіктерін бағалайық. Бірақ, әрине алдымен МА тарихынан бастаймыз.
Биографтар айтуы бойынша, XIX ғасырдың өзінде атақты математик Чарльз
Бэббидж британдық үкіметті оның есептеуіш машинаны жасау бойынша
зерттеулерін қаражаттандыру керек екендігіне көз жеткізуге тырысқан. Басқа
да жақсы жақтарының ішнде, ол әйтеу бір кезде бұл машина автоматты түрде
сөздерді аударады деп уәде еткен. Қазіргі кезде Бэббидж компьютер
жұмысының негізінде жатқан көптеген идеялар авторы болып саналғанмен, ол
өзінің машинасын да, уәде еткен МА іске асыра алмай қалды. Ал бұл идея
қазіргі күнге дейін айтарлықтай деңгейде жүзеге асырылмаған болып тұр.
Алайда бүкіләлемдік байланыс негізі болып тұрған Интернеттің пайда болуына
байланысты бұл идея қайтадан инвестициялар тарту мен қызығушылық тудыруда.
Жалпы, МА-ның алғашқы бағдарламалары, компьютер паайда болғаннан кейін
бірнеше ғана жылдар өткен соң, 50-ші жылдары шықты, бірақ ПК кең таралуына
дейін МА есептеуіш техниканы қолданудың маңызды саласынан гөрі ғылыми
зерттеулердің қызықты объектісі ғана болды, оның негізгі екі себебі бар:
компьютердің жұмыс істеу уақытының қымбаттығынан және оның ресурстарымен
ұжымды түрде қолдану. Соңғы жағдай, МА-ның оның қарапайым,
оперативтілігінен маңызды артықшылықтарын жойып электронды көмекшіні бірден
қолдануға мұрсат бермеді.
МА-ның туылған күні болып (зерттеу саласы ретіндегі) 1947 ж саналады,
оның бәрі Уоррен Уивердің, Рокфеллеров фондының жаратылыстану ғылымы
бөлімінің директоры, Норберт Винерге сол жылдың наурыз айында жазған
хатынан басталды. Онда аудару мәселесі мәтінді дешифровка мәселесімен
салыстырылған. Соңғысы сол кездің өзінде ақ электромеханикалық құрылғыларда
орындалатын. Бұл хаттың артынан көптеген талқылаулар жүргізілді, және
зерттеу жұмыстарына қаражат бөлінді.
1952 ж атақты математик Бар Хиллелмен ұйымдастырылған бірінші
конференция өтті. Онда зерттеушілер тілдің көптеген синтаксистік ережелерін
ұймдастыруға, семантиканы, морфологиялық құрылымды, аудару жүйесі үшін
сөздіктер құрылымын сипаттау әдістеріне қатысты өз ойларымен бөлісті.
Академиялық зерттеулердегі жетістіктер МА-на мәселесіне коммерсиялық
қызығушылық тудырды, және IBM фирмасы АҚШ-тағы Джорджтаундық университетпен
бірге 1954 жылы 250 сөзден тұратын сөздік пен 6 синтаксистік ережеге
негізделген және 49 алдын ала таңдалған сөйлемнің аудармасын қамтамасыз
ететін бірінші жүйені көрсете алды. Бұл тәжірибе зерттеулер тізімін
көбейтті: келесі он жылда АҚШ үкіметі және әскери мекемесі МА саласын
зерттеуге 40млн долларға жуық қаражат жұмсады.
Бірінші нәтижеден алынған эйфориядан МА іске аспауын толығымен жойылуы
арасында ек сегіз жыл өтті. Мұндай шешімге АҚШ ғыллымының Ұлттық
Академисының қолданбалы лингвистика бойынша арнайы комитетінің (ALPAC)
шолуына сүйеніп келді. Онда автоматты аудару жүйесі болашақта қажетті
сапаны қаматамасыз ете алмайды деп жазылды. Бұл есеп беру МА дамуына кері
әсерін тигізді, соның салдарынан АҚШ пен Европада қаражат болмағандықтан
қандай болмасын зерттеу жұмыстары тоқтатылды. Тек 70 жылдардың соңында,
ақпаратты компьютерлік іздеу мен жасанды интеллекттің лингвистикалық
мәселесін проектілеушілер мен зерттеушілердің қызығушылығы артуына
байланысты МА зерттеулері қайта жандандырылды.
Тек 80 жылдардың басынан, ПК сенімді және қуатты түрде әлемді жаулап
ала бастағаннан кейін, олардың жұмыс істеу уақыты арзандады және оны кез
келген уақытта қолдану мүмкін бола бастады. Демек, МА әйтеуір экономикалық
жағынан пайдалы бола бастады. Сол жылдары және одан кейін де
бағдарламлардың жетілдірілуі мәтіндердің көптеген түрін тура аударуға
мүмкін бере бастады, алайда МА проблемалары осы күнге дейін шешілмей тұр.
90 жылдарды МА-ның дамуының қайта жандануының негізігі кезеңі деп
санауға болады, ол ПК мүмкіндігінің жоғары деңгейімен, сканерлер мен OCR
программасының пайда болуымен ғана емес, Интернетинтранет
(Internetintranet) де пайда болуымен байланысты. Ол жеке инвесторлар мен
мемлекеттік құрылым үшін қаражат салудың ең тартымды түрі бола бастады.
МА технологиясының көптеген кемшіліктері болғанымен, көптеген ұйымдар
Бэббидждің берген уәдесін еске түсіре бастады. Машиналық аудару
жетілдірулерден әлі алыс, бірақ кез-келген оның көмегімен құжаттың негізгі
мағынасын түсіне алады,- МА-мен экспериментті онлайн режимде бастаған. ірі
Web-узелдің Alta Vista технологиялық директоры Луи Монье солй деп санайды.
Европалық Бірлестіктің Мемлекеттері соңғы 15 жылда осы мәселе бойынша
зерттеулерге 70 млн. доллардан артық қаражат жұмсады, ал жапон мемлекеттік
ұйымдары -200млн. доллардан артық. MT SUMMIT VI де МАның өз елі үшін
стратегиялық маңыздылығы туралы қызықты баяндама жасаған Т.Р.Педтке айтуы
бойынша бұл бағыттың дамуындағы маңызды рөлді үкімет атқарады. МА
проблемасы жоғарғы технологиялардың дамуындағы және АҚШтың бүкіләлемдік
ақпараттық кеңістікте бәсекелестікке жарамдылығын қамтамасыз ету үшін
негізгі қарастырылатын мәселе болып тұр.
1.2 Машиналық аударудың проблемалары мен перспективалары
Берілген электрондық аудармашы түріндегі программалық өнімдермен жұмыс
істеу кезінде мәтінді аудару кезінде қателіктер көрінеді. Аударылған
мәтіндердің лексикалық талдануы электрондық аудармашылар көбінесе сөйлемнің
қарапайым бөлігін жақсы аударатынын, бірақ септіктерді, сын есімдерді,
сөйлемді құруға байланысты қателіктер жібереді.
Кейбір аудармашылардың кемшілігі бірнеше мағынасы бар сөздерді тура
аудармауы болып табылады. Дұрыс аударылу үшін, сөйлемнің әр түрлі мүшелері
және олардың грамматикалық сипаттамалары үшін аударма сапасын жақсартып,
және арнайы мәтіндерді аудару кезінде сөздіктердің қарама қайшы болуына жол
бермей сөйлемнің грамматикалық тұрғызылуының өте терең эвристикалық
талдауын ұсынуға болады.
Мәтіндердің грамматикалық талдануы электрондық аудармашы көпше және
жекеше түрде тұрған сөздерді жақсы аударатынын, ал септікті және
етістіктерді қажетті санға қойуда қиындықтар туындайтынын көрсетті. Бұл
қазақ және ағылшын тілдері септіктері арасындағы әр түрлі интерпретацияға
байланысты: қазақ тілінде – жалғау арқылы, ағылшын тілінде –предлог арқылы.
Сонымен, компьютер әлі көп нәрселерде аудармашыны алмастыра алмайды.
Онда машиналық аударма жүйесін қолдаып қажет пе? Әрине, қажет. Егер
компьютер көркем әдеби шығармаларды аударуға қолданылса, онда аударманың
алғашқы ретке келтірілмеген түрі алынады, оны тілді жақсы меңгермеген,
бірақ жақсы редактор болып табылатын адам баласы артынан өнер туындысына
айналдырады. Егер техникалық мәтіндерді аудару мәселесі болса, мұнда мәтін
жазылған мамандану бойынша сөздік дұрыс таңдалса, қанағаттандырарлықтай,
кей кезде өңдеуді қажет етпейтін нәтиже алынады. Жалпы компьютерлік
аударманы жөндеу көбінесе жоғарыда айтылған мәселелерге байланысты. Ол
үшін машиналық аудару жүйесі міндетті түрде мәтіндерді редакциялау құралына
ие болады.
Кейбір тапсырушылар үшін аударманың мұндай деңгейі мүлдем келмейді.
Машиналық аудару –бұл миф- деп Electronic Data Systems (Плейно, шт.
Техас) корпарциясы қызметінің консультанты, компанияның бүкіләлемдік
интражелісін құрастыруға қатысқан Линн Сешедри санайды - Ол техникалық
құжаттар үшін ғана жарайтын шығар, бірақ басқа жағдайдарда сіз 15% мағына
ал 85% түсініксіз сөздерді аласыз. Өзінің EDS интражелісінің мазмұнын
аудару үшін контракттік негізде мамандандырылған аудармашылар қызметін
қолданады. Алайда басқаларын машиналық аударма қанағаттандырады, себебі
көбінесе оған нақты альтернатива жоқ. Гуманизмнің дамуы үшін Париждік
қоры (FPH) өз кезінде өздеірінң бюджеттерінің көлемді бөлігін
аудармашыларға беру немесе машиналық аудару құралын қолданып көру деген
таңдау алдында тұрған. Бұл ұйым, жеке көздердн қаражаттандырылатын,
экология, экономика эәне басқа салалардағы баяндамаларды шығаратын, оларды
жасау үшін ғалымдардың интернационалдық топтарын тартатын. Оның таңдауы
машиналық аудару технологиясына түсті, дәлірек айтсақ ПК үшін жеткілікті
түрде сапалы және қымбат емес қосымшасы бар Globalink фирмасының өнімін
таңдады. FPH оны, әр түрлі тілде сөйлейтін мамандардың араласуы жеңіл және
тиімді болсын деп электрондық почтаның серверіне орнатты.
Бұл жақсы шешім –деп санайды FPH консультанты Марина Урквиди-
Көптеген адамдар ағылшын тілінде емес, өз тілінде жұмыс істегенді қалайды.
Ал енді оларда ондай мүмкіндік бар. Ол машиналық аударудың өзінің
кемшіліктері бар екенін мойындайды, бірақ егер адам керек қылса машиналық
аударманың мағынасын түсініп алады деп сенеді. Егер сіз біраз ойлансаңыз,
не туралы сөз қозғалып жатқанын түсінесіз. Осылайша, егер МА-дан көп нәрсе
т алап етпесеңіз, мүмкін Бэббидждің машиналық аудару жайлы берген уәдесі
орындалатын шығыр.
Машиналық аударма – бұл құрал. Бәрімізге мәлім, мәтінді аудару -бұл
тек творчествалық қана емес, еңбекті көп қажет ететін жұмыс. Тіптен ең
жақсы аударманың өзі, редактрлік өңдеуді қажет етеді. Творчествалық
бөлігіне келсек, онда болашақта компьютер – адам жарысында әрқашанда тірі
аудармашы жеңіп кетеді. Алайда аудару процесінің көп еңбекті қажет
ететіндігіне байланысты мәселені шешу үшін МА жүйесі жақсы көмекші бола
алады. Оны жақсы түсіну үшін, машиналық аудару программасыынң
артықшылықтарын тізіп шығайық (МА жүйесінің барлығы үшін бірдей және PROMT
жүйелері үшін жеке):
1. Жоғары жылдамдық. Тек бірнеше секунд, содан кейін Сіз көп жолды
мәтіннің аудармасын аласыз. Бұл мәтін мағынасын тез түсінуге мүмкіндік
береді, ал егер жүйе сол тематикадағы мәтіндерді аударуға келтірілген
болса, онда минимум редактрлік жөндеу қажет болады.
2. Арзан баға. Оны бағалау өте оңай: егер сіз мамандандырылған
аудармашылар көмегіне жүгінетін болсаңыз, әр аударалған сөздердің бетіне
төлеуіне тура келеді ( аймаққа және аудармашының мамандану деңгейіне
байланысты 5доллардан 20 долларға дейін жетеді), немесе сіз тұрақты
қызметтегі аудармашыны жалдайсыз, оған жалақы төлеу қажет. Машиналық аудару
жағдайында, сіз тек программаны сатып аларда ғана төлейсіз. Сіз –бір рет
қаражат шығару ма, әлде ұдайы шығын шығаруды қалайсыз ба? ПРОМТ
компаниясының тұтынушылары мәліметтері бойынша айына 50 беттен жоғары
мәтінді аудару кезінде PROMT 98 аудармашы программасы бір ай ішінде өзін-
өзі ақтайды.
3. Қызметтерді қолдану мүмкіндігі. МА жүйесін сөгетіндер ескере
бермейтін маңызды фактор. Аудармашы программасы әрқашан қол астында, ал
аудару қызметі бюросына бару уақыт пен күшті зая кетірумен байланысты.
4. Құпиялылық. МА жүйесіне сіз кез-келген ақпаратты сеніп тапсыра
аласыз. Сізге жеке бас хаттамаларын аударуға беру қолайлы ма? Сіз өзіңіздің
финанстық жұмыстарыңызға бөтен біреуді енгізуге даярсыз ба? Аудару бюросына
эротикалық тақырыптағы әдебиетті аударуға апарасыз ба? Егер бұл сұрақтың
бәріне ия деп жауап берсеңіз, онда ешқандай қиындықтар жоқ. Бірақ, көп
тұтынушылар бұған келісе бермейді. Біз көптеген тұтынушылар біздің аудару
жүйесін жеке бас хаттарын аударуға қолданатынын білеміз, себебі осы жүйені
қоладанатын көп адамдардан бізге өз жеке өмірін орналастыруға көмектескені
үшін алғыс хаттары келеді. Аударма программасы, сіз сеніп тапсырған кез-
келген мәтінді құпия сақтайды.
5. Әмбебаптылығы. Кез-келген аудармашы белгілі бір мамандыққа сәйкес
аударады, яғни өзі жақсы білетін таырыптағы мәтіндерді ғана аударады.
Көркем әдебиет шығармасын аударушы, техникалық мәтінді аудару кезінде
қателіктерді көп жібереді. Классикалық мысалды қарастыратын болсақ та:
Жалаңаш проводник автобус бойымен жүгіріп жүр (негізінде "Naked conductor
runs along the bus"). Бұл компьютер аударған мәтін емес, бұл компьютер
бәрінде бола берген емес кездегі тарихи жағдай. МА жүйесі ол абсолютті
әмбебап. Тек сәйкес тақырыпқа арнайы сөздікті дұрыс таңдау керек. МА
жүйесінің артықшылықтарын да ескеру керек: олардың арнайы мамандандырылған
сөздіктерін жаңа терминдермен толықтырып отыру мүмкіндігі полиграфикалық
түрде жасалған сөздіктерден алда тұрады. Кейбір жағдайларда өзіңнің жаңа
терминдер немесе мағыналары енгізілген сөздікті қолдану мүмкіндігі
ұсынылады. Бұл жағдайда сіз қажетті сападағы аударманы міндетті түрде
аласыз.
6. Интернеттегі ақпараттарды аудару. Онлайнда МА жүйесінің барлық
артықшылықтары көрінеді. Сонымен қатар, егер сіз бірнеше тілді білмесеңіз,
Интернетте ақпаратты аудару аударма программасы көмегімен іске асады. Міне
осы қажеттілік МА бүкіл әлемдегі қызығушылығын тудырды. Тек МА онлайндық
жүйесінің арқасында, оларды аударуға қиналмай шет елдік сайттарды қарау
мүмкіндігі пайда болды. Содан басқа, мұнда жоғарыда айтылған МА жүйесінің
барлық артықшылықтары жұмыс істейді: кез келген тақырыптағы мәтінді аудару
тез әрі құпия орындалады.
МА жүйелерін коллективті пайдалану ұйымдарда келесі артықшылықтарды
береді:
1. Стильдің және қолданылатын терминологияның бірдей болуы. Коллектив
жұмысын редактрлеу кезіндегі шығын аударманың 100%-140% құрайды. МА жүйесі
жасаған аударманы түзету оңай, себебі ол бір стильде жазылғн. Егер мәтінде
термин дұрыс аударылмаған болса, онда бұл қателіктердің барлығын
автоалмастырумен түзетуге болады. Көлемді мәтін бір топ аудармашылармен
аударылатын болса, онда әрбір аудармашы жіберген жеке сәйкессіздіктерді
анықтап отыруға тура келеді. Редакторға бұл жағдайда стильді де түзеп
отыруға тура келеді.
2. Форматтауға шығын кетпейді. Бұл электрондық құжатты аудару кезінде
өте маңызды. Аударма программасы бастапқы форматталуды сақтап тұрады, ол
аударманы дайындау кезінде кететін уақыт пен үнемдейді.
Алайда, МАның бұл артықшылықтарын қолдануға тырыспай, кейбір адамдар МА
арналмаған қызметтерді орындауға , мысалы мақал мәтелдерді, өлеңдерді,
тақпақтарды және т.б. аударып бас қатырады. Кейбіреулері сипатталған
бағдарламаны оқымай, медициналық тақырыптардағы мәтіндерді банктік
сөздікпен аударуға тырысады, сонан кейін шыққанмағынасыз аударманы оқып
көңілденеді. Осылайша олар өздерінің комплекстерімен күресуге тырысатындай
және олар компьютерден ақылдырақ екендігін дәлелдеуге тырысатындай әсер
қалады. Мұндай критиктер, бензопила астына ломды тастап, қорқынышты
нәтижені көріп масаттанған анекдот иесіне сәйкестендіріледі.
1.3 Машиналық аудару программаларын салыстыру
Машиналық аударудың перспективаларына қарамастан, оның даму
процесіндегі біраз жаңалықтар әлі де ашыла қоймады. Бұл жаңалықтар
болашақта іске асады деген үлкен үміт бар. Әзірге бізде әлі де болса біраз
кемшіліктер бар, ешқандай аудармашы қателеспейтін қателіктер кездеседі.
Өкінішке орай жақын арада бұл қателіктер түзетілмеу ықтималдығы да бар.
Бірақ негізгі машиналық аудару саласында прогммалық тұрғыда жақсы
өзгерістер байқалуда.
Дәлел ретінде, қазіргі таңда актуальді аудармашы программалар арқылы
мысалдар келтіремін "ПРОМТ" және "Magic Gooddy" (өндірушілері бір),
"Pragma", "Socrat" және нақты уақытта онлайн аудару. Ол үшін мен британдық
газеттің бір статиясын алдым.
The Sunday Times:
Egypt has been training British MI5 and MI6 agents in how to combat
Islamic terrorists, underlining Cairo’s growing importance to the war
against terror and the Middle East peace process.
A senior Middle Eastern military intelligence official revealed last
week that British officers had undergone the training as part of a co-
operation programme with Egypt that began after the September 11 attacks on
America in 2001 and continued until last year.
Details have not been revealed, but it is believed to have included
instruction in specialized interrogation techniques and in the terminology
used by terrorists, which will enable agents to understand monitored
telephone conversations.
Promt XT (Magic Gooddy):
Египет обучил британский MI5 и MI6 агентов при том, как сразиться с
Исламскими террористами, подчеркивая важность роста Каира к войне против
ужаса {террора} и ближневосточного мирного процесса.
Старшее Ближневосточное военное должностное лицо сведений {интеллекта}
показало на прошлой неделе, что британские чиновники{офицеры} подверглись
обучению как часть программы сотрудничества с Египтом, который начал после
11 сентября нападения на Америку в 2001 и продолжался до прошлого года.
Детали не были показаны, но это, как полагают, включило инструкцию в
специализированные методы допроса и в терминологию, используемую
террористами, которые позволят агентам понять проверенные телефонные
беседы.
Socrat:
Египет готовил British MI5 и агентов MI6 в как, чтобы бороться
террористов Islamic, подчеркивающих Каир растущего значения в войну против
террора и мирный процесс Среднего Востока.
Старший Средний Восточный военный чиновник разведки обнаруживал
прошлую неделю, которую Британские должностные лица подверглись подготовку
как часть программы сотрудничества с Египтом, который начинался после
Сентябрьские 11 атак в Америке в 2001 и продолженной до прошлого года.
Детали не обнаружены, но поверено включенная инструкция в specialised
методах опроса и в терминологии использованной террористами, которые
позволят, чтобы понимать проверенную телефонную беседу.
Pragma:
Египет обучает Британский MI5 и агенты MI6 в том, как бороться с
Мусульманскими террористами, подчеркивая Cаiro’s, дорастающий важность
война против террора и процесса мира Ближнего Востока.
Ответственный Средний Восточный военный работник сведений, показанный
на последней неделе, что Британские офицеры имели undergone обучение, так
как часть программы сотрудничества с Египтом, который начался после 11
сентября, нападает на Америке в 2001 и длительный пока прошлый год.
Детали не были показаны, но это, как полагается, включало инструкцию
в speciаlised методах допроса и в терминологии, используемой террористами,
которые предоставят возможность агентам понять контролируемые телефонные
беседы.
Internet machine translator www.tranexp.com:
Египетский вспомогательный глагол для образования сложных времен быть
воспитывать Британский MI5 и MI6 действующая сила в как к бой Мусульманский
террорист, подчеркивать Пирамида из камней рост значительность к
грамматический определенный член война от ужас и грамматический
определенный член Середина Восток мир процесс. ВЫСШАЯ ОТМЕТКА ЗА КЛАССНУЮ
РАБОТУ старший Середина Восточный военный ум служебный открывать последний
неделя тот Британский чиновник вспомогательный глагол для образования
сложных времен испытывать грамматический определенный член воспитывать как
часть яние) от высшая отметка за классную работу coдействие программа с
Египетский тот начинать за грамматический определенный член Сентябрь 11
атаковать на Американский в 2001 и непрерывный до прошлый год. Подробность
вспомогательный глагол для образования сложных времен не быть открывать,
только он быть верить к вспомогательный глагол для образования сложных
времен заключать обучение в специализация вопрос техника и в грамматический
определенный член терминология употребление у террорист, который воля
давать возможность или право действующая сила к понимать наставник телефон
разговор.
Literary translation:
Египет обучал агентов пятого и шестого отделов Британской военной
разведки методам борьбы с исламскими террористами, тем самым, подчеркнув
растущую значимость Каира в мирном процессе на Ближнем Востоке и борьбе с
террором.
Старшее должностное лицо Ближневосточной военной разведки обнародовал
секретные данные о том, что Британские офицеры прошли курс подготовки в
качестве части программы сотрудничества с Египтом, которая началась вскоре
после атак на Америку 11 сентября 2001 года и продолжалась до прошлого
года.
Детали не разглашались, однако считается, что они прошли курс обучения
специальным техникам допроса и терминологии используемой террористами,
который позволит агентам расшифровывать перехваченные телефонные разговоры.
Күмәнсіз "ПРОМТ" программасының аудармасы дұрыстау болды, бірақ
дегенмен "ПРОект МТ" компаниясы жеткен жетістігімен тоқтауға болмайды.
1.4 Машиналық аударудың экономикалық эффектісі
Біздің жасап шығарғанымыздың барлығы қаражатты талап етеді. Әрине,
сондықтан аударманың қандай түрін жасаған тиімдірек болатынын білу қызық.
Мен, Ткачтың Тілдік Болжамдары туралы қызықты мақала таптым.
Тілдік Ткач - қарапайым ережелерге негізделген әдістер орнына
статистикалық алгоритмдермен іске қосылған статистикалық машиналық
аударудағы (SMT) пионер және бүкіләлемдік лидер.
“Өзгеріп тұратын өндірістер Ткач Тілі аудармасы үшін толығымен жаңа,
қолданылмаған коммерциялық аударма рыноктарын жасап берді, себебі біз
сапалы аударманың бағасын лезде төмендетіп жібердік ” деп Тілдік Ткачтың
президенті Марк Тэплинг айтты. “Қарапайым аударма қызметі бір сөз үшін 21
центті құрайды. Тілдік Ткач, үлкен көлемді мәтіндердің байланыс мағынасын
жақсы беретін, жылдам әрі нақты автоматтандырылған шешім ұсына алады.”
Консалтингтік фирманың Консультативті Айқын көзқарасы мен зерттеулер
нәтижесі бойынша аударма рыногі қазір $14 миллиардқа бағалануда. Автоматты
аудару беретін аз шығын үшін Тілдік Ткач қолданылмаған жалпы рынок көлемін
$67,5 миллиардқа бағалайды.
Консультативті Айқын көзқарас машиналық аударуға қатысты
хабарламасында ғаламдық экономикалық бір тұтастықтың комбинациясын
аяқтайды, және аудармамен жабдықтау үшін сандық мазмұндылықтың өсуі
басқарылуда бағаға және көлем факторына қысым көрсетеді. "Мемлекеттік
мекемелер, ғаламдық өндірушілер және БАҚ компаниялары өнімдер мен қызмет
көрсету ақпараттарына негізделген сәйкес рынокты басып алғандай, олар
аудармамен қаматамасыз ету жүйесінен ауыспалы көлем мен өте арзан бағаны
талап етеді." Консультативті Айқын көзқарас атап көрсеткендей, фирмалардың
көбі, және қалғандары оған кейіннен қосылатына кәміл сенімдіміз, автоматты
аударма жеткілікті көлемде, жылдамдықта және ауыспалылығында логарифмдік
өсімді шешу әдісі ретінде қарастырады.
“Біз шамалардың ретіне сәйкес аудармалардың сандық жеткілікті
орындарында адамдар байланысының бағасын арзандатқандықтан, аударма күшті
және стратегиялық құрал мағынасына ие,” деп Тілдік Ткачтың Tapling айтты.
“Әр бизнес жан-жақты болғанын қалайды, бірақ аз бөлігі ғана аударма
жасағысы келетін. Ал енді барлығының қолынан келеді.”
Тілдік Ткач үш жаңа стратегиялық рынокқа шығады: веб мазмұн, іс шолуы,
және клиенттермен жұмыс, ол Тілдік Ткачтың үлкен көлем, жылдам қызмет
көрсететін, және бұл уақытқа дейін бағасы қол жетпейтіндей болып көрінген
автоматты аудару үшін дәл шешімдер дәлелденген мүмкіндігіне негізделген.
Тэплинг Компаниясы өзінің үкіметтік қызметін одан әрі жалғастыратынын
айтты. “Біздің мемлекеттік тапсырымыз біздің бастамамыздың якорі ретінде
болды. Біз үкіметтік клиенттерден көп нәрсе үйрендік және осы рынокта
қызметіміз жалғаса береді.”
Нью Йорк Таймс газетінен алынған тағы да бір қызықтырар мақала.
Көпшілігіңіз ерікті аудармашылар туралы естіген боларсыздар. Бұл таң
қаларлық, бірақ кейбір компаниялар осындай ерікті аудармашылар есебінен
ақша жасайды. Мысалға конференцияның енді шақырылған компаниясы ВОРОШИТ.
еріті аудармашыдар көмегімен 500 000$ үнемдеп қалды.
Автор, бұл мақала басқа елдер президенттері де осындай еркін аударманы
ала алады деп ойлағанын көргені туралы айтып кетті.
Тағы да ескерте кеткен жайт, Сіз аудармаға тұрарлық болуыңыз керек,
pro-bono қызмет көрсетуімен келеңсіз оқиғаға тап болмауыңыз керек, әсіресе
егер сіз коммерциялық компания болсаңыз.
Facebook, Google, енді, аудармаға тұрарлық секілді. Алайда, ол
мысалға делік General Motors компаниясын бұл салада жетістіктерге жетуін
күтпеген болу керек (олар мүмкін көмекке жүгінген шығар).
Алайда, аударма өндірісіне зиян келтіретін, аударма бағасын көтере
алатын компанияларға өз қызметін ұсынатын ерікті аудармашыларда. Ол
машиналық аударма тірі жан иесі аударған аударма өндірісін бұзады деп
ойламайды, себебі компаниялар мәтінді аудау үшін адам жалдамайды. Бірақ
Алайда еріктіде жасалған аударма өзгешелігі бар.
Ерікті аудармашылар өздерінің серіктестерінің күн көрісінен айыруда.
Әрине, және Google, және Facebook төлеу мүмкіндігі бар. Немесе ерікті
аудармашылар, өздерінің жұмыстарының бағалылығын жоғарылататын, осылайша
жалпы аударма өндірісіне пайда әкелелтін?
OpenLogos жобасы – машиналық аударудың үлкен және күшті жүйесі,
құрамында неміс және ағылшын тілдері бастапқы тіл ретінде және негізгі
еуропалық тілдер француз, итальян, испан, португал тілдеріне аударылады.
Қосымша басқа да тілдерді құрамына енгізу жетілдірілу үстінде.
ЭМБЛЕМ машиналық аударма жүйесі – машиналық аударма жүйесі
ішіндегі ең үлкен және ең күштісі. Әр түрлі форматтағы әр түрлі мәтіндік
құжаттар жүйеге келеді және қысқа уақыт аралығында әр түрлі тілдегі
аудармасы шығады.
Шикі аударма нәтижесі де үлкен тілдік сапаға ие. Бірақ қажетті
аударманы адам -аудармашымен өңдеуге болады. Тұтынушы уақытын үнемдейді
және негізігі құжаттың форматы жоғары дәрежеде сақталып тұрады.
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы
Қазақ тілінің өткен шағының екі түрі болады: болымды және болымсыз.
Қимыл, іс-әрекеттің өткен уақытта болғанын көрсететін етістіктің түрі өткен
шақ деп аталады. Мысалы: Тұрар Мәскеуден келді. Ол Мәскеуден кеше келіпті.
Осы келді, келіпті сөздері екі түрлі мағына береді. Бірінші сөйлемде айтушы
Тұрарды өзі көріп, іле хабарлап тұр, екінші сөйлемде айтушы біреуден естіп,
хабарлап тұр.
Сондықтан өз көзімен көріп, жедел хабарлап тұрған етістіктің өткен
шағын жедел өткен шақ дейміз де, біреуден естіп барып, содан кейін хабарлап
тұрған немесе бұрын көргенін бөгеліп барып хабарлап тұрған етістіктің өткен
шағын бұрынғы өткен шақ дейміз. Мына сөйлемдерді салыстырып көрейік: Мен
киноға баратынмын. Сен киноға қашан баратын едің?
Бірінші сөйлемде іс, оқиға өткен шақтық мағынада болса, екіншіде келер
шақтық мағынаны білдіріп тұр. Осындай, бір істің бірнеше рет қайталанып,
дағдыға айналуын көрсететін түрі ауыспалы өткен шақ делінеді. Сөйтіп, өткен
шақ 1) жедел өткен шақ, 2) бұрынғы өткен шақ, 3) ауыспалы өткен шақ болып
үшке бөлінеді. Төменде өткен шақтың түрлері схема ретінде көрсетілген.
(1,2,3-суреттер)
Қазақ тілінде өткен шақ есімше және көсемше арқылы құрылады. Өткен
шақтық көсемше – амалды, себепті, кейде мезгілдің сөйлеп тұрған уақыттан
болғандығын білдіреді.
Қазақ тілінің өткен шақтағы жай сөйлемдерінің лексикалық талдауын жасау
үшін маған, өткен шақтың түрлерін оның жұрнақ-жалғауларын толығымен зерттеу
қажет.
2.2 Формальды грамматика
Туынды тілдер, кәдімгі адамдар, әр-түрлі ұлттардың сөйлесетін тілден
айырмашылығы, ол белгілі бір текстерді құруға арналған. Туынды тілдер
қарапайым тілден оңайлау, себебі онда қысқартылған грамматика, синтаксис,
семантика, сондай-ақ контекстік қажеттілік азайтылған. Туынды тілдердің
негізгі қызметі ақпараттарды компьютерлерге және басқарушы құрылғыларға
жеткізу болып табылады. Ақпарат немесе текст компьютер әлде басқарушы
құрылғы атқаратын жұмысын көрсетеді. Мұндай жұмыстың текстін адам ойлап
жасайды. Бұл кіріс тексті деп аталады. Ол басқа қолданушы адамдарға да
түсінікті болу мақсатында құрылады. Адамдарға арналған тіл компьютер
тілінен өзгеше болады. Кіріс тіліндегі текстің өзгертіліп компьютерге
түсінікті болу үшін, транслятор атты арнайы құрылғылар немесе программалар
қолданылады.
Транслятор құру жауапты және қиын іс болып табылады. Оның сапасына
қарай, тілдік өзгерістер құрылады. Трансляторға қойылатын негізгі мақсат
кіріс барысындағы текстің құрылымын нақты жеткізу болып табылады. Мұны іске
асыру үшін кіріс барысындағы текстің нақты құрылымын білу қажет, синтаксис,
лексика, грамматика.
G - грамматика
Т - терминалды грамматикалық тұлғалар
N - терминалды емес грамматикалық тұлғалар
P - ережелер
S - бастапқы символ
G={N, T, P, S}
{Жұрнақтар}, {жіктік жалғаулар}, есімше, негіз, көсемше
S=өткен шақ
P:
1: өткен шақ :: = жедел өткен шақ бұрынғы өткен шақ
ежелгі өткен шақ ауыспалы өткен
шақ
2: жедел өткен шақ :: = негіз жедел өткен шақтың жұрнағы, жіктік
жалғау
3: жедел өткен шақтың жұрнағы :: = “ды” “ді” “ты” “ті”
4: жіктік жалғау :: = “м” “ң” “қ” “к” “мын” “мін” “бын”
“бін” “пын” “пін” “быз” “біз”
5: бұрынғы өткен шақ :: = есімше, бұрынғы өткен шақтың жұрнағы,
жіктік жалғау
6: бұрынғы өткен шақтың жұрнағы :: = “ған” “ген” “қан” “кен”
7: жіктік жалғау :: = “м” “ң” “қ” “к” “сың” “сің” “дың”
“дің”
8: ежелгі өткен шақ :: = көсемше, ежелгі өткен шақтың жұрнағы,
жіктік жалғау
9: ежелгі өткен шақтың жұрнағы :: = “ып” “іп” “п”
10: ауыспалы өткен шақ :: = есімше, ауыспалы өткен шақтың жұрнағы,
жіктік жалғау
11: ауыспалы өткен шақтың жұрнағы:: = “атын” “етін” “йтын” “йтін”
12: болымсыз өткен шақ :: = болымсыз жедел өткен шақ
болымсыз бұрынғы
өткен шақ
болымсыз ежелгі
өткен шақ
болымсыз ауыспалы
өткен шақ
13: болымсыз жедел өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, жедел өткен шақтың жұрнағы, жіктік жалғау
көсемше, болымсыз етістіктің жалғауы, жедел өткен шақтың
жұрнағы, жіктік жалғау
көсемше, болымсыз етістіктің жалғауы, жедел өткен шақтың
жұрнағы, жіктік жалғау
14: болымсыз етістіктің жалғауы :: = “ма”, “ме”, “па”, “пе”, “ба”, “бе”
15: жедел өткен шақтың жұрнағы :: = “ды” “ді” “ты” “ті”
16: көсемше:: = “ып” “іп” “п”
17: көсемше:: = “а” “е” “й”
18: болымсыз бұрынғы өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, болымсыз бұрынғы өткен шақтың жұрнағы, жіктік жалғау
19: бұрынғы өткен шақтың жұрнағы :: = “ған” “ген” “қан” “кен”
20: болымсыз ежелгі өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, болымсыз ежелгі өткен шақтың жұрнағы, жіктік жалғау
21: болымсыз ежелгі өткен шақтың жұрнағы :: = “п”
22: болымсыз ауыспалы өткен шақ :: = есімше, болымсыз етістіктің
жалғауы, болымсыз ауыспалы өткен шақтың жұрнағы, жіктік жалғау
23: болымсыз ауыспалы өткен шақтың жұрнағы:: = “ушы” “уші” “йтын”
“йтін”
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ
3.1 Статистикалық машиналық ... жалғасы
КІРІСПЕ 3
1 АНАЛИТИКАЛЫҚ ТАЛДАУ 6
1.1 Машиналық аударудың тарихы 6
1.2 Машиналық аударудың проблемалары мен перспективалары 8
1.3 Машиналық аудару программаларын салыстыру 11
1.4 Машиналық аударудың экономикалық эффектісі 14
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ 16
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы 16
2.2 Формальды грамматика 20
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ 22
3.1 Статистикалық машиналық аударма 22
3.2 Жалпы құрылымдық схеманы құру 24
4 АҚПАРАТТЫҚ ЖАБДЫҚТАУ 27
5 ПРОГРАММАЛЫҚ ЖАБДЫҚТАУ 31
5.1 Қолданылатын программалық тілі 33
5.2 Қолданылған жұрнақ-жалғаулар 36
5.3 Қолданылатын программалық процедура 42
6 ЭКСПЕРИМЕНТАЛДЫҚ ЕСЕПТЕУ ЖҰМЫСТАРЫНЫҢ НӘТИЖЕЛЕРІ 44
7 ЖОБАНЫҢ ЭКОНОМИКАЛЫҚ ТИІМІДІЛІГІНІҢ БАҒАЛАНУЫ 47
ҚОРЫТЫНДЫ 49
ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ 50
ҚОСЫМША А 51
КІРІСПЕ
Бұл дипломдық жұмыс қазақ тілінен ағылышын тіліне машиналық аудару
мәселесіне арналған. Бұл аумақтағы зерттеулер жұмыс нөлдік деңгейде тұр.
Бұл проблеманы шешу үшін, біз екі тілдің грамматикасын терең зерттедік
және оны негізгі бөліктерге келесі түрде бөлуге шештік:
• Сөздің бастапқы формасынан мәліметтер базасын құру;
• Қазақ тілінің лексикалық (морфологиялық) талдауы;
• Қазақ тілінің синтаксистік талдауы;
• Машиналық аударма көмегімен өнім тілінде мәтіндерді өндіру;
• Ағылшын тілінің лексикалық және синтаксистік талдауы.
Терең зерттеулер жүргізгеннен кейін біз әр бөлік үшін программалық
жабдықтау жасауды ұйғардық, себебі бұл нақты болып, және грамматиканың
көптеген ерекшеліктеріне назар аудар керек. Содан кейін, біз олардың
барлығын бір толық программалық жабдықтауға біріктіреміз.
Егер жұмысымыз сәтті шықса, онда оны көптеген салаларда қолдануға
болады. Әсіресе, біздің мемлекет Еуропа Одағы Үштігінің құрамына және ВТО
құрамына енейін деп жатқан уақытта өте маңызды болып отыр. Онда бүкіл әлем
бойынша ғылыми –техникалық құжаттардың аудармасына қойылатын талаптар зор.
Заңда көрсетілгеннен басқа, барлық құжаттар Қазақ тілінде жазылған болу
керек. Ағылшын тілі әрқашанда халықаралық тіл болып саналған, және жоғарғы
мақсаттарға жетемін деген адамдардың барлығы ол тілді үйренуде. Мемлекеттер
арасындағы кездесулердің, талқылаулардың, конференциялардың және т.с.с.
көпшілігі осы тілде өтеді. Бұрынғы Кеңес Одағының құрамында болған
мемлекеттердің көпшілігі орыс тілін қолданатыны барлығына мәлім, сонлықтан
біздің программалық жабыдқтау, тілді үйрену кезінде уақыт пен ақшаны зая
кетірмей барлығына да көмектеседі.
Бұл программалық жабдықтау барлық сөйлемдерді тек тура аудармай,
семантикалық түрде де аудару қажет. Біз техникалық сөздерден бастадық және
тек қарапайым өйлемдерді қолдандық. Бірақ өте қажет болған жағдайда, біз
мәліметтер базасын кеңейтіп, көркем әдебиет сөздерін де қолдана аламыз.
Менің ойымша, бірінші деңгейде жетістікке жетсек, біз одан да жоғары
деңгейлерде, күрделі сөйлемдерді аудара алатындай деңгейге жетеміз.
Менің бітіру жұмысымның негізі, техникалық мәтіндерді қазақ тілінен
ағылшын тіліне аударылуын тексерген машиналық аудару жүйесін зерттеу. Менің
бітіру жұмысымның мақсаты, ағылшын тіліндегі схемаларға сәйкес келетін,
қазақ тіліндегі схемасы бар болатын программалық жабдықтау құру.
Аудармалық эквиваленттік түсінігі, бір бірінің нақты аудармасы ретінде
қабылданған кіріс пен шығыс тілі мағынасы арасындағы қатынас. Аудармалық
эквиваленттік қалыпты уақыт аралығындағы эквиваленттік қатынасы емес:
арнайы мамандандырылған тұтас тұжырымды негізігі тіліне аударсақ та, бұл
аударманың бастапқы мағынасы қажетті нәтижеге әкелмейді. Схема жасамастан
бұрын біз қазақ тілі мен ағылшын тілін жетік меңгерген болуымыз керек.
Біріншіі қадамым, алтыншы сыныптан осы уақытқа дейінгі грамматиканы
қайталадым және оқыдым. Екінші қадам, бір- біріне семантикалық әдіспен тең
екі тілдегі барлық мүмкін схемаларды біліп алдым.
Машиналық аударма – мәтінді бір тілден екінші тілге аударуға қажетті
программалық жабыдқтауды қолданатын компьютерлік лингвистиканың астыртын
жағы. Оның бастапқы деңгейінде МА тек сөздерді бір тілден екінші тілге
алмастырып отырады. Ертеден информатикадағы қол жетпей келе жатқан
мақсаттардың бірі машиналық аудару болған, бірақ көптеген белгілі бір
салаларда пайдалы, жеткілікті сапаға ие өнімді шығаратын жүйелер қолдану
мүмкін болып отыр.
Егер біз сөйлемнің жақсы аударылғанын қалайтын болсақ, біз оны алдымен
орыс тіліне, кейіннен ағылышын тіліне аударуымыз қажет. Оған бізідің көп
уақытымыз кетеді және біз орыс тілін өте жақсы білмейтін адамдарды ескерген
жоқпыз. Ендігі бір қиындық құжаттарды толтыруда болып тұр, себебі белгілі
бір сөздерді, терминдерді халықтың көп бөлігі түсінбейді. Бірақ үкімет ол
құжаттардың ұлттық тілде болған талап етеді. Бұл мәселелердің барлығы, бұл
саланы өте терең зерттеп, қазақ тілінен ағылшын тіліне аудару мәселесін
шешуге алып келіп отыр. Егер біз алдыға қойған мақсаттарымыздың негізіг
бөлігін өтетін болсақ, онда бізідің мемлекеттегі екі тілдің алдыға дамуы
деп есептеуге әбден болады. Қазіргі уақытта қазақ тілін үйрену мәселесі
Қазақстанда өзекті болып тұр. Біздің үкімет ұлттық тілді дамыту үшін
көптеген шаралар ұйымдастырды және олар бұл аумақта басқа да бағдарламалар
ұйымдастыруды жоспарлап отыр.
Қазіргі заманғы жүйелерді дұрыс қолдану үшін, машина сөйлемді қалай
аударатынын түбегейлі білу секілді машиналық аударманы бағалау үшін өзінің
бір стандарты қажет. Мұндай стандартты орнату туралы негізгі талқылаулар
тек қазіргі уақытта басталды, бірақ келісімді қабыладу үшін көп уақыт
кетпейді, себебі оларды қарастыратын болсақ, әсер ететін көптеген факторлар
бар. Бағалау факторлары қолдану мақсатына қарай бөлінеді. Бағалауда
қарастырылуы қажет факторлар:
1. Өнім, операция және қызмет көрсету бағасы; үйрету, мәтіндік енгізу,
қарапайым сөздер және арнайы терминология үшін сөздікті жаңарту; өңдеу,
қорытынды мәтіндік дайындық, аударма сапасы мен бағасы арасындағы қатынас.
2. Мәтінді енгізу жылдамдығы, алдын ала өңдеу (жұмыс үстелі мен
сандарды, және т.с.с. өңдеулерді қоса алғанда), машиналық аударма,
қорытынды мәтінді өңдеу келсімді форматтайды (жұмыс үстелі мен сандарды,
және т.с.с. өңдеулерді қоса алғанда), алдын ала өңдеу мен кейінгі өңдеу
қатынасы.
3. Дұрыстығы, түсініктілігі, және қарапайымдылығы көз қарасы бойынша
алынған сапалылығы.
4. Сөздікті өзгертудің жетілідірілгендігі, жүйенің негізгі сөздігі мен
тұтынушылық сөздігі деңгейін жоғарылату, әсіресе белгілі бір аумақтағы
әлеуметтік диалект үшін грамматиканы жетілідіру, тұтынушыларға сөздік пен
грамматиканы жақсартудың рұқсат етілген деңгейі, және жетілідірілгеннен
кейін әдісті тексеруге болатын жүйе мүмкіндігі.
5. Жүйені бір мәтіндік аумақтан екіншісіне және бір тілден екінші
тілге кеңейту мүмкіндігі.
6. Операциялық штат саны, алдын ала өңдеу, кейін өңдеу, және сөздікке
қызмет көрсететін адамдар көзқарасы жағынан тұтынушымен қойылатын күш салу
деңгейі, құжаттар жүйесі құрылымын машианлық аударуға бейімдеу үшін және
авторлар негізіг мәтінді дайындау кезінде бастапқы тілдің тұжырымдарын
басқаруға қажетті сынақтан өткізу мен ретке келтіру уақыты.
7. Грамматика, семантикамен, анафора мен ellipsis қоса алғандағы
сөздік ақпараты- әңгімелесу, программалық жабдықтаудың жылдамдығы,
мүмкіндігін зерттеу, интерактивтік аударма немесе кейіннен өңдеу, ауыспалы
мағыналылық шешімі, тек ең жақсы аударма өнімін немесе сөйлемдер үшін
барлық мүмкін құрылымдар жасау үшін жүйенің қуаттылығы мен шектеулері.
Бұл мәселе әрқашанда өзекті қазіргі заман талабына сай, және қажетті
екенін білдіреді.
1 АНАЛИТИКАЛЫҚ ТАЛДАУ
1.1 Машиналық аударудың тарихы
Соңғы кездері шет тілін білу тек саяхаттау немесе шет елден келген
қонақтарды күтіп алу кезінде ғана емес, өз үйіңнің ішінде де, мысалы,
танымал голливуд киноларын көргенде, теңіздің арғы жағынан келген
өнімдердің қолдануға арналған нұсқауларын немесе шаршамайтын браузер бүкіл
әлемнен іздеп шығатын Web-беттерін оқыған кезде қажет болады. Осылайша,
үйімізден шықпай жатып–ақ бізге аудармашылар көмегі қажет екенін түсінеміз.
Алайда бізге қажетті көмекті үйде тұрған компьютер көрсете алады.
Машиналық аудару (МА) жүйелері таң қаларлық нәрсе болудан қалған. Олар
өзінің балалық кезеңінен біртіндеп шығып, және де байланыспаған бала
былдыры орнына жеткілікті түрде түсінікті адамзат тілінде сөйлеуде. Аяққы
кезге дейін мұндай бағдарламалар, бағасы жағынан қуатты графикалық және
баспалық жүйлермен бірдей қымбат болып қана қоймай, олармен жұмыс істеу
өте қиын және күрделі болатын. Міне, үйдегі жеке компьтерлерде қолдануға
жарамды алғашұқы аудармашылар пайда болды. Олармен жақынырақ танысып,
мүмкіндіктерін бағалайық. Бірақ, әрине алдымен МА тарихынан бастаймыз.
Биографтар айтуы бойынша, XIX ғасырдың өзінде атақты математик Чарльз
Бэббидж британдық үкіметті оның есептеуіш машинаны жасау бойынша
зерттеулерін қаражаттандыру керек екендігіне көз жеткізуге тырысқан. Басқа
да жақсы жақтарының ішнде, ол әйтеу бір кезде бұл машина автоматты түрде
сөздерді аударады деп уәде еткен. Қазіргі кезде Бэббидж компьютер
жұмысының негізінде жатқан көптеген идеялар авторы болып саналғанмен, ол
өзінің машинасын да, уәде еткен МА іске асыра алмай қалды. Ал бұл идея
қазіргі күнге дейін айтарлықтай деңгейде жүзеге асырылмаған болып тұр.
Алайда бүкіләлемдік байланыс негізі болып тұрған Интернеттің пайда болуына
байланысты бұл идея қайтадан инвестициялар тарту мен қызығушылық тудыруда.
Жалпы, МА-ның алғашқы бағдарламалары, компьютер паайда болғаннан кейін
бірнеше ғана жылдар өткен соң, 50-ші жылдары шықты, бірақ ПК кең таралуына
дейін МА есептеуіш техниканы қолданудың маңызды саласынан гөрі ғылыми
зерттеулердің қызықты объектісі ғана болды, оның негізгі екі себебі бар:
компьютердің жұмыс істеу уақытының қымбаттығынан және оның ресурстарымен
ұжымды түрде қолдану. Соңғы жағдай, МА-ның оның қарапайым,
оперативтілігінен маңызды артықшылықтарын жойып электронды көмекшіні бірден
қолдануға мұрсат бермеді.
МА-ның туылған күні болып (зерттеу саласы ретіндегі) 1947 ж саналады,
оның бәрі Уоррен Уивердің, Рокфеллеров фондының жаратылыстану ғылымы
бөлімінің директоры, Норберт Винерге сол жылдың наурыз айында жазған
хатынан басталды. Онда аудару мәселесі мәтінді дешифровка мәселесімен
салыстырылған. Соңғысы сол кездің өзінде ақ электромеханикалық құрылғыларда
орындалатын. Бұл хаттың артынан көптеген талқылаулар жүргізілді, және
зерттеу жұмыстарына қаражат бөлінді.
1952 ж атақты математик Бар Хиллелмен ұйымдастырылған бірінші
конференция өтті. Онда зерттеушілер тілдің көптеген синтаксистік ережелерін
ұймдастыруға, семантиканы, морфологиялық құрылымды, аудару жүйесі үшін
сөздіктер құрылымын сипаттау әдістеріне қатысты өз ойларымен бөлісті.
Академиялық зерттеулердегі жетістіктер МА-на мәселесіне коммерсиялық
қызығушылық тудырды, және IBM фирмасы АҚШ-тағы Джорджтаундық университетпен
бірге 1954 жылы 250 сөзден тұратын сөздік пен 6 синтаксистік ережеге
негізделген және 49 алдын ала таңдалған сөйлемнің аудармасын қамтамасыз
ететін бірінші жүйені көрсете алды. Бұл тәжірибе зерттеулер тізімін
көбейтті: келесі он жылда АҚШ үкіметі және әскери мекемесі МА саласын
зерттеуге 40млн долларға жуық қаражат жұмсады.
Бірінші нәтижеден алынған эйфориядан МА іске аспауын толығымен жойылуы
арасында ек сегіз жыл өтті. Мұндай шешімге АҚШ ғыллымының Ұлттық
Академисының қолданбалы лингвистика бойынша арнайы комитетінің (ALPAC)
шолуына сүйеніп келді. Онда автоматты аудару жүйесі болашақта қажетті
сапаны қаматамасыз ете алмайды деп жазылды. Бұл есеп беру МА дамуына кері
әсерін тигізді, соның салдарынан АҚШ пен Европада қаражат болмағандықтан
қандай болмасын зерттеу жұмыстары тоқтатылды. Тек 70 жылдардың соңында,
ақпаратты компьютерлік іздеу мен жасанды интеллекттің лингвистикалық
мәселесін проектілеушілер мен зерттеушілердің қызығушылығы артуына
байланысты МА зерттеулері қайта жандандырылды.
Тек 80 жылдардың басынан, ПК сенімді және қуатты түрде әлемді жаулап
ала бастағаннан кейін, олардың жұмыс істеу уақыты арзандады және оны кез
келген уақытта қолдану мүмкін бола бастады. Демек, МА әйтеуір экономикалық
жағынан пайдалы бола бастады. Сол жылдары және одан кейін де
бағдарламлардың жетілдірілуі мәтіндердің көптеген түрін тура аударуға
мүмкін бере бастады, алайда МА проблемалары осы күнге дейін шешілмей тұр.
90 жылдарды МА-ның дамуының қайта жандануының негізігі кезеңі деп
санауға болады, ол ПК мүмкіндігінің жоғары деңгейімен, сканерлер мен OCR
программасының пайда болуымен ғана емес, Интернетинтранет
(Internetintranet) де пайда болуымен байланысты. Ол жеке инвесторлар мен
мемлекеттік құрылым үшін қаражат салудың ең тартымды түрі бола бастады.
МА технологиясының көптеген кемшіліктері болғанымен, көптеген ұйымдар
Бэббидждің берген уәдесін еске түсіре бастады. Машиналық аудару
жетілдірулерден әлі алыс, бірақ кез-келген оның көмегімен құжаттың негізгі
мағынасын түсіне алады,- МА-мен экспериментті онлайн режимде бастаған. ірі
Web-узелдің Alta Vista технологиялық директоры Луи Монье солй деп санайды.
Европалық Бірлестіктің Мемлекеттері соңғы 15 жылда осы мәселе бойынша
зерттеулерге 70 млн. доллардан артық қаражат жұмсады, ал жапон мемлекеттік
ұйымдары -200млн. доллардан артық. MT SUMMIT VI де МАның өз елі үшін
стратегиялық маңыздылығы туралы қызықты баяндама жасаған Т.Р.Педтке айтуы
бойынша бұл бағыттың дамуындағы маңызды рөлді үкімет атқарады. МА
проблемасы жоғарғы технологиялардың дамуындағы және АҚШтың бүкіләлемдік
ақпараттық кеңістікте бәсекелестікке жарамдылығын қамтамасыз ету үшін
негізгі қарастырылатын мәселе болып тұр.
1.2 Машиналық аударудың проблемалары мен перспективалары
Берілген электрондық аудармашы түріндегі программалық өнімдермен жұмыс
істеу кезінде мәтінді аудару кезінде қателіктер көрінеді. Аударылған
мәтіндердің лексикалық талдануы электрондық аудармашылар көбінесе сөйлемнің
қарапайым бөлігін жақсы аударатынын, бірақ септіктерді, сын есімдерді,
сөйлемді құруға байланысты қателіктер жібереді.
Кейбір аудармашылардың кемшілігі бірнеше мағынасы бар сөздерді тура
аудармауы болып табылады. Дұрыс аударылу үшін, сөйлемнің әр түрлі мүшелері
және олардың грамматикалық сипаттамалары үшін аударма сапасын жақсартып,
және арнайы мәтіндерді аудару кезінде сөздіктердің қарама қайшы болуына жол
бермей сөйлемнің грамматикалық тұрғызылуының өте терең эвристикалық
талдауын ұсынуға болады.
Мәтіндердің грамматикалық талдануы электрондық аудармашы көпше және
жекеше түрде тұрған сөздерді жақсы аударатынын, ал септікті және
етістіктерді қажетті санға қойуда қиындықтар туындайтынын көрсетті. Бұл
қазақ және ағылшын тілдері септіктері арасындағы әр түрлі интерпретацияға
байланысты: қазақ тілінде – жалғау арқылы, ағылшын тілінде –предлог арқылы.
Сонымен, компьютер әлі көп нәрселерде аудармашыны алмастыра алмайды.
Онда машиналық аударма жүйесін қолдаып қажет пе? Әрине, қажет. Егер
компьютер көркем әдеби шығармаларды аударуға қолданылса, онда аударманың
алғашқы ретке келтірілмеген түрі алынады, оны тілді жақсы меңгермеген,
бірақ жақсы редактор болып табылатын адам баласы артынан өнер туындысына
айналдырады. Егер техникалық мәтіндерді аудару мәселесі болса, мұнда мәтін
жазылған мамандану бойынша сөздік дұрыс таңдалса, қанағаттандырарлықтай,
кей кезде өңдеуді қажет етпейтін нәтиже алынады. Жалпы компьютерлік
аударманы жөндеу көбінесе жоғарыда айтылған мәселелерге байланысты. Ол
үшін машиналық аудару жүйесі міндетті түрде мәтіндерді редакциялау құралына
ие болады.
Кейбір тапсырушылар үшін аударманың мұндай деңгейі мүлдем келмейді.
Машиналық аудару –бұл миф- деп Electronic Data Systems (Плейно, шт.
Техас) корпарциясы қызметінің консультанты, компанияның бүкіләлемдік
интражелісін құрастыруға қатысқан Линн Сешедри санайды - Ол техникалық
құжаттар үшін ғана жарайтын шығар, бірақ басқа жағдайдарда сіз 15% мағына
ал 85% түсініксіз сөздерді аласыз. Өзінің EDS интражелісінің мазмұнын
аудару үшін контракттік негізде мамандандырылған аудармашылар қызметін
қолданады. Алайда басқаларын машиналық аударма қанағаттандырады, себебі
көбінесе оған нақты альтернатива жоқ. Гуманизмнің дамуы үшін Париждік
қоры (FPH) өз кезінде өздеірінң бюджеттерінің көлемді бөлігін
аудармашыларға беру немесе машиналық аудару құралын қолданып көру деген
таңдау алдында тұрған. Бұл ұйым, жеке көздердн қаражаттандырылатын,
экология, экономика эәне басқа салалардағы баяндамаларды шығаратын, оларды
жасау үшін ғалымдардың интернационалдық топтарын тартатын. Оның таңдауы
машиналық аудару технологиясына түсті, дәлірек айтсақ ПК үшін жеткілікті
түрде сапалы және қымбат емес қосымшасы бар Globalink фирмасының өнімін
таңдады. FPH оны, әр түрлі тілде сөйлейтін мамандардың араласуы жеңіл және
тиімді болсын деп электрондық почтаның серверіне орнатты.
Бұл жақсы шешім –деп санайды FPH консультанты Марина Урквиди-
Көптеген адамдар ағылшын тілінде емес, өз тілінде жұмыс істегенді қалайды.
Ал енді оларда ондай мүмкіндік бар. Ол машиналық аударудың өзінің
кемшіліктері бар екенін мойындайды, бірақ егер адам керек қылса машиналық
аударманың мағынасын түсініп алады деп сенеді. Егер сіз біраз ойлансаңыз,
не туралы сөз қозғалып жатқанын түсінесіз. Осылайша, егер МА-дан көп нәрсе
т алап етпесеңіз, мүмкін Бэббидждің машиналық аудару жайлы берген уәдесі
орындалатын шығыр.
Машиналық аударма – бұл құрал. Бәрімізге мәлім, мәтінді аудару -бұл
тек творчествалық қана емес, еңбекті көп қажет ететін жұмыс. Тіптен ең
жақсы аударманың өзі, редактрлік өңдеуді қажет етеді. Творчествалық
бөлігіне келсек, онда болашақта компьютер – адам жарысында әрқашанда тірі
аудармашы жеңіп кетеді. Алайда аудару процесінің көп еңбекті қажет
ететіндігіне байланысты мәселені шешу үшін МА жүйесі жақсы көмекші бола
алады. Оны жақсы түсіну үшін, машиналық аудару программасыынң
артықшылықтарын тізіп шығайық (МА жүйесінің барлығы үшін бірдей және PROMT
жүйелері үшін жеке):
1. Жоғары жылдамдық. Тек бірнеше секунд, содан кейін Сіз көп жолды
мәтіннің аудармасын аласыз. Бұл мәтін мағынасын тез түсінуге мүмкіндік
береді, ал егер жүйе сол тематикадағы мәтіндерді аударуға келтірілген
болса, онда минимум редактрлік жөндеу қажет болады.
2. Арзан баға. Оны бағалау өте оңай: егер сіз мамандандырылған
аудармашылар көмегіне жүгінетін болсаңыз, әр аударалған сөздердің бетіне
төлеуіне тура келеді ( аймаққа және аудармашының мамандану деңгейіне
байланысты 5доллардан 20 долларға дейін жетеді), немесе сіз тұрақты
қызметтегі аудармашыны жалдайсыз, оған жалақы төлеу қажет. Машиналық аудару
жағдайында, сіз тек программаны сатып аларда ғана төлейсіз. Сіз –бір рет
қаражат шығару ма, әлде ұдайы шығын шығаруды қалайсыз ба? ПРОМТ
компаниясының тұтынушылары мәліметтері бойынша айына 50 беттен жоғары
мәтінді аудару кезінде PROMT 98 аудармашы программасы бір ай ішінде өзін-
өзі ақтайды.
3. Қызметтерді қолдану мүмкіндігі. МА жүйесін сөгетіндер ескере
бермейтін маңызды фактор. Аудармашы программасы әрқашан қол астында, ал
аудару қызметі бюросына бару уақыт пен күшті зая кетірумен байланысты.
4. Құпиялылық. МА жүйесіне сіз кез-келген ақпаратты сеніп тапсыра
аласыз. Сізге жеке бас хаттамаларын аударуға беру қолайлы ма? Сіз өзіңіздің
финанстық жұмыстарыңызға бөтен біреуді енгізуге даярсыз ба? Аудару бюросына
эротикалық тақырыптағы әдебиетті аударуға апарасыз ба? Егер бұл сұрақтың
бәріне ия деп жауап берсеңіз, онда ешқандай қиындықтар жоқ. Бірақ, көп
тұтынушылар бұған келісе бермейді. Біз көптеген тұтынушылар біздің аудару
жүйесін жеке бас хаттарын аударуға қолданатынын білеміз, себебі осы жүйені
қоладанатын көп адамдардан бізге өз жеке өмірін орналастыруға көмектескені
үшін алғыс хаттары келеді. Аударма программасы, сіз сеніп тапсырған кез-
келген мәтінді құпия сақтайды.
5. Әмбебаптылығы. Кез-келген аудармашы белгілі бір мамандыққа сәйкес
аударады, яғни өзі жақсы білетін таырыптағы мәтіндерді ғана аударады.
Көркем әдебиет шығармасын аударушы, техникалық мәтінді аудару кезінде
қателіктерді көп жібереді. Классикалық мысалды қарастыратын болсақ та:
Жалаңаш проводник автобус бойымен жүгіріп жүр (негізінде "Naked conductor
runs along the bus"). Бұл компьютер аударған мәтін емес, бұл компьютер
бәрінде бола берген емес кездегі тарихи жағдай. МА жүйесі ол абсолютті
әмбебап. Тек сәйкес тақырыпқа арнайы сөздікті дұрыс таңдау керек. МА
жүйесінің артықшылықтарын да ескеру керек: олардың арнайы мамандандырылған
сөздіктерін жаңа терминдермен толықтырып отыру мүмкіндігі полиграфикалық
түрде жасалған сөздіктерден алда тұрады. Кейбір жағдайларда өзіңнің жаңа
терминдер немесе мағыналары енгізілген сөздікті қолдану мүмкіндігі
ұсынылады. Бұл жағдайда сіз қажетті сападағы аударманы міндетті түрде
аласыз.
6. Интернеттегі ақпараттарды аудару. Онлайнда МА жүйесінің барлық
артықшылықтары көрінеді. Сонымен қатар, егер сіз бірнеше тілді білмесеңіз,
Интернетте ақпаратты аудару аударма программасы көмегімен іске асады. Міне
осы қажеттілік МА бүкіл әлемдегі қызығушылығын тудырды. Тек МА онлайндық
жүйесінің арқасында, оларды аударуға қиналмай шет елдік сайттарды қарау
мүмкіндігі пайда болды. Содан басқа, мұнда жоғарыда айтылған МА жүйесінің
барлық артықшылықтары жұмыс істейді: кез келген тақырыптағы мәтінді аудару
тез әрі құпия орындалады.
МА жүйелерін коллективті пайдалану ұйымдарда келесі артықшылықтарды
береді:
1. Стильдің және қолданылатын терминологияның бірдей болуы. Коллектив
жұмысын редактрлеу кезіндегі шығын аударманың 100%-140% құрайды. МА жүйесі
жасаған аударманы түзету оңай, себебі ол бір стильде жазылғн. Егер мәтінде
термин дұрыс аударылмаған болса, онда бұл қателіктердің барлығын
автоалмастырумен түзетуге болады. Көлемді мәтін бір топ аудармашылармен
аударылатын болса, онда әрбір аудармашы жіберген жеке сәйкессіздіктерді
анықтап отыруға тура келеді. Редакторға бұл жағдайда стильді де түзеп
отыруға тура келеді.
2. Форматтауға шығын кетпейді. Бұл электрондық құжатты аудару кезінде
өте маңызды. Аударма программасы бастапқы форматталуды сақтап тұрады, ол
аударманы дайындау кезінде кететін уақыт пен үнемдейді.
Алайда, МАның бұл артықшылықтарын қолдануға тырыспай, кейбір адамдар МА
арналмаған қызметтерді орындауға , мысалы мақал мәтелдерді, өлеңдерді,
тақпақтарды және т.б. аударып бас қатырады. Кейбіреулері сипатталған
бағдарламаны оқымай, медициналық тақырыптардағы мәтіндерді банктік
сөздікпен аударуға тырысады, сонан кейін шыққанмағынасыз аударманы оқып
көңілденеді. Осылайша олар өздерінің комплекстерімен күресуге тырысатындай
және олар компьютерден ақылдырақ екендігін дәлелдеуге тырысатындай әсер
қалады. Мұндай критиктер, бензопила астына ломды тастап, қорқынышты
нәтижені көріп масаттанған анекдот иесіне сәйкестендіріледі.
1.3 Машиналық аудару программаларын салыстыру
Машиналық аударудың перспективаларына қарамастан, оның даму
процесіндегі біраз жаңалықтар әлі де ашыла қоймады. Бұл жаңалықтар
болашақта іске асады деген үлкен үміт бар. Әзірге бізде әлі де болса біраз
кемшіліктер бар, ешқандай аудармашы қателеспейтін қателіктер кездеседі.
Өкінішке орай жақын арада бұл қателіктер түзетілмеу ықтималдығы да бар.
Бірақ негізгі машиналық аудару саласында прогммалық тұрғыда жақсы
өзгерістер байқалуда.
Дәлел ретінде, қазіргі таңда актуальді аудармашы программалар арқылы
мысалдар келтіремін "ПРОМТ" және "Magic Gooddy" (өндірушілері бір),
"Pragma", "Socrat" және нақты уақытта онлайн аудару. Ол үшін мен британдық
газеттің бір статиясын алдым.
The Sunday Times:
Egypt has been training British MI5 and MI6 agents in how to combat
Islamic terrorists, underlining Cairo’s growing importance to the war
against terror and the Middle East peace process.
A senior Middle Eastern military intelligence official revealed last
week that British officers had undergone the training as part of a co-
operation programme with Egypt that began after the September 11 attacks on
America in 2001 and continued until last year.
Details have not been revealed, but it is believed to have included
instruction in specialized interrogation techniques and in the terminology
used by terrorists, which will enable agents to understand monitored
telephone conversations.
Promt XT (Magic Gooddy):
Египет обучил британский MI5 и MI6 агентов при том, как сразиться с
Исламскими террористами, подчеркивая важность роста Каира к войне против
ужаса {террора} и ближневосточного мирного процесса.
Старшее Ближневосточное военное должностное лицо сведений {интеллекта}
показало на прошлой неделе, что британские чиновники{офицеры} подверглись
обучению как часть программы сотрудничества с Египтом, который начал после
11 сентября нападения на Америку в 2001 и продолжался до прошлого года.
Детали не были показаны, но это, как полагают, включило инструкцию в
специализированные методы допроса и в терминологию, используемую
террористами, которые позволят агентам понять проверенные телефонные
беседы.
Socrat:
Египет готовил British MI5 и агентов MI6 в как, чтобы бороться
террористов Islamic, подчеркивающих Каир растущего значения в войну против
террора и мирный процесс Среднего Востока.
Старший Средний Восточный военный чиновник разведки обнаруживал
прошлую неделю, которую Британские должностные лица подверглись подготовку
как часть программы сотрудничества с Египтом, который начинался после
Сентябрьские 11 атак в Америке в 2001 и продолженной до прошлого года.
Детали не обнаружены, но поверено включенная инструкция в specialised
методах опроса и в терминологии использованной террористами, которые
позволят, чтобы понимать проверенную телефонную беседу.
Pragma:
Египет обучает Британский MI5 и агенты MI6 в том, как бороться с
Мусульманскими террористами, подчеркивая Cаiro’s, дорастающий важность
война против террора и процесса мира Ближнего Востока.
Ответственный Средний Восточный военный работник сведений, показанный
на последней неделе, что Британские офицеры имели undergone обучение, так
как часть программы сотрудничества с Египтом, который начался после 11
сентября, нападает на Америке в 2001 и длительный пока прошлый год.
Детали не были показаны, но это, как полагается, включало инструкцию
в speciаlised методах допроса и в терминологии, используемой террористами,
которые предоставят возможность агентам понять контролируемые телефонные
беседы.
Internet machine translator www.tranexp.com:
Египетский вспомогательный глагол для образования сложных времен быть
воспитывать Британский MI5 и MI6 действующая сила в как к бой Мусульманский
террорист, подчеркивать Пирамида из камней рост значительность к
грамматический определенный член война от ужас и грамматический
определенный член Середина Восток мир процесс. ВЫСШАЯ ОТМЕТКА ЗА КЛАССНУЮ
РАБОТУ старший Середина Восточный военный ум служебный открывать последний
неделя тот Британский чиновник вспомогательный глагол для образования
сложных времен испытывать грамматический определенный член воспитывать как
часть яние) от высшая отметка за классную работу coдействие программа с
Египетский тот начинать за грамматический определенный член Сентябрь 11
атаковать на Американский в 2001 и непрерывный до прошлый год. Подробность
вспомогательный глагол для образования сложных времен не быть открывать,
только он быть верить к вспомогательный глагол для образования сложных
времен заключать обучение в специализация вопрос техника и в грамматический
определенный член терминология употребление у террорист, который воля
давать возможность или право действующая сила к понимать наставник телефон
разговор.
Literary translation:
Египет обучал агентов пятого и шестого отделов Британской военной
разведки методам борьбы с исламскими террористами, тем самым, подчеркнув
растущую значимость Каира в мирном процессе на Ближнем Востоке и борьбе с
террором.
Старшее должностное лицо Ближневосточной военной разведки обнародовал
секретные данные о том, что Британские офицеры прошли курс подготовки в
качестве части программы сотрудничества с Египтом, которая началась вскоре
после атак на Америку 11 сентября 2001 года и продолжалась до прошлого
года.
Детали не разглашались, однако считается, что они прошли курс обучения
специальным техникам допроса и терминологии используемой террористами,
который позволит агентам расшифровывать перехваченные телефонные разговоры.
Күмәнсіз "ПРОМТ" программасының аудармасы дұрыстау болды, бірақ
дегенмен "ПРОект МТ" компаниясы жеткен жетістігімен тоқтауға болмайды.
1.4 Машиналық аударудың экономикалық эффектісі
Біздің жасап шығарғанымыздың барлығы қаражатты талап етеді. Әрине,
сондықтан аударманың қандай түрін жасаған тиімдірек болатынын білу қызық.
Мен, Ткачтың Тілдік Болжамдары туралы қызықты мақала таптым.
Тілдік Ткач - қарапайым ережелерге негізделген әдістер орнына
статистикалық алгоритмдермен іске қосылған статистикалық машиналық
аударудағы (SMT) пионер және бүкіләлемдік лидер.
“Өзгеріп тұратын өндірістер Ткач Тілі аудармасы үшін толығымен жаңа,
қолданылмаған коммерциялық аударма рыноктарын жасап берді, себебі біз
сапалы аударманың бағасын лезде төмендетіп жібердік ” деп Тілдік Ткачтың
президенті Марк Тэплинг айтты. “Қарапайым аударма қызметі бір сөз үшін 21
центті құрайды. Тілдік Ткач, үлкен көлемді мәтіндердің байланыс мағынасын
жақсы беретін, жылдам әрі нақты автоматтандырылған шешім ұсына алады.”
Консалтингтік фирманың Консультативті Айқын көзқарасы мен зерттеулер
нәтижесі бойынша аударма рыногі қазір $14 миллиардқа бағалануда. Автоматты
аудару беретін аз шығын үшін Тілдік Ткач қолданылмаған жалпы рынок көлемін
$67,5 миллиардқа бағалайды.
Консультативті Айқын көзқарас машиналық аударуға қатысты
хабарламасында ғаламдық экономикалық бір тұтастықтың комбинациясын
аяқтайды, және аудармамен жабдықтау үшін сандық мазмұндылықтың өсуі
басқарылуда бағаға және көлем факторына қысым көрсетеді. "Мемлекеттік
мекемелер, ғаламдық өндірушілер және БАҚ компаниялары өнімдер мен қызмет
көрсету ақпараттарына негізделген сәйкес рынокты басып алғандай, олар
аудармамен қаматамасыз ету жүйесінен ауыспалы көлем мен өте арзан бағаны
талап етеді." Консультативті Айқын көзқарас атап көрсеткендей, фирмалардың
көбі, және қалғандары оған кейіннен қосылатына кәміл сенімдіміз, автоматты
аударма жеткілікті көлемде, жылдамдықта және ауыспалылығында логарифмдік
өсімді шешу әдісі ретінде қарастырады.
“Біз шамалардың ретіне сәйкес аудармалардың сандық жеткілікті
орындарында адамдар байланысының бағасын арзандатқандықтан, аударма күшті
және стратегиялық құрал мағынасына ие,” деп Тілдік Ткачтың Tapling айтты.
“Әр бизнес жан-жақты болғанын қалайды, бірақ аз бөлігі ғана аударма
жасағысы келетін. Ал енді барлығының қолынан келеді.”
Тілдік Ткач үш жаңа стратегиялық рынокқа шығады: веб мазмұн, іс шолуы,
және клиенттермен жұмыс, ол Тілдік Ткачтың үлкен көлем, жылдам қызмет
көрсететін, және бұл уақытқа дейін бағасы қол жетпейтіндей болып көрінген
автоматты аудару үшін дәл шешімдер дәлелденген мүмкіндігіне негізделген.
Тэплинг Компаниясы өзінің үкіметтік қызметін одан әрі жалғастыратынын
айтты. “Біздің мемлекеттік тапсырымыз біздің бастамамыздың якорі ретінде
болды. Біз үкіметтік клиенттерден көп нәрсе үйрендік және осы рынокта
қызметіміз жалғаса береді.”
Нью Йорк Таймс газетінен алынған тағы да бір қызықтырар мақала.
Көпшілігіңіз ерікті аудармашылар туралы естіген боларсыздар. Бұл таң
қаларлық, бірақ кейбір компаниялар осындай ерікті аудармашылар есебінен
ақша жасайды. Мысалға конференцияның енді шақырылған компаниясы ВОРОШИТ.
еріті аудармашыдар көмегімен 500 000$ үнемдеп қалды.
Автор, бұл мақала басқа елдер президенттері де осындай еркін аударманы
ала алады деп ойлағанын көргені туралы айтып кетті.
Тағы да ескерте кеткен жайт, Сіз аудармаға тұрарлық болуыңыз керек,
pro-bono қызмет көрсетуімен келеңсіз оқиғаға тап болмауыңыз керек, әсіресе
егер сіз коммерциялық компания болсаңыз.
Facebook, Google, енді, аудармаға тұрарлық секілді. Алайда, ол
мысалға делік General Motors компаниясын бұл салада жетістіктерге жетуін
күтпеген болу керек (олар мүмкін көмекке жүгінген шығар).
Алайда, аударма өндірісіне зиян келтіретін, аударма бағасын көтере
алатын компанияларға өз қызметін ұсынатын ерікті аудармашыларда. Ол
машиналық аударма тірі жан иесі аударған аударма өндірісін бұзады деп
ойламайды, себебі компаниялар мәтінді аудау үшін адам жалдамайды. Бірақ
Алайда еріктіде жасалған аударма өзгешелігі бар.
Ерікті аудармашылар өздерінің серіктестерінің күн көрісінен айыруда.
Әрине, және Google, және Facebook төлеу мүмкіндігі бар. Немесе ерікті
аудармашылар, өздерінің жұмыстарының бағалылығын жоғарылататын, осылайша
жалпы аударма өндірісіне пайда әкелелтін?
OpenLogos жобасы – машиналық аударудың үлкен және күшті жүйесі,
құрамында неміс және ағылшын тілдері бастапқы тіл ретінде және негізгі
еуропалық тілдер француз, итальян, испан, португал тілдеріне аударылады.
Қосымша басқа да тілдерді құрамына енгізу жетілдірілу үстінде.
ЭМБЛЕМ машиналық аударма жүйесі – машиналық аударма жүйесі
ішіндегі ең үлкен және ең күштісі. Әр түрлі форматтағы әр түрлі мәтіндік
құжаттар жүйеге келеді және қысқа уақыт аралығында әр түрлі тілдегі
аудармасы шығады.
Шикі аударма нәтижесі де үлкен тілдік сапаға ие. Бірақ қажетті
аударманы адам -аудармашымен өңдеуге болады. Тұтынушы уақытын үнемдейді
және негізігі құжаттың форматы жоғары дәрежеде сақталып тұрады.
2 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ МОДЕЛІН ҚҰРУ
2.1 Өткен шақ жай сөйлемдердің грамматикалық сипаттамасы
Қазақ тілінің өткен шағының екі түрі болады: болымды және болымсыз.
Қимыл, іс-әрекеттің өткен уақытта болғанын көрсететін етістіктің түрі өткен
шақ деп аталады. Мысалы: Тұрар Мәскеуден келді. Ол Мәскеуден кеше келіпті.
Осы келді, келіпті сөздері екі түрлі мағына береді. Бірінші сөйлемде айтушы
Тұрарды өзі көріп, іле хабарлап тұр, екінші сөйлемде айтушы біреуден естіп,
хабарлап тұр.
Сондықтан өз көзімен көріп, жедел хабарлап тұрған етістіктің өткен
шағын жедел өткен шақ дейміз де, біреуден естіп барып, содан кейін хабарлап
тұрған немесе бұрын көргенін бөгеліп барып хабарлап тұрған етістіктің өткен
шағын бұрынғы өткен шақ дейміз. Мына сөйлемдерді салыстырып көрейік: Мен
киноға баратынмын. Сен киноға қашан баратын едің?
Бірінші сөйлемде іс, оқиға өткен шақтық мағынада болса, екіншіде келер
шақтық мағынаны білдіріп тұр. Осындай, бір істің бірнеше рет қайталанып,
дағдыға айналуын көрсететін түрі ауыспалы өткен шақ делінеді. Сөйтіп, өткен
шақ 1) жедел өткен шақ, 2) бұрынғы өткен шақ, 3) ауыспалы өткен шақ болып
үшке бөлінеді. Төменде өткен шақтың түрлері схема ретінде көрсетілген.
(1,2,3-суреттер)
Қазақ тілінде өткен шақ есімше және көсемше арқылы құрылады. Өткен
шақтық көсемше – амалды, себепті, кейде мезгілдің сөйлеп тұрған уақыттан
болғандығын білдіреді.
Қазақ тілінің өткен шақтағы жай сөйлемдерінің лексикалық талдауын жасау
үшін маған, өткен шақтың түрлерін оның жұрнақ-жалғауларын толығымен зерттеу
қажет.
2.2 Формальды грамматика
Туынды тілдер, кәдімгі адамдар, әр-түрлі ұлттардың сөйлесетін тілден
айырмашылығы, ол белгілі бір текстерді құруға арналған. Туынды тілдер
қарапайым тілден оңайлау, себебі онда қысқартылған грамматика, синтаксис,
семантика, сондай-ақ контекстік қажеттілік азайтылған. Туынды тілдердің
негізгі қызметі ақпараттарды компьютерлерге және басқарушы құрылғыларға
жеткізу болып табылады. Ақпарат немесе текст компьютер әлде басқарушы
құрылғы атқаратын жұмысын көрсетеді. Мұндай жұмыстың текстін адам ойлап
жасайды. Бұл кіріс тексті деп аталады. Ол басқа қолданушы адамдарға да
түсінікті болу мақсатында құрылады. Адамдарға арналған тіл компьютер
тілінен өзгеше болады. Кіріс тіліндегі текстің өзгертіліп компьютерге
түсінікті болу үшін, транслятор атты арнайы құрылғылар немесе программалар
қолданылады.
Транслятор құру жауапты және қиын іс болып табылады. Оның сапасына
қарай, тілдік өзгерістер құрылады. Трансляторға қойылатын негізгі мақсат
кіріс барысындағы текстің құрылымын нақты жеткізу болып табылады. Мұны іске
асыру үшін кіріс барысындағы текстің нақты құрылымын білу қажет, синтаксис,
лексика, грамматика.
G - грамматика
Т - терминалды грамматикалық тұлғалар
N - терминалды емес грамматикалық тұлғалар
P - ережелер
S - бастапқы символ
G={N, T, P, S}
{Жұрнақтар}, {жіктік жалғаулар}, есімше, негіз, көсемше
S=өткен шақ
P:
1: өткен шақ :: = жедел өткен шақ бұрынғы өткен шақ
ежелгі өткен шақ ауыспалы өткен
шақ
2: жедел өткен шақ :: = негіз жедел өткен шақтың жұрнағы, жіктік
жалғау
3: жедел өткен шақтың жұрнағы :: = “ды” “ді” “ты” “ті”
4: жіктік жалғау :: = “м” “ң” “қ” “к” “мын” “мін” “бын”
“бін” “пын” “пін” “быз” “біз”
5: бұрынғы өткен шақ :: = есімше, бұрынғы өткен шақтың жұрнағы,
жіктік жалғау
6: бұрынғы өткен шақтың жұрнағы :: = “ған” “ген” “қан” “кен”
7: жіктік жалғау :: = “м” “ң” “қ” “к” “сың” “сің” “дың”
“дің”
8: ежелгі өткен шақ :: = көсемше, ежелгі өткен шақтың жұрнағы,
жіктік жалғау
9: ежелгі өткен шақтың жұрнағы :: = “ып” “іп” “п”
10: ауыспалы өткен шақ :: = есімше, ауыспалы өткен шақтың жұрнағы,
жіктік жалғау
11: ауыспалы өткен шақтың жұрнағы:: = “атын” “етін” “йтын” “йтін”
12: болымсыз өткен шақ :: = болымсыз жедел өткен шақ
болымсыз бұрынғы
өткен шақ
болымсыз ежелгі
өткен шақ
болымсыз ауыспалы
өткен шақ
13: болымсыз жедел өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, жедел өткен шақтың жұрнағы, жіктік жалғау
көсемше, болымсыз етістіктің жалғауы, жедел өткен шақтың
жұрнағы, жіктік жалғау
көсемше, болымсыз етістіктің жалғауы, жедел өткен шақтың
жұрнағы, жіктік жалғау
14: болымсыз етістіктің жалғауы :: = “ма”, “ме”, “па”, “пе”, “ба”, “бе”
15: жедел өткен шақтың жұрнағы :: = “ды” “ді” “ты” “ті”
16: көсемше:: = “ып” “іп” “п”
17: көсемше:: = “а” “е” “й”
18: болымсыз бұрынғы өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, болымсыз бұрынғы өткен шақтың жұрнағы, жіктік жалғау
19: бұрынғы өткен шақтың жұрнағы :: = “ған” “ген” “қан” “кен”
20: болымсыз ежелгі өткен шақ :: = негіз, болымсыз етістіктің
жалғауы, болымсыз ежелгі өткен шақтың жұрнағы, жіктік жалғау
21: болымсыз ежелгі өткен шақтың жұрнағы :: = “п”
22: болымсыз ауыспалы өткен шақ :: = есімше, болымсыз етістіктің
жалғауы, болымсыз ауыспалы өткен шақтың жұрнағы, жіктік жалғау
23: болымсыз ауыспалы өткен шақтың жұрнағы:: = “ушы” “уші” “йтын”
“йтін”
3 ӨТКЕН ШАҚ ЖАЙ СӨЙЛЕМДЕРІНІҢ ЛЕКСИКАЛЫҚ ТАЛДАУДЫҢ АЛГОРИТМІН ҚҰРУ
3.1 Статистикалық машиналық ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz