Машиналық аударманың түрі мен стратегиясы


ҚАЗАҚСТАН РЕСПУБЛИКАСЫ ҒЫЛЫМ ЖӘНЕ
БІЛІМ МИНИСТРЛІГІ
«АБЫЛАЙ ХАН АТЫНДАҒЫ ҚАЗАҚ ХАЛЫҚАРАЛЫҚ ҚАТЫНСТАР ЖӘНЕ ӘЛЕМ ТІЛДЕРІ УНИВЕРСИТЕТІ» АҚ
Мамандығы: “5B020700 - Аударма ісі”
ДИПЛОМДЫҚ ЖОБА
Цифрлы қоғам дәуіріндегі машиналық аударма
(орыс-қазақ, қазақ-орыс «Сөздік» онлайн аудармашы негізінде)
Орындаушы:
4 курс студенті
Медет Жеңісбек
Ғылыми жетекшісі:
. филология ғылымдарының докторы,
профессор ИСМАГУЛОВА Б. Х.
Тәжірибе жетекшісі:
“Қорғауға жіберілді”
Синхронды аударма кафедрасының меңгерушісі
Динасилова Молдиp Акжановна
Алматы, 2021
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН
АО «КАЗАХСКИЙ УНИВЕРСИТЕТ МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ И МИРОВЫХ ЯЗЫКОВ ИМЕНИ АБЫЛАЙ ХАНА»
Специальность: “5B020700 - Переводческое дело”
ДИПЛОМНЫЙ ПРОЕКТ
Машинный перевод в эпоху цифрового общества
(русско-казахский, казахско-русский «словарь» на основе онлайн-переводчика)
)
Исполнитель:
Студент 4 курса
Медет Женисбек
Научный руководитель:
доктор филологических наук,
профессор ИСМАГУЛОВА Б. Х.
Руководитель базы практики:
“Допущено к защите”
Заведующий кафедрой синхронного перевода
Динасилова Молдиp Акжановна
Алматы, 2021
М А З М Ұ Н Ы
КІРІСПЕ . . . 4
І ТАРАУ. Машиналық аударма - жасанды интеллекттің бір бағыты . . .
ІІ ТАРАУ. Машиналық аударманың түрі мен стратегиясы . . .
ҚОРЫТЫНДЫ. . . .
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ . . .
ҚОСЫМША (Цифрлы қоғам дәуіріндегі орысша-қазақша термин сөздігі) . . .
КІРІСПЕ
Онлайн аударманы ХХІ ғасырдың ең танымал қызметінің бірі деп атауға болады. Орташа есеппен алғанда, интернетте планетаның әр тұрғыны күніне жеті сөз аударады екен, бұл - дамылсыз өсіп келе жатқан статистика.
Бірақ бүгінде мұндай қызмет өте көп, және осы салада аудармашының қайсысын таңдау керек деген сұрақ туады. Google Translate, PROMT. One, Яндекс. Переводчик, DeepL сияқты ірі аудармашы бар, олардың аударма сапасы жоғары, қолжетімді, көп тілден аудару мүмкіндігі жоғары.
Жаңа технологияны қолдануды жасанды интеллект жұмысының үлгілі мысалы деп санауға болады. Өйткені адамға деген қажеттілік жойылмайды, аудармашы барлық қара жұмысты алгоритмге қалдырып, машиналық аударманың редакторы болады. Бұл аударма жұмысын тез орындауға мүмкіндік береді. Және машиналық аударманың құны білікті маманның қызметінен жүз есе төмен.
Осындай машиналық аударманың Қазақстанға келгеніне де көп уақыт болды. Мысалы, https://sozdik. kz сайты. Осынау орысша-қазақша және қазақша-орысша онлайн сөздік әр аударма бағыты бойынша 60 000 -нан астам сөзді қамтиды. Дегенмен бұл аударма сайты жеке сөз бен сөз тіркестерін ғана жақсы аудара алады. Тұтас мәтінді аударуға әлі дайын емес.
Машиналық аударма заң, техника, медицина, іскери лексиканы аударуға уақыт жағынан біршама септігін тигізсе, көркем аударма жасауға икемі келмейді, шамасы жетпейді. Іскери әдебиетті аударып бергеннің өзінде әр абзацты өзгертуге тура келді. Машиналық аударма мәтіннің не туралы екенін түсінуге мүмкіндік береді - болды. Ал бір тілден өзге тілге ыждаһатты етіп, төрт құбыласын түгел етіп аудара алмайды. Жасанды интеллектінің оған шамасы жоқ. Себебі, машиналық аудармада синтаксистік проблемалар бар: орыс тілінде қазақ тіліне қарағанда сөздердің қатаң тәртібі бар. Егер сіз машиналық аудармаға еркіндік берсеңіз, ол орыс тілінің синтаксисін орындайды. Қазақ тілі сөз тәртібімен ойнауға мүмкіндік береді, мұндай дүниеге машиналық аудармаәлі жарамайды, ол үнемі тек стандарт схема бойынша тәжіма жасайды.
Бс-алты жыл бұрынғы әлеуетімен қазіргісін салыстырсақ, машиналық аудармаәлдеқайда жақсы жұмыс істейді. 2015 жылы мәтінді аудармашыға жазған кезде, тәржімадан кейін сіз әлі де жұмыс істеуіңіз керек еді, ал қазір, - бұл әдеби-көркем кітап немесе эссе болмаса - көңілге қанағат, жазылғанның мағынасын түсінуге мүмкіндік береді. Бірақ білікті аудармашыларсыз-ақ машина өзі аудара береді деп айтуға әлі ерте.
Көп нәрсе сіз жұмыс істейтін тілге байланысты. Егер сіз бір кітапты Google аудармашымен аударып шығарсаңыз, нәтижесі нашар болады деп ойлаймын, өйткені Google негізінен ағылшын мәтіндерімен жұмыс істейді. Яндексте ақпаратты толық шығара алатын орыс мәтіндерінің мол базасы бар, ол ағылшын тілінен орыс тіліне аударманы жақсы жасай алады, бірақ орыс тілінен қазақ тіліне аударғанда әлі де олқылықтар ұшырасады. Мысалы, мен бүкіл мәтінді (толық бір бет) Google-ге тәржімаға салған кезде машиналық аударманы ала алмайтын бөлшектерге назар аудара бастадым. Жалпы, бұл аударманың орташа деңгейін ғана жасай алады, тәржімаланған мәтін үлкен редакторлық жұмысты қажет етеді. Мысалы, орыс тілінде «брак» деп өнеркәсіп саласында кәсіпорыннан толық сапалы болып шықпаған, сапасында кемшілігі бар әлдебір затты атайды, сонымен бірге «брак» деп некені де айтатыны белгілі. Мұндай көп мағыналы сөздер көп, сондықтан жасанды интеллект осындай мәселелерде жолынан жаңылып жатады.
Интернетте кейбір аударма мәтінді оқығанда, анық сәйкессіздікті немесе терминдердің дұрыс қолданылмағанын байқап қаламыз, әйткенмен аударманың машиналық шығу тегі кейбір кезде кітаптардан аңдалмайды да. Ол, әлбетте, тәржіманың үстінен редактордың жұмыс істегенін аңғартады. Интернетте, әрине, осы жолмен аударылған «калька» мақаланы көптеп таба аласыз. Мұның бәрі интернет-басылымның ар-ұжданына қалады, әрине.
І тарау
Машиналық аударма - жасанды интеллекттің бір бағыты
Машиналық аударма терминін кем дегенде екі мағынада түсінуге болады. Машиналық аударма - бұл белгілі мәтінді бір тілден екінші тілге аудару процесі, оны машиналық компьютер толықтай жүзеге асырады. Бұл процесс барысында мәтін машинаның бірінші «есігіне», яғни кіріске енгізіледі, ал екінші «есігінен», яңни шығыстан басқа тілдегі мәтінді шығарып береді, осы процесс машиналық тәржіма болып табылады, ал кіріс мәтінін шығыс мәтінге айналдыру адамның араласуынсыз жүзеге асырылады (кейде пост-редакциялауға рұқсат етіледі) .
Машиналық аударма кең мағынада лингвистика, математика, кибернетика қиылысында орналасқан және машиналық аударманы тар мағынада жүзеге асыратын жүйені құруға бағытталған ғылыми зерттеу саласы болып табылады.
Енді машиналық аударманың пайда болуы және дамуы тарихына үңіле кетейік.
1946 жылы Рокфеллер қорының жаратылыстану бөлімінің Уоррен Уивер Эндрю Бут деген директоры Норберт Винермен хат алмасу кезінде алғаш рет машиналық аударма тұжырымын жасаған болатын, машиналық аударма ғылыми бағыт ретінде осы кезден басталады.
1952 жылы Массачусетс технологиялық университетінде машиналық тәржіма бойынша алғашқы конференция өтті, ал 1954 жылы Нью-Йоркте IBM компаниясы Джорджтаун университетімен бірлесіп әзірлеген бірінші машиналық тәржіма - IBM Mark II жүйесі ұсынылды (бұл оқиға тарихқа Джорджтаун эксперименті ретінде енді) .
ХХ ғасырдың 50-жылдарының басында АҚШ пен Еуропадағы бірқатар зерттеу тобы машина тәржімасы саласында жұмыс істеді. Бұл зерттеуге айтарлықтай қаражат жұмсалды, бірақ нәтиже көп ұзамай инвесторлардың көңілін қалдырды. Сол жылдардағы машина тәржімасы сапасы төмендігінің басты себебінің бірі аппараттық құралдардың шектеулі мүмкіндігі болды: ақпаратқа жадтың аздығы, жоғары деңгейлі бағдарламалау тілін толық пайдалану мүмкін еместігі еді.
70-жылдардың аяғында компьютерлік технологияның дамуымен (микрокомашиналық аудармаьютерлердің пайда болуы, желілердің дамуы, жад ресурстарының ұлғаюы) машиналық аударма"ренессанс"дәуіріне енді. Сонымен бірге, назар біршама өзгерді: зерттеушілер қазір аударма процесінің әртүрлі кезеңдеріне адамның қатысуын көздейтін "нақты" машиналық аударма жүйесін дамытуды мақсат етті.
90-шы жылдар дербес комашиналық аудармаьютерлер нарығының (жұмыс үстелінен қалтаға дейін) және ақпараттық технологиялардың қарқынды дамуына, Интернет желісін кеңінен пайдалануға (ол барған сайын интернационалдық және көптілді бола түсуде) әкелді. Мұның бәрі машиналық аударма жүйесін одан әрі дамытуға мүмкіндік берді, ең бастысы сұранысқа ие болды.
Қазіргі әлемде машиналық аударма жұмысын дамытуға екі негізгі ынталандыру бар.
Біріншісі-нақты ғылыми; ол аударманы комашиналық аудармаьютерлік модельдеудің күрделілігі мен күрделілігімен анықталады. Түрі ретінде тілдік қызметін ауыстыру қозғайтын барлық деңгейлері тілі - жылғы тану графем (және фонем ауыстыру кезінде ауызша сөйлеу) бергенге дейін мәні сөздері және мәтін. Сонымен қатар, аударма кері байланыспен және белгілі бір тілдік деңгейлердің құрылысы туралы теориялық гипотезаны және ұсынылған алгоритмдердің тиімділігін бірден тексеру мүмкіндігімен сипатталады. Жалпы аударманың және машиналық аударманың бұл ерекшелігі теоретиктердің назарын аударады, нәтижесінде аударманы автоматтандырудың және тілдік деректер мен процестерді формализациялаудың жаңа теориялары пайда болады.
Екінші ынталандыру - бұл әлеуметтік, және бұл қазіргі әлемдегі машиналық аударма тәжірибесінің тілдік байланысты қамтамасыз етудің қажетті шарты ретінде өсіп келе жатқан рөліне байланысты, оның көлемі жыл сайын артып келеді. Қарым - қатынас жолындағы тілдік кедергілерді жеңудің басқа тәсілдері - бір тілді дамыту немесе қабылдау, сондай-ақ шет тілдерін үйрену-тиімділігі бойынша аудармамен салыстыруға болмайды. Осы тұрғыдан алғанда, аудармаға балама жоқ деп айтуға болады, сондықтан жоғары сапалы және жоғары өнімді машиналық аудармажүйелерін дамыту маңызды әлеуметтік-коммуникативтік міндеттерді шешуге ықпал етеді.
Машиналық аударма жүйесін пайдалану мәтіндерді аудару үшін қажет уақытты едәуір қысқартады. Кәсіби аудармашылардың қызметіне жүгіне отырып, біз аударымның әрбір беті үшін ақша төлеуге мәжбүрміз. Алайда, көбінесе мәтіннің керемет аудармасын алудың қажеті жоқ, бірақ сіз жіберілген хаттың немесе Интернеттегі парақтың мазмұнын тез түсінуіңіз керек. Бұл жағдайда аударма жүйесі сенімді және тиімді көмекші болады.
Көптеген пайдаланушылар жеке хаттарды аудару үшін MP жүйелерін үнемі пайдаланады, өйткені әр адам шетелдік аудармашыға жеке хат алмасуға немесе қаржылық құжаттардың аудармасын тапсыруға дайын емес.
Кәсіби аудармашы, әдетте, белгілі бір тақырыптағы мәтіндерді аударуға мамандандырылған. Аудармашы бағдарламасы әртүрлі салалардағы мәтіндердің аудармасын жеңе алады: мамандандырылған терминдерді дұрыс аудару үшін қажетті параметрлерді қосу жеткілікті.
ІІ тарау
Машиналық аударманың түрі мен стратегиясы
Аударма түрлерінің екі негізгі классификациясы бар:
а) аударылған мәтіндердің табиғаты бойынша (түпнұсқаның жанрлық және стильдік ерекшеліктері) ;
б) аудармашының аударма процесінде сөйлеу әрекетінің табиғаты бойынша (аударма формасы) .
Түпнұсқаның жанрлық-стилистикалық ерекшеліктеріне байланысты аудармалардың жанрлық-стилистикалық жіктелуі аударманың үш функционалды түрін ажыратады:
а) көркем;
ә) қоғамдық-саяси;
б) арнайы.
Көркем аударма объектісі-көркем шығармалар. Кез-келген өнер туындысының негізгі міндеті-оқырманға бейнелі-эмоционалды және эстетикалық әсер ету. Аударма тіліне белгілі бір эстетикалық әсерге қол жеткізу үшін эпитеттен (түрлі-түсті анықтамадан) фразаның ырғақты-синтаксистік құрылысына дейін көптеген тілдік құралдар қолданылады. Мұндай эстетикалық көркемдік аударманың бағыты аударманың басқа түрлерінен ерекшеленеді. Осы себептерге байланысты көркем мәтіндерді машиналық аудару қиынға соғады.
Қоғамдық-саяси аударма-қоғамдық-саяси және публицистикалық сипаттағы мәтіндерді насихаттау немесе үгіт-насихат жолымен аудару. Қоғамдық-саяси аударма әртүрлі терминологияның қанықтылығымен жарқын эмоционалды бояумен сипатталады.
Арнайы аударма белгілі бір терминологиялық номенклатурасы бар әртүрлі пәндік білім салаларына қызмет етеді. Арнайы аударма объектісі-бұл адам білімі мен ғылым мен техниканың әр түрлі салаларына қатысты материалдар. Бұл материалдар ойдың өте дәл көрінісімен сипатталады, сондықтан терминологияны кеңінен қолданады. Мұндай аударма машина түрінде оңай жүзеге асырылады, өйткені арнайы мәтіндер мәтінді құрудың қатаң логикасымен, сөйлемдердің қатаң құрылымымен, эмоционалды бояу мен субтекстің болмауымен сипатталады.
Аударма нысандары деп аударма жүзеге асырылатын әдістер бар: жазбаша және ауызша.
Жазбаша аударма машиналық іске асыруды жеңілдетеді, өйткені ауызша қосымша мәселені шешуді талап етеді - ауызша сөйлеуді тану және синтездеу.
Қазіргі уақытта автоматтандыру дәрежесі бойынша машиналық аударма түрлері бөлінеді:
а) толық автоматты;
ә) адамның қатысуымен автоматтандырылған машиналық аударма(алдын - ала, интер-немесе постредакциялаумен) ;
б) комашиналық аудармаьютерді қолдану арқылы адам жасаған аударма (мысалы, электронды сөздіктерді қолдану) .
Алғашқы машиналық аударма жүйесі тікелей (мақал-мәтел) аударма стратегиясымен сипатталады. Машиналық аударма құрудың бұл тәсілінің мәні-кіріс тіліндегі бастапқы мәтін біртіндеп бірқатар кезеңдер арқылы шығыс тілінің мәтініне айналады. Түрлендірулер кіріс тіліндегі сөз (сөз тіркесі) оның Шығыс тіліндегі сөздік баламасына ауыстырылатындығына байланысты. Тікелей аударма стратегиясын қолданатын бірінші буын жүйелерінде жалпы тіл жүйесінің жұмысын модельдеудің қажеті жоқ екені түсінікті. Мұндай жүйелердің жұмысы үшін сөздік корреспонденция ережелері жеткілікті. Сирек жағдайларда, жүйе сөздігінде қайтадан ұсынылған гетерогенді өрнектерді аудару үшін контекстке талдау жасалады. Ескеру маңызды, бұл стратегия тікелей аудару ажырата емес, түсіне (талдау) және синтезбен (қолының ісі еді), өйткені олар іс жүзінде алынып тасталды өзгерістердің ережелері бойынша сөздік сәйкестіктер. Тікелей аударма әрқашан белгілі бір тілдер жұпына байланысты. Мысалы, кіріс тілінің өрнектерінің түсініксіздігі шығыс тілі үшін қажет болған жағдайда ғана шешіледі. Уақыт бойынша бірінші буын жүйелері негізінен 40-жылдардың аяғынан 60-жылдардың ортасына дейін құрылды.
Тікелей аударма стратегиясының маңызды модификациясы тек кіріс тілінің лексемаларын шығыс тілінің сөздік сәйкестіктеріне ауыстыруға дейін азайтылмайтын тіларалық операциялардың трансфер-кезеңі бар жүйелерде жүзеге асырылады. Трансфер кезеңінің болуы мыналарды қамтиды "аралық " немесе" ішкі " көрініс шығыс тілінің сөйлем құрылымына "бейімделеді". Бірінші стратегиядан айырмашылығы, трансфері бар машиналық аударма жүйесінің архитектурасында талдау (түсіну) және синтез арнайы процедуралар ретінде бар және әртүрлі алгоритмдермен қызмет етеді.
... жалғасы- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.

Ақпарат
Қосымша
Email: info@stud.kz