Машиналық аударманың түрі мен стратегиясы



Жұмыс түрі:  Материал
Тегін:  Антиплагиат
Көлемі: 11 бет
Таңдаулыға:   
ҚАЗАҚСТАН РЕСПУБЛИКАСЫ ҒЫЛЫМ ЖӘНЕ
БІЛІМ МИНИСТРЛІГІ
АБЫЛАЙ ХАН АТЫНДАҒЫ ҚАЗАҚ ХАЛЫҚАРАЛЫҚ ҚАТЫНСТАР ЖӘНЕ ӘЛЕМ ТІЛДЕРІ УНИВЕРСИТЕТІ АҚ

Мамандығы: "5B020700 - Аударма ісі"

ДИПЛОМДЫҚ ЖОБА

Цифрлы қоғам дәуіріндегі машиналық аударма
(орыс-қазақ, қазақ-орыс Сөздік онлайн аудармашы негізінде)

Орындаушы:
4 курс студенті
Медет Жеңісбек
Ғылыми жетекшісі:
. филология ғылымдарының докторы,
профессор ИСМАГУЛОВА Б.Х.
Тәжірибе жетекшісі:

"Қорғауға жіберілді"
Синхронды аударма кафедрасының меңгерушісі
Динасилова Молдиp Акжановна
____________

Алматы, 2021

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН
АО КАЗАХСКИЙ УНИВЕРСИТЕТ МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ И МИРОВЫХ ЯЗЫКОВ ИМЕНИ АБЫЛАЙ ХАНА

Специальность: "5B020700 - Переводческое дело"

ДИПЛОМНЫЙ ПРОЕКТ

Машинный перевод в эпоху цифрового общества
(русско-казахский, казахско-русский словарь на основе онлайн-переводчика)
)

Исполнитель:
Студент 4 курса
Медет Женисбек
Научный руководитель:
доктор филологических наук,
профессор ИСМАГУЛОВА Б.Х.
Руководитель базы практики:

"Допущено к защите"
Заведующий кафедрой синхронного перевода
Динасилова Молдиp Акжановна
____________

Алматы, 2021

М А З М Ұ Н Ы
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..4
І ТАРАУ. Машиналық аударма - жасанды интеллекттің бір бағыты ... ... ... ... ... ... ... . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
ІІ ТАРАУ. Машиналық аударманың түрі мен стратегиясы ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
ҚОРЫТЫНДЫ ... ... ... ... ... ... .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ ... ... ... ... ... ... ... . ... ... ... ...
ҚОСЫМША (Цифрлы қоғам дәуіріндегі орысша-қазақша термин сөздігі) ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

КІРІСПЕ

Онлайн аударманы ХХІ ғасырдың ең танымал қызметінің бірі деп атауға болады. Орташа есеппен алғанда, интернетте планетаның әр тұрғыны күніне жеті сөз аударады екен, бұл - дамылсыз өсіп келе жатқан статистика.
Бірақ бүгінде мұндай қызмет өте көп, және осы салада аудармашының қайсысын таңдау керек деген сұрақ туады. Google Translate, PROMT.One, Яндекс.Переводчик, DeepL сияқты ірі аудармашы бар, олардың аударма сапасы жоғары, қолжетімді, көп тілден аудару мүмкіндігі жоғары.
Жаңа технологияны қолдануды жасанды интеллект жұмысының үлгілі мысалы деп санауға болады. Өйткені адамға деген қажеттілік жойылмайды, аудармашы барлық қара жұмысты алгоритмге қалдырып, машиналық аударманың редакторы болады. Бұл аударма жұмысын тез орындауға мүмкіндік береді. Және машиналық аударманың құны білікті маманның қызметінен жүз есе төмен.
Осындай машиналық аударманың Қазақстанға келгеніне де көп уақыт болды. Мысалы, https:sozdik.kz сайты. Осынау орысша-қазақша және қазақша-орысша онлайн сөздік әр аударма бағыты бойынша 60 000 -нан астам сөзді қамтиды. Дегенмен бұл аударма сайты жеке сөз бен сөз тіркестерін ғана жақсы аудара алады. Тұтас мәтінді аударуға әлі дайын емес.
Машиналық аударма заң, техника, медицина, іскери лексиканы аударуға уақыт жағынан біршама септігін тигізсе, көркем аударма жасауға икемі келмейді, шамасы жетпейді. Іскери әдебиетті аударып бергеннің өзінде әр абзацты өзгертуге тура келді. Машиналық аударма мәтіннің не туралы екенін түсінуге мүмкіндік береді - болды. Ал бір тілден өзге тілге ыждаһатты етіп, төрт құбыласын түгел етіп аудара алмайды. Жасанды интеллектінің оған шамасы жоқ. Себебі, машиналық аудармада синтаксистік проблемалар бар: орыс тілінде қазақ тіліне қарағанда сөздердің қатаң тәртібі бар. Егер сіз машиналық аудармаға еркіндік берсеңіз, ол орыс тілінің синтаксисін орындайды. Қазақ тілі сөз тәртібімен ойнауға мүмкіндік береді, мұндай дүниеге машиналық аудармаәлі жарамайды, ол үнемі тек стандарт схема бойынша тәжіма жасайды.
Бс-алты жыл бұрынғы әлеуетімен қазіргісін салыстырсақ, машиналық аудармаәлдеқайда жақсы жұмыс істейді. 2015 жылы мәтінді аудармашыға жазған кезде, тәржімадан кейін сіз әлі де жұмыс істеуіңіз керек еді, ал қазір, - бұл әдеби-көркем кітап немесе эссе болмаса - көңілге қанағат, жазылғанның мағынасын түсінуге мүмкіндік береді. Бірақ білікті аудармашыларсыз-ақ машина өзі аудара береді деп айтуға әлі ерте.
Көп нәрсе сіз жұмыс істейтін тілге байланысты. Егер сіз бір кітапты Google аудармашымен аударып шығарсаңыз, нәтижесі нашар болады деп ойлаймын, өйткені Google негізінен ағылшын мәтіндерімен жұмыс істейді. Яндексте ақпаратты толық шығара алатын орыс мәтіндерінің мол базасы бар, ол ағылшын тілінен орыс тіліне аударманы жақсы жасай алады, бірақ орыс тілінен қазақ тіліне аударғанда әлі де олқылықтар ұшырасады. Мысалы, мен бүкіл мәтінді (толық бір бет) Google-ге тәржімаға салған кезде машиналық аударманы ала алмайтын бөлшектерге назар аудара бастадым. Жалпы, бұл аударманың орташа деңгейін ғана жасай алады, тәржімаланған мәтін үлкен редакторлық жұмысты қажет етеді. Мысалы, орыс тілінде брак деп өнеркәсіп саласында кәсіпорыннан толық сапалы болып шықпаған, сапасында кемшілігі бар әлдебір затты атайды, сонымен бірге брак деп некені де айтатыны белгілі. Мұндай көп мағыналы сөздер көп, сондықтан жасанды интеллект осындай мәселелерде жолынан жаңылып жатады.
Интернетте кейбір аударма мәтінді оқығанда, анық сәйкессіздікті немесе терминдердің дұрыс қолданылмағанын байқап қаламыз, әйткенмен аударманың машиналық шығу тегі кейбір кезде кітаптардан аңдалмайды да. Ол, әлбетте, тәржіманың үстінен редактордың жұмыс істегенін аңғартады. Интернетте, әрине, осы жолмен аударылған калька мақаланы көптеп таба аласыз. Мұның бәрі интернет-басылымның ар-ұжданына қалады, әрине.

І тарау
Машиналық аударма - жасанды интеллекттің бір бағыты
Машиналық аударма терминін кем дегенде екі мағынада түсінуге болады. Машиналық аударма - бұл белгілі мәтінді бір тілден екінші тілге аудару процесі, оны машиналық компьютер толықтай жүзеге асырады. Бұл процесс барысында мәтін машинаның бірінші есігіне, яғни кіріске енгізіледі, ал екінші есігінен, яңни шығыстан басқа тілдегі мәтінді шығарып береді, осы процесс машиналық тәржіма болып табылады, ал кіріс мәтінін шығыс мәтінге айналдыру адамның араласуынсыз жүзеге асырылады (кейде пост-редакциялауға рұқсат етіледі).
Машиналық аударма кең мағынада лингвистика, математика, кибернетика қиылысында орналасқан және машиналық аударманы тар мағынада жүзеге асыратын жүйені құруға бағытталған ғылыми зерттеу саласы болып табылады.
Енді машиналық аударманың пайда болуы және дамуы тарихына үңіле кетейік.
1946 жылы Рокфеллер қорының жаратылыстану бөлімінің Уоррен Уивер Эндрю Бут деген директоры Норберт Винермен хат алмасу кезінде алғаш рет машиналық аударма тұжырымын жасаған болатын, машиналық аударма ғылыми бағыт ретінде осы кезден басталады.
1952 жылы Массачусетс технологиялық университетінде машиналық тәржіма бойынша алғашқы конференция өтті, ал 1954 жылы Нью-Йоркте IBM компаниясы Джорджтаун университетімен бірлесіп әзірлеген бірінші машиналық тәржіма - IBM Mark II жүйесі ұсынылды (бұл оқиға тарихқа Джорджтаун эксперименті ретінде енді).
ХХ ғасырдың 50-жылдарының басында АҚШ пен Еуропадағы бірқатар зерттеу тобы машина тәржімасы саласында жұмыс істеді. Бұл зерттеуге айтарлықтай қаражат жұмсалды, бірақ нәтиже көп ұзамай инвесторлардың көңілін қалдырды. Сол жылдардағы машина тәржімасы сапасы төмендігінің басты себебінің бірі аппараттық құралдардың шектеулі мүмкіндігі болды: ақпаратқа жадтың аздығы, жоғары деңгейлі бағдарламалау тілін толық пайдалану мүмкін еместігі еді.
70-жылдардың аяғында компьютерлік технологияның дамуымен (микрокомашиналық аудармаьютерлердің пайда болуы, желілердің дамуы, жад ресурстарының ұлғаюы) машиналық аударма"ренессанс"дәуіріне енді. Сонымен бірге, назар біршама өзгерді: зерттеушілер қазір аударма процесінің әртүрлі кезеңдеріне адамның қатысуын көздейтін "нақты" машиналық аударма жүйесін дамытуды мақсат етті.
90-шы жылдар дербес комашиналық аудармаьютерлер нарығының (жұмыс үстелінен қалтаға дейін) және ақпараттық технологиялардың қарқынды дамуына, Интернет желісін кеңінен пайдалануға (ол барған сайын интернационалдық және көптілді бола түсуде) әкелді. Мұның бәрі машиналық аударма жүйесін одан әрі дамытуға мүмкіндік берді, ең бастысы сұранысқа ие болды.
Қазіргі әлемде машиналық аударма жұмысын дамытуға екі негізгі ынталандыру бар.
Біріншісі-нақты ғылыми; ол аударманы комашиналық аудармаьютерлік модельдеудің күрделілігі мен күрделілігімен анықталады. Түрі ретінде тілдік қызметін ауыстыру қозғайтын барлық деңгейлері тілі - жылғы тану графем (және фонем ауыстыру кезінде ауызша сөйлеу) бергенге дейін мәні сөздері және мәтін. Сонымен қатар, аударма кері байланыспен және белгілі бір тілдік деңгейлердің құрылысы туралы теориялық гипотезаны және ұсынылған алгоритмдердің тиімділігін бірден тексеру мүмкіндігімен сипатталады. Жалпы аударманың және машиналық аударманың ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Кәсіптік өндірістік практикасын өту туралы есеп
Лексикография
Аудармашы этикасі қолданушының көзқарасына тәуелді
Лингвистикалық аударма теориясы
Қазақ тілінен ағылышын тіліне машиналық аудару жүйесін жетілдіру
Қазақ тілінен орыс тіліне машиналық аударудың лингвистикалық сөздіктерін Apertium платформасының негізінде жасау
«қазақ тілінен ағылшын тіліне машиналық аударудың лингвистикалық сөздіктерін apertium платформасының негізінде жасау»
Қазақ тілінен ағылшын тіліне машиналық аударудағы лексикалық таңдауды шешу жолдарының моделдері мен әдістерін жасау
Аударма - көп мағыналы сөз
Аударманың түрлері жайында
Пәндер