Тіл білімі жəне компьютерлік лингвистика


Ақтөбе өңірлік Баишев Университеті
Білім Берудің Жоғары Мектебі
Қазақ Тілі мен Әдебиеті кафедрасы
МӘНЖАЗБА
Тақырыбы: Тіл білімі жəне компьютерлік лингвистика.
Орындаған: Мукушева Ғайша ҚТмӘ-302
Тексерген: Ертазина Сая Сыдыккызы
Ақтөбе 2020
Ақпараттық технологиялар мен интернеттің қарқынды дамуы адамдар арасындағы коммуникациялық қарым-қатынасты арттыруда. Бұл өз кезегінде үлкен көлемдегі сандық ақпараттың жинақталуына алып келді. Ақпарат алмасу тек технологиялық қарым-қатынас қана емес, сонымен қатар лингвистикалық құбылыс. Адамдардың тілді пайдалануы, сөз бен сөз тіркестерін қолдануы, мәліметтердің контекстуалдық ортасын түсінуі сынды мәселелер тіл білімінің маңызды саласына айналып, компьютерлік ғылым мен лингвистиканың тоғысқан жерінде компьютерлік лингвистика саласы пайда болды. Аталған сала XX ғасырдың 50-60 жылдары қалыптаса бастағанымен, қарқынды дамуы 2000 жылдардан бастау алады. Компьютерлік лингвистика дегеніміз - тілді пайдалану мен түсіндіру мақсатында тілдік нормаларды математикалық және компьютерлік модельдеу. Түп мақсаты - жасанды интеллект құрастыру. Бүгінгі күнде компьютерлік лингвистика жетістіктері екі негізгі бағытта қолданылады. Біріншісі, тілдерді түсіну мен зерттеу әдістерін дамыту. Бұрын белгісіз болған заңдылықтар мен құбылыстарды ашу. Екіншісі, адам мен машина арасындағы байланысты жеңілдету. Бұл бағытта технологиялық шешімдер мен өнімдерге назар аударылады. Жоғарыда айтылғандай, компьютерлік лингвистика нәтижелері жасанды интеллектінің құрамдас бөлшегі. Әр мемлекет жасанды интеллектіні өз тілінде сөйлетуге тырысуда. Себебі болашақта есептеу қуаты мықты компьютерлер ғана тілді сақтау және оны дамытумен тиімді айналыса алады. Сол себепті дамыған елдерде компьютерлік лингвистикаға жете назар аударылып, осы саланы дамытуға қыруар қаражат бөлінуде.
Компьютерлік лингвистика алдында көптеген мақсаттар тұр. Олардың ішіндегі ең маңыздылары:
- Бірінші, корпустық лингвистика. Тілдің электронды корпусын жасау және оны маңызды ақпаратпен толықтырып отыру. Бұл - тілдің бар байлығын, қолдану ерекшелігін сандық үлгіде топтастыру. Маңыздылығы бойынша кезек күттірмейтін жоба. Себебі тілге қатысты жасалмақ негізгі технологиялардың көпшілігі корпусқа сүйенетін болады. Басқаша айтқанда, ұлттық тіл корпусы компьютерлік лингвистиканың іргетасы. Өкінішке қарай, қазақ тілінің ұлттық тіл корпусы әлі жасалмаған. Алайда келесі жылы жасалады деп күтілуде.
- Екінші, қазақ тілінің қолданылуын жеңілдететін көмекші құралдар мен анықтамалық-ақпараттық портал. Қазіргі кезде Microsoft компаниясының Word атты мәтінді өңдеуге арналған өнімі қазақ тіліндегі мәтіннің орфографиясын ғана тексере алады. Әрине, бұның қазақ тіліндегі сөздерді қатесіз жазуға көмектескені анық. Дегенмен осы Word бағдарламасы ағылшын және орыс тілдеріндегі мәтінді нақты грамматикалық ережелер бойынша да тексереді. «WikiBilim» қоғамдық қоры Мәдениет және спорт министрлігі Тілдерді дамыту және қоғамдық-саяси жұмыс комитетімен бірлесе, қазақ тілін сауатты жазуға көмектесетін көмекші құралдар мен ақпараттық-анықтамалық материалдардан тұратын sauat. kz порталын жасауды жоспарлап отыр. Аталмыш жоба қазақ тілінің күнделікті өмірде, ресми қарым-қатынаста сауатты қолданылуына әсер етеді деп күтілуде.
- Үшінші, электронды сөздіктер, тезаурустар жасақтау. Қазіргі кезде көптеген сапалы сөздіктер шығарылуда. Алайда ол сөздіктер дәстүрлі баспа кітап күйінде ғана. Ал адамдар уақытының көп бөлігін компьютердің алдында өткізеді және өзіне керек ақпаратты компьютерден алғанды қалайды. Осы орайда, сөздіктердің электронды нұсқада, ыңғайлы үлгіде болғаны өте маңызды деп білеміз. Біздің ұйым жүзеге асырып жатқан «Қазақстанның ашық кітапханасы» жобасының аясында «Қазақ тілінің әмбебап сөздігі» жұмыс істейді. Аталмыш сөздік А. Байтұрсынұлы атындағы Тіл білімі институтының белді ғалымдарымен бірлестікте жасалған. Сөздіктің негізін «Қазақ әдеби тілі» сөздігіндегі 150 000 аса сөз бен сөз тіркесі құрайды. Алдағы уақытта осы сөздікке енген сөз қорын тұтастай дыбыстық үлгіге түсіру мақсаты тұр. Сонымен қатар салалық, синоним, антоним және аударма сөздіктерімен толықтырып, барлық компьютерлерге, планшеттерге, смартфондарға арналған нұсқасын жасау өте маңызды мәселе.
- Төртінші, автоматты аударма жүйесі. Технологиялардың дамуы екі тілді аудармадан көптілді аударма жасау мүмкіндігін берді. Мысалы, бұл технология Google компаниясының аударма қызметінде жүзеге асырылған. Аталмыш жүйеге қазақ тілі өткен жылдың желтоқсан айында енгізілді. Енді қазақтілді қолданушылар қас-қағым сәтте қазақ тілінен әлемнің 90 тіліне аударма жасай алу мүмкіндігіне ие болды. Жобаны жүзеге асырушы ұйым ретінде аударма сапасын мінсіз деп айта алмаймыз. Алайда бұл қазақ тілін жасанды интеллектімен достастыруға жасалған алғашқы қадам деп білеміз. Жүйе өз-өзін дамыта алатын күрделі алгоритмге негізделгендіктен, аудармада жіберілетін қателіктер уақыт өте жөнделіп, аударма сапасы арта түспек. Осы орайда тіл мамандарын жобаға үлес қосуға шақырамыз.
- Бесінші, мәтінге автоматты түрде сараптама жасау және сараптама негізінде қорытынды шығара алу. Бұл тілдегі болып жатқан өзгерістерді бақылауға көмектеседі. Сондай-ақ аталмыш технология мәтінді сараптау арқылы саяси, экономикалық, әлеуметтік-психологиялық зерттеулер жасауға жол ашады. Өкінішке қарай, аталмыш технология қазақ тілінде қолжетімді емес.
- Алтыншы, контенттің сандық трансформациясы. Көптеген елдерде ақпаратты тасымалдаудың аналогтық түрінен сандық үлгіге ауыстыру процесі жылдам жүзеге асырылуда. Себебі адамзат «қағаз мәдениетінен» «экран мәдениетіне» ауысуда. Ғалымдардың пайымдауынша, жақын болашақта қағаз күйіндегі кітаптардың орнын электронды кітаптар толықтырмақ. Алда айтып өткендей, біздің қоғамдық қор «Қазақстанның ашық кітапханасы» жобасын жүзеге асыруда. Жобаның мақсаты - қазақ тілінде жарық көрген барлық кітаптарды ең соңғы технологияға сүйене отырып, ыңғайлы сандық үлгіде жинақтау. Қазірдің өзінде кітапханамызда 4000-нан аса электронды кітап бар. Бұдан өзге 1500-ге жуық көркем шығарманың және 400 ертегінің толық аудионұсқасы орналастырылған.
- Жетінші, адам дауысын түсіну жүйесін құру. Адам мен машина қарым-қатынасының жаңа сапалық деңгейі - машинаның адам дауысын түсініп, оған қисынды түрде жауап бере алу мүмкіндігі. Мысалы, iPhone телефонына осындай қызметті атқара алатын Сири атты бағдарлама орнатылған. Бұл технология әзірше тек 17 тілде ғана, ағылшын, француз, неміс, жапон, корей, итальян, испан, қытай (мандарин мен кантон диалектілері), дат, нидерланд, португал, швед, тай, түрік, норвег және орыс тілдерінде жұмыс істейді.
- Сегізінші, мәтінді сөйлету технологиясы. Қазіргі таңда кез келген сандық үлгідегі мәтінді жасанды адам дауысымен дыбыстау технологиясы кеңінен қолданысқа енуде. Аталмыш технология зағип
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.

Ақпарат
Қосымша
Email: info@stud.kz