Тіл білімі жəне компьютерлік лингвистика
Ақтөбе өңірлік Баишев Университеті
Білім Берудің Жоғары Мектебі
Қазақ Тілі мен Әдебиеті кафедрасы
МӘНЖАЗБА
Тақырыбы: Тіл білімі жəне компьютерлік лингвистика.
Орындаған:Мукушева Ғайша ҚТмӘ-302
Тексерген: Ертазина Сая Сыдыккызы
Ақтөбе 2020
Ақпараттық технологиялар мен интернеттің қарқынды дамуы адамдар арасындағы коммуникациялық қарым-қатынасты арттыруда. Бұл өз кезегінде үлкен көлемдегі сандық ақпараттың жинақталуына алып келді. Ақпарат алмасу тек технологиялық қарым-қатынас қана емес, сонымен қатар лингвистикалық құбылыс. Адамдардың тілді пайдалануы, сөз бен сөз тіркестерін қолдануы, мәліметтердің контекстуалдық ортасын түсінуі сынды мәселелер тіл білімінің маңызды саласына айналып, компьютерлік ғылым мен лингвистиканың тоғысқан жерінде компьютерлік лингвистика саласы пайда болды. Аталған сала XX ғасырдың 50-60 жылдары қалыптаса бастағанымен, қарқынды дамуы 2000 жылдардан бастау алады. Компьютерлік лингвистика дегеніміз - тілді пайдалану мен түсіндіру мақсатында тілдік нормаларды математикалық және компьютерлік модельдеу. Түп мақсаты - жасанды интеллект құрастыру.Бүгінгі күнде компьютерлік лингвистика жетістіктері екі негізгі бағытта қолданылады. Біріншісі, тілдерді түсіну мен зерттеу әдістерін дамыту. Бұрын белгісіз болған заңдылықтар мен құбылыстарды ашу. Екіншісі, адам мен машина арасындағы байланысты жеңілдету. Бұл бағытта технологиялық шешімдер мен өнімдерге назар аударылады. Жоғарыда айтылғандай, компьютерлік лингвистика нәтижелері жасанды интеллектінің құрамдас бөлшегі. Әр мемлекет жасанды интеллектіні өз тілінде сөйлетуге тырысуда. Себебі болашақта есептеу қуаты мықты компьютерлер ғана тілді сақтау және оны дамытумен тиімді айналыса алады. Сол себепті дамыған елдерде компьютерлік лингвистикаға жете назар аударылып, осы саланы дамытуға қыруар қаражат бөлінуде.
Компьютерлік лингвистика алдында көптеген мақсаттар тұр. Олардың ішіндегі ең маңыздылары:
Бірінші, корпустық лингвистика. Тілдің электронды корпусын жасау және оны маңызды ақпаратпен толықтырып отыру. Бұл - тілдің бар байлығын, қолдану ерекшелігін сандық үлгіде топтастыру. Маңыздылығы бойынша кезек күттірмейтін жоба. Себебі тілге қатысты жасалмақ негізгі технологиялардың көпшілігі корпусқа сүйенетін болады. Басқаша айтқанда, ұлттық тіл корпусы компьютерлік лингвистиканың іргетасы. Өкінішке қарай, қазақ тілінің ұлттық тіл корпусы әлі жасалмаған. Алайда келесі жылы жасалады деп күтілуде.
Екінші, қазақ тілінің қолданылуын жеңілдететін көмекші құралдар мен анықтамалық-ақпараттық портал. Қазіргі кезде Microsoft компаниясының Word атты мәтінді өңдеуге арналған өнімі қазақ тіліндегі мәтіннің орфографиясын ғана тексере алады. Әрине, бұның қазақ тіліндегі сөздерді қатесіз жазуға көмектескені анық. Дегенмен осы Word бағдарламасы ағылшын және орыс тілдеріндегі мәтінді нақты грамматикалық ережелер бойынша да тексереді. WikiBilim қоғамдық қоры Мәдениет және спорт министрлігі Тілдерді дамыту және қоғамдық-саяси жұмыс комитетімен бірлесе, қазақ тілін сауатты жазуға көмектесетін көмекші құралдар мен ақпараттық-анықтамалық материалдардан тұратын sauat.kz порталын жасауды жоспарлап отыр. Аталмыш жоба қазақ тілінің күнделікті өмірде, ресми қарым-қатынаста сауатты қолданылуына әсер етеді деп күтілуде.
Үшінші, электронды сөздіктер, тезаурустар жасақтау. Қазіргі кезде көптеген сапалы сөздіктер шығарылуда. Алайда ол сөздіктер дәстүрлі баспа кітап күйінде ғана. Ал адамдар уақытының көп бөлігін компьютердің алдында өткізеді және өзіне керек ақпаратты компьютерден алғанды қалайды. Осы орайда, сөздіктердің электронды нұсқада, ыңғайлы үлгіде болғаны өте маңызды деп білеміз. Біздің ұйым жүзеге асырып жатқан Қазақстанның ашық кітапханасы жобасының аясында Қазақ тілінің әмбебап сөздігі жұмыс істейді. Аталмыш сөздік А.Байтұрсынұлы атындағы Тіл білімі институтының белді ғалымдарымен бірлестікте жасалған. Сөздіктің негізін Қазақ әдеби тілі сөздігіндегі 150 000 аса сөз бен сөз тіркесі құрайды. Алдағы уақытта осы сөздікке енген сөз қорын тұтастай дыбыстық үлгіге түсіру мақсаты тұр. Сонымен қатар салалық, синоним, антоним және аударма сөздіктерімен толықтырып, барлық компьютерлерге, планшеттерге, смартфондарға арналған нұсқасын жасау өте маңызды мәселе.
Төртінші, автоматты аударма жүйесі. Технологиялардың дамуы екі тілді аудармадан көптілді ... жалғасы
Білім Берудің Жоғары Мектебі
Қазақ Тілі мен Әдебиеті кафедрасы
МӘНЖАЗБА
Тақырыбы: Тіл білімі жəне компьютерлік лингвистика.
Орындаған:Мукушева Ғайша ҚТмӘ-302
Тексерген: Ертазина Сая Сыдыккызы
Ақтөбе 2020
Ақпараттық технологиялар мен интернеттің қарқынды дамуы адамдар арасындағы коммуникациялық қарым-қатынасты арттыруда. Бұл өз кезегінде үлкен көлемдегі сандық ақпараттың жинақталуына алып келді. Ақпарат алмасу тек технологиялық қарым-қатынас қана емес, сонымен қатар лингвистикалық құбылыс. Адамдардың тілді пайдалануы, сөз бен сөз тіркестерін қолдануы, мәліметтердің контекстуалдық ортасын түсінуі сынды мәселелер тіл білімінің маңызды саласына айналып, компьютерлік ғылым мен лингвистиканың тоғысқан жерінде компьютерлік лингвистика саласы пайда болды. Аталған сала XX ғасырдың 50-60 жылдары қалыптаса бастағанымен, қарқынды дамуы 2000 жылдардан бастау алады. Компьютерлік лингвистика дегеніміз - тілді пайдалану мен түсіндіру мақсатында тілдік нормаларды математикалық және компьютерлік модельдеу. Түп мақсаты - жасанды интеллект құрастыру.Бүгінгі күнде компьютерлік лингвистика жетістіктері екі негізгі бағытта қолданылады. Біріншісі, тілдерді түсіну мен зерттеу әдістерін дамыту. Бұрын белгісіз болған заңдылықтар мен құбылыстарды ашу. Екіншісі, адам мен машина арасындағы байланысты жеңілдету. Бұл бағытта технологиялық шешімдер мен өнімдерге назар аударылады. Жоғарыда айтылғандай, компьютерлік лингвистика нәтижелері жасанды интеллектінің құрамдас бөлшегі. Әр мемлекет жасанды интеллектіні өз тілінде сөйлетуге тырысуда. Себебі болашақта есептеу қуаты мықты компьютерлер ғана тілді сақтау және оны дамытумен тиімді айналыса алады. Сол себепті дамыған елдерде компьютерлік лингвистикаға жете назар аударылып, осы саланы дамытуға қыруар қаражат бөлінуде.
Компьютерлік лингвистика алдында көптеген мақсаттар тұр. Олардың ішіндегі ең маңыздылары:
Бірінші, корпустық лингвистика. Тілдің электронды корпусын жасау және оны маңызды ақпаратпен толықтырып отыру. Бұл - тілдің бар байлығын, қолдану ерекшелігін сандық үлгіде топтастыру. Маңыздылығы бойынша кезек күттірмейтін жоба. Себебі тілге қатысты жасалмақ негізгі технологиялардың көпшілігі корпусқа сүйенетін болады. Басқаша айтқанда, ұлттық тіл корпусы компьютерлік лингвистиканың іргетасы. Өкінішке қарай, қазақ тілінің ұлттық тіл корпусы әлі жасалмаған. Алайда келесі жылы жасалады деп күтілуде.
Екінші, қазақ тілінің қолданылуын жеңілдететін көмекші құралдар мен анықтамалық-ақпараттық портал. Қазіргі кезде Microsoft компаниясының Word атты мәтінді өңдеуге арналған өнімі қазақ тіліндегі мәтіннің орфографиясын ғана тексере алады. Әрине, бұның қазақ тіліндегі сөздерді қатесіз жазуға көмектескені анық. Дегенмен осы Word бағдарламасы ағылшын және орыс тілдеріндегі мәтінді нақты грамматикалық ережелер бойынша да тексереді. WikiBilim қоғамдық қоры Мәдениет және спорт министрлігі Тілдерді дамыту және қоғамдық-саяси жұмыс комитетімен бірлесе, қазақ тілін сауатты жазуға көмектесетін көмекші құралдар мен ақпараттық-анықтамалық материалдардан тұратын sauat.kz порталын жасауды жоспарлап отыр. Аталмыш жоба қазақ тілінің күнделікті өмірде, ресми қарым-қатынаста сауатты қолданылуына әсер етеді деп күтілуде.
Үшінші, электронды сөздіктер, тезаурустар жасақтау. Қазіргі кезде көптеген сапалы сөздіктер шығарылуда. Алайда ол сөздіктер дәстүрлі баспа кітап күйінде ғана. Ал адамдар уақытының көп бөлігін компьютердің алдында өткізеді және өзіне керек ақпаратты компьютерден алғанды қалайды. Осы орайда, сөздіктердің электронды нұсқада, ыңғайлы үлгіде болғаны өте маңызды деп білеміз. Біздің ұйым жүзеге асырып жатқан Қазақстанның ашық кітапханасы жобасының аясында Қазақ тілінің әмбебап сөздігі жұмыс істейді. Аталмыш сөздік А.Байтұрсынұлы атындағы Тіл білімі институтының белді ғалымдарымен бірлестікте жасалған. Сөздіктің негізін Қазақ әдеби тілі сөздігіндегі 150 000 аса сөз бен сөз тіркесі құрайды. Алдағы уақытта осы сөздікке енген сөз қорын тұтастай дыбыстық үлгіге түсіру мақсаты тұр. Сонымен қатар салалық, синоним, антоним және аударма сөздіктерімен толықтырып, барлық компьютерлерге, планшеттерге, смартфондарға арналған нұсқасын жасау өте маңызды мәселе.
Төртінші, автоматты аударма жүйесі. Технологиялардың дамуы екі тілді аудармадан көптілді ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz