Құдайберген Жұбановтың ғылыми шығармалары тілінің статистикалық ерекшеліктері
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
Негізгі бөлім
1 Қазақ тіл біліміндегі статистиканың орны ... ... ... ... ... ... ... ... ... ... ... ...
1.1 Лингво.статистиканың пәнаралық сипаты ... ... ... ... ... ... ... ... ... ... ... ... ...
1.2 Лингво.статистикадағы сөздіктердің жалпы сипаттамасы ... ... ... ... ... ...
2 Шығарма мәтіндеріндегі сөз таптарының қолдану аясы ... ... ... ... ... ...
2.1 Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті қолдану ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
2.2 Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың зат есім табының статистикасы ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Қорытынды ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Пайдаланылған әдебиеттер ... ... ... ... ... ... ... ... ... ... ... ... ...
Қосымша
Негізгі бөлім
1 Қазақ тіл біліміндегі статистиканың орны ... ... ... ... ... ... ... ... ... ... ... ...
1.1 Лингво.статистиканың пәнаралық сипаты ... ... ... ... ... ... ... ... ... ... ... ... ...
1.2 Лингво.статистикадағы сөздіктердің жалпы сипаттамасы ... ... ... ... ... ...
2 Шығарма мәтіндеріндегі сөз таптарының қолдану аясы ... ... ... ... ... ...
2.1 Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті қолдану ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
2.2 Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың зат есім табының статистикасы ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Қорытынды ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Пайдаланылған әдебиеттер ... ... ... ... ... ... ... ... ... ... ... ... ...
Қосымша
Тақырыптың өзектілігі: Соңғы жылдары тілдік құбылыстарды сандық және сапалық жақтан анықтауда ықтимал статистикалық заңдылықтарды ашуға мүмкіндік беретін лингвостатитикалық әдіс-тәсілдер қолданылуда ( Қ. Бектаев, А. Жұбанов, Ә.Ақабаев, Қ.Молдабек).
Бұл қолданбалы тіл білімі саласына, лингвостатистикалық әдіспен зерттеушілерге, компьютермен тіл үйренушілерге өзіндік үлес қосары анық. Зерттеу жұмысының негізгі тұжырымдары мен алынған сөздіктерді ақын-жазушылардың сөздік қорын молайту және ана тілімізді меңгерту мәселелерінде пайдалануға болады.Қ.Жұбановтың ғылыми шығармалары тілінің статистикалық ерекшеліктері» атты тақырыпта жазушы тілін зерттеудің мақсаты мен басты бағыттары, міндеттерінің лексико-грамматикалық құрылымын зерттеуде квантитативтік модельдеу әдісін қолданудың тиімді жолдары анықталып, мәтіндердегі сөз қолданыстарға сандық және сапалық сипаттама берілді. Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың жиілік сөздіктері мәліметтеріне сүйене отырып, ондағы статистикалық нәтижелердің ескерілу қажеттігі негізделіп, оқырман тілі мен шығарма тілі арасындағы қатынасты анықтауда жүргізілген эксперимент нәтижесінің түйіндері берілді. Мұнда автор күй, домбыра, қобыз, жыр, толғау, бақсы, сыбызғы, ән, би т.б. музыкалық терминдерге тарихи – лингвистикалық талдау жасай отырып, ондағы сандық және сапалық ерекшеліктерді айқындау, зерттеу нәтижелеріне сүйене отырып, сөздердің қолданылымындағы кейбір тіл заңдылықтарын түсіндіру жалпы тіл білімінде ерекше маңызға ие болып отыр. Лингвосттатистикалық әдістер тілдік фактілерді жадағай түрде санамалаудан гөрі оларды топтастырып, белгілі бір өлшемдер негізінде ықтималды немесе дедуктивті болжамдар жасауға мүмкіндік береді.Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» тарихи - лингвистикалық шығарманың сөз формалары мен сөз қолданыстардың қолданылу жиілігі негізінде кейбір тілдік заңдылықтарды ашуға тырыстық.
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» щығарманың стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау. Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – статистикалық деректерді өңдеуде компьютерлік технологияны пайдалану,математикалық статистика әдістерін басқа ғылымдар тәсілдерімен ұштастыру, шетелдік тіл білімінің даму бағытына сай келу.
Бұл қолданбалы тіл білімі саласына, лингвостатистикалық әдіспен зерттеушілерге, компьютермен тіл үйренушілерге өзіндік үлес қосары анық. Зерттеу жұмысының негізгі тұжырымдары мен алынған сөздіктерді ақын-жазушылардың сөздік қорын молайту және ана тілімізді меңгерту мәселелерінде пайдалануға болады.Қ.Жұбановтың ғылыми шығармалары тілінің статистикалық ерекшеліктері» атты тақырыпта жазушы тілін зерттеудің мақсаты мен басты бағыттары, міндеттерінің лексико-грамматикалық құрылымын зерттеуде квантитативтік модельдеу әдісін қолданудың тиімді жолдары анықталып, мәтіндердегі сөз қолданыстарға сандық және сапалық сипаттама берілді. Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» шығарманың жиілік сөздіктері мәліметтеріне сүйене отырып, ондағы статистикалық нәтижелердің ескерілу қажеттігі негізделіп, оқырман тілі мен шығарма тілі арасындағы қатынасты анықтауда жүргізілген эксперимент нәтижесінің түйіндері берілді. Мұнда автор күй, домбыра, қобыз, жыр, толғау, бақсы, сыбызғы, ән, би т.б. музыкалық терминдерге тарихи – лингвистикалық талдау жасай отырып, ондағы сандық және сапалық ерекшеліктерді айқындау, зерттеу нәтижелеріне сүйене отырып, сөздердің қолданылымындағы кейбір тіл заңдылықтарын түсіндіру жалпы тіл білімінде ерекше маңызға ие болып отыр. Лингвосттатистикалық әдістер тілдік фактілерді жадағай түрде санамалаудан гөрі оларды топтастырып, белгілі бір өлшемдер негізінде ықтималды немесе дедуктивті болжамдар жасауға мүмкіндік береді.Қ.Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» тарихи - лингвистикалық шығарманың сөз формалары мен сөз қолданыстардың қолданылу жиілігі негізінде кейбір тілдік заңдылықтарды ашуға тырыстық.
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген Жұбановтың «Қазақ музыкасындағы күй жанрының пайда болуы жайлы» щығарманың стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау. Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – статистикалық деректерді өңдеуде компьютерлік технологияны пайдалану,математикалық статистика әдістерін басқа ғылымдар тәсілдерімен ұштастыру, шетелдік тіл білімінің даму бағытына сай келу.
1. Абай тілі сөздігі. – Алматы, 1968. 734-6.
2. Алексеев П. М. Распределение лексических единиц по длине в тексте и словаре // Квантитативная лингвистика и автоматический анализ текстов. Тарту, 1986. Вып. 745. С. 3-28.
3. Ахабаев А, Статистический анализ лексико-морфологической структуры языка казахской публицистики. Автореф. дисс. канд. филол. наук. -Алма-Ата, 1971. С. 24.
4. Ахметов Е.Г. Статистическая характеристика родительного падежа имени существительного в английском и казахском языках // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 51-54.
5. Байтанаева Д.А., Бектаев КБ. Энтропия казахского текста // Статистика казахского текста. Алма-Ата, 1973. С. 664-696.
6. Байтанаева Д.А. Энтропия распределения слогов казахского письменного текста // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 80-82.
7. Байтанаева Д.А. Информационные характеристики казахского текста. Алма-Ата, 1985. С. 18.
8. Балакаев М. Современный казахский язык. Алма-Ата, 1985.
9. Бектаев К. Б. Алфавитно-частотный словарь слогов казахского языка // Статистика казахского текста. Алма-Ата,
1973. С. 566-612.
10. Бектаев Ќ., Белботаев А., Смайылов Т. Ќазаќ тіл біліміндегі лингвистиканыњ алѓашќы кµріністері // Ќ‰дайберген Ж‰банов жєне ќазаќ совет тіл білімі. Алматы: «Ѓылым», 1990. 108-115-66.
11. Бектаев КБ., Пиотровский Р.Г. Математические методы в языкознании. 4.1. Теория вероятностей и моделирование нормы языка. Алма-Ата, 1973. 281 с.; Математическая статистика и моделирование текста. Алма-Ата,
1974. 334 с. Ч. П. Алма-Ата, 1974.
12. Бектаев КБ. Статистико-информационная типология тюркского текста. Алма-Ата, 1978. 183 с.
201
13. БектаевК.Б., Жұбанов А.К., Мырзабеков С., Белботаев А.Б. М.Әуезовтің «Абай жолы» романыныњ жиілік сµздігі Алматы, 1979. 334-6.
14. Бектаев Ќ.Б., Жубанов А.Ќ., Мырзабеков С., Белбоптаев А.Б. М.О.Әуезовтің 20 томдық шығармалар текстерініњ жиілік сөздіктері. Алматы-Түркістан, 1995. 346-6.
15. Бектаев КБ., Зубов А.В., Ковалевич Е.Ф. и др. к исследованию законов распределения лингвистических единиц //Статистика текста. Минск, 1969. С. 131-162.
16. Бектаев К. Б., Лукъяненков К.Ф. О законах распределения единиц письменной речи // Статистика речи и автоматический анализ текста. Л., 1971. С. 47-112.
17. Бектаев К Ықтимадықтар теориясы және математикалық статистика. Алматы: «Рауан», 1991. 432 с.
18. Белботаев А.Б. Лингвостатистические характеристики частей речи казахского текста. Автореф. дисс. ... канд. филол. наук. Алма-Ата, 1992. С. 32.
19. Белботаев А.Б. Ѓылыми-техникалыќ стильдегі сын есім аффикстерініњ ќолданылуы туралы. 225-230-66.; Математика тексініњ алфавитті-жиілік сµздігі. 543-552-66. // Қазақ тексінің статистикасы. Алматы: «Ғылым», 1973.
20. Белоногое Г.Г. О некоторых статистических закономерностях в русской письменной речи // ВЯ. 1962. №1. С. 100-101.
21. Беляева Л.Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике. Л., 1986.
22. Бодуэн де Куртенэ И.А. Языкознание, или лингвистика XIX века // Избранные труды по общему языкознанию. М., 1963. Т.2.
23. Вейсалов Ф. Е., Керимов Я.К., Сафаров М.Г. Комбинаторика фонем современного азербайджанского языка // Вопросы азербайджанского языкознания. Баку, 1981.
24. Вентцель Е.С. Теория вероятностей. М., 1969. 576 с.
25. Втер К Кибернетика. М., 1983.
26. Виноградов В.В. Современный русский язык. Введение в грамматическое учение о слове. 1938. Вып. 1. 160 с.
27. Гарипов Т. М. Лексикостатистические отношения тюркских языков Урало-Поволжья // Языковые контакты в Башкирии. Уфа, 1972. С. 248-267.
202
28. Герд А.С. Предмет и основные направления прикладной лингвистики. // Прикладное языкознание. Ст.-Пб., 1996. С. 5-14.
29. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: «Высшая школа», 1972. 368 с,
30. Головин Б.Н. Язык и статистика. М., 1971. 191 с.
31. Джубанов А.Х. Квантитативная структура казахского текста (опыт лингвистического анализа на ЭВМ). Алма-Ата, 1987. С. 147.
32. Джубанов А.Х. К вопросу о графемной статистике казахского текста // Вопросы казахской фонетики и фонологии. Алма-Ата, 1979. С. 79-86.
33. Джубанов А.Х., Джунисбеков А. Преобразование с помощью ЭВМ казахских текстов в фонетическую запись // Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. С. 317-319.
34. Джунусбеков А. Гласные казахского языка. Алма-Ата, 1972. С. 94.
35. Длин А. М. Математическая статистика в технике. М., 1958.466с.
36. Ергалауов А. Статистическая характеристика форм страдательного залога в английском и казахском языках // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 62-63.
38. Жетешиков Ж. Статистический анализ словоизменительных аффиксов имен существительных киргизского языка (на материале газетных текстов)//Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. С. 25.
39. Жубанов А.К. Основные принципы формализации содержания казахского текста. Алматы, 2002. 250 с.
40. ЖубановҚ. Қазақ тілі жөніндегі зерттеулер. Алматы: «Ғылым», 1999. 581 б.
41. Засорина Л.Н. Частотные словари и вопросы лексико-статистики // Межвузовская конференция по вопросам частотных словарей и автоматизации. Л., 1966. С. 3-4.
203
42. Звегинцев В. А. 1) История-языкознания XIX - XX веков о очерках и извлечениях. Ч. П. М., 1965; 2) Теорическая и прикладная лингвистика. М., 1968.
43. ЗекеноваА. МО. Әуезов пьесаларындағы есім сөздердің морфологиялық құрылысы жайында // Известия АН КазССР. Сер. филолог. 1976. С. 56-62.
44. Знание языка и языкознание. М., 1991.
45. Зубов А.В. Основы лингвистической информатики-Учеб. пособие. Ч.І. Минск, 1991; Ч. П. 1992; Ч. Ш. 1993.
46. Зубов А.В., Лихтарович А.А. ЭВМ анализирует текст. Минск, 1989.
47. Зубов А.В., Хотяшов Э.Н. Статистический анализ текста с помощью ЭВМ // Энтропия языка и статистика речи. Минск, 1966.С. 118-166.
48. Ибрагимов С. И. Некоторые статистические характеристики имен существительных киргизского языка // Тезисы докладов и сообщений всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 34-38.
49. Ибрагимов Т.Н. Некоторые статистические данные о слогах татарского языка: вероятностные методы и кибернетика // Учен. зап. Казанского ун-та. Вып. 4. Т. 25. Кн. 6. 1966. С. 74-78; Его же. Изучения слогов и структуры их сочетаний в татарском литературном языке. Казань, 1970.
50. Использование ЭВМ в лингвистических исследованиях / Под ред. В.И. Перебейнос. Киев, 1990.
51. Ишанов К.И., Садиков А.В., Мырзабеков С. Частотно-сопоставительная характеристика падежных форм русского и казахского языков // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 56-58.
52. Кецесбаев I., Мұсабаев Р. Қазіргі қазақ тілі. Алматы, 1962.315-6.
53. Кенесбаева С.С. К вопросу исследования протетического звука в словах арабского происхождения статистическим методом // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С.43-44.
54. Клоусон ДЖ. Лексико-статистическая оценка алтайской теории // ВЯ. 1969. №5. С.22-41.
2. Алексеев П. М. Распределение лексических единиц по длине в тексте и словаре // Квантитативная лингвистика и автоматический анализ текстов. Тарту, 1986. Вып. 745. С. 3-28.
3. Ахабаев А, Статистический анализ лексико-морфологической структуры языка казахской публицистики. Автореф. дисс. канд. филол. наук. -Алма-Ата, 1971. С. 24.
4. Ахметов Е.Г. Статистическая характеристика родительного падежа имени существительного в английском и казахском языках // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 51-54.
5. Байтанаева Д.А., Бектаев КБ. Энтропия казахского текста // Статистика казахского текста. Алма-Ата, 1973. С. 664-696.
6. Байтанаева Д.А. Энтропия распределения слогов казахского письменного текста // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 80-82.
7. Байтанаева Д.А. Информационные характеристики казахского текста. Алма-Ата, 1985. С. 18.
8. Балакаев М. Современный казахский язык. Алма-Ата, 1985.
9. Бектаев К. Б. Алфавитно-частотный словарь слогов казахского языка // Статистика казахского текста. Алма-Ата,
1973. С. 566-612.
10. Бектаев Ќ., Белботаев А., Смайылов Т. Ќазаќ тіл біліміндегі лингвистиканыњ алѓашќы кµріністері // Ќ‰дайберген Ж‰банов жєне ќазаќ совет тіл білімі. Алматы: «Ѓылым», 1990. 108-115-66.
11. Бектаев КБ., Пиотровский Р.Г. Математические методы в языкознании. 4.1. Теория вероятностей и моделирование нормы языка. Алма-Ата, 1973. 281 с.; Математическая статистика и моделирование текста. Алма-Ата,
1974. 334 с. Ч. П. Алма-Ата, 1974.
12. Бектаев КБ. Статистико-информационная типология тюркского текста. Алма-Ата, 1978. 183 с.
201
13. БектаевК.Б., Жұбанов А.К., Мырзабеков С., Белботаев А.Б. М.Әуезовтің «Абай жолы» романыныњ жиілік сµздігі Алматы, 1979. 334-6.
14. Бектаев Ќ.Б., Жубанов А.Ќ., Мырзабеков С., Белбоптаев А.Б. М.О.Әуезовтің 20 томдық шығармалар текстерініњ жиілік сөздіктері. Алматы-Түркістан, 1995. 346-6.
15. Бектаев КБ., Зубов А.В., Ковалевич Е.Ф. и др. к исследованию законов распределения лингвистических единиц //Статистика текста. Минск, 1969. С. 131-162.
16. Бектаев К. Б., Лукъяненков К.Ф. О законах распределения единиц письменной речи // Статистика речи и автоматический анализ текста. Л., 1971. С. 47-112.
17. Бектаев К Ықтимадықтар теориясы және математикалық статистика. Алматы: «Рауан», 1991. 432 с.
18. Белботаев А.Б. Лингвостатистические характеристики частей речи казахского текста. Автореф. дисс. ... канд. филол. наук. Алма-Ата, 1992. С. 32.
19. Белботаев А.Б. Ѓылыми-техникалыќ стильдегі сын есім аффикстерініњ ќолданылуы туралы. 225-230-66.; Математика тексініњ алфавитті-жиілік сµздігі. 543-552-66. // Қазақ тексінің статистикасы. Алматы: «Ғылым», 1973.
20. Белоногое Г.Г. О некоторых статистических закономерностях в русской письменной речи // ВЯ. 1962. №1. С. 100-101.
21. Беляева Л.Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике. Л., 1986.
22. Бодуэн де Куртенэ И.А. Языкознание, или лингвистика XIX века // Избранные труды по общему языкознанию. М., 1963. Т.2.
23. Вейсалов Ф. Е., Керимов Я.К., Сафаров М.Г. Комбинаторика фонем современного азербайджанского языка // Вопросы азербайджанского языкознания. Баку, 1981.
24. Вентцель Е.С. Теория вероятностей. М., 1969. 576 с.
25. Втер К Кибернетика. М., 1983.
26. Виноградов В.В. Современный русский язык. Введение в грамматическое учение о слове. 1938. Вып. 1. 160 с.
27. Гарипов Т. М. Лексикостатистические отношения тюркских языков Урало-Поволжья // Языковые контакты в Башкирии. Уфа, 1972. С. 248-267.
202
28. Герд А.С. Предмет и основные направления прикладной лингвистики. // Прикладное языкознание. Ст.-Пб., 1996. С. 5-14.
29. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: «Высшая школа», 1972. 368 с,
30. Головин Б.Н. Язык и статистика. М., 1971. 191 с.
31. Джубанов А.Х. Квантитативная структура казахского текста (опыт лингвистического анализа на ЭВМ). Алма-Ата, 1987. С. 147.
32. Джубанов А.Х. К вопросу о графемной статистике казахского текста // Вопросы казахской фонетики и фонологии. Алма-Ата, 1979. С. 79-86.
33. Джубанов А.Х., Джунисбеков А. Преобразование с помощью ЭВМ казахских текстов в фонетическую запись // Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. С. 317-319.
34. Джунусбеков А. Гласные казахского языка. Алма-Ата, 1972. С. 94.
35. Длин А. М. Математическая статистика в технике. М., 1958.466с.
36. Ергалауов А. Статистическая характеристика форм страдательного залога в английском и казахском языках // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 62-63.
38. Жетешиков Ж. Статистический анализ словоизменительных аффиксов имен существительных киргизского языка (на материале газетных текстов)//Материалы семинара «Статистическая оптимизация преподавания языков и инженерная лингвистика». Чимкент, 1980. С. 25.
39. Жубанов А.К. Основные принципы формализации содержания казахского текста. Алматы, 2002. 250 с.
40. ЖубановҚ. Қазақ тілі жөніндегі зерттеулер. Алматы: «Ғылым», 1999. 581 б.
41. Засорина Л.Н. Частотные словари и вопросы лексико-статистики // Межвузовская конференция по вопросам частотных словарей и автоматизации. Л., 1966. С. 3-4.
203
42. Звегинцев В. А. 1) История-языкознания XIX - XX веков о очерках и извлечениях. Ч. П. М., 1965; 2) Теорическая и прикладная лингвистика. М., 1968.
43. ЗекеноваА. МО. Әуезов пьесаларындағы есім сөздердің морфологиялық құрылысы жайында // Известия АН КазССР. Сер. филолог. 1976. С. 56-62.
44. Знание языка и языкознание. М., 1991.
45. Зубов А.В. Основы лингвистической информатики-Учеб. пособие. Ч.І. Минск, 1991; Ч. П. 1992; Ч. Ш. 1993.
46. Зубов А.В., Лихтарович А.А. ЭВМ анализирует текст. Минск, 1989.
47. Зубов А.В., Хотяшов Э.Н. Статистический анализ текста с помощью ЭВМ // Энтропия языка и статистика речи. Минск, 1966.С. 118-166.
48. Ибрагимов С. И. Некоторые статистические характеристики имен существительных киргизского языка // Тезисы докладов и сообщений всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 34-38.
49. Ибрагимов Т.Н. Некоторые статистические данные о слогах татарского языка: вероятностные методы и кибернетика // Учен. зап. Казанского ун-та. Вып. 4. Т. 25. Кн. 6. 1966. С. 74-78; Его же. Изучения слогов и структуры их сочетаний в татарском литературном языке. Казань, 1970.
50. Использование ЭВМ в лингвистических исследованиях / Под ред. В.И. Перебейнос. Киев, 1990.
51. Ишанов К.И., Садиков А.В., Мырзабеков С. Частотно-сопоставительная характеристика падежных форм русского и казахского языков // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С. 56-58.
52. Кецесбаев I., Мұсабаев Р. Қазіргі қазақ тілі. Алматы, 1962.315-6.
53. Кенесбаева С.С. К вопросу исследования протетического звука в словах арабского происхождения статистическим методом // Тезисы докладов и сообщений Всесоюзного семинара «Статистическое и информационное изучение тюркских языков». Алма-Ата, 1969. С.43-44.
54. Клоусон ДЖ. Лексико-статистическая оценка алтайской теории // ВЯ. 1969. №5. С.22-41.
ӘЛ-ФАРАБИ АТЫНДАҒЫ ҚАЗАҚ ҰЛТТЫҚ УНИВЕРСИТЕТІ
Филология факультеті
Жалпы тіл білімі кафедрасы
Диплом жұмысы
Құдайберген Жұбановтың ғылыми шығармалары тілінің
статистикалық ерекшеліктері
Мамандығы: 021740 – Қолданбалы лингвистика
Орындаған:
5-курс студенті
Ә.Нұрманова
Ғылыми жетекші:
ф.ғ.д..профессор
А.Қ.Жұбанов
Пікір жазушы:
ф.ғ.д..профессор
З.Базарбаева
Норма бақылаушы:
ф.ғ.к.андидаты
А.Қ.Таусоғарова
Қорғауға жіберілді:
______ _______2006ж.
Жалпы тілі білімі кафедрасының
меңгерушісі профессор Э.Д.Сүлейменова
Алматы 2006
Реферат
Диплом жұмысының тақырыбы: Құдайберген Жұбановтың ғылыми шығармалары
тілінің статистикалық ерекшеліктері
Жұмыстың көлемі:
Пайдаланған әдебиеттер тізімі:
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген
Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы щығарманың
стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім
сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы
арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау.
Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты
ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – қазіргі таңдағы лингвостатистиканың қолданылу
аясы қазақ тілі біліміндегі алатын орнының ерекше. Сонымен қатар,
статистикалық әдіс тіл зерттеу ісіне тұрақты сипатта енді. Статистистикалық
әдістің тіл саласындағы қолданылу аясы кеңейіп, басқа да ірі ғылым
салаларында сандық деректерге жүгінудің қажеттілігі туындап отыр.
Мазмұны
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... ..
Негізгі бөлім
1 Қазақ тіл біліміндегі статистиканың орны
... ... ... ... ... ... ... ... ... ... ... ...
1.1 Лингво-статистиканың пәнаралық
сипаты ... ... ... ... ... ... ... ... ... ... ... ... ...
1.2 Лингво-статистикадағы сөздіктердің жалпы
сипаттамасы ... ... ... ... ... ...
2 Шығарма мәтіндеріндегі сөз таптарының қолдану
аясы ... ... ... ... ... ...
2.1 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті
қолдану ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... ... ..
2.2 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың зат есім табының
статистикасы ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Қорытынды ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... .
Пайдаланылған әдебиеттер
... ... ... ... ... ... ... ... ... ... ... ... ... .
Қосымша
Кіріспе
Тақырыптың өзектілігі: Соңғы жылдары тілдік құбылыстарды сандық және
сапалық жақтан анықтауда ықтимал статистикалық заңдылықтарды ашуға
мүмкіндік беретін лингвостатитикалық әдіс-тәсілдер қолданылуда ( Қ.
Бектаев, А. Жұбанов, Ә.Ақабаев, Қ.Молдабек).
Бұл қолданбалы тіл білімі саласына, лингвостатистикалық әдіспен
зерттеушілерге, компьютермен тіл үйренушілерге өзіндік үлес қосары анық.
Зерттеу жұмысының негізгі тұжырымдары мен алынған сөздіктерді ақын-
жазушылардың сөздік қорын молайту және ана тілімізді меңгерту мәселелерінде
пайдалануға болады.Қ.Жұбановтың ғылыми шығармалары тілінің статистикалық
ерекшеліктері атты тақырыпта жазушы тілін зерттеудің мақсаты мен басты
бағыттары, міндеттерінің лексико-грамматикалық құрылымын зерттеуде
квантитативтік модельдеу әдісін қолданудың тиімді жолдары анықталып,
мәтіндердегі сөз қолданыстарға сандық және сапалық сипаттама берілді.
Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың жиілік сөздіктері мәліметтеріне сүйене отырып, ондағы
статистикалық нәтижелердің ескерілу қажеттігі негізделіп, оқырман тілі мен
шығарма тілі арасындағы қатынасты анықтауда жүргізілген эксперимент
нәтижесінің түйіндері берілді. Мұнда автор күй, домбыра, қобыз, жыр,
толғау, бақсы, сыбызғы, ән, би т.б. музыкалық терминдерге тарихи –
лингвистикалық талдау жасай отырып, ондағы сандық және сапалық
ерекшеліктерді айқындау, зерттеу нәтижелеріне сүйене отырып, сөздердің
қолданылымындағы кейбір тіл заңдылықтарын түсіндіру жалпы тіл білімінде
ерекше маңызға ие болып отыр. Лингвосттатистикалық әдістер тілдік
фактілерді жадағай түрде санамалаудан гөрі оларды топтастырып, белгілі бір
өлшемдер негізінде ықтималды немесе дедуктивті болжамдар жасауға мүмкіндік
береді.Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
тарихи - лингвистикалық шығарманың сөз формалары мен сөз қолданыстардың
қолданылу жиілігі негізінде кейбір тілдік заңдылықтарды ашуға тырыстық.
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген
Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы щығарманың
стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім
сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы
арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау.
Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты
ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – статистикалық деректерді өңдеуде компьютерлік
технологияны пайдалану,математикалық статистика әдістерін басқа ғылымдар
тәсілдерімен ұштастыру, шетелдік тіл білімінің даму бағытына сай келу.
1 Қазақ тіл біліміндегі статистиканың орны
Тақырыптың өзектілігі: Статистикалық әдістің тіл саласындағы қолданылу
тарихын сөз еткенде, осы әдісті тұңғыш ұсынған орыстың белгілі
математикалық ғалымы В.Я.Буняковскийдің (1804-1889) атымен байланысты.
Сонымен бірге басқа да ірі ғалымдардың тілді зерттеуде сандық деректерге
жүгінудің қажеттілігін дәлелдеулеріне деректерді көптеп келтіруге
болады.(И.А.Бодуэн де Куртенэ, А.М.Пешковский, М.Н.Петерсон, Е.Д.Поливанов,
В.В.Виноградовт.б.)
Заманның қарқынды дамуына байланысты, электронды–есептеу техникасының
дамуы, нақты әдіс–тәсілдердің түрлі білімдер салаларында қолданыс табуы тіл
біліміне, өз ықпалын тигізді. Өткен ғасырдың өзінде үнді – еуропа тіл
білімінде кең тараған статистикалық әдіс, қазақ тілінде тек XX ғасырдың 60
жылдарынан бастап жүйелі және ғылыми тұрғыда қолданыла бастады. Бірақ бұдан
бұрын да аталған әдіс ішінара қолданыс тауып, тілдің әр діңгейіндегі
бірліктердің сандық және пайыздық арасалмағын анықтаумен шектеліп келген
болатын. Мамандардың пайымдауынша, кітаби және сөйлеу тіліндегі түрлі типті
сөздердің әр ыңғайындағы қолдану жиілігін анықтайтын мұндай тәсіл тілдің
құрылымдық – грамматикалық, кейде стильдік – семантикалық айырым белгілерін
ажырата отырып, осы стильдерге тән қасиеттерді анықтауға мүмкіндік жасайды.
[2]
Тілдік мәселелерге қолданылатын математикалық әдісті интуитивті түрде
тұжырымдалған, сол сияқты толық шешімі жоқ мәселелердің логикалық
тұжырымдалуына бағынатын және алгоритмдік шешімі бар бір немесе бірнеше
қарапайым математикалық моделіне көшуді қажет етеді.[3] Тілдің аса күрделі
түрдегі сн алуан параметрлі көп қабатты жүйе екенін ескерсек, онда
ықтималдық теория, математикалық статистика, ақпарат теориясы және т.б.
ғылыми салалар әдістерін қолданудың мүмкіндігі кең екені байқалады.[4]
Статистикалық әдіс басқа математикалық әдістерге қарағанда тіл зерттеу
ісіне бұрынырақ және тұрақты сипатта енді деуге болады. Белгілі орыс ғалымы
Б.Н.Головин әуелден – ақ сандық сипаттың, тіл категориялары мен оның
элементтеріне обьективті түрде тән болуынан, сонымен бірге сапалық және
сандық сипаттарының өзара қатынастылығы тілдің қатынас құралы ретіндегі
қызметі мен даму сатысындағы обьективтілігімен тілді сандық тұрғыда зерттеу
қажеттілігі туындады деп түсіндірді.
Тілдік фактілерді сандық ұғымдарға жүгініп баяндау қазақ тіл білімін
зерттеуші ғалымдарға да тән. Өйткені қай кезде болмасын қазақ тілі жайлы
зерттеулердің бәрінде дерлік аз, көп, жиі, сирек, өнімді, өнімсіз, мол,
жуық, тең, шамалас, көп т.б.мөлшерд көрсететін сөздер кездесіп отырады және
бұлардың мәнін нақты санмен көрсетуге талаптанушы ғалымдар да бар.
Сөйтіп, қолданбалы тіл білімінің бүгінді Статистикалық лингвистика
деп аталып жүрген хаңа саласының алғашқы нышандары мен белгілері міне,
осылардан басталады. Қазақ тіл біліміндегі бұл саланың бастауында профессор
Құдайберген Қуанұлы Жұбанов тұрды.
Қазақ совет тіл білімінің негізін қалаушылардың бірі, совет
дәуірінде қазақ тілін тұңғыш рет ғылыми түрде зерттеген лингвист- маман
Қ.Жұбанов ретіне қарай сандық деректерді де пайдаланды.
Статистикалық әдіс түрлі тілдердегі грамматикалық тұлғаларды
салыстыра зерттеуде де елеулі нәтижелерге ие болды.[5] Мәселен, Т.М.Гарипов
башқұрт, қазақ, татар, чуваш, түркі тілдерін лексика – семантикалық тұрғыда
талдап, олардық сандық және сапалық ерекшеліктерін анықтауды мақсат етті.
Сол сияқты туыстас емес тілдер қазақ және орыс, қазақ және ағылшын тілдерін
салыстырғандағы грмматикалық формалар да статистикалық зерттеу аясынан тыс
қалмады.[18,19]
1987 жылы ҚазКСР Наука баспасынан шыққан Квантитативная
структура казахского текста және 2002ж жарық көрген Основные принципы
формализации содержания казахского текста атты монографияларында қазақ
тілінің заманға сай өзекті зерттеу мәселелері сөз етілді. Бірінші аталған
ғылыми еңбекте қазақ тіліндегі әтіндерді автоматты түрде электронды –
есептеу машиналары арқылы статистикалық әдіспен зерттеу мүмкіндігі мен сөз
таптарының ықтималды – үйлестірімді заңдылықтары зерттелсе, екінші
монографияда – қазақ мәтіннің мәтін лингвистикасы тұрғыснан мазмұн
формальдау жолдары және мәтіннің туындау проблемалық мәселелері
қарастырылады. [6]
Статистикалық әдіс – тәсілдермен зерттеу тәжірибесінде әртүрлі жиілік
сөздіктер жасаудың өзекті мәселе екендігін көрсетті. Себебі, олардың
негізінде аса маңызды және күрделі мәселелді: тілді лексика-грамматикалық
нормалау, тілдерді зерттеу өзара салыстырмалы-типологиялық зерттеу және
олардың компьютерлік қорын жасауға зор мүмкіндік жасалады.Бүгінде тіл
білімінің бір саласына айналып отырған лингвистикалық статистика, тілдің
сандық сипатынан байқалатын сапалық қасиеттерін оны зерттеуде пайдалануға
болатын тиімді әдіс көздерінің бірі. Сандық деректердің негізінде тілге
қатысты дыбыстар, буындар, сөздер, сөйлем мүшелерінің орны. [7]
Статистикалық лингвистика саласына қатысты зерттеулер, бұл әдістің
әмбебаптық сипаты. Тілдіњ ќолданбалы аясы б‰рыннан да µзініњ кењ жµне жан-
жаќтылыѓымен ерекшеленетін. Оныњ ескіден келе жатќан саласы - жазу
(графика), ана тілі мен шет тілін оќыту єдістемесі жєне тілдіњ
лексикографиялыќ ж‰йесі. Осылардан кейін барып - аударма, шифртану
(дешифровка), орфография, транслитерация жєне терминологияны µњдеу.
Ќолданбалы лингвистиканыњ дєст‰рлі баѓыттарыныњ бірі - мемлекеттіњ тіл
саясатына ќатынасу:
1) µліпбиді, орфографияны µњдеу, сауатсыздыќты жою;
2) мемлекетгік тілді таѓайындау;
3) мемлекетгік тілден басќа тілдердіњ орнын аныќтау;
4) ±лттыќ терминологияны µњдеу, бір ізге келтіру жєне ќалыптастыру;
5) кала, кµше, алањдарѓа ат ќою мен оныњ б‰рыннан келе жатќан атын
µзгерту, яѓни ономастика мєселелері.
Ќолданбалы тіл білімніњ осындай классикалыќ баѓыт-баѓдарын дамыту
жєне мейлінше жетілдіру мєсёлелерімен бірге XX ѓасырдыњ екінші жартысынан
бастап оныњ бірќатар жања баѓыттары орын ала бастады. Б‰л баѓыттар заманѓа
сай ќоѓам-дыќ, жаратылыстану жєне техникалыќ ѓылымдардыњ µзара даму
сипатынан туындайтын ќолданбалы лингвистиканыњ тарихи дамуыныњ логикалыќ
жалѓасыныњ кµрінісі еді.
Негізінен алѓанда, адам баласыныњ ќызметініњ эр т‰рлі аясындаѓы ж‰мыстарын
жењілдету бір ѓана проблемалыќ мєсе-леге тіреледі. Ол - ќоѓам µміріндегі
аќпарат ж±мысын µњдеу. Б‰ндай аќпарат мєтін т‰ріндегі жазба тілінде не
‰йреншікгі сµйлеу тілінде болуы м‰мкін.
Қоѓамныњ практикалыќ ќажеттігін µтеуде, єсіресе, аќпа-ратты саќтау
мен оны тарату істерініњ сьфын ашуда зерттеуші оны ењ алдымен тілдіњ ішкі
табиѓатындаѓы зањдылыќтардан іздегені жµн.
Осымен байланысты µзекті мєселеніњ бірі - оператордыњ дауысымен
басќарылатын станок пен ќ‰рал-аспаптарды µндіру. Ол ‰шін эр т‰рлі
тілдердегі аќпараттарды автоматты т‰рде µндеу мен оларды іздестіру,
байланыс торабы ж‰мысын (телефон, радиобайланыс т.б.) жетілдіру, адам
баласыньщ сµйлеу мен есту ќабілетініњ б‰зылуына ќатысты ауруларды емдеуде
дыбыстыњ фонетикалыќ деректеріне ж‰гіну жєне т.б.
Аталѓан проблемалыќ мєселелерді ЭЕМ-ды (компъютерді) кењ т‰рде
ќолдана отырып, мєтінді (жазба, сµйлеу) автоматты т‰рде µндеу ќажеттілігі
туындайды. Мєселен, әр типті аќпараттыќ ж‰йелерді тілдік деректермен
ќамтамасыз ету; машиналыќ аударма мєселесі; табиѓи тілді т‰сінетін ж‰йе
ќ‰ру (жасанды интеллект ж‰йе-сіњдегі тілдік мєселелер); сµйлеу кезіндегі
дыбыстыќ сигналдарда бар аќпараттарды пайдалану негізінде арнайы ж‰йе ќ‰ру
т.б.
Соњѓы жылдары әр т‰рлі аќпараттыќ ж‰йелерді тілдік деректермен
ќамтамасыз етумен байланысты терминтану мєселесін бірізділікке т‰сіріп,
т‰раќтандыру µзекті мєселеге айна-лып отыр. Себебі, эр білім саласыныњ
ѓьшыми жєне техникалыќ терминдерді ќолдану ќажеттігі барынша с‰раныс
тудыруда. Єрине, м±ндай мєселе лексикография саласынан тыс µз шешімін
таппайтыны белгілі. Сондыќтан ќоѓам µмірінде ЭЕМ-ніњ (компьютердіњ) кењ
ќолдануымен тыѓыз байланысты автоматты лексикография саласы біртіндеп µз
отауын ќ‰руда.
Практикапык мєселелерді шешуге байланысты табиѓи тідде диалогты
іске асыру ‰шін адам мен ЭЕМ арасында єсерлі ќарым-ќатынас орнату ќажет.
Мєселен, оларѓа жататындар: с‰раќ-жауап ж‰йесін ќ‰ру, роботтарды басќару
ж‰йесін ќ‰ру, аталѓан басќару ж‰йелерінде д‰рыс шешім ќабылдау ‰шін
диалогтыќ процесті іске ќосу. М‰ндаѓы ењ негізгі мєселе -автоматты
ќ‰рылѓыныњ жазба не дыбыстыќ мєтінді т‰сіне білу (тану) проблемасы.
Єрбір тілдіњ ќолданбалы мєселені шешуде µзіне тєн ерекшелігі
бар. М‰ндай есептердіњ санын, т‰рін алдын ала білу м‰мкін емес. ¤мірде олар
жыл сайын, аи сайын ауысып, біреуі келіп, екіншісі кетіп жатады. Ќолданбалы
лингвистикаѓа ќатысты іргелі зерттеулер ѓылыми-техникалыќ, ‰йымдастыру-
басќарудыњ ауызша-жазбаша ќ‰жаттарыныњ, сµздік т‰зу мен жєне т.б.
т‰рлерініњ фонетикалыќ, грамматикалыќ, семанти-калыќ жєне статистикалыќ
ќ‰рылымью сипаттау мен модельдеу жаќтарын ќамтиды. Жекелеп айтсаќ, оѓан
теориялыќ жµне ќолданбалы лингвистиканыњ шекарасында жатќан мєтіндік
бірліктердіњ формальды моделін (‰лгісін) ќ‰ру проблемасын жатќызуѓа болады.
Теориялыќ лингвистика, негізінен, тілді ќалыптыќ, ж‰йелік т‰рѓыда
ќарастыратындыќтан, ќолданбалы тіл білімі тілді єрекет ‰стінде, яѓни оныњ
ќарым-ќатынас (коммуникация) кезіндегі табиѓатын т‰сінуге тырысады. Кµптен
бері ќолданбалы тіл білімі ѓылыми-техникалыќ пен іскерлік прозадан µзін
алшаќ ‰стаѓаны аян.
Дегенмен, XX ѓ. 70-жылдарында ѓалымдардыњ мынадай шешім жасауына тура
келді. Кµптеген ќолданбалы мєселелер таза лингвистикалыќ емес, тіпті
дєлірек айтсаќ, ол проблеманы шешу адамныњ іс-єрекеті мен ойлау процесін,
тілдіњ семантикасы мен оныњ формальды жєне семантикалыќ єдіс-амалын
синтездеу (жинаќтау) жолдарын модельдеуге тікелей ќатысты. Осыдан барып
ќолданбалы т±рѓыдаѓы зерттеу-лердіњ іргелі проблемасы - білімді модельдеу
(моделирование знаний) мєселесі аныќталды.
Соњѓы кезде б‰л проблема (білімді модельдеу) бірнеше ѓылымдар
тоѓысына, дєлірек айтќанда - логика, лингвистика, математика, психология,
кибернетика салаларыныњ аясына ќатысты болып отыр. Кµптеген ѓылымдардыњ осы
мєселеге ќызыѓушылыѓыныњ негізгі себебі біреу-аќ, ол - автоматты жасанды
интеллект ж‰йесін ќ‰ру. Солай бола т‰ра, білім бізге тіл арќылы
берілетіні аныќ. Білім сµйлеу мєтінінде де (монолог, диалог, эр
жаѓдайдаѓы реплика) жєне сонымен бірге жазба мєтіндерде де (ескі жазба
ескерткіші, кµркем єдебиет, ѓылыми-техникалыќ єдебиет) кµрініс табады.
Тіл арќылы білімді біз ‰рпаќтан-‰рпаќќа жеткіземіз. Сондыќтан
тіл -білімді саќтау формасы жєне оны тарату ќ‰ралы десек те болады.
Біздіњше, ѓылым мен теханикада мєтіннен тыс жатќан білім жоќ деуге
болады, ал ѓылыми-техникалыќ мєтінніњ
семантикасын модельдеу дегеніміз - ол осы салалардыњ білім ж‰йесін
модельдеу. Осылайша, біртіндеп келіп, білімді модельдеу проблемасы мєтін
мазм‰нын (маѓынасын) модельдеумен ‰штасып жатќанына кµз жеткізуге болады.
Б±л жерде ењ негізгі шешімін табуды ќажет ететін мєселе - мµтінніњ
семантикалыќ кµрінісін (семантическое представление) ќ±ру.
Дегенмен, техникалыќ жєне іскерлік коммуникация аясын-даѓы наќты
ќолданбалы мєселені шешу сол саладаѓы ќ‰жаттыќ мєтіндершіњ грамматикалыќ,
лексикалыќ, семантикалыќ ќ‰ры-лымыныњ сипатталуына байланысты. Сонымен
бірге, аталѓан салалардьщ терминологиялыќ сµздігініњ болуына, мєтінніњ
статистикалыќ ќ‰рылымыныњ зерттелуіне жєне осындай мєтіндер типтерініњ
семантикалыќ кµрінісініњ толыќ ќ‰рылуына да байланысты екенін айта кету
ќажет.
Ќолданбалы лингвистиканыњ дамуына, яѓни ѓылыми жетіс-тіктерге ие
болуы тіл білімі теориясыныњ дамуы да µз єсерін тигізбей ќоймады. Мысалы,
XX ѓ, 20-30-жылдары практикалыќ ќажеттіктен туындаѓан ѓылыми-техникалыќ
терминологияны бірізді жєне т‰раќты ету жолдары жања лингвистикалыќ пєн
-терминтану ("терминоведение") саласын µмірге єкеледі. Сол сияќты, Кењес
Одаѓы халыќтары тілініњ єліпбиі мен жазуын ќ‰руѓа байланысты 30-^0-жылдары
ж‰ргізілген кењ кµлемді єрі орасан к‰рделі, єрі зор тєжірибелік мєні бар
ж‰мыстар тілдерді синхронды сипаттаудыњ єдістерін жетілдіруге себепші болды
(ынталандырды) деуге болады.
Соњѓы 20-30 жылда пайда болтан ќолданбалы лингвистиканыњ жања
аспектілерініњ бєрі бір ѓана ортаќ проблемаѓа тєуелді екенін байќатты, ол -
тілдіњ жазба не сµйлеу т‰рлерін автоматты µњдеу мєселесі еді. М‰ндай
проблемамен айналысу тілді талдау мен сипаттаудыњ жања єдіс-тєсілдерініњ
дамуына жєне тіл табираты мен тіл білімі ќ‰рылымына деген жањаша
кµзќарастыњ пайда болуына м‰мкіндік тушзды.
XX ѓасырдыњ 50-70-жылдарында тілдік материалдарды автоматты т‰рде
µњцеуге ќатысты к‰рделі проблеманыњ шешім табуы ќолданбалы лингвистиканыњ
µрі ќарай дамуына айтарлыќтай эсер етті.
Ќолданбалы лингвистиканыњ жања аспектілері теориялыќ тіл біліміне жањадан
ѓана ене бастаѓан математикалыќ єдістерді, әсіресе, теоретика-жиындыќ,
формальды-логикалыќ, статистикалыќтималдыќ єдістердіњ ќолдануын барынша
жеделдетгі.
Классикалыќ тіл білімініњ, классикалыќ логиканыњ, психодогияныњ,
семантика мен математиканьщ ќиылысуынан барып тілдегі модельдеу єдісініњ
µзінше бµлек ѓылым ретінде кµрініс табуыныњ нєтижесінде ќазіргі
ќ‰рыльімдыќ лингвистика деп аталып ж‰рген ѓылыми сала µмірге келгені
белгілі. Сол сияќты енді тіл біліміндегі дербес т‰рѓан теориялыќ баѓыт
ретінде тілдіњ теориялыќ модельдері атты жања тарау пайда болды.
Лингвистика мен математика салаларыныњ аралыѓынан туындаѓан -
математикалыќ лингвистика атты жања пµн µмірге келді. Б‰л пєнніњ XX ѓ. 50-
60-жылдары ќалыптасуы б‰рыннан да тіл білімініњ барлыќ ішкі дамуыныњ µзінен
де сезіле бастаѓан болатын. Мєселен, б‰л жайт тілдіњ ќ‰рылымына кµњіл
аударудан, тілдік ж‰йе ретінде ќарастырудан жєне оныњ микрож‰йелерден т‰ру
к‰рделілігін жете т‰сінуден, лингвистикалыќ нысандар мен олардыњ
атрибуттары аралы-ѓындаѓы ќатынастарды танып-білуден- байќалып,
математикалыќ лингвистика пєнініњ дамуына объективті жаѓдай туѓызды деуге
болады.
Атап айтќанда, ќазіргі теориялыќ тіл білімініњ дамуына ењ кµп эсер
еткен - ќ‰рылымдыќ лингвистика мен математикалыќ лингвистика пєндері.
Б‰ндай эсер кµбінде грамматиканыњ синтаксис жєне семантика салаларында
айтарлыќтай кµрініс тапты.
Ќ‰рылымдыќ синтаксисте мынадай формальды екі синтак-систік
модельдер ж‰йелі т‰рде жете зерттелді. Олар - тікелей ќ‰растырушылар моделі
мен µзара тєуелді модельдер деп аталады. Б‰л аталѓан екі модель де
машиналыќ аударма жасауда, автоматтанѓан синтаксистік талдау мен мєтінге
жаса-латын басќа да автоматты µњдеулерде кењ т‰рде пайда-ланылады.
Семантика тілдіњ барлыќ дењгейлеріне ортаќ болѓан-дыќтан, тіл білімінде
оны бµлек дењгей ретінде ќарастырмайды. Семантикада, біріншіден,
лингвистиканыњ µзіне ѓана тєн єдістіњ єсері байќалса, екіншіден, логикалыќ
семантика мен теориялыќ классификациялау єдістерініњ де єсері орын алады.
1.1 Лингво-статистиканың пәнаралық сипаты
Лингвистикалық статистика (ағылш.linguistical statistics-
лингвостатистика). Статистикалық әдістерді пайдалану арқылы тілдегі және
сөйлеудегі сандық заңдылықтарды зерттеумен айналысатын тіл білімінің
саласы.
Лингвистикалық статистика ғылыми бағыт ретінде лингвистикалық
бірліктердің құрылым сипаттарының жиынтығын, олардың пайдалану,
ереетеліктерімен толықтыруға байланысты пайда болды. Статистикалық
лингвистика тілді зерттеудің тек әдісі не тәсілі болып қана қоймай, қазіргі
кездегі тілтануда өзінше бір бөлек ғылыми пән дәрежесіне келтіріп отыр. Бұл
пән тілдік бірліктердің сапалық және сандық мәліеттерін тілдің табиғатына
сай қарастыруды жөн санайды.
Статистикалық лингвистика, негізінен математикалық статистика
әдістемесіне сүйенеді. Зерттеу барысында ондай әдістемені қолдану қатынас
құралы ретінде “тілді” белгілі бір жүй деп қарастырудан туындайды.[8]
Шынында да, “тіл” дегеніміз обьективті болмыста өмір сүретін көп өлшемді
және белгілі бір ішкі заңдылықтардың негізінде топталған табиғи құбылыс
деуге болады. Ал тілдік жүйе математикалық статистика заңдылықтарына бағыну
үшін ондағы бірліктер тобы қайталанып отыратын және кездейсоқтық сипатта
болатын тілдік элементтерден тұруы қажет. Бұл жерде айта кететін жайт, тіл
қызметі кезіндегі дыбыстар, сөздер, сөз тіркестері, сөйлемдер және одан да
үлкен бөліктер қайталанбайтын сипатта болса, адамдар арасындағы тілдік
қатынас бұзылып, ақпарат таратушы мен қабылдаушы арасында түсінбестік пайда
болған болар еді.
Сондықтан да тілдік бірліктердің қайталануы олардың тілімізге тән
болуынан, олардың қолдану сипатына, жиі, сирек деген ұғымдардың да тән
екендігіне туындайды. Табиғи ортадағы элементтер арасындағы қайталану
сипатының негізінде математикалық статистика мен ықтималдық теория атты
ғылым салаларында тілдік бірліктердің статистикалық заңдылықтары
қалыптасады. Зерттеуге алынған бірліктің ондай заңдылыққа бағыну не
бағынбауын айқындау үшін алынатын ортаның аумағы (мәселен мәтін көлемі)
барынша мол болғаны жөн. Мысалы кітаптың бір бетінде кездесетін сөздер мен
оның жүз бетінде кездесетін сөздердің қайталану сипаты әртүрлі
болатындығына еткімнің күмәні жоқ. Ал, заңдылықты айқындау үшін, кітаптың
бір бетіндегі мәліметтен гөрі оның көптеген беттерінен алынған
мәліметтердің шамасы шындыққа жақын болатындығы анық.[9]
Тілге тән заңдылықтарды статистика тәсілімен анықтау негіздемесі
мынада:
1) сандық (мөлшерлік) құбылыс тіл табиғатына әуелден-ақ тән болуы.
2) тіл құрылымындағы сандық және сапалық сипаттардың өзара байланыста
болуы;
3) тілдің әртүрлі бірліктері сөйлеу ағымында статистикалық
заңдылықтардың ең болмағанда біреуіне бағынуы тиіс деп ұйғару керектігі.
Әдістердің индуктивті, дедуктивті болып ажыратылатынын ескере отырып,
негізінен алғанда, статистикалық әдіс-индуктивті әдіс арқылы, ал тілдің әр
түрлі модельдерін жасау үшін қолданылатын логика-математикалық әдістер-
дедуктивті әдіс арқылы жүзеге асатыны анық. [11]
Тілдің ықтималды-статистикалық моделін жасауға болатыны белгілі десек,
ондай модель, біріншіден, белгілі бір тілдік жүйенің мәтіндері арқылы
жасалады, ал екіншіден, тілдің логика-математикалық моделі сол тілдің толық
жүйесін айқындай алады.
Сөйлесу арқылы қатынас жасау кезіндегі тілдік процесті байланыс жолы
деп есептеуге болады. Ал мұндай байланыс жолы арқылы таратылатын ақпарат,
әріп, дыбыс морфема және т.б. лингвистикалық бірліктер негізінде іске
асады. Бұл жердегі лингвистикалық бірліктер белгілі бір “кодтың” символдары
ретінде есептеледі. Байланыс жолындағы хабарлаушы мен қабылдаушы, яғни
айтушы мен тыңдаушы өзара бірдей “кодты” пайдаланулары шарт болуы қажет.
Тіл зерттеу тәжірибесінде статистиканың араласуы бұрыннан да бар десек,
ондай әдіс тек жекелеген зерттеушілердің ізденістерінде ғана кездессе, енді
статистикалық лингвистика жеке ғылыми пәнге, ғылыми бағытқа айналып отыр.
Осымен байланысты статистикалық лингвистика саласының қазақ
тіліне қатысты өзіне тән алға қойған теориялық және практикалық мақсаты мен
міндеті айқындалуда.[12]
Мұндай жиілік сөздіктерді алғаш қажет еткен-оқушыларға, студенттерге шет
тілдерді, басқа тілді оқыту процесіндегі кейбір қиындықтар еді. Өйткені
оқытушы тілдің барлық сөзін, сөздік құрамын белгілі оқыту мерзімінде түгел
толық үйретіп, білдіре алмайды, оқушы да бөтен тілдің барлық сөз қорын
игере кете қоюы мүмкін емес. Ал, үйреніп отырған бөтен тілде сөйлей алу
үшін әрі айтылған пікірді түсініп,өз ойын жеткізе алу үшін ол тілдегі
барлық сөзді тегіс білу міндетті емес.
Өйткені, қандай тілдегі болмасын сөзднрдің қолданылу мүмкіндігі
бірдей емес. Кейбір сөздер белгілі тексте бір-бірден қолданылса, кейбіреуі
бірнете рет кездеседі. Оқушы алдымен тілде жиі қолданылатын сөздерді
үйренуі қажет. Мысалы: Абай шығармаларында небары 6017сөз 46847рет
қайталанған.[13,14,] Енді осы өнімді, яғни жиі қолданылатын сөздер қайсысы
дегенде дәл жауап бере алатын тек осы жиілік сөздіктер.
Тілдегі әртүрлі жанр, немесе әр кезеңдегі жазба мұралар
материалдары негізінде бірнете статистикалық талдаулар жасалады да, шыққан
көрсеткіштер корреляциялық өзара байланыс немесе математикалық
корреляциялық анализ арқылы салыстырылады, салыстыру үшін алынған
үзінділердің көлемі тең болу қажет. Бұл жерде статистикалық талдау сөз
(лесика), фонема (дыбыс), грамматикалық көрсеткіштер көлемінде де
жүргізіледі. [15]
Осының нәтижесінде тілдегі стильдік тармақтардың өзара байланысы
мен бір-бірінен ерекшелігі, тілдің әр кезеңдегі көрініс дәрежесі мен даму
процесі айқындалады. Белгілі бір дәуірдегі актив сөздер кейінгі кезеңдерге
ондай қасиеттен айрылып қалуы мүмкін, ол дәрежеде басқа бір сөздер жүруі
ықтимал. Сонымен бірге сол сөздердің тіркестегі сөйлеу процесіндегі салмағы
өзгереді. Енді осы өзгерістердің ішкі және сыртқы себептері ашылады. Сол
сияқты төркіндес тілдердің туыстық дәрежесі, олардың даму қарқыны,
мәселелері де статистикалық талдауларсыз шетуге бомайды. Туыстыға жоқ
тілдерді статистикалық талдау негізінде салыстыра зерттеу де жеке тілдің
өзіндік ереетеліктерін, заңдылықтарын, сол сияқты жалпы тіл атаулыға тән
ортақ заңдылықтарды, басқа да қоғамдық құбылыстар арасындағы тілдің алатын
орны, қарым-қатынасы тәрізді мәселелердің басын ашуға мүмкіндік
береді.[16,18]
Машина арқылы аударудың, тіл мен кибернетика мәселелерінің
бүгінгі таңдағы қажеттігі мамандарды ойландырып отыр. Бұл проблемалар
статистикалық талдау негізінде зерттеулердің табиғи жалғасы бола отырып,
оның үстіне көптеген тың мәселелерді айқындай түсуді талап етеді. Қазіргі
кезде жазба және сөйлеу тілдерін талдап-саралап, тілдік элементтерді
ажыратып, екінші тілге аудара алатын машина жасау мәселесі алға қойылып
отыр. Басқа түркі тілдерін айтпағанда, қазақ тілінің көптеген кезек
күттірмейтін мәселелері, мәселен лексикография саласы бойынша компьютерлік
қор жасау, қазақ тілінен басқа, немесе керісінше компьютерлік аударма
жасау, ақпарат мазмұнынан қысқаша мәлімет алу.[17,19]
1.2 Лингво-статистикадағы сөздіктердің жалпы сипаттамасы
Кейбір тілдік құбылыстар өте әлсіз көрініс тауып, жасырын сипатта
тұрып, көп жағдайда зерттеушінің тікелей бақылауынан тыс қалады. Міне,
осындай тілдік құбылыстарды анықтайтын математикалық құралды статистикалық
зерттеулер арқылы тбуға болады.
Тілді, оның дамуы мен жеке адамның қалыптасуындағы рөлін зерртеу-
адамның бүкіл таным қызметінің қалыптасуын қарастыруда ерекше маңызға ие
болып отырған ғылымның басты мәселесіне айналды.
Қазіргі тіл білімінің даму тәжірибесі көрсеткендей, тілдің түрлі топтарының
лексикасы мен морфологиясын салыстыруға және оның нәтижелерін алуға жағдай
туғызатын мәтіннің квантитативтік әдісінің ерекше тиімді түрлі
1) әліпби-жиілік сөздік;
2) жиілік сөздік;
3) кері әліпби-жиілік сөздік;
4) сөзнұсқағыш әліпби-жиілік сөздік (сирек құрастырылатын жиілік
сөздіктің түрі).
Әліпби-жиілік сөздік. Жиілік сөздіктің бұл түрінде зерттеу мақсатына
сай таңдалып алынған мәтіндердегі сөздер (сөзтұлғалар) түгелімен қамтылуы
қажет және олар бір-бірімен салыстырылып, әрқайсысының қолдану саны
анықталады. Осындай сандық көрсеткіш сөздің (сөзтұлғаның) мәтін ішіндегі
қолдану жиілігі деп немесе сөздің абсолютті жиілігі деп аталады.
Әліпби-жиілік сөздікте көрініс табатын ең бірінші (қатарда) — сөздік
бірлігінің реттік сандары, екінші – мәтіннен бөлініп алынған әр түрлі
сөздің (сөзтұлғаның) қатаң әліпби тәртібімен орналасқан тұлғасы және үшінші
- сөздің абсолютгі жиілігі.
Жиілік сөздіктердің толық түрінде осы аталғандардан басқа: жиынтық
абсолютгі жиілік, қатынастық жиілік, жиынтық қатынастық жиілік және
сонымен бірге бір топ сөздердің мәтінді қамтуының пайыздық шамалары
беріледі. Жиілік сөздіктер жасау (түзу) арнайы компьютерлік бағдарламалар
көмегімен іске асады. Сөздіктерді жасау барысының бастамасы сөздік
бірлігінің әліпби тәртібіне келтірілмеген жиілікті сөзтізбе түрінде
алынады.
Осыдан кейін арнайы компьютерлік сұрыптау бағдарламасының негізінде
басқа да сөздіктер түрлері түзіледі. Мәселен, әліпбилік сұрыптау
арқылы Әліпби-жиілік сөздік алынады.
Әліпби-жиілік сөздік зерттеушіге қажет деген сөздің (оның туынды
тұлғаларының да) қолдану дәрежесін, яғни оның жиілігін табуға, зерттеуге
алынған мәтіндер лексикасының әліпбилік құрамының статистикасын анықтау
үшін аса маңызды. Сондықтан, оны тілдің әліпбилік тұрғыдағы статистикалық
үлгісі (моделі) деп те атауға болады.
Әліпби-жиілік сөздік сөздіктің нормативті түріне жатпағандықтан,
зерттеуші мәтіндегі немесе оның сөзтізбегіндегі сөздердің (сөзтұлғалардың)
әдеби нормаға не орфографиялық жазылу нормасына жату-жатпауына жауап таба
алмауы мүмкін. Оның себебі, сөздікте көрініс тапқан сөздер (не
сөзтұлғалар), әдетте, қалам иесінің (автордың) не сол шығарманы жарыққа
шығарушы жауапты адамның (редактордың) тіл игеру дәрежесіне қатысты да
болады.
Жиілік сөздік. Сөздіктердің жиілік сөздік түрі әліпби-жиілік
сөздіктен басқаша, дәлірек айтқанда, әр сөздің (сөзтұлғаның) қолдану
жиілігінің дәрежесіне қарай орналасады: ең бірінші ретте орналасатын
мәтіндегі ең жиі қолданылған сөз (не сөзтұлға), екінші, үшінші ретте
орналасатын сөздер -кездесу жиіліктері бірте-бірте кеміп отыратын сөздер
(сөзтұлғалар). Егер бірнеше сөздің (не сөзтұлғаның) жиіліктері тұрақтылық
сипатта болса, яғни біріне-бірі тең болып келсе, онда ол сөздер
(сөзтұлғалар) жиілік сөздікте әліпби тәртібімен реттеледі.
Зерттеуші (мұғалім, оқушы) әліпби-жиілік сөздік бойынша өзін
қызықтыратын сөздің қандай жиілікте қолданылатынын немесе керісінше,
алдын ала қызықтыратын жиілік шамасының қандай сөздерге тән екендігін
анықтай алады.
Жиілік сөздік (әліпби-жиілік сөздіктер тәрізді) әр түрлі тілдік
бірліктер (сөз, сөзтұлға, сөзтіркес т.б.) бойынша жасалуы мүмкін. Біздің
баяндауымызда қарастыратын бірліктеріміз негізінен сөзге не сөзтұлғаға
сәйкес келетіндіктен, сөздің жиілік сөздігі не сөзтұлғаның жиілік
сөздігі деген сөз тіркестер жиі-жиі кездесуі мүмкін. Ал бұл сөздіктердің
де жалпы аты - жиілікті сөзтізбе.
Ана тіліміздің немесе басқа да туыстас (не туыстас емес) тілдердің әр
стильдік мәтіндеріне қатысты жасалған жиілік сөздіктер сол тілдің
лексикалық құрылымын терең зерттеуде, лексиканың жалпы функционалдық
стильге ортақ бөлігін ажыратуда септігі мол.
Сондай-ақ, жалпы халықтық лексиканың, кірме сөздер мен терминдердің,
неологизмдердің және басқа лексикалық топтардың тілдің жалпы лексика
жүйесінен алатын орны жөнінде де жиілік сөздік бойынша көптеген саңдық және
сапалық мәліметгер алуға болады. Сөздердің саны мен тұлғалары арқылы тілдің
лексикалық байлығы мен стильдік ерекшеліктері анықталады. Мұндай
сөздіктерден зертгеуші жаңа сөзжасам жүйесіне қатысты да бағалы деректер
ала алады. Сонымен бірге, жиілік сөздік мәліметтері қазақ тілін туыстас
түркі тілдері және туыс емес тілдермен салыстыру — типологиялық зерттеу
үшін де аса қажетгі екенін атап өткен жөн.(12)
Жиілік сөздіктер күнделікті қолданбалы сипатгағы міндеттерді шешуде де
маңызды. Мәселен, әр түрлі типтегі минимум сөздіктерін жасауда және шет
тілдерін (екінші тілді) үйрену мен оқытуға қажетгі статистикалық әдістерді
қолдануда да қажетгі. Сонымен бірге жиілік сөздіктердің тілдік және сандық
мәліметтері оқулықтар мен оқу құралдарын құрастыру ісінде тілдік
материалдарды тиімді түрде орналастыруда және әр қилы лексикалық топтар мен
грамматикалық категорияларды орынды түрде оқыту процесінде де таптырмас
тілдік құрал рөлін атқара алады.
Жиілік сөздіктер материалдарының тіл білімін зерттеудегі қажеттілігі
мен бағалылығы жөнінде Л.Н.Засорина мынадай пікір айтқан болатын:
Материалы частотных словарей исключительно ценны и для собственно
лингвистических исследований. Они оказывают влияние на судьбы традиционной
лексикографии. Ими пользуются в решении основной проблемы общей
лексикологии - выделение словарного фонда активного и периферического
словаря; они полезны и при изучении вопросов стилистики, семантики и
литературной нормы языка. (41,С.3-4)
Жиілік сөздік өзге сөздіктердің көлеміне қатысты және басқа да
лексикографиялық мәселелерді шешуде объективті негіз болатындықтан, екі
немесе одан да көп тілдік аударма сөздік пен түсіндірме сөздік жасаушылар
бұл сөздіктен қажетгі деректер таба алады.
Жиілік сөздіктер телефон мен телеграф байланыстарын жетілдіру үшін де,
стенография мен полиграфия мұқтаждықтары үшін де пайдаланылады.
Сайып келгенде, жалпы түркі тілдерінің, соның ішінде қазақ тілінің
жиілік сөздіктерін жасау қажет деп саналады, өйткені олар көптеген
лингвистикалық мәселелерге математикалық әдістерді қолданып зерттеуге
мүмкіндік туғызады.
Қазақ тілінің сөз байлығын, яғни қазіргі қазақ әдеби тілінің жалпы
лексикасын түгел қамтитын жиілік сөздік әлі жасала қойған жоқ. Мұндай
сөздіктің құрастырылуы мен жарық көруі -жуық болашақтың ісі.
Кері әліпби-жиілік сөздік. Сөздіктердің басым көшпілігінде сөздер
алдыңғы дыбыстар бойынша әліпби тәртібімен орналасса, кері әліпби сөздікте,
керісінше, сөз бен сөзтұлғалар соңғы әріп-дыбысынан басталып әліпби
тәртібіне келтіріледі және сөздердің соңғы жағынан тегістеліп беріледі.
Сөздіктің бұл түрі Кері әліпби-сөздік немесе тек Кері сөздік деп аталып
жүр. Егер белгілі бір мәтін бойынша түзілген мұндай сөздікте әр сөздің
мәтіндегі қолдану жиіліктері де ескерілетін болса, ондай сөздікті Кері
әліпби-жиілік сөздік деп атайды. Қазақ тілін зертгеу жұмыстарында мұндай
сөздіктер де бірте-бірте қолданыс тауып келеді.
Кері сөздіктің алғашқы үлгісі осыдан бір ғасырдай бұрын (1873 ж.)
баспадан шыға бастағаны белгілі. Бірақ біздің заманымызда бұл сөздіктерге
қызығушылық тек XX ғасырдың 80-жылдарынан ғана басталды деуге болады.
Мәселен, 1904 жылы латын тілі мен ескі иран тілінің кері сөздіктері
жарияланды. 1944 жылы ескі грек тілінің кері сөздігі пайда болды. 1955 жылы
ескі славян тілінің, ал 1957 жылы қазіргі румын тілінің кері сөздігі шықты.
Чехославакияда 1935-1957 жылдары чех тілінің 9 томды сөздігі бойынша
жасалған кері сөздік кішігірім кітапшалар түрінде басылып шықты.
Кері сөздіктердің рөлі, әсіресе, агглютинативті тілдер үшін ерекше
екенін еске сала отыра, олардың саны әлі де болса санаулы. Осындай
сөздіктердің алғашқылары ретіңде: Қ.Бектаевтың Қазақ тілінің кері
алфавитті сөздігі (Алматы, 1971), Р.Кунгуров, А.Тихонов Обратный словарь
узбекского языка (Самар-каңд,1969, езбек тілінде) және т.б. кері
сөздіктерді атауға болар еді. Аталған сөздіктер мәтінге тікелей қатыссыз,
яғни бұрын жарық көрген түсіндірме, орфографиялық және т.б. сөздіктер
негізінде жасалғандықтан, оларда сөздердің қолдану жиілігі көрсетілмеген.
Ал белгілі бір мәтінге байланысты жасалған кері сөздіктер грамматикалық
формантгардың жұмсалуын зертгеуге бірден-бір қажет екені айқын.
Жиілік сөздіктің кері әліпби түрінде реестрлік сөзге (сөзтұлғаға)
қосылған біркелкі жалғаулар мен жаңа сөз жасаушы немесе сөз түрлендіруші
жұрнақтар бір жерге жинақталып берілуі тілді зертгеушілер үшін аса құнды
тілдік мәліметтер деп саналады. Кері әліпби-жиілік сөздік морфологиялық
категорияларды зерттеу кезінде де және сөз тудырушы, сөз түрлендіруші
морфемалардың құнарлы не құнарсыз екендігін анықтау үшін де, терминдер мен
басқа тілдерден енген сөздерге жалғанған қосымшалардың құрылымын талдауда
да аса бағалы. Осы айтылғандармен қатар, тіл зертгеушіге қажетгі деген
тілдік мәліметтерді әрі толық, әрі тез түрде тауып алу үшін кері әліпби-
жиілік сөздік тілдік қазына деуге болады.
Кері әліпби-жиілік сөздіктердің лингвистикалық қүндылығын И.Штиндлова
өзінің мынадай ой-пікірімен білдіреді: ...Обратные словари могут быть
использованы не только в качестве материала для освещения вопросов
словообразования, не только как словари рифм или как пособия для
восстановления испорченного текста, но они ценны, в первую очередь, при
сравнительном изучении родственных языков.
И были бы интересны и для другого типа, например для аналитического
языка, или для аглютинативных языков [97].
Кері әліпби-жиілік сөздіктің әрбір жұрнақ пен жалғаудың (олардың
варианттарымен) және әрбір сөз табының белгілі бір мәтіндердегі қолданылу
жиіліктерін анықтауда мүмкіндігі мол.
Тіл білімінің лексикография саласына сөздіктер түзу мәселесі,
түсіндірме сөздікті құрастыру барысына тән-ең алдымен неше түрлі сөздердің
мағынасын ашатын қор жинақтау. Қордағы әрбір сөз-тірек сөз (лексема)
сөздің мағынасына қатысты контекс жүргізеді. Сонымен қатар, мәтіннің қандай
шығармадан алынғаны және оның шығу деректері: авторы, шығарма аты, баспа
аты, шыққан жылы, көлемі, мәтіннің кездескен бет саны да бірге берілуі
керек.
Бұл сөздіктер арқылы жазушы тілін тілдің басқа түрлі салаларымен
салыстыруға және кватитативтік әдіс арқылы алынған жазушы мәтіндеріндегі
сөз қолданыстарды анықтап, алынған зерттеу нәтижелеріне сүйене отырып,
сөздіктердің тиімді әдіс-тәсілдерін айқындауға болады.
Соңғы кезде жалпы тіл білімінде дәстүрлі сипаттала зерттеу әдістерімен
қатар жаңа әдістерде қолдану әсіресе, математика, статистика сияқты дәл
ғылымдар саласында қолданылап жүрген зерттеу ідістерін пйдалану мәселесі
қойылып отыр.
Бұл бағыт математикалық лингвистика, статистикалық лингвитика деп
аталып, советтік тіл білмінде де шетел ғалымдары тарапынан дп қолдау тауып
отыр. Еліміздегі ірі-ірі ғылым ордаларында, ғылыми-зерттеу институттарында
арнайы бөлім, секторлар ашылып, жоғарғы оқу орындарында арнаулы пән
оқылады. Москва, Ленинград сияқты қалаларда болып өткен Бүкілодақтық
конференциялар сөздіктер жасаудың әдістері және лингвостатистикалық
жұмыстарды автоматтандыру, математикалық лингвистика, машина арқылы аудару
мәселелерді арнайы қарады. Осы арада жаңа әдістерді тіл біліміне енгізудің
себебіне, оның мақсаты қандай деген сұрақ туады.
Тіл біліміндегі мұндай жаңа бағыт екі түрлі қажеттілікпен туып отыр.
Ең алдымен бұл проблеманы алға қойып отырған тіл білімінің ішкі факторлары,
яғни тіл заңдылықтарын, оның ішкі сырын, даму процесін, тарихын, мәнін
басқа тілдермен қарым-қатынасы сияқты ереетеліктерін басқа ғылымдар
саласында қолданылып жүрген тиімді әдістер арқылы аша түсу болса,
екіншіден, тіл тек қана зерртеу обьектісі емес, оның қоғамдық қызметі,
коммуникацялық рөлі, функционалдық мәні, бар құбылыс болғандықтан,
күнделікті өмір таабынан туып отырған практиалық қажеттілік болып отыр.
Математикалық, статистикалық талдаудың обьектісі-тілдік құрылым болады.
Мысалы: белгілі бір грамматикалық мағына белгілі грамматикалық түр арқылы
беріледі, оның өзіне тән тұлғасы болады. Ал сол грамматикалық мағынаның
сөйлеу процесіндегі салмағы, алатын орны тәуелдік жалғауының және тәуелдік
мағынаны білдіретін басқы қосымша, амалдардың тексте қолданылу арқылы
анықталады. Ыңғайлас, біріңғай тілдік элементттердің (фонема мен фонеманың,
қосымша мен қосымшаның, лексема мен лексеманың, тіркес пен тіркестің) жалпы
тілде, белгілі бір тексте, жеке қалам қайраткерлерінің сөз өрнегінде
қолдану мүмкіндігі бірдей емес.
Тілдегі сапалық құбылыстардың сандық қасиеті болатынын тіл мамандары
көрмей қалған жоқ. Тіл туралы жекелеген зерттеулерде, грамматикаларда
беріліп жүрген, мысалы: дербес тілдік фонетикалық заңдылықтарына
бағынбайтын ауытқулар, сол сияқты грамматикалық көрсететтер (сөз тудырушы,
жұрнақтар) өнімді, өнімсіз, актив, пассив болып бөлінуі, сондай үлкенді-
кішілі ережелер статистикалық бақылаулардың негізінде топталынған еді.
Тілді статистика, математика әдістері негізінде зерттеудің лексика
саласындағы алғашқы жолы жеке жанрлық текстердің сол сияқты жеке жазушылар
шығармасы немесе жалпы халықтық тілдің сөздіктерін сөздің, сөз формаларының
жиілік тізімін жасаудан басталып отыр. Қазіргі кезде тіл мамандары
жиырмадан астам тілдің материалдары негізінде үш жүз шақты жиілік сөздік
құрастырды. Орыс тілінде бірнете сөздіктер басылып шықты, мысалы:
Э.А.Штейнфельдтің “Частотный словарь русского языка” атты сөздігі және
басқалар. Сонымен бірге орыс тілі мамандарының бірқатары әр жанрдың, әр
стильдің, жеке ақын жазушылар шығармалары тілдерінің материалдары негізінде
әр көлемде жиілік сөздіктер құрастыру ісімен біраздан бері шұғылданып
келеді. Жиілік сөздік әртүрлі мақсатпен құрастырылады. Осыған орай
материалдардың сипаты мен көлемі де, жанрлық, стильдік ереетеліктері де
ескеріліп белгілі бір текст не болмаса, бірнете үзінді алынады да, әрбір
сөз біртіндеп, жеке-жеке карточкаға түсіріледі.
Осыған жиілік сөздіктерді тек сөз шеңберінде ғана емес, грамматикалық
көрсеткіштер (тұлға), фонема көлемінде де жасауға болады.
Жиілік сөздік-мәтінді белгілі мөлшерде сөздердің пайдалану жиілігіне
қарай орналасқан сөздер тізімінен тұратын сөздік. Жиілік сөздік және мәтін
құрылымында сандық заңдылықтарды салыстыруға мүмкіндік береді. Тілдік
бірлік ретінде оның орнына мәтін бойындағы әріптер, буындар, сөздер, сөз
тұлғалар, сөз тіркестер немесе сөйледер және олардың морфологиялық
құрылымдары алынуы мүмкін . Мұндай жиілік сөздіктер лингвистикалық
статистика мәселесімен тығыз байланысты.
Демек, қазіргі міндет-тілдің барлық құбылысын толық қамти алатын
обьективті заңдарын айқындап, оның универсалды математикалық көрінісін
көрсету болып отыр.
2 Шығарма мәтіндеріндегі сөз таптарының қолдану аясы
Қазақ тілінде сөз таптарын зерттейтін сала-морфология деп
аталады. Морфология-сөз және оның формалары туралы ілім. Сөйлеу дағдысында
әр сөз сөйлем ішіндегі өзге сөздермен белгілі заң бойынша әр қилы қарым-
қатынасқа түседі де, әлденеше қилы өзгеріске ұшырап, әр алуан қызмет
атқарады. Морфология осындай сөздерді жеке-жеке қарамай, жалпы сөз атаулыны
алып, оларды белгілі топтарға бөліп, сол топ-топтың әрқайсысына тән жалпы
грамматикалық сыр-сипатын анықтайды. Соның арқасында сөздердің әр тобының
өзіне лайық жалпы грамматикалық мағыналарымен грамматикалық формалары
айқындалады, сөз таптары ажыратылады, әр сөз табына тән категориялардың сыр-
сипаттары ашылады. Осындай талдаудың нәтижесінде сөздің жасалу, түрлену,
өзгеру жүйелері, сөздің бөлшектенуі және олардың әрқайсысының гамматикалық
мағыналары мен қызметтері анықталады. Морфология сөзді, сөздің тиісті
бөлшектерін, олардың мағыналары мен қызметтерін талдайды. Белгілі бір сөзді
оқшау қарамай, оны басқа сөздермен байланысты қарап барып, олардың қарым-
қатынастарын анықтайды. Бірақ, мофология сөздерді, олардың қарым-
қатынастарын сол тілдің жүйесінің қалыпты бір көрінісі, бөлшегі ретінде
талдап, оларды бір-бірімен ұштастырып қарайды. Өйткені сөзден сөз тудыру,
сөзі түрлендіріп өзгерту, сөз бен сөзді жалғастыру сияқты амал-тәсілдер -
әрі әбден қалыптасып орныққан, әрі үнемі қолданылатын дағдылы, жүйелі
құбылыстар. Сол себептен морфология тіліміздегі әрбір жұрнақты, әрбір
жалғауды я болмаса басқа бір морфологиялық құбылысты және олардың
әрқайсысының формасын тілдің жүйесімен байланысты, сол жүйеден тарайтын
заңды құбылыс деп қарайды. Морфология сөз формасын да тексереді. Ал, сөз
формасы деген ұғымға сөздің негізгі түбірі де, сөздің туынды, біріккен,
қосарланған, әрқилы қосымшалар қосылған түрлері де, сөз тіркестері де
енеді.
Тілдегі сөздерді грамматикалық мағыналарына, формаларына және қызметтеріне
қарай, топ-топқа бөліп топтастыру да, әр сөз табына тән категориялары
анықтау да морфологияның міндеті. Сөз табының мазмұны лексика-
грамматикалық деп аталатын екі компоненттің бірлігінен құрылады.
Бұл атаудан лексикалық семантикамен бірге грамматикалық семантика
деген ұғымды білдіреді. Яғни, бұл жердегі грамматикалық ұғымына сөздің
жаңадан сөз тудыру, сөз түрлендіру, сөз байланыстыру жүйелерінің мағыналары
мен тұлғалары, бүкіл сөздің морфологиялық және синтаксистік лингвистиканы
ңалдына қойған мақсаттарының бірі – сөз табының лексикалық, грамматикалық
белгілері арқылы, яғни осы үш белгінің негізінде статистикалық зерттеулер
жүргізіп, сөздің мағынасын, морфологиялық формасын және синтаксистік
қызметін сандық деректер арқылы тани білу. Соның нәтижесінде мәтін мазмұнын
ашудың формальды жақтарын айқындау.
Сөз таптарының ішкі жіктеген бөліктерінің түрлері тілде біреуі аз, не көп
қолданылуы мүмкін. Статистикалық зерттеу тәжірибесі бойынша олардың қолдану
жиілігін анықтау үшін кейбір шаралары алдын ала белгілейтін бағдарламаларды
іске қосу қажет.
Әр түрлі тілдік стильдердегі сөз таптарының қатынастық сипатының
статистикасын білу керек болса, әр сөз табына қатысты шартта белгіні қоюдың
зерттеушіге ыңғайлы жолдарын қарастыру керек. Мәтіннің жиілік сөздігін
құрастыруда лингвистикалық статистиканың мәні зор. Соның негізінде
Құдайберген Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың зат есім табының статистикасын зерттеген болатынбыз.
2.1 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті қолдану
Сөздің жиілік тізімін жасауға кіріскен зерттеуші ең алдымен
жиілікті мөлшердегі мәтін көлемін анықтап алуы тиіс. Таңдама көлемін
анықтау лингвостатистиканың ең маңызды мәселелерінің бірі. Қажетті мүмкін
болатын бұл мәтін көлемі іске асу мүмкіндіктерін есепке алғандағы
статистика теориясының талаптары негізінде анықталады. Таңдама мәтініне
жүргізілген зерттеулер нәтижесінде анықталған заңдылықтардан туындайтын
қорытындылар тұтас мәтіннің заңдылықтары жайлы тұжырымдар хасауға мүмкіндік
береді.
Лингвостатистикада сенімділіктің белгілі бір шамаларында
статистикалық мәндерді бағалауға және жиілік сөздіктің бірліктері үшін
қажетті жеткілікті мөлшердегі жиын көлемін анықтауға мүмкіндік беретін
мысалдар аз емес.
Лингвостатистикалық зерттеулерде қажетті таңдама көлемін анықтау үшін
таңдалған мәтіннің статистикалық жағынан сенімді мөлшердегі сөздігін алу
қажетболған жағдайда зерттеуге алынған таңдама көлемі жайында алдын ала
мағлұмат алуға, оны бағалауға мүмкіндік беретін қатынасты қателік шамасын
анықтау әдісін қолданамыз.
Қ.Жұбановтың шығармасын зерттеу барысында ондағы сөздер мен сөз
формаларына арнайы индекстеу жүргіздік, яғни әрбір сөзді шартты түрде
алынған бұл таңбамен белгілеп отырдық. Бұл сөз таптарының классификациясына
негізделді. Қазіргі тіл білімінде сөздер негізгі үш белгісіне қарай
топтастырылуда:лексикалық мағынасы, морфологиялық құрылымы және
синтаксистік қызметі. Осы үш белгілерін салыстыра отырып, әрбір сөзді
белгіл сөз таптарына жіктеп қатысты белгілермен таңбаладық.
Бұл жерде сөздерді индекстеу мен оларға морфологиялық талдау жасауда кері
алфавитті жиілік сөздіктерді де пайдаландық. Мәтінді сөз таптарына ажырату
арқылы таңбаладық.
Сонымен сөздердің белгілі бір лексика-грамматикалық, топқа
қатыстылығы мына төмендегіше белгіленді:
Зт-зат есім, Сн-сын есім, са-сан есім, ет-етістік, үс-үстеу, ел-еліктеуіш,
ес-есімдік, шл-шылау, од-одғай, мд-модаль сөз.
Әдетте, жілік сөздіктері алынатын мәтіндерді зерттеудің бір түрі мәтіндерді
тұтасымен зерттеу кезінде лексикалық бірліктің барлық қолданыстары түгел
қамтылуы ... жалғасы
Филология факультеті
Жалпы тіл білімі кафедрасы
Диплом жұмысы
Құдайберген Жұбановтың ғылыми шығармалары тілінің
статистикалық ерекшеліктері
Мамандығы: 021740 – Қолданбалы лингвистика
Орындаған:
5-курс студенті
Ә.Нұрманова
Ғылыми жетекші:
ф.ғ.д..профессор
А.Қ.Жұбанов
Пікір жазушы:
ф.ғ.д..профессор
З.Базарбаева
Норма бақылаушы:
ф.ғ.к.андидаты
А.Қ.Таусоғарова
Қорғауға жіберілді:
______ _______2006ж.
Жалпы тілі білімі кафедрасының
меңгерушісі профессор Э.Д.Сүлейменова
Алматы 2006
Реферат
Диплом жұмысының тақырыбы: Құдайберген Жұбановтың ғылыми шығармалары
тілінің статистикалық ерекшеліктері
Жұмыстың көлемі:
Пайдаланған әдебиеттер тізімі:
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген
Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы щығарманың
стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім
сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы
арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау.
Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты
ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – қазіргі таңдағы лингвостатистиканың қолданылу
аясы қазақ тілі біліміндегі алатын орнының ерекше. Сонымен қатар,
статистикалық әдіс тіл зерттеу ісіне тұрақты сипатта енді. Статистистикалық
әдістің тіл саласындағы қолданылу аясы кеңейіп, басқа да ірі ғылым
салаларында сандық деректерге жүгінудің қажеттілігі туындап отыр.
Мазмұны
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... ..
Негізгі бөлім
1 Қазақ тіл біліміндегі статистиканың орны
... ... ... ... ... ... ... ... ... ... ... ...
1.1 Лингво-статистиканың пәнаралық
сипаты ... ... ... ... ... ... ... ... ... ... ... ... ...
1.2 Лингво-статистикадағы сөздіктердің жалпы
сипаттамасы ... ... ... ... ... ...
2 Шығарма мәтіндеріндегі сөз таптарының қолдану
аясы ... ... ... ... ... ...
2.1 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті
қолдану ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... ... ..
2.2 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың зат есім табының
статистикасы ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Қорытынды ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... .
Пайдаланылған әдебиеттер
... ... ... ... ... ... ... ... ... ... ... ... ... .
Қосымша
Кіріспе
Тақырыптың өзектілігі: Соңғы жылдары тілдік құбылыстарды сандық және
сапалық жақтан анықтауда ықтимал статистикалық заңдылықтарды ашуға
мүмкіндік беретін лингвостатитикалық әдіс-тәсілдер қолданылуда ( Қ.
Бектаев, А. Жұбанов, Ә.Ақабаев, Қ.Молдабек).
Бұл қолданбалы тіл білімі саласына, лингвостатистикалық әдіспен
зерттеушілерге, компьютермен тіл үйренушілерге өзіндік үлес қосары анық.
Зерттеу жұмысының негізгі тұжырымдары мен алынған сөздіктерді ақын-
жазушылардың сөздік қорын молайту және ана тілімізді меңгерту мәселелерінде
пайдалануға болады.Қ.Жұбановтың ғылыми шығармалары тілінің статистикалық
ерекшеліктері атты тақырыпта жазушы тілін зерттеудің мақсаты мен басты
бағыттары, міндеттерінің лексико-грамматикалық құрылымын зерттеуде
квантитативтік модельдеу әдісін қолданудың тиімді жолдары анықталып,
мәтіндердегі сөз қолданыстарға сандық және сапалық сипаттама берілді.
Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың жиілік сөздіктері мәліметтеріне сүйене отырып, ондағы
статистикалық нәтижелердің ескерілу қажеттігі негізделіп, оқырман тілі мен
шығарма тілі арасындағы қатынасты анықтауда жүргізілген эксперимент
нәтижесінің түйіндері берілді. Мұнда автор күй, домбыра, қобыз, жыр,
толғау, бақсы, сыбызғы, ән, би т.б. музыкалық терминдерге тарихи –
лингвистикалық талдау жасай отырып, ондағы сандық және сапалық
ерекшеліктерді айқындау, зерттеу нәтижелеріне сүйене отырып, сөздердің
қолданылымындағы кейбір тіл заңдылықтарын түсіндіру жалпы тіл білімінде
ерекше маңызға ие болып отыр. Лингвосттатистикалық әдістер тілдік
фактілерді жадағай түрде санамалаудан гөрі оларды топтастырып, белгілі бір
өлшемдер негізінде ықтималды немесе дедуктивті болжамдар жасауға мүмкіндік
береді.Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
тарихи - лингвистикалық шығарманың сөз формалары мен сөз қолданыстардың
қолданылу жиілігі негізінде кейбір тілдік заңдылықтарды ашуға тырыстық.
Тірек сөздер: Статистика, лингвистикалық статистика, сөздік.
Жұмыстың негізгі мақсаты мен міндеті: 1936 жылы жарық көрген Құдайберген
Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы щығарманың
стато-лингвистикалық әдісіне сүйене отырып, шығарма тілінің зат есім
сөздерінің статистикалық сипатын анықтау. Зат есім сөздерінің статистикасы
арқылы жиілік сөздік, әліпбилі сөздік және кері-әліпбилі сөздік алу.
Жұмыстың нысаны – шығарма мәтіндерінің жиілік құрылымын анықтау.
Лингвостатистиканың орны мен қолданылу ерекшеліктерінің сипатын айқындау.
Жұмыстың дерек көздері – тілді статистикалық әдіспен зерттеуге қатысты
ғылыми еңбектер, жиілік сөздіктер және қазақ тілінің дәстүрлі сөздіктері.
Жұмыстың жаңашылдығы – статистикалық деректерді өңдеуде компьютерлік
технологияны пайдалану,математикалық статистика әдістерін басқа ғылымдар
тәсілдерімен ұштастыру, шетелдік тіл білімінің даму бағытына сай келу.
1 Қазақ тіл біліміндегі статистиканың орны
Тақырыптың өзектілігі: Статистикалық әдістің тіл саласындағы қолданылу
тарихын сөз еткенде, осы әдісті тұңғыш ұсынған орыстың белгілі
математикалық ғалымы В.Я.Буняковскийдің (1804-1889) атымен байланысты.
Сонымен бірге басқа да ірі ғалымдардың тілді зерттеуде сандық деректерге
жүгінудің қажеттілігін дәлелдеулеріне деректерді көптеп келтіруге
болады.(И.А.Бодуэн де Куртенэ, А.М.Пешковский, М.Н.Петерсон, Е.Д.Поливанов,
В.В.Виноградовт.б.)
Заманның қарқынды дамуына байланысты, электронды–есептеу техникасының
дамуы, нақты әдіс–тәсілдердің түрлі білімдер салаларында қолданыс табуы тіл
біліміне, өз ықпалын тигізді. Өткен ғасырдың өзінде үнді – еуропа тіл
білімінде кең тараған статистикалық әдіс, қазақ тілінде тек XX ғасырдың 60
жылдарынан бастап жүйелі және ғылыми тұрғыда қолданыла бастады. Бірақ бұдан
бұрын да аталған әдіс ішінара қолданыс тауып, тілдің әр діңгейіндегі
бірліктердің сандық және пайыздық арасалмағын анықтаумен шектеліп келген
болатын. Мамандардың пайымдауынша, кітаби және сөйлеу тіліндегі түрлі типті
сөздердің әр ыңғайындағы қолдану жиілігін анықтайтын мұндай тәсіл тілдің
құрылымдық – грамматикалық, кейде стильдік – семантикалық айырым белгілерін
ажырата отырып, осы стильдерге тән қасиеттерді анықтауға мүмкіндік жасайды.
[2]
Тілдік мәселелерге қолданылатын математикалық әдісті интуитивті түрде
тұжырымдалған, сол сияқты толық шешімі жоқ мәселелердің логикалық
тұжырымдалуына бағынатын және алгоритмдік шешімі бар бір немесе бірнеше
қарапайым математикалық моделіне көшуді қажет етеді.[3] Тілдің аса күрделі
түрдегі сн алуан параметрлі көп қабатты жүйе екенін ескерсек, онда
ықтималдық теория, математикалық статистика, ақпарат теориясы және т.б.
ғылыми салалар әдістерін қолданудың мүмкіндігі кең екені байқалады.[4]
Статистикалық әдіс басқа математикалық әдістерге қарағанда тіл зерттеу
ісіне бұрынырақ және тұрақты сипатта енді деуге болады. Белгілі орыс ғалымы
Б.Н.Головин әуелден – ақ сандық сипаттың, тіл категориялары мен оның
элементтеріне обьективті түрде тән болуынан, сонымен бірге сапалық және
сандық сипаттарының өзара қатынастылығы тілдің қатынас құралы ретіндегі
қызметі мен даму сатысындағы обьективтілігімен тілді сандық тұрғыда зерттеу
қажеттілігі туындады деп түсіндірді.
Тілдік фактілерді сандық ұғымдарға жүгініп баяндау қазақ тіл білімін
зерттеуші ғалымдарға да тән. Өйткені қай кезде болмасын қазақ тілі жайлы
зерттеулердің бәрінде дерлік аз, көп, жиі, сирек, өнімді, өнімсіз, мол,
жуық, тең, шамалас, көп т.б.мөлшерд көрсететін сөздер кездесіп отырады және
бұлардың мәнін нақты санмен көрсетуге талаптанушы ғалымдар да бар.
Сөйтіп, қолданбалы тіл білімінің бүгінді Статистикалық лингвистика
деп аталып жүрген хаңа саласының алғашқы нышандары мен белгілері міне,
осылардан басталады. Қазақ тіл біліміндегі бұл саланың бастауында профессор
Құдайберген Қуанұлы Жұбанов тұрды.
Қазақ совет тіл білімінің негізін қалаушылардың бірі, совет
дәуірінде қазақ тілін тұңғыш рет ғылыми түрде зерттеген лингвист- маман
Қ.Жұбанов ретіне қарай сандық деректерді де пайдаланды.
Статистикалық әдіс түрлі тілдердегі грамматикалық тұлғаларды
салыстыра зерттеуде де елеулі нәтижелерге ие болды.[5] Мәселен, Т.М.Гарипов
башқұрт, қазақ, татар, чуваш, түркі тілдерін лексика – семантикалық тұрғыда
талдап, олардық сандық және сапалық ерекшеліктерін анықтауды мақсат етті.
Сол сияқты туыстас емес тілдер қазақ және орыс, қазақ және ағылшын тілдерін
салыстырғандағы грмматикалық формалар да статистикалық зерттеу аясынан тыс
қалмады.[18,19]
1987 жылы ҚазКСР Наука баспасынан шыққан Квантитативная
структура казахского текста және 2002ж жарық көрген Основные принципы
формализации содержания казахского текста атты монографияларында қазақ
тілінің заманға сай өзекті зерттеу мәселелері сөз етілді. Бірінші аталған
ғылыми еңбекте қазақ тіліндегі әтіндерді автоматты түрде электронды –
есептеу машиналары арқылы статистикалық әдіспен зерттеу мүмкіндігі мен сөз
таптарының ықтималды – үйлестірімді заңдылықтары зерттелсе, екінші
монографияда – қазақ мәтіннің мәтін лингвистикасы тұрғыснан мазмұн
формальдау жолдары және мәтіннің туындау проблемалық мәселелері
қарастырылады. [6]
Статистикалық әдіс – тәсілдермен зерттеу тәжірибесінде әртүрлі жиілік
сөздіктер жасаудың өзекті мәселе екендігін көрсетті. Себебі, олардың
негізінде аса маңызды және күрделі мәселелді: тілді лексика-грамматикалық
нормалау, тілдерді зерттеу өзара салыстырмалы-типологиялық зерттеу және
олардың компьютерлік қорын жасауға зор мүмкіндік жасалады.Бүгінде тіл
білімінің бір саласына айналып отырған лингвистикалық статистика, тілдің
сандық сипатынан байқалатын сапалық қасиеттерін оны зерттеуде пайдалануға
болатын тиімді әдіс көздерінің бірі. Сандық деректердің негізінде тілге
қатысты дыбыстар, буындар, сөздер, сөйлем мүшелерінің орны. [7]
Статистикалық лингвистика саласына қатысты зерттеулер, бұл әдістің
әмбебаптық сипаты. Тілдіњ ќолданбалы аясы б‰рыннан да µзініњ кењ жµне жан-
жаќтылыѓымен ерекшеленетін. Оныњ ескіден келе жатќан саласы - жазу
(графика), ана тілі мен шет тілін оќыту єдістемесі жєне тілдіњ
лексикографиялыќ ж‰йесі. Осылардан кейін барып - аударма, шифртану
(дешифровка), орфография, транслитерация жєне терминологияны µњдеу.
Ќолданбалы лингвистиканыњ дєст‰рлі баѓыттарыныњ бірі - мемлекеттіњ тіл
саясатына ќатынасу:
1) µліпбиді, орфографияны µњдеу, сауатсыздыќты жою;
2) мемлекетгік тілді таѓайындау;
3) мемлекетгік тілден басќа тілдердіњ орнын аныќтау;
4) ±лттыќ терминологияны µњдеу, бір ізге келтіру жєне ќалыптастыру;
5) кала, кµше, алањдарѓа ат ќою мен оныњ б‰рыннан келе жатќан атын
µзгерту, яѓни ономастика мєселелері.
Ќолданбалы тіл білімніњ осындай классикалыќ баѓыт-баѓдарын дамыту
жєне мейлінше жетілдіру мєсёлелерімен бірге XX ѓасырдыњ екінші жартысынан
бастап оныњ бірќатар жања баѓыттары орын ала бастады. Б‰л баѓыттар заманѓа
сай ќоѓам-дыќ, жаратылыстану жєне техникалыќ ѓылымдардыњ µзара даму
сипатынан туындайтын ќолданбалы лингвистиканыњ тарихи дамуыныњ логикалыќ
жалѓасыныњ кµрінісі еді.
Негізінен алѓанда, адам баласыныњ ќызметініњ эр т‰рлі аясындаѓы ж‰мыстарын
жењілдету бір ѓана проблемалыќ мєсе-леге тіреледі. Ол - ќоѓам µміріндегі
аќпарат ж±мысын µњдеу. Б‰ндай аќпарат мєтін т‰ріндегі жазба тілінде не
‰йреншікгі сµйлеу тілінде болуы м‰мкін.
Қоѓамныњ практикалыќ ќажеттігін µтеуде, єсіресе, аќпа-ратты саќтау
мен оны тарату істерініњ сьфын ашуда зерттеуші оны ењ алдымен тілдіњ ішкі
табиѓатындаѓы зањдылыќтардан іздегені жµн.
Осымен байланысты µзекті мєселеніњ бірі - оператордыњ дауысымен
басќарылатын станок пен ќ‰рал-аспаптарды µндіру. Ол ‰шін эр т‰рлі
тілдердегі аќпараттарды автоматты т‰рде µндеу мен оларды іздестіру,
байланыс торабы ж‰мысын (телефон, радиобайланыс т.б.) жетілдіру, адам
баласыньщ сµйлеу мен есту ќабілетініњ б‰зылуына ќатысты ауруларды емдеуде
дыбыстыњ фонетикалыќ деректеріне ж‰гіну жєне т.б.
Аталѓан проблемалыќ мєселелерді ЭЕМ-ды (компъютерді) кењ т‰рде
ќолдана отырып, мєтінді (жазба, сµйлеу) автоматты т‰рде µндеу ќажеттілігі
туындайды. Мєселен, әр типті аќпараттыќ ж‰йелерді тілдік деректермен
ќамтамасыз ету; машиналыќ аударма мєселесі; табиѓи тілді т‰сінетін ж‰йе
ќ‰ру (жасанды интеллект ж‰йе-сіњдегі тілдік мєселелер); сµйлеу кезіндегі
дыбыстыќ сигналдарда бар аќпараттарды пайдалану негізінде арнайы ж‰йе ќ‰ру
т.б.
Соњѓы жылдары әр т‰рлі аќпараттыќ ж‰йелерді тілдік деректермен
ќамтамасыз етумен байланысты терминтану мєселесін бірізділікке т‰сіріп,
т‰раќтандыру µзекті мєселеге айна-лып отыр. Себебі, эр білім саласыныњ
ѓьшыми жєне техникалыќ терминдерді ќолдану ќажеттігі барынша с‰раныс
тудыруда. Єрине, м±ндай мєселе лексикография саласынан тыс µз шешімін
таппайтыны белгілі. Сондыќтан ќоѓам µмірінде ЭЕМ-ніњ (компьютердіњ) кењ
ќолдануымен тыѓыз байланысты автоматты лексикография саласы біртіндеп µз
отауын ќ‰руда.
Практикапык мєселелерді шешуге байланысты табиѓи тідде диалогты
іске асыру ‰шін адам мен ЭЕМ арасында єсерлі ќарым-ќатынас орнату ќажет.
Мєселен, оларѓа жататындар: с‰раќ-жауап ж‰йесін ќ‰ру, роботтарды басќару
ж‰йесін ќ‰ру, аталѓан басќару ж‰йелерінде д‰рыс шешім ќабылдау ‰шін
диалогтыќ процесті іске ќосу. М‰ндаѓы ењ негізгі мєселе -автоматты
ќ‰рылѓыныњ жазба не дыбыстыќ мєтінді т‰сіне білу (тану) проблемасы.
Єрбір тілдіњ ќолданбалы мєселені шешуде µзіне тєн ерекшелігі
бар. М‰ндай есептердіњ санын, т‰рін алдын ала білу м‰мкін емес. ¤мірде олар
жыл сайын, аи сайын ауысып, біреуі келіп, екіншісі кетіп жатады. Ќолданбалы
лингвистикаѓа ќатысты іргелі зерттеулер ѓылыми-техникалыќ, ‰йымдастыру-
басќарудыњ ауызша-жазбаша ќ‰жаттарыныњ, сµздік т‰зу мен жєне т.б.
т‰рлерініњ фонетикалыќ, грамматикалыќ, семанти-калыќ жєне статистикалыќ
ќ‰рылымью сипаттау мен модельдеу жаќтарын ќамтиды. Жекелеп айтсаќ, оѓан
теориялыќ жµне ќолданбалы лингвистиканыњ шекарасында жатќан мєтіндік
бірліктердіњ формальды моделін (‰лгісін) ќ‰ру проблемасын жатќызуѓа болады.
Теориялыќ лингвистика, негізінен, тілді ќалыптыќ, ж‰йелік т‰рѓыда
ќарастыратындыќтан, ќолданбалы тіл білімі тілді єрекет ‰стінде, яѓни оныњ
ќарым-ќатынас (коммуникация) кезіндегі табиѓатын т‰сінуге тырысады. Кµптен
бері ќолданбалы тіл білімі ѓылыми-техникалыќ пен іскерлік прозадан µзін
алшаќ ‰стаѓаны аян.
Дегенмен, XX ѓ. 70-жылдарында ѓалымдардыњ мынадай шешім жасауына тура
келді. Кµптеген ќолданбалы мєселелер таза лингвистикалыќ емес, тіпті
дєлірек айтсаќ, ол проблеманы шешу адамныњ іс-єрекеті мен ойлау процесін,
тілдіњ семантикасы мен оныњ формальды жєне семантикалыќ єдіс-амалын
синтездеу (жинаќтау) жолдарын модельдеуге тікелей ќатысты. Осыдан барып
ќолданбалы т±рѓыдаѓы зерттеу-лердіњ іргелі проблемасы - білімді модельдеу
(моделирование знаний) мєселесі аныќталды.
Соњѓы кезде б‰л проблема (білімді модельдеу) бірнеше ѓылымдар
тоѓысына, дєлірек айтќанда - логика, лингвистика, математика, психология,
кибернетика салаларыныњ аясына ќатысты болып отыр. Кµптеген ѓылымдардыњ осы
мєселеге ќызыѓушылыѓыныњ негізгі себебі біреу-аќ, ол - автоматты жасанды
интеллект ж‰йесін ќ‰ру. Солай бола т‰ра, білім бізге тіл арќылы
берілетіні аныќ. Білім сµйлеу мєтінінде де (монолог, диалог, эр
жаѓдайдаѓы реплика) жєне сонымен бірге жазба мєтіндерде де (ескі жазба
ескерткіші, кµркем єдебиет, ѓылыми-техникалыќ єдебиет) кµрініс табады.
Тіл арќылы білімді біз ‰рпаќтан-‰рпаќќа жеткіземіз. Сондыќтан
тіл -білімді саќтау формасы жєне оны тарату ќ‰ралы десек те болады.
Біздіњше, ѓылым мен теханикада мєтіннен тыс жатќан білім жоќ деуге
болады, ал ѓылыми-техникалыќ мєтінніњ
семантикасын модельдеу дегеніміз - ол осы салалардыњ білім ж‰йесін
модельдеу. Осылайша, біртіндеп келіп, білімді модельдеу проблемасы мєтін
мазм‰нын (маѓынасын) модельдеумен ‰штасып жатќанына кµз жеткізуге болады.
Б±л жерде ењ негізгі шешімін табуды ќажет ететін мєселе - мµтінніњ
семантикалыќ кµрінісін (семантическое представление) ќ±ру.
Дегенмен, техникалыќ жєне іскерлік коммуникация аясын-даѓы наќты
ќолданбалы мєселені шешу сол саладаѓы ќ‰жаттыќ мєтіндершіњ грамматикалыќ,
лексикалыќ, семантикалыќ ќ‰ры-лымыныњ сипатталуына байланысты. Сонымен
бірге, аталѓан салалардьщ терминологиялыќ сµздігініњ болуына, мєтінніњ
статистикалыќ ќ‰рылымыныњ зерттелуіне жєне осындай мєтіндер типтерініњ
семантикалыќ кµрінісініњ толыќ ќ‰рылуына да байланысты екенін айта кету
ќажет.
Ќолданбалы лингвистиканыњ дамуына, яѓни ѓылыми жетіс-тіктерге ие
болуы тіл білімі теориясыныњ дамуы да µз єсерін тигізбей ќоймады. Мысалы,
XX ѓ, 20-30-жылдары практикалыќ ќажеттіктен туындаѓан ѓылыми-техникалыќ
терминологияны бірізді жєне т‰раќты ету жолдары жања лингвистикалыќ пєн
-терминтану ("терминоведение") саласын µмірге єкеледі. Сол сияќты, Кењес
Одаѓы халыќтары тілініњ єліпбиі мен жазуын ќ‰руѓа байланысты 30-^0-жылдары
ж‰ргізілген кењ кµлемді єрі орасан к‰рделі, єрі зор тєжірибелік мєні бар
ж‰мыстар тілдерді синхронды сипаттаудыњ єдістерін жетілдіруге себепші болды
(ынталандырды) деуге болады.
Соњѓы 20-30 жылда пайда болтан ќолданбалы лингвистиканыњ жања
аспектілерініњ бєрі бір ѓана ортаќ проблемаѓа тєуелді екенін байќатты, ол -
тілдіњ жазба не сµйлеу т‰рлерін автоматты µњдеу мєселесі еді. М‰ндай
проблемамен айналысу тілді талдау мен сипаттаудыњ жања єдіс-тєсілдерініњ
дамуына жєне тіл табираты мен тіл білімі ќ‰рылымына деген жањаша
кµзќарастыњ пайда болуына м‰мкіндік тушзды.
XX ѓасырдыњ 50-70-жылдарында тілдік материалдарды автоматты т‰рде
µњцеуге ќатысты к‰рделі проблеманыњ шешім табуы ќолданбалы лингвистиканыњ
µрі ќарай дамуына айтарлыќтай эсер етті.
Ќолданбалы лингвистиканыњ жања аспектілері теориялыќ тіл біліміне жањадан
ѓана ене бастаѓан математикалыќ єдістерді, әсіресе, теоретика-жиындыќ,
формальды-логикалыќ, статистикалыќтималдыќ єдістердіњ ќолдануын барынша
жеделдетгі.
Классикалыќ тіл білімініњ, классикалыќ логиканыњ, психодогияныњ,
семантика мен математиканьщ ќиылысуынан барып тілдегі модельдеу єдісініњ
µзінше бµлек ѓылым ретінде кµрініс табуыныњ нєтижесінде ќазіргі
ќ‰рыльімдыќ лингвистика деп аталып ж‰рген ѓылыми сала µмірге келгені
белгілі. Сол сияќты енді тіл біліміндегі дербес т‰рѓан теориялыќ баѓыт
ретінде тілдіњ теориялыќ модельдері атты жања тарау пайда болды.
Лингвистика мен математика салаларыныњ аралыѓынан туындаѓан -
математикалыќ лингвистика атты жања пµн µмірге келді. Б‰л пєнніњ XX ѓ. 50-
60-жылдары ќалыптасуы б‰рыннан да тіл білімініњ барлыќ ішкі дамуыныњ µзінен
де сезіле бастаѓан болатын. Мєселен, б‰л жайт тілдіњ ќ‰рылымына кµњіл
аударудан, тілдік ж‰йе ретінде ќарастырудан жєне оныњ микрож‰йелерден т‰ру
к‰рделілігін жете т‰сінуден, лингвистикалыќ нысандар мен олардыњ
атрибуттары аралы-ѓындаѓы ќатынастарды танып-білуден- байќалып,
математикалыќ лингвистика пєнініњ дамуына объективті жаѓдай туѓызды деуге
болады.
Атап айтќанда, ќазіргі теориялыќ тіл білімініњ дамуына ењ кµп эсер
еткен - ќ‰рылымдыќ лингвистика мен математикалыќ лингвистика пєндері.
Б‰ндай эсер кµбінде грамматиканыњ синтаксис жєне семантика салаларында
айтарлыќтай кµрініс тапты.
Ќ‰рылымдыќ синтаксисте мынадай формальды екі синтак-систік
модельдер ж‰йелі т‰рде жете зерттелді. Олар - тікелей ќ‰растырушылар моделі
мен µзара тєуелді модельдер деп аталады. Б‰л аталѓан екі модель де
машиналыќ аударма жасауда, автоматтанѓан синтаксистік талдау мен мєтінге
жаса-латын басќа да автоматты µњдеулерде кењ т‰рде пайда-ланылады.
Семантика тілдіњ барлыќ дењгейлеріне ортаќ болѓан-дыќтан, тіл білімінде
оны бµлек дењгей ретінде ќарастырмайды. Семантикада, біріншіден,
лингвистиканыњ µзіне ѓана тєн єдістіњ єсері байќалса, екіншіден, логикалыќ
семантика мен теориялыќ классификациялау єдістерініњ де єсері орын алады.
1.1 Лингво-статистиканың пәнаралық сипаты
Лингвистикалық статистика (ағылш.linguistical statistics-
лингвостатистика). Статистикалық әдістерді пайдалану арқылы тілдегі және
сөйлеудегі сандық заңдылықтарды зерттеумен айналысатын тіл білімінің
саласы.
Лингвистикалық статистика ғылыми бағыт ретінде лингвистикалық
бірліктердің құрылым сипаттарының жиынтығын, олардың пайдалану,
ереетеліктерімен толықтыруға байланысты пайда болды. Статистикалық
лингвистика тілді зерттеудің тек әдісі не тәсілі болып қана қоймай, қазіргі
кездегі тілтануда өзінше бір бөлек ғылыми пән дәрежесіне келтіріп отыр. Бұл
пән тілдік бірліктердің сапалық және сандық мәліеттерін тілдің табиғатына
сай қарастыруды жөн санайды.
Статистикалық лингвистика, негізінен математикалық статистика
әдістемесіне сүйенеді. Зерттеу барысында ондай әдістемені қолдану қатынас
құралы ретінде “тілді” белгілі бір жүй деп қарастырудан туындайды.[8]
Шынында да, “тіл” дегеніміз обьективті болмыста өмір сүретін көп өлшемді
және белгілі бір ішкі заңдылықтардың негізінде топталған табиғи құбылыс
деуге болады. Ал тілдік жүйе математикалық статистика заңдылықтарына бағыну
үшін ондағы бірліктер тобы қайталанып отыратын және кездейсоқтық сипатта
болатын тілдік элементтерден тұруы қажет. Бұл жерде айта кететін жайт, тіл
қызметі кезіндегі дыбыстар, сөздер, сөз тіркестері, сөйлемдер және одан да
үлкен бөліктер қайталанбайтын сипатта болса, адамдар арасындағы тілдік
қатынас бұзылып, ақпарат таратушы мен қабылдаушы арасында түсінбестік пайда
болған болар еді.
Сондықтан да тілдік бірліктердің қайталануы олардың тілімізге тән
болуынан, олардың қолдану сипатына, жиі, сирек деген ұғымдардың да тән
екендігіне туындайды. Табиғи ортадағы элементтер арасындағы қайталану
сипатының негізінде математикалық статистика мен ықтималдық теория атты
ғылым салаларында тілдік бірліктердің статистикалық заңдылықтары
қалыптасады. Зерттеуге алынған бірліктің ондай заңдылыққа бағыну не
бағынбауын айқындау үшін алынатын ортаның аумағы (мәселен мәтін көлемі)
барынша мол болғаны жөн. Мысалы кітаптың бір бетінде кездесетін сөздер мен
оның жүз бетінде кездесетін сөздердің қайталану сипаты әртүрлі
болатындығына еткімнің күмәні жоқ. Ал, заңдылықты айқындау үшін, кітаптың
бір бетіндегі мәліметтен гөрі оның көптеген беттерінен алынған
мәліметтердің шамасы шындыққа жақын болатындығы анық.[9]
Тілге тән заңдылықтарды статистика тәсілімен анықтау негіздемесі
мынада:
1) сандық (мөлшерлік) құбылыс тіл табиғатына әуелден-ақ тән болуы.
2) тіл құрылымындағы сандық және сапалық сипаттардың өзара байланыста
болуы;
3) тілдің әртүрлі бірліктері сөйлеу ағымында статистикалық
заңдылықтардың ең болмағанда біреуіне бағынуы тиіс деп ұйғару керектігі.
Әдістердің индуктивті, дедуктивті болып ажыратылатынын ескере отырып,
негізінен алғанда, статистикалық әдіс-индуктивті әдіс арқылы, ал тілдің әр
түрлі модельдерін жасау үшін қолданылатын логика-математикалық әдістер-
дедуктивті әдіс арқылы жүзеге асатыны анық. [11]
Тілдің ықтималды-статистикалық моделін жасауға болатыны белгілі десек,
ондай модель, біріншіден, белгілі бір тілдік жүйенің мәтіндері арқылы
жасалады, ал екіншіден, тілдің логика-математикалық моделі сол тілдің толық
жүйесін айқындай алады.
Сөйлесу арқылы қатынас жасау кезіндегі тілдік процесті байланыс жолы
деп есептеуге болады. Ал мұндай байланыс жолы арқылы таратылатын ақпарат,
әріп, дыбыс морфема және т.б. лингвистикалық бірліктер негізінде іске
асады. Бұл жердегі лингвистикалық бірліктер белгілі бір “кодтың” символдары
ретінде есептеледі. Байланыс жолындағы хабарлаушы мен қабылдаушы, яғни
айтушы мен тыңдаушы өзара бірдей “кодты” пайдаланулары шарт болуы қажет.
Тіл зерттеу тәжірибесінде статистиканың араласуы бұрыннан да бар десек,
ондай әдіс тек жекелеген зерттеушілердің ізденістерінде ғана кездессе, енді
статистикалық лингвистика жеке ғылыми пәнге, ғылыми бағытқа айналып отыр.
Осымен байланысты статистикалық лингвистика саласының қазақ
тіліне қатысты өзіне тән алға қойған теориялық және практикалық мақсаты мен
міндеті айқындалуда.[12]
Мұндай жиілік сөздіктерді алғаш қажет еткен-оқушыларға, студенттерге шет
тілдерді, басқа тілді оқыту процесіндегі кейбір қиындықтар еді. Өйткені
оқытушы тілдің барлық сөзін, сөздік құрамын белгілі оқыту мерзімінде түгел
толық үйретіп, білдіре алмайды, оқушы да бөтен тілдің барлық сөз қорын
игере кете қоюы мүмкін емес. Ал, үйреніп отырған бөтен тілде сөйлей алу
үшін әрі айтылған пікірді түсініп,өз ойын жеткізе алу үшін ол тілдегі
барлық сөзді тегіс білу міндетті емес.
Өйткені, қандай тілдегі болмасын сөзднрдің қолданылу мүмкіндігі
бірдей емес. Кейбір сөздер белгілі тексте бір-бірден қолданылса, кейбіреуі
бірнете рет кездеседі. Оқушы алдымен тілде жиі қолданылатын сөздерді
үйренуі қажет. Мысалы: Абай шығармаларында небары 6017сөз 46847рет
қайталанған.[13,14,] Енді осы өнімді, яғни жиі қолданылатын сөздер қайсысы
дегенде дәл жауап бере алатын тек осы жиілік сөздіктер.
Тілдегі әртүрлі жанр, немесе әр кезеңдегі жазба мұралар
материалдары негізінде бірнете статистикалық талдаулар жасалады да, шыққан
көрсеткіштер корреляциялық өзара байланыс немесе математикалық
корреляциялық анализ арқылы салыстырылады, салыстыру үшін алынған
үзінділердің көлемі тең болу қажет. Бұл жерде статистикалық талдау сөз
(лесика), фонема (дыбыс), грамматикалық көрсеткіштер көлемінде де
жүргізіледі. [15]
Осының нәтижесінде тілдегі стильдік тармақтардың өзара байланысы
мен бір-бірінен ерекшелігі, тілдің әр кезеңдегі көрініс дәрежесі мен даму
процесі айқындалады. Белгілі бір дәуірдегі актив сөздер кейінгі кезеңдерге
ондай қасиеттен айрылып қалуы мүмкін, ол дәрежеде басқа бір сөздер жүруі
ықтимал. Сонымен бірге сол сөздердің тіркестегі сөйлеу процесіндегі салмағы
өзгереді. Енді осы өзгерістердің ішкі және сыртқы себептері ашылады. Сол
сияқты төркіндес тілдердің туыстық дәрежесі, олардың даму қарқыны,
мәселелері де статистикалық талдауларсыз шетуге бомайды. Туыстыға жоқ
тілдерді статистикалық талдау негізінде салыстыра зерттеу де жеке тілдің
өзіндік ереетеліктерін, заңдылықтарын, сол сияқты жалпы тіл атаулыға тән
ортақ заңдылықтарды, басқа да қоғамдық құбылыстар арасындағы тілдің алатын
орны, қарым-қатынасы тәрізді мәселелердің басын ашуға мүмкіндік
береді.[16,18]
Машина арқылы аударудың, тіл мен кибернетика мәселелерінің
бүгінгі таңдағы қажеттігі мамандарды ойландырып отыр. Бұл проблемалар
статистикалық талдау негізінде зерттеулердің табиғи жалғасы бола отырып,
оның үстіне көптеген тың мәселелерді айқындай түсуді талап етеді. Қазіргі
кезде жазба және сөйлеу тілдерін талдап-саралап, тілдік элементтерді
ажыратып, екінші тілге аудара алатын машина жасау мәселесі алға қойылып
отыр. Басқа түркі тілдерін айтпағанда, қазақ тілінің көптеген кезек
күттірмейтін мәселелері, мәселен лексикография саласы бойынша компьютерлік
қор жасау, қазақ тілінен басқа, немесе керісінше компьютерлік аударма
жасау, ақпарат мазмұнынан қысқаша мәлімет алу.[17,19]
1.2 Лингво-статистикадағы сөздіктердің жалпы сипаттамасы
Кейбір тілдік құбылыстар өте әлсіз көрініс тауып, жасырын сипатта
тұрып, көп жағдайда зерттеушінің тікелей бақылауынан тыс қалады. Міне,
осындай тілдік құбылыстарды анықтайтын математикалық құралды статистикалық
зерттеулер арқылы тбуға болады.
Тілді, оның дамуы мен жеке адамның қалыптасуындағы рөлін зерртеу-
адамның бүкіл таным қызметінің қалыптасуын қарастыруда ерекше маңызға ие
болып отырған ғылымның басты мәселесіне айналды.
Қазіргі тіл білімінің даму тәжірибесі көрсеткендей, тілдің түрлі топтарының
лексикасы мен морфологиясын салыстыруға және оның нәтижелерін алуға жағдай
туғызатын мәтіннің квантитативтік әдісінің ерекше тиімді түрлі
1) әліпби-жиілік сөздік;
2) жиілік сөздік;
3) кері әліпби-жиілік сөздік;
4) сөзнұсқағыш әліпби-жиілік сөздік (сирек құрастырылатын жиілік
сөздіктің түрі).
Әліпби-жиілік сөздік. Жиілік сөздіктің бұл түрінде зерттеу мақсатына
сай таңдалып алынған мәтіндердегі сөздер (сөзтұлғалар) түгелімен қамтылуы
қажет және олар бір-бірімен салыстырылып, әрқайсысының қолдану саны
анықталады. Осындай сандық көрсеткіш сөздің (сөзтұлғаның) мәтін ішіндегі
қолдану жиілігі деп немесе сөздің абсолютті жиілігі деп аталады.
Әліпби-жиілік сөздікте көрініс табатын ең бірінші (қатарда) — сөздік
бірлігінің реттік сандары, екінші – мәтіннен бөлініп алынған әр түрлі
сөздің (сөзтұлғаның) қатаң әліпби тәртібімен орналасқан тұлғасы және үшінші
- сөздің абсолютгі жиілігі.
Жиілік сөздіктердің толық түрінде осы аталғандардан басқа: жиынтық
абсолютгі жиілік, қатынастық жиілік, жиынтық қатынастық жиілік және
сонымен бірге бір топ сөздердің мәтінді қамтуының пайыздық шамалары
беріледі. Жиілік сөздіктер жасау (түзу) арнайы компьютерлік бағдарламалар
көмегімен іске асады. Сөздіктерді жасау барысының бастамасы сөздік
бірлігінің әліпби тәртібіне келтірілмеген жиілікті сөзтізбе түрінде
алынады.
Осыдан кейін арнайы компьютерлік сұрыптау бағдарламасының негізінде
басқа да сөздіктер түрлері түзіледі. Мәселен, әліпбилік сұрыптау
арқылы Әліпби-жиілік сөздік алынады.
Әліпби-жиілік сөздік зерттеушіге қажет деген сөздің (оның туынды
тұлғаларының да) қолдану дәрежесін, яғни оның жиілігін табуға, зерттеуге
алынған мәтіндер лексикасының әліпбилік құрамының статистикасын анықтау
үшін аса маңызды. Сондықтан, оны тілдің әліпбилік тұрғыдағы статистикалық
үлгісі (моделі) деп те атауға болады.
Әліпби-жиілік сөздік сөздіктің нормативті түріне жатпағандықтан,
зерттеуші мәтіндегі немесе оның сөзтізбегіндегі сөздердің (сөзтұлғалардың)
әдеби нормаға не орфографиялық жазылу нормасына жату-жатпауына жауап таба
алмауы мүмкін. Оның себебі, сөздікте көрініс тапқан сөздер (не
сөзтұлғалар), әдетте, қалам иесінің (автордың) не сол шығарманы жарыққа
шығарушы жауапты адамның (редактордың) тіл игеру дәрежесіне қатысты да
болады.
Жиілік сөздік. Сөздіктердің жиілік сөздік түрі әліпби-жиілік
сөздіктен басқаша, дәлірек айтқанда, әр сөздің (сөзтұлғаның) қолдану
жиілігінің дәрежесіне қарай орналасады: ең бірінші ретте орналасатын
мәтіндегі ең жиі қолданылған сөз (не сөзтұлға), екінші, үшінші ретте
орналасатын сөздер -кездесу жиіліктері бірте-бірте кеміп отыратын сөздер
(сөзтұлғалар). Егер бірнеше сөздің (не сөзтұлғаның) жиіліктері тұрақтылық
сипатта болса, яғни біріне-бірі тең болып келсе, онда ол сөздер
(сөзтұлғалар) жиілік сөздікте әліпби тәртібімен реттеледі.
Зерттеуші (мұғалім, оқушы) әліпби-жиілік сөздік бойынша өзін
қызықтыратын сөздің қандай жиілікте қолданылатынын немесе керісінше,
алдын ала қызықтыратын жиілік шамасының қандай сөздерге тән екендігін
анықтай алады.
Жиілік сөздік (әліпби-жиілік сөздіктер тәрізді) әр түрлі тілдік
бірліктер (сөз, сөзтұлға, сөзтіркес т.б.) бойынша жасалуы мүмкін. Біздің
баяндауымызда қарастыратын бірліктеріміз негізінен сөзге не сөзтұлғаға
сәйкес келетіндіктен, сөздің жиілік сөздігі не сөзтұлғаның жиілік
сөздігі деген сөз тіркестер жиі-жиі кездесуі мүмкін. Ал бұл сөздіктердің
де жалпы аты - жиілікті сөзтізбе.
Ана тіліміздің немесе басқа да туыстас (не туыстас емес) тілдердің әр
стильдік мәтіндеріне қатысты жасалған жиілік сөздіктер сол тілдің
лексикалық құрылымын терең зерттеуде, лексиканың жалпы функционалдық
стильге ортақ бөлігін ажыратуда септігі мол.
Сондай-ақ, жалпы халықтық лексиканың, кірме сөздер мен терминдердің,
неологизмдердің және басқа лексикалық топтардың тілдің жалпы лексика
жүйесінен алатын орны жөнінде де жиілік сөздік бойынша көптеген саңдық және
сапалық мәліметгер алуға болады. Сөздердің саны мен тұлғалары арқылы тілдің
лексикалық байлығы мен стильдік ерекшеліктері анықталады. Мұндай
сөздіктерден зертгеуші жаңа сөзжасам жүйесіне қатысты да бағалы деректер
ала алады. Сонымен бірге, жиілік сөздік мәліметтері қазақ тілін туыстас
түркі тілдері және туыс емес тілдермен салыстыру — типологиялық зерттеу
үшін де аса қажетгі екенін атап өткен жөн.(12)
Жиілік сөздіктер күнделікті қолданбалы сипатгағы міндеттерді шешуде де
маңызды. Мәселен, әр түрлі типтегі минимум сөздіктерін жасауда және шет
тілдерін (екінші тілді) үйрену мен оқытуға қажетгі статистикалық әдістерді
қолдануда да қажетгі. Сонымен бірге жиілік сөздіктердің тілдік және сандық
мәліметтері оқулықтар мен оқу құралдарын құрастыру ісінде тілдік
материалдарды тиімді түрде орналастыруда және әр қилы лексикалық топтар мен
грамматикалық категорияларды орынды түрде оқыту процесінде де таптырмас
тілдік құрал рөлін атқара алады.
Жиілік сөздіктер материалдарының тіл білімін зерттеудегі қажеттілігі
мен бағалылығы жөнінде Л.Н.Засорина мынадай пікір айтқан болатын:
Материалы частотных словарей исключительно ценны и для собственно
лингвистических исследований. Они оказывают влияние на судьбы традиционной
лексикографии. Ими пользуются в решении основной проблемы общей
лексикологии - выделение словарного фонда активного и периферического
словаря; они полезны и при изучении вопросов стилистики, семантики и
литературной нормы языка. (41,С.3-4)
Жиілік сөздік өзге сөздіктердің көлеміне қатысты және басқа да
лексикографиялық мәселелерді шешуде объективті негіз болатындықтан, екі
немесе одан да көп тілдік аударма сөздік пен түсіндірме сөздік жасаушылар
бұл сөздіктен қажетгі деректер таба алады.
Жиілік сөздіктер телефон мен телеграф байланыстарын жетілдіру үшін де,
стенография мен полиграфия мұқтаждықтары үшін де пайдаланылады.
Сайып келгенде, жалпы түркі тілдерінің, соның ішінде қазақ тілінің
жиілік сөздіктерін жасау қажет деп саналады, өйткені олар көптеген
лингвистикалық мәселелерге математикалық әдістерді қолданып зерттеуге
мүмкіндік туғызады.
Қазақ тілінің сөз байлығын, яғни қазіргі қазақ әдеби тілінің жалпы
лексикасын түгел қамтитын жиілік сөздік әлі жасала қойған жоқ. Мұндай
сөздіктің құрастырылуы мен жарық көруі -жуық болашақтың ісі.
Кері әліпби-жиілік сөздік. Сөздіктердің басым көшпілігінде сөздер
алдыңғы дыбыстар бойынша әліпби тәртібімен орналасса, кері әліпби сөздікте,
керісінше, сөз бен сөзтұлғалар соңғы әріп-дыбысынан басталып әліпби
тәртібіне келтіріледі және сөздердің соңғы жағынан тегістеліп беріледі.
Сөздіктің бұл түрі Кері әліпби-сөздік немесе тек Кері сөздік деп аталып
жүр. Егер белгілі бір мәтін бойынша түзілген мұндай сөздікте әр сөздің
мәтіндегі қолдану жиіліктері де ескерілетін болса, ондай сөздікті Кері
әліпби-жиілік сөздік деп атайды. Қазақ тілін зертгеу жұмыстарында мұндай
сөздіктер де бірте-бірте қолданыс тауып келеді.
Кері сөздіктің алғашқы үлгісі осыдан бір ғасырдай бұрын (1873 ж.)
баспадан шыға бастағаны белгілі. Бірақ біздің заманымызда бұл сөздіктерге
қызығушылық тек XX ғасырдың 80-жылдарынан ғана басталды деуге болады.
Мәселен, 1904 жылы латын тілі мен ескі иран тілінің кері сөздіктері
жарияланды. 1944 жылы ескі грек тілінің кері сөздігі пайда болды. 1955 жылы
ескі славян тілінің, ал 1957 жылы қазіргі румын тілінің кері сөздігі шықты.
Чехославакияда 1935-1957 жылдары чех тілінің 9 томды сөздігі бойынша
жасалған кері сөздік кішігірім кітапшалар түрінде басылып шықты.
Кері сөздіктердің рөлі, әсіресе, агглютинативті тілдер үшін ерекше
екенін еске сала отыра, олардың саны әлі де болса санаулы. Осындай
сөздіктердің алғашқылары ретіңде: Қ.Бектаевтың Қазақ тілінің кері
алфавитті сөздігі (Алматы, 1971), Р.Кунгуров, А.Тихонов Обратный словарь
узбекского языка (Самар-каңд,1969, езбек тілінде) және т.б. кері
сөздіктерді атауға болар еді. Аталған сөздіктер мәтінге тікелей қатыссыз,
яғни бұрын жарық көрген түсіндірме, орфографиялық және т.б. сөздіктер
негізінде жасалғандықтан, оларда сөздердің қолдану жиілігі көрсетілмеген.
Ал белгілі бір мәтінге байланысты жасалған кері сөздіктер грамматикалық
формантгардың жұмсалуын зертгеуге бірден-бір қажет екені айқын.
Жиілік сөздіктің кері әліпби түрінде реестрлік сөзге (сөзтұлғаға)
қосылған біркелкі жалғаулар мен жаңа сөз жасаушы немесе сөз түрлендіруші
жұрнақтар бір жерге жинақталып берілуі тілді зертгеушілер үшін аса құнды
тілдік мәліметтер деп саналады. Кері әліпби-жиілік сөздік морфологиялық
категорияларды зерттеу кезінде де және сөз тудырушы, сөз түрлендіруші
морфемалардың құнарлы не құнарсыз екендігін анықтау үшін де, терминдер мен
басқа тілдерден енген сөздерге жалғанған қосымшалардың құрылымын талдауда
да аса бағалы. Осы айтылғандармен қатар, тіл зертгеушіге қажетгі деген
тілдік мәліметтерді әрі толық, әрі тез түрде тауып алу үшін кері әліпби-
жиілік сөздік тілдік қазына деуге болады.
Кері әліпби-жиілік сөздіктердің лингвистикалық қүндылығын И.Штиндлова
өзінің мынадай ой-пікірімен білдіреді: ...Обратные словари могут быть
использованы не только в качестве материала для освещения вопросов
словообразования, не только как словари рифм или как пособия для
восстановления испорченного текста, но они ценны, в первую очередь, при
сравнительном изучении родственных языков.
И были бы интересны и для другого типа, например для аналитического
языка, или для аглютинативных языков [97].
Кері әліпби-жиілік сөздіктің әрбір жұрнақ пен жалғаудың (олардың
варианттарымен) және әрбір сөз табының белгілі бір мәтіндердегі қолданылу
жиіліктерін анықтауда мүмкіндігі мол.
Тіл білімінің лексикография саласына сөздіктер түзу мәселесі,
түсіндірме сөздікті құрастыру барысына тән-ең алдымен неше түрлі сөздердің
мағынасын ашатын қор жинақтау. Қордағы әрбір сөз-тірек сөз (лексема)
сөздің мағынасына қатысты контекс жүргізеді. Сонымен қатар, мәтіннің қандай
шығармадан алынғаны және оның шығу деректері: авторы, шығарма аты, баспа
аты, шыққан жылы, көлемі, мәтіннің кездескен бет саны да бірге берілуі
керек.
Бұл сөздіктер арқылы жазушы тілін тілдің басқа түрлі салаларымен
салыстыруға және кватитативтік әдіс арқылы алынған жазушы мәтіндеріндегі
сөз қолданыстарды анықтап, алынған зерттеу нәтижелеріне сүйене отырып,
сөздіктердің тиімді әдіс-тәсілдерін айқындауға болады.
Соңғы кезде жалпы тіл білімінде дәстүрлі сипаттала зерттеу әдістерімен
қатар жаңа әдістерде қолдану әсіресе, математика, статистика сияқты дәл
ғылымдар саласында қолданылап жүрген зерттеу ідістерін пйдалану мәселесі
қойылып отыр.
Бұл бағыт математикалық лингвистика, статистикалық лингвитика деп
аталып, советтік тіл білмінде де шетел ғалымдары тарапынан дп қолдау тауып
отыр. Еліміздегі ірі-ірі ғылым ордаларында, ғылыми-зерттеу институттарында
арнайы бөлім, секторлар ашылып, жоғарғы оқу орындарында арнаулы пән
оқылады. Москва, Ленинград сияқты қалаларда болып өткен Бүкілодақтық
конференциялар сөздіктер жасаудың әдістері және лингвостатистикалық
жұмыстарды автоматтандыру, математикалық лингвистика, машина арқылы аудару
мәселелерді арнайы қарады. Осы арада жаңа әдістерді тіл біліміне енгізудің
себебіне, оның мақсаты қандай деген сұрақ туады.
Тіл біліміндегі мұндай жаңа бағыт екі түрлі қажеттілікпен туып отыр.
Ең алдымен бұл проблеманы алға қойып отырған тіл білімінің ішкі факторлары,
яғни тіл заңдылықтарын, оның ішкі сырын, даму процесін, тарихын, мәнін
басқа тілдермен қарым-қатынасы сияқты ереетеліктерін басқа ғылымдар
саласында қолданылып жүрген тиімді әдістер арқылы аша түсу болса,
екіншіден, тіл тек қана зерртеу обьектісі емес, оның қоғамдық қызметі,
коммуникацялық рөлі, функционалдық мәні, бар құбылыс болғандықтан,
күнделікті өмір таабынан туып отырған практиалық қажеттілік болып отыр.
Математикалық, статистикалық талдаудың обьектісі-тілдік құрылым болады.
Мысалы: белгілі бір грамматикалық мағына белгілі грамматикалық түр арқылы
беріледі, оның өзіне тән тұлғасы болады. Ал сол грамматикалық мағынаның
сөйлеу процесіндегі салмағы, алатын орны тәуелдік жалғауының және тәуелдік
мағынаны білдіретін басқы қосымша, амалдардың тексте қолданылу арқылы
анықталады. Ыңғайлас, біріңғай тілдік элементттердің (фонема мен фонеманың,
қосымша мен қосымшаның, лексема мен лексеманың, тіркес пен тіркестің) жалпы
тілде, белгілі бір тексте, жеке қалам қайраткерлерінің сөз өрнегінде
қолдану мүмкіндігі бірдей емес.
Тілдегі сапалық құбылыстардың сандық қасиеті болатынын тіл мамандары
көрмей қалған жоқ. Тіл туралы жекелеген зерттеулерде, грамматикаларда
беріліп жүрген, мысалы: дербес тілдік фонетикалық заңдылықтарына
бағынбайтын ауытқулар, сол сияқты грамматикалық көрсететтер (сөз тудырушы,
жұрнақтар) өнімді, өнімсіз, актив, пассив болып бөлінуі, сондай үлкенді-
кішілі ережелер статистикалық бақылаулардың негізінде топталынған еді.
Тілді статистика, математика әдістері негізінде зерттеудің лексика
саласындағы алғашқы жолы жеке жанрлық текстердің сол сияқты жеке жазушылар
шығармасы немесе жалпы халықтық тілдің сөздіктерін сөздің, сөз формаларының
жиілік тізімін жасаудан басталып отыр. Қазіргі кезде тіл мамандары
жиырмадан астам тілдің материалдары негізінде үш жүз шақты жиілік сөздік
құрастырды. Орыс тілінде бірнете сөздіктер басылып шықты, мысалы:
Э.А.Штейнфельдтің “Частотный словарь русского языка” атты сөздігі және
басқалар. Сонымен бірге орыс тілі мамандарының бірқатары әр жанрдың, әр
стильдің, жеке ақын жазушылар шығармалары тілдерінің материалдары негізінде
әр көлемде жиілік сөздіктер құрастыру ісімен біраздан бері шұғылданып
келеді. Жиілік сөздік әртүрлі мақсатпен құрастырылады. Осыған орай
материалдардың сипаты мен көлемі де, жанрлық, стильдік ереетеліктері де
ескеріліп белгілі бір текст не болмаса, бірнете үзінді алынады да, әрбір
сөз біртіндеп, жеке-жеке карточкаға түсіріледі.
Осыған жиілік сөздіктерді тек сөз шеңберінде ғана емес, грамматикалық
көрсеткіштер (тұлға), фонема көлемінде де жасауға болады.
Жиілік сөздік-мәтінді белгілі мөлшерде сөздердің пайдалану жиілігіне
қарай орналасқан сөздер тізімінен тұратын сөздік. Жиілік сөздік және мәтін
құрылымында сандық заңдылықтарды салыстыруға мүмкіндік береді. Тілдік
бірлік ретінде оның орнына мәтін бойындағы әріптер, буындар, сөздер, сөз
тұлғалар, сөз тіркестер немесе сөйледер және олардың морфологиялық
құрылымдары алынуы мүмкін . Мұндай жиілік сөздіктер лингвистикалық
статистика мәселесімен тығыз байланысты.
Демек, қазіргі міндет-тілдің барлық құбылысын толық қамти алатын
обьективті заңдарын айқындап, оның универсалды математикалық көрінісін
көрсету болып отыр.
2 Шығарма мәтіндеріндегі сөз таптарының қолдану аясы
Қазақ тілінде сөз таптарын зерттейтін сала-морфология деп
аталады. Морфология-сөз және оның формалары туралы ілім. Сөйлеу дағдысында
әр сөз сөйлем ішіндегі өзге сөздермен белгілі заң бойынша әр қилы қарым-
қатынасқа түседі де, әлденеше қилы өзгеріске ұшырап, әр алуан қызмет
атқарады. Морфология осындай сөздерді жеке-жеке қарамай, жалпы сөз атаулыны
алып, оларды белгілі топтарға бөліп, сол топ-топтың әрқайсысына тән жалпы
грамматикалық сыр-сипатын анықтайды. Соның арқасында сөздердің әр тобының
өзіне лайық жалпы грамматикалық мағыналарымен грамматикалық формалары
айқындалады, сөз таптары ажыратылады, әр сөз табына тән категориялардың сыр-
сипаттары ашылады. Осындай талдаудың нәтижесінде сөздің жасалу, түрлену,
өзгеру жүйелері, сөздің бөлшектенуі және олардың әрқайсысының гамматикалық
мағыналары мен қызметтері анықталады. Морфология сөзді, сөздің тиісті
бөлшектерін, олардың мағыналары мен қызметтерін талдайды. Белгілі бір сөзді
оқшау қарамай, оны басқа сөздермен байланысты қарап барып, олардың қарым-
қатынастарын анықтайды. Бірақ, мофология сөздерді, олардың қарым-
қатынастарын сол тілдің жүйесінің қалыпты бір көрінісі, бөлшегі ретінде
талдап, оларды бір-бірімен ұштастырып қарайды. Өйткені сөзден сөз тудыру,
сөзі түрлендіріп өзгерту, сөз бен сөзді жалғастыру сияқты амал-тәсілдер -
әрі әбден қалыптасып орныққан, әрі үнемі қолданылатын дағдылы, жүйелі
құбылыстар. Сол себептен морфология тіліміздегі әрбір жұрнақты, әрбір
жалғауды я болмаса басқа бір морфологиялық құбылысты және олардың
әрқайсысының формасын тілдің жүйесімен байланысты, сол жүйеден тарайтын
заңды құбылыс деп қарайды. Морфология сөз формасын да тексереді. Ал, сөз
формасы деген ұғымға сөздің негізгі түбірі де, сөздің туынды, біріккен,
қосарланған, әрқилы қосымшалар қосылған түрлері де, сөз тіркестері де
енеді.
Тілдегі сөздерді грамматикалық мағыналарына, формаларына және қызметтеріне
қарай, топ-топқа бөліп топтастыру да, әр сөз табына тән категориялары
анықтау да морфологияның міндеті. Сөз табының мазмұны лексика-
грамматикалық деп аталатын екі компоненттің бірлігінен құрылады.
Бұл атаудан лексикалық семантикамен бірге грамматикалық семантика
деген ұғымды білдіреді. Яғни, бұл жердегі грамматикалық ұғымына сөздің
жаңадан сөз тудыру, сөз түрлендіру, сөз байланыстыру жүйелерінің мағыналары
мен тұлғалары, бүкіл сөздің морфологиялық және синтаксистік лингвистиканы
ңалдына қойған мақсаттарының бірі – сөз табының лексикалық, грамматикалық
белгілері арқылы, яғни осы үш белгінің негізінде статистикалық зерттеулер
жүргізіп, сөздің мағынасын, морфологиялық формасын және синтаксистік
қызметін сандық деректер арқылы тани білу. Соның нәтижесінде мәтін мазмұнын
ашудың формальды жақтарын айқындау.
Сөз таптарының ішкі жіктеген бөліктерінің түрлері тілде біреуі аз, не көп
қолданылуы мүмкін. Статистикалық зерттеу тәжірибесі бойынша олардың қолдану
жиілігін анықтау үшін кейбір шаралары алдын ала белгілейтін бағдарламаларды
іске қосу қажет.
Әр түрлі тілдік стильдердегі сөз таптарының қатынастық сипатының
статистикасын білу керек болса, әр сөз табына қатысты шартта белгіні қоюдың
зерттеушіге ыңғайлы жолдарын қарастыру керек. Мәтіннің жиілік сөздігін
құрастыруда лингвистикалық статистиканың мәні зор. Соның негізінде
Құдайберген Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың зат есім табының статистикасын зерттеген болатынбыз.
2.1 Қ.Жұбановтың Қазақ музыкасындағы күй жанрының пайда болуы жайлы
шығарманың лексикалық жүйесін зерттеуде статистикалық әдісті қолдану
Сөздің жиілік тізімін жасауға кіріскен зерттеуші ең алдымен
жиілікті мөлшердегі мәтін көлемін анықтап алуы тиіс. Таңдама көлемін
анықтау лингвостатистиканың ең маңызды мәселелерінің бірі. Қажетті мүмкін
болатын бұл мәтін көлемі іске асу мүмкіндіктерін есепке алғандағы
статистика теориясының талаптары негізінде анықталады. Таңдама мәтініне
жүргізілген зерттеулер нәтижесінде анықталған заңдылықтардан туындайтын
қорытындылар тұтас мәтіннің заңдылықтары жайлы тұжырымдар хасауға мүмкіндік
береді.
Лингвостатистикада сенімділіктің белгілі бір шамаларында
статистикалық мәндерді бағалауға және жиілік сөздіктің бірліктері үшін
қажетті жеткілікті мөлшердегі жиын көлемін анықтауға мүмкіндік беретін
мысалдар аз емес.
Лингвостатистикалық зерттеулерде қажетті таңдама көлемін анықтау үшін
таңдалған мәтіннің статистикалық жағынан сенімді мөлшердегі сөздігін алу
қажетболған жағдайда зерттеуге алынған таңдама көлемі жайында алдын ала
мағлұмат алуға, оны бағалауға мүмкіндік беретін қатынасты қателік шамасын
анықтау әдісін қолданамыз.
Қ.Жұбановтың шығармасын зерттеу барысында ондағы сөздер мен сөз
формаларына арнайы индекстеу жүргіздік, яғни әрбір сөзді шартты түрде
алынған бұл таңбамен белгілеп отырдық. Бұл сөз таптарының классификациясына
негізделді. Қазіргі тіл білімінде сөздер негізгі үш белгісіне қарай
топтастырылуда:лексикалық мағынасы, морфологиялық құрылымы және
синтаксистік қызметі. Осы үш белгілерін салыстыра отырып, әрбір сөзді
белгіл сөз таптарына жіктеп қатысты белгілермен таңбаладық.
Бұл жерде сөздерді индекстеу мен оларға морфологиялық талдау жасауда кері
алфавитті жиілік сөздіктерді де пайдаландық. Мәтінді сөз таптарына ажырату
арқылы таңбаладық.
Сонымен сөздердің белгілі бір лексика-грамматикалық, топқа
қатыстылығы мына төмендегіше белгіленді:
Зт-зат есім, Сн-сын есім, са-сан есім, ет-етістік, үс-үстеу, ел-еліктеуіш,
ес-есімдік, шл-шылау, од-одғай, мд-модаль сөз.
Әдетте, жілік сөздіктері алынатын мәтіндерді зерттеудің бір түрі мәтіндерді
тұтасымен зерттеу кезінде лексикалық бірліктің барлық қолданыстары түгел
қамтылуы ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz