Лексикография

Алғы сөз ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 3

Кіріспе ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 7

«Адам.компьютер.адам» жүйесіндегі табиғи тіл қызметінің ерекшеліктері ... ... ... ... ... ... ... ... ... ... ... ...
20

Жасанды интеллект жүйесін құрастыруға қатысты мәселелер жайында ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
28

Оқу лексикографиясының ғылыми пән ретіндегі ерекшелігі ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
39

Ғылыми.техникалық лексикография және арнаулы сөздіктер түрлері ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
52

Лексикография саласындағы автоматтандыру тәсілі ... 64

Реферат құрастырудың әдіс.тәсілдері ... ... ... ... ... ... ... 84

Ақпарат іздестіру жүйесі ... ... ... ... ... ... ... ... ... ... ... ... . 97

Автоматтанған оқу жүйесінің негізгі ұстанымдары ... . 129

Автоматты (машиналық) аударма ... ... ... ... ... ... ... ... ... 140

Баспа ісін автоматтандырудың лингвистикалық негіздері ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
177

Қазақ тілінің компьютерлік қорын (базасын)
құрастыру жайлы ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
189

Қорытынды ... ... ... ... ... ... ... ... ... ... ... ... ... ... 199
«Компьютерлік лингвистика» термині (computational linguistics), негізінен, тіл қызметін модельдеуге қатысты пайдаланылатын компьютерлік бағдарламалар мен тілдік деректерді өңдеу, сол үшін қажетті компьютерлік технологияны жинақтау және компьютердің араласуына қатысты басқа да тіл зерттеу жұмыстарымен байланысты қолданылады. Кең мағынада алғанда, тіл білімі аясына қатысты теориялық және практикалық мәселелердің шешімін табуға байланысты компью-тердің араласу жағдайларының бәрін бірдей компьютерлік лингвистика саласына жатқызуға болады.
Адам баласының ақпараттық ортада өмір сүретіні белгілі. Ал бұл ортада қабылдаушының жауапты ақпарат бойынша дұрыс шешімге келуіне жағдай жасайтын ақпараттық техноло-гияның түрлері көп. Олар: автоматтандырылған ақпараттық жүйе, бұқаралық коммуникация құралдарына жататын теле-радио байланыс жүйелері, компьютерлік (машиналық) аударма жүйесі, диалогтік жүйе және сұрақ-жауап, т.б. жүйелер. Мұндай жүйелердің саны мен сапасы күннен-күнге артуда. Ақпараттық қоғамдағы тілдік практика мен қазіргі кезеңдегі тілді зерттеу теориясының қолданылу аясы да өсіп келеді.
Тілді зерттеудегі компьютерлік лингвистика саласы қолданбалы тіл білімі атқаратын қызметтердің бір тармағы ғана деуге болады, себебі «қолданбалы тіл білімі» ұғымы көптармақты бола келе, күнделікті өмірде дәстүрлі және жаңаша
1. Гузев В.Г., Пиотровский Р.Г., Щербак А.М. О создании машинного фонда тюркских языков // Советская тюркология. 1988. №2. C. 98-101.
2. Ершов А.П. К методологии построения диалоговых систем: феномен деловой прозы. Препр. №156, ВЦ СО АН СССР. Новосибирск, 1979.
3. Машинный фонд русского языка: идеи и суждения. М.: Наука, 1986. 240 с.
        
        АЛҒЫ  СӨЗ
Табиғи тілдегі ақпараттардың басым көпшілігі сөйлеу тілі түрінде немесе
жазба мәтін түрінде кездесетін болғандықтан, ... ... ... арқылы өңдеудің маңызды-лығы артуда. Осы айтылғандарға сәйкес
мәселелердің қолданба-лы және ... ... ... ... ... да ... бар. Оның қолданбалы филология
саласына қатыстылығы – ... ... ... ... ... Сонымен бірге қазіргі кездегі бұқаралық қатынас құралдары
мен іс прозасының ... даму ... оның ... ... ... ... әрбір түрі өз мазмұны арқылы сипатталады да, бірақ олардың
бәрі бірдей машиналық (компьютерлік) көрініске ... ... ... Сондықтан информатика ғылымының негізгі міндеті ақпараттың барлық
түрін қазіргі техникалық құралдар (компьютерлер) ... ... ... ұзақ ... ... ... ... тарату мен оны
қолданудың заңдылықтарын зерттеу.
Ғылым ретіндегі информатика саласының кең ... ... ... ... ... ақпараттық моделін зерттеу мен құрастыру мәселесімен
айналысатын ғылым саласына ... ... ... ... ... және ... бірліктердің атқаратын рөлімен жанасып
жатады. Бұл бірліктер ең кіші ... ... ... ... қоса ... ... тілдік деңгейлерді қамтиды деуге болады.
Тілдің әр деңгейіне және оның толық пішініне ... ішкі ... бере ... ... ... ... ... әлі де жоқ
және ондай ... ... өзі де ... ... ... мен зерттеудің нысаны ретінде тіл қызметінің әр аспектілері ... ... ... лингвистика саласына тоқталатын болсақ, оны да ... ... жеке ... ... ... ... деуге болады.
Компьютерлік лин-гвистика – информатиканың лингвистикалық негіздерін және
тілдік байланыстардың барлық аспектілерін, ... мен ... ... ... програм-малар арқылы тікелей зерттеп танумен
айналысатын ғылым саласы. Сол сияқты, компьютерлік тіл ... ... ... ... ... ... тең, сөзден үлкен түрлерін, яғни сөз тіркестерін,
сөйлемдерді ... ... ... ... және ... ... проблемаларын зерттейді. Мысалы, соңғы айтылғанға
қатысты, мәтін ішіндегі мән-мағынаны анықтау мен бір ... ... ... ... ... болар еді. Лингвистикалық автоматтардың
мүмкіндіктерінің ... ... ... компью-терлік
лингвистиканың шешетін мәселелерінің де аясы кеңейіп, тереңдей түсуде. Оның
шеңберінде жаңа әдістер мен теориялар тәжірибе ... ... ... ... отырған оқу құралында “қолданбалы лингвистика”, “инженерлік
лингвистика”, “информатиканың лингвистикалық негіздері», «компьютерлік
лингвистика» және т.б. ... ... ... ... ... ... де «қолданбалы лингвистика» пәнінің аясына сиысып
кететінін, оның кең мағыналы ... ... ... ... ... ... лингвистика мен ... ғана ... ... ... бірге лингводидактика мен
одан да басқа ғылымдар салаларын ... ... ... ... ... лингвистикалық негіздері» атты терминнің ең ... ие ... ... ... Оны, шын мағынасында, информатиканың
компьютерлік және ақпараттық ғылымдар ... ... ... ... мәселелердің жиынтығы деп те қарастыруға болады.
“Компьютерлік лингвистика” терминін аталған екі ... ... ие ... ... Ол ... ... негіздеріне»
тән мағынадан кең түрде қолданылады. ... ... ... ... ... қатысы бар оқыту-үйрету жүйесінің лингвисти-
калық мәселелерімен де ... ... ... лингвистика”
терминінің “қолданбалы лингвистика” терминіне қарағанда мағынасы тар.
Қазіргі кездегі компьютерлік лингвистика саласының ... ... ... осы оқу құралында қарастыруды мақсат еттік.
Компьютерлік лингвистика ғылымының құрамы мен құрылымы жайлы пікірлер
әлі де ... ... ... жоқ. ... ... ... әр ғылым саласының
да бастапқы кезеңіне тән екені белгілі. Сондықтан компьютерлік ... сөз ... оны ... ... ... ... жазуға, жасанды интеллектіге қатысты мәселелері деп түсінген
жөн.
Информатиканың ... ... ... ... ... Мәселен, Ю.Н.Марчук “Основы компьютерной лингвистики”1 атты оқу
құралын жазуда өз ... ... ... байланысты “информати-
каны” тілдік деректермен қамтамасыз етудің нәтижелерін жинақтау мен ... ... ... ... ... тіл ... бойынша, ең алғаш 1996 жылы С.-Петербургте
жарық көрген “Прикладное языкознание” атты ... ... мен ... жоғарыда аталған еңбектен басқаша. Онда тіл білімінің қолданбалы
саласының негізгі мәселелері (әдістемеліктен жалпығылымдыққа ... ... ... ... ... ... ... олардың
атқаратын қызметіне қарай топтастыр-ылып, жеке-жеке тақырыптар бойынша
көрініс тапқан. Мысалы, ... ... ... ... ... ... “Машинный перевод”
және т.б.
Аталған оқулықтың ... ... ... және ... ... отырып, біз ұсынып ... ... ... атты оқу ... да сол ... және ... ұсталынды. Сонымен бірге, ол ... ... ... ... автордың ұғынуынша қазақшаға аударылып,
әл-Фараби атындағы Қазақ ұлттық университеті ... ... ... мамандығы бойынша оқитын студенттерге ... ... және Абай ... ... ... ... ... филологиясы факультетінің ... ... ... атауға болады. Оқылған теориялық материалдар қажетті жүйеге
келтіріліп, ұсынылып отырған оқу құралына ... Оның ... ... ол алғы ... ... ... ... саласы-ның
маңызды мәселелеріне қатысты 11 күрделі тақырыптан және ... ... ... ... пайда-ланылған әдебиеттер тізімі әрбір
тақырыпқа қатысты мақаланың соңында берілді.
Әрине, бұл тақырыптардың бәрі бірдей толық ... ... ... ... ... ...... оқу орындары студенттеріне
компьютерлік лингвистика ғылы-мына кіріспе ретінде мәлімет беретін ... оқу ... ... ... ... айта кететін жайт, оқу құралы
мәтінінде кейбір орыс тіліндегі және орыс тілі арқылы ... ... ... өз ... ... ... ... берілді.
К І Р І С П Е
«Компьютерлік лингвистика» термині (computational ... тіл ... ... ... ... компьютерлік
бағдарламалар мен тілдік деректерді өңдеу, сол үшін қажетті ... ... және ... ... ... басқа да тіл
зерттеу жұмыстарымен байланысты қолданылады. Кең мағынада алғанда, тіл
білімі ... ... ... және ... ... ... ... компью-тердің араласу жағдайларының ... ... ... ... ... ... баласының ақпараттық ортада өмір сүретіні белгілі. Ал бұл ортада
қабылдаушының жауапты ақпарат бойынша дұрыс шешімге келуіне ... ... ... ... көп. ... автоматтандырылған ақпараттық
жүйе, бұқаралық коммуникация құралдарына жататын ... ... ... ... ... жүйесі, диалогтік жүйе және
сұрақ-жауап, т.б. жүйелер. Мұндай жүйелердің саны мен сапасы күннен-күнге
артуда. Ақпараттық ... ... ... мен ... ... тілді
зерттеу теориясының қолданылу аясы да өсіп келеді.
Тілді зерттеудегі компьютерлік лингвистика саласы қолданбалы тіл білімі
атқаратын ... бір ... ғана ... болады, себебі «қолданбалы
тіл білімі» ұғымы көптармақты бола ... ... ... ... және
жаңаша мағынада кездесіп жүр. Мәселен, бұл ұғым дәстүрлі ... ... ... ... ... ... ... яғни жазу
мәселесін дамытуды, ауызекі ... ... ... ... шетел
сөздерінің транскрип-ция жүйесін жасауды, стенография тәсілдерін дамытуды,
арнайы ... ... ... ... ... ... айқындауды, ғылыми-техникалық терминологияны қалыптастыруды т.б.
іс-шараларды қамтиды.
Қолданбалы тіл білімінің ... сөз ... ... саласы қазақ
тілінде ойдағыдай дамып, түркі тілдері ішінде көш ... ... ... Ал оның ... ... жаңа саласы – «компьютерлік қазақ
тіл білімі» әлде де кешеуілдеп дамуда.
Қолданбалы тіл ... ... ... ... тарауы бойынша ғылыми ізденістер проф. Қалдыбай Бектаевтың
атымен және оның ғылыми мектебімен тығыз байланысты. Қазақ ... ... ... ... ... ... ... кейіннен компьютерлердің көмегімен алынған ... ... ... жиілік, кері әліпбилі) тілдің ... ... ... ... ... алуға мүмкіндік туғызды. Осылайша,
қазақ тіліндегі бай статистикалық мәліметтер негізінде бірнеше кандидаттық
және докторлық диссертация-лардың қорғалғаны ... ... ... ... ... Тіл ... институтының «компьютерлік
лингвистика» бағыты бойынша қол жеткен ғылыми нәтижелері айтарлықтай деуге
болады. Осылардың тек ... деп ... ... ... ... ... әдебиет, көсемсөз, ғылыми-көпшілік әдебиет пен ... ... ... кейіннен компьютердің жадына көптеп
енгізіліп, олар ... ... ... ... ... ... ... сөздіктердің алынуы;
– М.Әуезовтің 20 томдық шығармалар жинағының компьютер жадына енгізілуі
және соның негізінде жазушы ... ... ... ... ... осы ... жиілік сөздіктердің негізінде қазақ сөздерінің әр стильде
және әр көлемді мәтіндерде қайталануының қосынды жиілігінің, сол ... ... ... ... ... ... мен мәтіндегі пайыздық
салмақтарының әр сөз таптарына ... ... ... ... ... сөз ... мәтін бойында кездесулерінің
математикалық статистика мен ықтималдық теория заңдылықтарына ... ... ... ... тілінің «ТІЛ – ҚАЗЫНА» атты автоматтандырылған компьютерлік
картотекалық қорының іске қосылуы;
... ... ... ... оның ... қарай ашудың
(формалдаудың) негізгі принциптерінің айқындалуы;
– Тіл білімі институтында жоспарлы ... ... ... ... екі ... бір тілдік сөздіктер мәтіндерінің компьютер жадында
«сөздіктер қорын» құрап, тұрақты сақталуы.
Осы аталған іс-шаралардың ... ... ... ... және ... тіл ... саласына қатысты басқа ... атап ... ... ... ... түркі тілдері үшін тіл зерттеудің жаңа
саласы деп есептелгенімен, ... ... ... ... зерттеу мәселелеріне айналған компьютерлік лингвистиканың кейбір
жайттарына тіл зерттеудегі ... ... ... қауымға бағыштап,
арнайы сөз етуді жөн көрдік.
Өткен ғасырдың 50-жылдарынан бастап «қолданбалы лингвистика» термині
жаңа ... ие бола ... Ол ... ... ... және ... басқару жүйесінің араласуы арқылы мәтінді
авто-матты түрде ... ... ... ... ... ... ... (анализ) мен жинақтау (синтез) негізінде тілдің танылуы
мен ... ... ... ... ... Орыс ... көрген әдебиет-терде «қолданбалы лингвистика», «есептік лингвистика»,
«инженерлік лингвистика», «автоматты лингвистика», ... ... ... ... ... орнына бірі
қолданыла бастады. Әрине, бұл аталған терминдерді ортақтастыру дұрыс шешім
деуге болмайды, ... ... ... тіл ... ... ... және әдіс-тәсілдерінде өзіндік ерекшеліктері бар. Тілдің қолдан-
балы шеңберінің ... ... оның ... ... салаларымен түйісу
мүмкіншілігінен деп түсіну керек ... 23). Тіл ... ... ... ... ... тек қана оң әсерін тигізумен
қатар, қазіргі тіл ... ... ... (концептуальдық
аппаратын) жаңар-туға да мүмкіндік туғызды.
Қолданбалы лингвистика саласының кең мағыналылығын – тілдің құрылымы мен
қызметіне ... ... ... ... ... ... ... баласының практикалық мұқтаждығынан және мұндай қызметтің теория-лық
негіздемесі ретінде қолданылуынан туындайтынын ... ... ... функционалдық көзқарас тұрғысынан қарастырсақ,
оны тіл қызметінің ең қолайлы ... ... ... пән деп ... ... ... коммуникативті функциясының қолайлы жақтарын
ұсынатын пәндер – аударма теориясы, машиналық ... ... ... мен шет ... оқытудағы ақпараттық-іздестіру жүйесінің теориясы мен
практикасы, ақпараттық жасанды тіл жүйесін жасаудағы таңбалау теориясы.
Тілдің коммуникативті функциясының бір көрінісі ... ... ... тіл ... ... ... мен тілдік саясатта,
орфография мен орфоэпияда, әсерлік теория мен ... ... ... белгілі. Сол сияқты тілдің когнитивті ... ең ... ... тіл ... психолингвистика мен афазиологияда және
квантитативтік лингвистика салаларында көрініс тауып жүр (Баранов, 8).
Компьютерлік ... ... ... ... ... «тіл» мен «ойлау» арасындағы байланысты және одан
туындайтын тікелей ... ... ... ... ... шұғыл-данады. Компьютерлік лингвистиканы тілдік бірліктерге
қатысты проблемалар да қызықтырады. Ондай бірліктер сөзден кіші, үлкен және
оған тең де ... ... Бұл ... ... ... деп ...... сөйлемдер (айтылымдар) және толық мәтіндер. Аталып ... ... ... ... ... ... ... жолдары
да қарастырылады. Мәселен, мәтін мазмұнын ашу жолдарын ... ... ... ... ... ... аудару жолдарын модельдеу мәселелері бұған
мысал бола алады.
Сөйлеу мен ойлау процестерінің ... ... аса ... мәселе екені мәлім. Біз олардың ... ... ... мен ... тілдік мәліметтерді тұрпатына
қарай (формалды) сипаттауда ұтымды пайдалануға болады демекпіз.
Адам баласының «ойлау» ... ... ... ... ... лингвистика мен логика арасын-дағы байланысқа ... ... ... ... және ... сипаты болып саналады.
Қазіргі тіл білімінде тіл мәселесіне байланысты кейбір жайттарды ... ... ... ал ... ... ... ... ашу жағы тілшілерге жүктелуде. Бұл түсінікті де. ... ... және ... ... әр ... бір ғана ... ... болып келеді. Табиғи тіл адам баласын
дағдылы ақиқат шындығынан уақытша ажыратып, тілдік тұлғалардың семантикалық
мағынасымен ... ... ... ... ... жаңа деңгейге
ауысуына жағдай жасайды.
Бұл айтылғандардың барлығы да компьютерлік лингвистика үшін аса маңызды
мәселелер. ... адам ... ... ... ... ... (формалды
түрде), әртүрлі дәлдікпен қайталаудың мүмкіншілігі туады. Ал бұл ... ... мен ... ... ... іске ... ... бар «жасанды интеллект» жасап шығаруға мүмкіндік ... ... ... ... атты жүйені – іс жүзінде «ойлау» қабілеті
бар және ... ... ... ... таба алатын
компьютерлік бағдарлама (программа) деп ... ... ... іске қосу үшін ең ... адам баласының белгілі
бір жағдайда шешім ... ... ... ... шешім іздеу
кезіндегі ойлау процесінің сырын зерттеп тану қажет. Әсіресе, адамның ойлау
процесіндегі көптеген ... ... ең ... ... алуды мақсат
еткен жөн. Бұл жолда күрделі ойлау ... ... ... мән бере
отырып, шығармашылықтың құпиясын қарапайым сатылы бөліктерге бөлшектеп,
компью-терлік ... ... ... ... ... ... ... интеллект» жасап шығарудың алғашқы кірпішін қалау жолдары
зерттеледі.
Ми қызметін дәлме-дәл анықтау мүмкін бола ... ... ... ... – өте ... ... ... сондықтан да оның
құпиясын ашу көптеген зерттеу-лерді ... ... ... ... негізгі талап ми қызметінің моделін
«ойлау құралы» деп ұйғарудан туындайды. Тіл ... ... ... ... есептелетін – аударма мәселесі. Бұл тілдік құрылымның
морфо-логиясынан синтаксисіне дейінгі барлық деңгейін қамтиды. Сондықтан ... ... тіл ... аса күрделі функцияларының бірі
болғандықтан, оны ... де ... ... ... кезде көптеген
еуропа тілдерінен орыс тіліне (және керісінше) компьютерлік аударма ... ... ... Ал осы ... ... ... тілдері бойынша,
оның ішінде қазақ тіліне қатысты жүзеге асыру – егеменді еліміздің кезек
күттірмейтін ... бірі ... ... ... ... ... жаңа ғана дамып келеді және оның ойдағыдай дәрежеге ... ... бар. ... ... ... ... жеке ғылыми бағыт
ретінде өткен ғасырдың 60-жылдарында ғана қалыптасты. Бұл сала ... ... ... жұмыстар жеткілікті. Мәселен, АҚШ-та әр тоқсан ... ... атты ... ... жарық көреді. Осымен
байланысты ... ... ... ... айналысатын аймақтық
құрылымдағы әлемдік «Қауымдастықтың» және ... екі жыл ... осы ... ... ... атты ... ... жұмыстары да
айтарлықтай жемісті деуге болады (Баранов,14).
«Компьютерлік ... ... ... ... бірі – ... тілдің мәтін морфология-сын автоматты түрде
талдау. Егер, дәстүрлі түсінік ... «сөз ... ... ... ... ... яғни сөз түбірін және оған жалғанатын
қосымшалардың ... ... ... анықтайтын болса, компьютерлік тіл
біліміндегі «морфология» терминінен басқаша ұғым туындайды. ... ... ... ... ... сыртқы тұрпатына қарай, тілдік құрылымның әрқилы
деңгейлері бойынша ... ... ... мүмкіндігін білдіреді.
Алғашында «морфо-логиялық талдау» ұғымы айтылған мағынада машиналық ... ... ... ... талдаудың» жаңаша түсінігі бойынша алынатын ... ... ... ... ... жоқ көптеген амалдардан
тұруы мүмкін. Осының салдарынан компьютерлік тіл біліміндегі «морфологиялық
талдау» ұғымы – ... ... ... ... яғни ... сыртқы
пішіні бойынша тілдік ақпараттарды танып-білу үшін жүргізілетін іс-әрекет
деп ұққан жөн сияқты. Басқаша айтсақ, ... ... тіл ... ұғымы
бойынша «морфо-логиялық талдау» кезінде «нені талдаймыз?» деп сұрақ қоятын
болсақ, компьютерлік тіл білімінде «қалай талдаймыз?» ... ... ... яғни ол сөз ... ... қажетті тілдік ақпараттарды қай жолмен
алуға болатындығымен айналысады.
Машиналық (компьютерлік) аударманың алғашқы тәжірибелерінде ... саны ... ... ал ... ... орыс және еуропа
тілдері бойынша бұл мәселе ... ... ... ... Ал ... тілі мен басқа да ... ... ... ... ... ... алынбай жүр.
Аталған түсініктегі «морфологиялық ... ... ... ... біріншісі – сөзтұлғаны оның негізі мен оған жалғануы
мүмкін болатын қосымшаларға ажырататын классикалық ... ... ... ... ... әріптерінің тіркесімдік
заңдылықтарының жиілік сөздіктердегі статистикалық мәлімет-теріне сүйенеді.
Үшінші бағыт – ... ... ... нәтижесі. Бұл бағыт
бойынша теңдеулердің ашық жүйелерінің пішіні ретінде, морфологияның әмбебап
математикалық ... ... ... ... ... ... ... және қажетті грамматикалық ақпарат алумен қатар,
сөзтұлғаларды жинақтау (синтездеу) да іске асады ... ... ... құрамының өзгеруін анықтайтын сөздерді өзара
топтауды (топтарға ... ... етіп ... автоматтандырылған
морфологиялық талдаудың алгоритмі ... ... ... ... деп ... жүр ... ... жазылуын-дағы әріптік өзгеріске ұшырау флективті және
агглютинативті тілдерде біркелкі емес.
Мәселен, орыс тіліндегі: ...... ... ... ... ... өзгеріске ұшыраса, сол сөздердің қазақша баламасы –
«отырмын – отырсың» сөздерінің жазылуында қосымшадағы ... ... атты ... аударма жүйесінде сөздердің синтаксистік қызметі
мен септік және т.б. жалғаулардың негізінде ... ... екі ... ... қарастырылды:
1) негіздерінде өзгеріс болатын сөздер тобы,
2) сөздердің флективті тобы.
Соңғы топ белгілі ... ғана тән ... ... ... ... ... ... бойына сақтаған дерек сөздер арқылы сипатталады.
Енді морфологиялық талдаудың түрлеріне қысқаша ... ... ... ... сөздігі арқылы морфологиялық талдау жүргізу;
– сөзтұлғалар сөздігі ... ... ... ... ... ... көбейту әдісін қолданып морфологиялық талдау жасау;
– морфологиялық талдауды сөздіктердің ... ... ... ... ... ... тілдерін зерттеуде көп тараған морфологиялық талдау түрі – ... ... мен ... ... кестелер жүйесін пайдалану. Аталған
сөздіктерде ішкі флексия-сыз, жай және күрделі ... ... ... ... ... ... ... беріліп отырады. Сөздіктегі әрбір
негіз сөзге морфологиялық ... екі ... ... ... ... қойылады. Ал омонимдік негіздерге шартты белгілердің (кодтардың)
тіркесімдік түрлері беріледі.
Морфологиялық талдаудың екінші түрі, яғни ... ... ... ... да зерттеушілер тәжірибесінде көп қолданыс тапқан, кең
тараған ... түрі ... ... Олай ... морфологиялық
талдаудың компьютерлік алгоритмінде морфемаларға бөлшектеу мен ... ... ... ... негіз сөздер сөздігіне қарағанда жеңіл
жүзеге асады. Бірақ талдаудың бұл түрінің өзіне тән осал ... де ... ... егер ... сөз ... ... кездеспеген
жағдайда, біз оның грамматикалық ақпараты жайлы да ... біле ... ... ... ... талдау жүргізу жүйесінде аффикстер мен
түбір сөздер тізімдері берілуі қажет. Осымен бірге бірнеше сөзтұлғаларды
бір ... ... ... ... ... тән ... ие,
белгілер (атрибуттары) толық берілгені талап етіледі. Бұл айтылған-дардан
туындайтын қорытынды – морфологиялық талдаудың негіз сөз ... ... ... ... “логикалық көбейту” әдісі айырықша орын алады.
Бұл әдісте «сөздік ... ... ... ... көңіл бөлу керек. Әрбір
«сөздік ... ... ... мен оған тән ақпарат сәйкес
қойылады. Осының негізінде әр сөзтұлғаның ... ғана тән ... ... ... ... арнайы кестемен беруге мүмкіндік туады.
Бірақ аталған функцияның мәнін басқаша, ... ... ... ... ... де ... ... сөзтұлға – әріптер тізбегі ... ... ... ...... ... ... ретінде, басқа морфемдік
элементтердің реттелмеген жиынымен ауыстыр-ылады;
3) сөзтұлғаға, морфемдік жиын ... ... ... ... бұл ... сөзтұлғаға қатысты деп саналатын ... ... ... ... беріледі (Марчук, 46).
Әрбір морфемаға құрылымында сондай морфемасы бар ... ... да ... ... ... Логикалық түсінік бойынша, мұндай
ақпараттар ... ... яғни ... құрылымдық белгілерінің
бір-біріне қарсы қойылуымен сәйкес келеді. Сөзтұлға жайлы ақпарат осы
сөзтұлғаның ... тән ... ... ... ... ... ... ақпараттар-дан тұратынын дәлелдеп шығуға болады.
Морфологиялық талдаудың логикалық көбейту әдісі, көбінде, флективті
тілдерде қолданылады және ... ... ... ... қажет етеді.
Қарастырып отырған автоматтандырылған морфологиялық талдаудың соңғы түрі
– сөздіксіз талдау немесе «тәуелсіз» ... Ол ... ... және ... ... ... мағынасыз сөздердің тізімі
негізінде іске асады. Морфологиялық ... бұл түрі ... өте ... ... ... морфологиялық талдаудың қазіргі күйі қандай? –
деген ... ... ... ... кезде кез келген мәтіннен компьютер арқылы сапалы ақпарат алу
жүйесіне қойылатын талап ... ... ... ... ... ... ... талдау жасау сызбасын (алгоритмін) жүзеге асыру
мәселе-сіне негізі деп ... ... ... ... кез ... тақырыптағы мәтіннің 98-99 пайызды қамтитын көптақырыпты
(политематический) «аса күшті» сөздік морфологиялық ... ... ... ... ... ... ... алгоритмі кез келген ... ... ие ... ... ... ... ескерілсе ғана
сөзтұлғаны жан-жақты тану мүмкіндігі артады және сан ... ... ... нәтижесі сөздікте қамтылған лексикалық бірліктен бірнеше ... ... ... ... ... ... жүйесінде «жаңа» сөздер,
сөздікте қамтылған ... ... ... дәрежеде қарастырылуы қажет және
оларды дұрыс танудың ықтималдығы 90-95 пайыздан)кем болмауы қажет;
– мәтінді ... ... ... ... ... ... қажет және оған енгізілетін мәтін көлеміне шек
қойылмауы керек;
– компьютер арқылы жүргізілетін ... ... ... ... ... ... (сөздікті толықтыру, өңдеу және т.б.)
мүмкіндігі алдын ала ескерілуі қажет, яғни бұл ... ... ... мол ... тууы ... (Марчук, 48-49).
Бүгінгі таңда, орыс тіліне және ... да ... ... ... талдау жүйелеріндегі кейбір сөздіктер мен мәтіндердің
көлемдері ... ... ... ... ... еді:
– негіз сөздерден тұратын көптақырыптық сөздіктің көлемі 100 ... ... кем ... ... көлемі 30 млн. сөзқолданыстан асатын көптақыры-птық мәтін
негізінде жасалғандықтан, оның кез келген ... ... ... ... өте ... ... 3 млн. сөзқолданыстан тұратын мәтіннің негізінде ... ... 46 мың ... ... ... ... отырған екі сөздікте де сөздердің құрылымы мен синтаксистік
сипаты жөнінде толық түрдегі грамматикалық ақпарат берілген ... ... ... ... ... түрлерін
өмірге келтірді. Оларда тілдік бірліктердің тұлғасына, туындау ережелеріне,
сөзтудырғыш, сөзтүрлендіргіш топтарына қарай реттеу жақтары ... ... ... ... ... соңғы жағынан бастап әліпби
тәртібіне келтірілген ... ... ... деп ... ... ... ... талдаудың талабы-на сай түзілген бұл
сөздікте ... ... ... ... және ... бірдей болып келетін күрделі сөздер өзара жіктелген ретте
көрініс табады. Кері ... ... ... сөздердің морфологиялық
құрылымына қатысты көптеген мәселелерді анықтауға болады. ... ... ... ... ... топталып берілуі олардың
грамматикалық сипатын және қосымша мен қандай ... ... ... ... ... ... ... мүмкіндік
туады.
Грамматикалық форманттардың синонимдік, ... ... ... және олардың тіркесімдік, сандық мөлшерінің сипаттарын анықтауға
мүмкіндіктер туады. Кері әліпбилі ... ... ... ... флективті және агглютинативті тілдер жүйелерінен морфоло-гиялық
форманттарға байланысты ақпараттарды көптеп алуға болады.
Осы ... ... ... ... ... қазақ тілін ЭЕМ-
ның және компьютердің көмегімен лингво-статистикалық зерттеу ... ... ... ... ... яғни әр ... түзілген
жиілік сөздік-тер мен олар арқылы алынған құнды деректер мен ... ... ... ... ... ... ... Ең алдымен,
сол ғылыми жетістігімізді үнді-еуропа тілдеріндегі ... ... ... орындалып жатқан ғылыми-зерттеу жұмыстарының
деңгейіне дейін көтеру қажет.
Компьютердің араласуымен ғана ... ... ... талдаулар мен
басқа да зерттеу түрлерін мемлекеттік дәрежедегі қазақ тілі аясына қолдана
отырып, ана тіліміздің компьютерлік ... ... ... және ... қол ... ... ... өмір қажет-тігіне
пайдалану ісі қазіргі заман талабы болып ... А.Н. ... в ... ... ... УРСС. М.,
2001.
Белоногов Г.Г., Новоселов А.П. Автоматизация ... ... и ... ... М.: ... ... А.Л., ... Ю.Н. Вычислительная лингвистика. Учебное
пособие для студентов отделения ... ... М.: ... ... ... Б.Ю. Актуальные проблемы прикладной лингвистики / Новое в
зарубежной лингвистике. Вып. ХІІ., 1983.
Зеленков Ю.Г. Морфологический ... в ... ... обработки
научно-технической информации. Канд. дис. М.: ВИНИТИ, 1988, 145 ... ... ... обработки сообщения. М.: Наука,
1983.
Марчук Ю.Н. Основы компьютерной лингвистики. Учебное ... М., ... ... тіл ... ... даму ... ... түскен сайын, ондағы ақпарат құралы
қызметін атқаратын – ... ... де ... ... ... ... ақпарат ағымының үздіксіздігі мен сапалылығына өз әсерін
тигізбей қоймады. Әсіресе, ... және ұзақ ... ... ... өзгеріске ұшырады.
Осының әсерінен, біріншіден, тілдік құрылымның негізгі қаңқасы ретіндегі
грамматиканың, түбір сөз бен өнімді сөзжасам моделі жүйесінің тұрақтылығы,
екіншіден, өндірістік ... пен ... ... ... сай ... ... ... бірліктер мен олардың тіркесімдерінің ... ... ... ... тұрақсыздық қасиеттерді де ... ... ... электрондық техниканың араласуы бұлшық ет күшіне қатысты
көптеген жұмыстарды жеңілдетумен қатар, ми қызметінің де ... ... ... ... Осыған байланысты адам миының қызметіне
бәсеке тудыратын неше түрлі ... ... мен ... ... ... машиналар жайлы жайттар соңғы кезде көптеген басылымдарда жарық
көруде. ... ... ... ... 200 жыл бұрын тоқу станогының
тоқымашыны ығыстырғаны сияқты, ... ... да ... ... ... ысырып тастап, оған тек тұтынушының ғана рөлін қалдыруы
мүмкін деп те күмән туғыза бастады. Әрине, мұндай ... ... ... ми ... мәнін дұрыс түсінбей, оны түгелімен бөлшектелетін
(алгоритмделі-нетін) процеске жатқызып, компьютер арқылы оны ... ... деп ... туындайды. Шынды-ғында, адамның ойлау
қабілеті негізінен дедуктивті-логикалық емес, ... ... ... ... ... деп ... керек.
Бұл пайымдаулардан адамның ойлау қабілетін түгелімен формалдауға
болмайтындығын және оны ... ... ... ... яғни ойлау әрекетін қайтадан өзгеріссіз қалпына келтіру мүмкін
еместігін ескеру қажет.
Соңғы ... ... ... өсуі ... жаңа ... ... ол – ... мерзімді ақпараттың көлемі арифметикалық прогрессия
құрап өседі де, ал ұзақ мерзімді ақпарат – геометриялық ... ... ... ... Сонымен қатар, ... ... ... ... ... ... ... саласында
көбірек және тезірек іске асады деп есептеу тенденциялары орын алып жүр.
Сол сияқты, табиғи тілге байланысты ... екі ... ... сөз ... ... біріншісі – тілдің компьютер жадындағы қызметіне қатысты
туындайтын сұрақ.
Табиғи тіл (ауызша не ... адам ... ... ... немесе
компьютерге түгелдей ауысуы ... ... ... ... ... әлде ... ... өзгеріссіз алғашқы қалпында қала ма?
Екіншісі – табиғи тілді зерттеу барысында формалдау процесі шекті ме?
Басқаша айтқанда, ... ... ... ... ... ... бе? ... қарастыруға болмаса, ондағы тілдік бірліктердің ... ... ... ... ... бе? – деген сұрақтар туындайды.
Бірінші сұрақтың жауабын «тіл» ұғымын әртүрлі тұрғыда қарастыруға
байланысты ... ... ... «тілді» тек семиотика тұрғысынан
анықтасақ, онда тіл – ... ... ... ... деп ... Бұл
түсінік бойынша адам да, логикалық робот та кибернетикалық жүйе ... ... ... ... ... ... ... керісінше –
роботтан адамға ауысу процесінде өзгеріс болмайды деп ұйғару керек.
Енді «тілді» мазмұнды лингвистикалық тұрғыдан қарастыратын ... ... ... «тілдің» екі түрі, яғни олардың жеке (дара) және ұлттық
тіл түрлері болады деп ұғынған жөн. Тілдің ... ... ... ... ... ыңғайлы болғанымен, ол жеткіліксіз. ... ... екі ... ... оны ... жүйесінің теориялық
аясында толық баяндауға мүмкіншілік туғызбайды. Екі жақтылық табиғат,
біріншіден, ... және ... жүйе ... ... ... құрал ретінде көрініс табады.
Егер логикалық роботты (компьютерді) аса бір зор ... ... ... оның ұқсастығымен қатар, айырмашылығын да аңғаруға
болады. Ұқсастығы – екеуінде де ... ... ... ... ... мен адам ... ... жүйе арқылы мәтіндік
ақпараттың адамнан ... ... ... табиғи тіл, оның көрінісі
ретіндегі жазбамен алмасады да, ал керісінше, ақпарат компьютерден ... ... ... ... ... ... ... психикалық кескін үйлесімінің бұрынғы қалпына келтіріледі, яғни
ішкі тіл (внутренняя речь) қалпына ауысады.
Сонымен, кез келген мәтінмен компьютер ... ... ... – тілге
психикалық әсер ету емес, ол мәтіннің формалды шартты белгілерінің оның өз
таңбаларымен әрекет етуі деп түсіну ... Бұл ... ... адамның
ойлау қабілетіндегі процестерге ұқсай бермейді.
Табиғи тілдің құрылымын ... ... ... ... ... ... ... выражения) мен мазмұндық көрінісі (план содержания)
арасындағы қатынастарын арнайы зерттеуді ... ... ... ... ... зерттей келе, біз жазба тілдің берілу көрінісін
баяндауда олардың ондай заңдылыққа бағынатынын ... Ал ... ... ... мен ... берілуінің арасындағы
байланысты зерттеу ... біз ... ... ... ... Бұл жағдайда «тілдік белгі» мен ... ... ... ... ... ғана ... ... олар мазмұнды
тұрғыдағы үнемі өзгерісте болатын экстралингвистикалық ұғымдармен ықтимал-
дық ... да ... ... ... ... толық
формалдануына кедергі жасайтын, негізінен алғанда, тілдегі семантикалық
құбылыстар.
Осы айтылғандардан ... ... ... болады.
Адам баласына тән сөйлеу не жазу тілі еш ... ... ... ... толық берілуі мүмкін емес. Компьютерді тілдің берілу көрінісін
анализдеу мен синтездеу және мүмкіндігінше оларды формалдау ... ... Ал ... ... ... ... бір семантикалық
шектен аспайтын көлемдегі формалдануға ... ... ғана іске ... ... ... шешілетін жоғарыда сөз болған тілдік көріністерді
формалдауға көнетін есептерді квазилингвис-тика саласына жатқызады. ... сан ... аз ... олардың қолданбалық шеңбері айтарлықтай
мол болады. Квазилингвистикалық есептер адам ... ... ... ... ... ойдағыдай шешілуі экономикаға ... ... ... ... істерінде және басқа да көптеген
ғылыми зерттеу жұмыстарында ... зор деп ... ... ... ... ең ...... қор жинау. Бірақ бұл мәселені
шешудің өзіндік қиындық жақтары бар. Ол, ... адам ... ... ... ... ... ажыратуға байланысты болып
келеді. Мысалы, жиі қайталанатын және оңай формалданатын тілдік бірліктерге
қатысты амалдарды: ... ... ... ... және т.б. жататын
есептерді компьютерге жүктеген жөн болады. Ал стандарттауға жатпайтындар –
семантикаға қатысты тілдік ... ... ... ... ...... көпмағыналығын айыру, омоним сөздердің мағынасын
ажырату және сол сияқты кейбір формалдау процесіне көне ... ... бар ... ... ... (порождение текста) жағдаятын және оны ... ... ... жайлы қысқаша мәлімет берейік.
Мәтін өзара қарым-қатынаста болатын тілдік жүйелердің «норма», «узус»
деп аталатын ережелері мен ... және ... ... ... ... сырт жағдайларына байланысты туындайды. Мұндағы «сырт жағдай» деп
отырға-нымыз, мәтінде баяндалатын ... мен ... ... ... ... ... ... өзіне бағытталған хабардың мән-мағынасын анықтауы,
оның тілдік жүйені меңгеру дәрежесіне және тілдің ... мен ... мен ... ... ... әрі сол ... сөз болатын
жағдайлармен қаншалықты таныстығына да көп ... адам ... ... ... ажырата білуі, оның
тілдік жүйені және оның «норма», «узус» деп ... ... ... ... осы ... ... болған жағдаяттың прагматикалық
құндылығын ескеруіне де қатысты.
Енді хабарламаны лингвистикалық тұрғыдан қабылдау деңгейлерін сөз ... онда ... ... ... ... ... ... деңгей (бұл деңгейде тек сөйлемнің грамматикалық
схемасы ғана қабылданады);
2) сөздік деңгей ... ... ... ... ... сөздік деңгейдегі жоғарғы саты – ол қабылдаудың фразеологиялық
деңгейі. Бұл қабылдауда сөз ... ... ... ал ... ... ... ескерілмейді.
4) келесі саты – жоғарыда аталған үш түрлі қабылдауды жалпылайтын саты –
мәтін бойындағы лексика-граммати-калық ... ... Бұл ... ... ... ... лингвистикалық қабылдаудан өтпейді. Себебі қабылдаушы
адам аталған деңгейлерде тек қана сөздер мен сөз ... ... ... ... ... ... оның тереңде жатқан
семантика-синтаксистік (әрі стильдік) байланыстарын аңғармай қалуы мүмкін.
Мұндай байланыстарды анықтау үшін ... адам ... ... деңгейге көтерілуі қажет. Бұл деңгей, әрине, қабылдаушының
тілді ... ... ... ... айтқанда, болашақ автомат-роботтың тілдік ... ... ... ... тиіс. Бірақ мұндай ... ... ... ісі, ... ... ... ... Осындай қиыншылықтардың негізгісі – адам баласының сөйлеу
тіліндегі дискреттік (бөліктенулік) және ... ... ... ... (Пиотровский).
Мәтінге қатысты инженерлік-лингвистикалық жұмыстар, яғни мәтінді ... және оны ... ... тек ... ... жүйесінде ғана іске асады. Бұл жердегі ... «А1» – ... «А2» – ... ... ... ал ... ... – хабаршының хабарламасын қабылдаушы адамға жедел және қолайлы түрде
жеткізетін аралық компонент.
«Адам–компьютер–адам» – хабардың берілу жүйесінің ... ... К ... ... ... берілу жүйесін екіге: (А1–К) және ... ... да ... Бірінші процесте (А1–К) мәтіндік хабарлама
адамнан компьютерге беріледі, ал екіншісі – (К–А2), керісінше, ... ... ... ... Осы екі түрлі процестің әрбіреуін төменде-
гідей төрт ... ... ... ... ... ... А1–К :
1.1) хабаршының (А1) назарында (ойлау процесінде) хабарлама мәтінінің
«туындауы»;
1.2) «туындалған» ... ... ... ... тізбегі
ретінде компьютерге берілуі;
1.3) қабылданған импульстер ... ... ... ... айқындау және оның мағынасын (мазмұнын) формалдау;
1.4) компьютер жадындағы ... ... ... сай ... ... басқа тілге аудару, мәтіннен аннотация, реферат алу,
индекстеу және нәтижесін табиғи тіл ... ... ... ... К–А2 ... төрт ... тұрады:
2.1) компьютер жадындағы мақсатқа сай өңделген ақпаратты тұтынушыға
ұсыну (бұл топтама жоғарыдағы көрсетілген 1.4-ке ... ... ... ... адамның (А2) қабылдауы;
2.3) компьютерлік хабарламаның семиозисі;
2.4) қабылдаушы адамның (А2) хабарламадан алған әсері.
Хабардың берілу жүйесі қызметінің ең ... деп, ... (1.3), ... ... және ... компьютер ұсынған
нәтижеге байланысты түсінігін айтады. Осы ... ... ... жетістігі табиғи тілдің компьютерлік ... яғни ... ... ... ... ... тығыз байланысты.
Инженерлік тіл білімінің келесі бір маңызды проблемасы – лингвистикалық
алгоритмдер мен олардың программаларын құру мәселесі. Мұны басқа ... ... ... деп те айтуға болады. Табиғи тіл мен жасанды ... ... ... ... бұл ... шешу ... түспейді.
Табиғи тіл де, жасанды математикалық (компьютерлік) тіл де семиотикалық
жүйеге жататындықтан, олардың негізгі қасиеттеріне тоқталайық.
Тіл ... ... ... және олардың арасындағы қатынастар деп
түсінетініміз мәлім. Ал ... ... ... ... ... ... әріп, морфа мен морфема, сөз бен сөзтұлға және олардың құрылымдық
түрлері, сөз ... ... және ... ... ... Енді ... ... бірліктері – әріп, цифрлар мен символдар және олардың
шартты белгілері (кодтары), компьютерлік түбір сөз, сөздер және ... ... ... сөз не ... сөз деп ... белгілі бір
түрде шектелген әріп тіркестері, ал компьютерлік сөз тіркес және сөйлемдер
дегендеріміз, ... ала ... ... ... ... сөздер
тізбегі болып табылады.
Табиғи тілдің мынадай үш түрлі функцияларын атауға болады (Баранов):
а) семантикалық және сигматикалық ақпаратты таратуға ... ... ... ... ... ... ... тілдік белгілерді өзара байланыста ұстайтын және мәтіндік ақпараттың
синтактикалық қасиетін сипаттайтын тілдің предикативті функциясы;
в) хабардың берілу ... ... ... және ... ... (А1) не ... (А2) жеке ... (жеке ұйымның)
қалауымен ұштастыра алатын прагматикалық функция.
Жасанды математика тілінде және оның барлық ... ... ... берілуінің өзінде-ақ предика-тивті функция біте
қайнасып жатады.
Жасанды компьютерлік тілдің номинативті ... ... ... ... ... Ал бұл ... ... тілде
прагматикалық функция атымен жоқ деуге болады (Пиотровский).
Сонымен, хабардың берілу жүйесі ... ... ... ... хабардың көлемдік мөлше-ріне және екіншіден, көпшілік
қабылдаушының дайындық дәре-жесіне де көп байланысты демекпіз.
Қысқаша ... ... тіл ... ... тіл теориясына қатысты
атқаратын кейбір қызметтері осындай.
Әдебиет
Андреев Н.Д. Язык в ... ... ... ... ... Л.: ... 1969. С. 25-40.
Баранов А.Н. Введение в прикладную ... ... ... ... 360 ... Р.Г. ... ... человек. Л.: Наука, 1975. 327 с.
Жасанды интеллект жүйесін құрастыруға
қатысты мәселелер жайында
Қазіргі түсініктегі электронды-есептеу машина (ЭЕМ) деген сөз ... ... 1946 ... бастап (ЭНИАК, АҚШ) қолдана бастады және бұл есептеу
техникасының қарқындап даму ... ... еді. ... осы ... ... де өз жалғасын табуда.
Бірінші есептеуіш машиналар көлемді арифметикалық есеп-қисаптарды
орындауға ... ол ... ... арқылы әрекет ететін ғажайып
үлкен калькуляторлар тәріздес болатын. Мысалы, осындай ... ... ... ... үшін ... ... ... өткен
ғасырдың 50-жылдарының басында-ақ ЭЕМ-ды пайдала-ну мұндай шағын аямен ғана
шектелмеу керектігі анық бола ... яғни ... ... ... ... да ... түрлері бойынша әрекет ету ... ... ... ... ... ... тұрғыдан қарастыр-ғанда, кез
келген ақпарат (мәтін, сурет, дыбыстық ... және т.б.) ЭЕМ ... ... арқылы кодталуына (шартты сандық белгімен ауыстырылуына)
мүмкіндігі бары анықталды. Бірақ бұл жайт ... ... ... маңызды емес еді. Оның себебі қазіргі кездегі есептеу техникасы
мен оны пайдалану әдістерінің даму сипатына қарай ЭЕМ үшін ... ... ... ... ... ... ... қатысты қойылған міндет-
терді шешуге болады. Ал бұл ... ... ... (шартты белгіленуі)
туралы мәліметті білуді тіпті де қажет етпейді.
Есептеу техникасының ... ... ЭЕМ ... ... емес ... ... тез ... ұғынуға математикалық логиканың қарқынды түрде
даму барысы себепші болды. Мысалы, ең алғашқы ... ... ... ... ... ... теориясының (математикалық логиканың
тарауы) Тьюринг машинасы, рекур-сивтік функциялар, ... ... және т.б. ... қол ... ... Сонымен, ХХ ғ. 50-
жылдарынан бастап қазіргі кезге дейін электронды есептеу ... ... ... да әртүрлі мәселелерін өңдеуде кең қолданыс тауып ... ... ... ... ... ... сұрақтар
мазалайтын: машинаны адамша ойлатуға бола ма ... ... ... интеллекті құрастыру мүмкін бе?
Шынында да, тірі адам ағзасындай ойлау ... бар ... ... табу мәселесі адамның тарихи даму кезеңдерінде бірнеше рет қойылғаны
мәлім. ... ... ... алу ... ... және ... аңыздармен жалғаса отырып, Карел Чапек пен ... ... ... мәселелерді мысалға келтіруге болады. Бірақ
тек ең ... ... ... ... бола ... бұл ... ... сызба мен көркем шығармалар деңгейінде емес,
белгілі ... ... ісі бола ... ... ... деңгейде
нақтылық түсінік ала бастады. Бұл мәселе ең бірінші рет ағылшынның тамаша
математигі А.Тьюрингтің 1950 жылы ... ... ... ... ... ... қарастырылды. Мақала «Машина ойлай ала ма?»
деп аталған болатын.
Жасанды интеллекті ... ... бола ма? – ... ... ... ... ... жеңіл болғанымен, ол аса ... ... еді. ... ... біз әлі де ... адам ... ойлау жағдаятын дұрыс
зерттей алмадық және ойлаудың жалпыға ортақ ... ... әлі де ... ... Оны айтпағанның өзінде, біз әлі «ойлау» деген не? – деп
қойылатын ... да ... бере ... Осы ... ... ... жасанды интеллект мәселелерін шешуге қатынасы бар философтарды,
психологтарды, инженерлерді, ... және т.б. ... ... ... ... ... ... “ойлау” қабілеті бар жүйе, яғни жасанды ... ... деп ... ... оның «ойлай алатынын» немесе ... ... ... ... Интеллектуалдықты қалай өлшейміз? Осы
мәселелерге байланысты А.Тьюрингтің жоғарыда аталынған ... ... ... ... және ол ... әдебиеттерде «Тьюринг тесті» деген
атпен аталып кетті. Қысқаша ... оны ... ... болады: егер
адам белгілі уақыт аралығында электронды машинамен ... ... ... адаммен емес, машинамен «тілдесіп» отырғанын байқамай
қалғанын сезінетін болса, тек ... ... ғана ... ... ... болады. Мұндай жағдайда адамның ... ... ... ... ... Мысалы, ақпаратты жолдауда адам
қайсыбір құралды (телетайпты) ... ... ... ... қою барынша
табиғи екені белгілі. Себебі, ол интеллектуалдық өлшемі ішінен ... ... ... және т.б. деп ... өлшемдерді (параметрлерді)
жоққа шығаруы мүмкін:
Тьюринг тестісінің өзіндік субъективтілігіне қарамай, ол интеллектуалдық
өлшем ... зор ... ие ... Оның ең ... ... – адамның
ойлау әрекетімен салыстыру әдісін ... ... ... ... ... ... болмауынан «бірдеңенің» ойлау қабілеті бар немесе жоқ деп
мойындау үшін оны тек адаммен ғана салыс-тыра аламыз. ... ол ... әлем ... ... жалғыз ғана тірі жан болып саналады.
Сонымен бірге аталған Тьюринг тесті ... ... ... ие. ... ... әдісі практикалық тұрғыда адам баласының интеллектуалдық
әрекетінің кез келген саласын қамтуға мүмкіндік туғызады. ... ... ... ... отырып, біз интеллектуалдық өлшемінің кейбіреуін
ғана туындата аламыз, яғни ол ... ... ... жеке ... шеше ... деген сөз. Мысалы, біз машина мен адам арасындағы
«сұхбаттың» белгілі ... сала ... ... ... етуімізге болады.
Сол сияқты арадағы қарым-қатынас тілінің лексикасы мен синтаксисіне де және
т.б. шектеулер ... ... ... асыруға болар еді.
Жасанды интеллектің қандай жеке ... шеше ... ... тестісінің ешбір көмегінің болмауынан, зерттеу ... ... ... ғана ... Мұндай міндеттер топтамасын әр зерттеуші
өзінше анықтаса да, оның «тұрақты өзегінің» ... ... Олар ... ... ... ... жасанды интеллект шешетін міндеттер
санына қосатын мәселе-лері: есептеу әрекетін орындау, ... ... ... ... ... ... Бұл термин көптеген мәселелердің ... ... ... ... дәлелдеу мен орта мектептің
физика ... ... ... ... ... ... өтейтін мәселелерге дейін. Мысалы, тіпті “қолымыздағы бар азық-
түліктен қандай тағам жасауға болады” деген сұраққа ... ... ... бұл ... ... есептердің нақты шешімін табу ғана ... ... ... ... ... ... ... табу, яғни есеп
шығару барысының моделін табу жайлы сөз болып отыр.
Әзірше, негізінен, әртүрлі ... ... ... ... ... ... ... математикалық есептер формалдау
әдісіне ... ... ... ... ... мәселенің жалпылама шешімін
табу үшін адамның пайымдау, қисынды қорытынды жасау мүмкіндіктерін зерттеп,
түсініп алу ... Тек ... ... ... үшін ғана ... пәнінің әдістерін қолдануға болар еді. Әрине, егер ... ... ... ... ... ... Себебі адам
баласы қолданатын логикалық әдістер формалды логикадан тіпті де ... ... Бұл ... ... ... ... еш пайдаланбайды
деген қорытынды шықпайды, бірақ олар нақты түрде қисынды өзгерістер жүргізу
мақсатында тағы басқа да, ... ... ... ... ... ... тек формалды логика ғана үстемдік ететін әлем өте-мөте
көңілсіз болатын шығар. Сонымен, егер математикалық ... ... ... ... пән деп есептесек, онда ... ... ... де
зерттелмеген сала деуге болады.
Шешім қабылдау мәселесі, ... ... ... ... ... ... ... және т.б. ойындарды модельдеуге
қатысты жұмыстар тек ... ... ... үшін ғана жүргізілмейді.
Дұрысы, керісінше. ... және ... да ... ... ... ... шын ... мақсаты бөлек. Олай дейтініміз,
«ойын ережелері» тек тақта бетіндегі шахмат фигураларын бір орыннан ... ... ... үшін ғана емес ... Оның ... ... ... пен құрал-саймандарды өңдіріс орындарына ... ... ... үшін ... мен армияны жылжыту, финанстық жүйе
бойынша қаржының ... ... және т.б. сол ... ... ... сай ... ... болады.
Әрбір нақты жеке жағдайға байланысты ең жақсы ... ... ... ... ... ... ортақ сипаттағы әдіс-тәсілі
анықталады. Осының нәтижесінде тек тиімді автоматтанған ... ... ғана қол ... ... ... ... ойлау әрекетінің
жалпы теориясына да белгілі ... үлес ... ... болады.
Бейнелерді тану. Адамға өзін қоршап тұрған материалдық әлемді ... ... ... тән ... ... Адам ... нысандардың шексіз
жиынын топ-топқа бөлшектеп қарастыруға дағдыланған. Мысалы, екі алманың
өзара ұқсастығының аздығына ... адам ... оны бір ... – алма ... Ал алмұрттың алмаға өте ұқсас болуына қарамай, оны ... ... ... деп ... сияқты, демалыстан оралған жақсы таныс ... ...... ... өсіп, қара көзілдірік киіп алғанына қарамай, біз ... ... ... ... танимыз.
Әртүрлі адамдардың бір әріптің өзін ... ... ... біз ... бір әріп ... тани ... және бір ғана ... адамның дыбыстау әрекетінің ерекшеліктеріне қарамай, біз оны да бір
сөз деп ... ... ... ... үшін адам ... ... көзге шалына
бермейтін белгілерге сүйенеді? Яғни, мысалы, екі ... да алма ... үшін ... ... көрген адам мен бүгінгі көріп тұрған адамның ... ... ... және т.б. үшін адам баласы қандай белгі-мүмкіндікті
пайдаланады?
Ойлау барысында адам ... ... мен ... ... қайсыбір
эталондық бейнесін құрастырады деп жорамалдауға болады. Тануға тиісті
нысанды адам өз ... орын ... ... салыстыру нәтижесінде ол
нысанды бейне топтарының біреуіне жатқызады. Бұл ... ... ... ... ... нейрофизиологиялық термин деп ұғынудан гөрі,
интуитивті түрде, адамның сол нысанға байланысты ... ... ... ... ... оған таныс бірыңғай сипаттамалар деп ... ... ... ... ... «бейне» ұғымы дәлірек айқындалуы
мүмкін.
“Бейне тану” мәселесінің шешімін табудың негізгісі – ол ең ... екі ... ... ... қажет етеді: эталондық бейне қалайша
құрастырылады (яғни адам қалайша әлемді бөліктейді және ... ... ... ... ... ... айырым белгілері мәнді, ал
қандайлары мәнсіз?
Адам өзін қоршаған ақиқаттық жайлы ... ... ... ... ... бар – көру, есту, сезіну және т.б. Сондықтан, ... ... ... ... ... болғандықтан, бейнені тану
ісі бірнеше мәселе-лерге ажыратылады: көру бейнелерін тану, акустикалық
бейне-лерді тану және ... ... ... ... ... ... ... байланысты көмегінің болмайтын-дығы жайлы жоғарыда да айтқанбыз.
Солай бола тұра, жасанды интеллект мәселелерінің ... ... ... бір ... бағыты – адам мен машина (компьютер) арасындағы қарым-
қатынасты (тілдесуді) табиғи тілде жүргізуді қамтамасыз ету. Бұл ... тек ... ... ... ... ... жақындату мен
ойлаудың жалпы теориясына белгілі үлес қосу ғана емес, ... ... ... ... де, оның ... практикалық қолданыста пайдаға
асатындығында. Мысалы, ол ... ... ... басқару
ісінің автоматты жүйесінде және басқа да арнайы тілдерді ... ... ... қолдануды қажет ететін жүйелерді ... ... ... тіл ... маңызды деп саналатын жасанды
интеллектің көптеген мәселелерінен ... ... ... ... ... ... мен жинақтау мәселелері жеке қарастыруды ... мен ... ... ... ... ... барысын былайша
елестетуге де болар еді: машина мәтінді өз жадына енгізіп, ... ... ... ... ... әсер ... ... Мұндай әсер
құрастырылатын жүйенің міндеті мен мүмкіндіктеріне қарай әртүрлі болуы ... ... ол ... машиналық мәтін түріндегі сұраққа жауап
беру әрекетінің әсері ... ... ... ішкі ... ... ... ... қабылдау) мен қайсыбір жай ғана ... өз ... ... ... ... әсері болуы да мүмкін.
Осындай мүмкін болатын әсерлердің ... біз тек ... ... ғана ... ... ... ... мәтін “ұғынықты әсер” етуі үшін ең
алдымен машина оны ... ... ... Осыған байланысты мынадай сауал
туындайды: мәтінді “түсіну” дегеніміз не және ... ... ... ... ... болады? Бұл аталған сұрақтар аса күрделі
сұрақтарға жататыны белгілі. “Ойлау” (мышление) терминіне анықтама ... ... ... ... де ... ... жоқ ... болады.
“Ойлау” мен “түсіну” терминдері-нің бір-бірінен алшақ еместігі жайлы ... ... ... ... ... туындатуы Тьюринг тестісіне ұқсастық
сипатта қарастырудың нәтижесі болуы да мүмкін. Мәселен, егер машинаның
мәтінге қатысты ... ... және ... ... ... ғана ... түсіне алады. Бұл критерийдің субъективтілік сипаты (Тьюринг тесті
тәріздес) айқын: машинаның мәтінге әсер ету ... ... ... ... ... аталған критерийде “түсіну” ұғымында “дұрыс
түсіну” жайлы да сөз болып отыр. Яғни ... ... ... жағы да ... сөз. Қалай болғанда да жасанды интеллектің практикалық ... ... бұл ... ... ... ... белгілі.
Мәтінді дұрыс түсінуге болатындығы жайлы аталған критерий де (Тьюринг
тестісі сияқты) көмекші құрал бола алмайды. Бұл ... ... ... әр ... өз ұстанымы болатындығы белгілі. Сонда да бұл
бағытқа ... ... ... сипаттама беруге болады: жасанды интеллект
жүйесі мәтінді қайсыбір ішкі көрініс құрылымына қайта өзгертуі қажет, ... ... ... көрінісіне келтіруге байланысты өзгертулер
жүргізіледі. Осы құрылымды негіз етіп ала отырып, ... жүйе ... ... ... ... Мәселен, қойылған сұраққа қатысты
қажетті деген жауапты ұйымдастыру, қайсыбір әрекетті жүзеге ... және ... ... ... ... ... ешбір де ережелері мен
нұсқаулары жоқ. Бар болғаны тек бір ғана барынша күңгірт сипаттағы талап ... ... ... ... мән-мағынасын дұрыс ашу мен ... ... ... ... ... ие болу. Сонымен
бірге әртүрлі мән-мағынаға әртүрлі құрылымның сәйкес келуі.
Кейбір зерттеушілер ... ... ... мәтінді түсіну барысы
«адамның түсіну» деңгейіндей ... ... ... Ондай ғалымдардың
түсінігінше, басқаша жағдайда табысқа жету ... ... ... бұл ... та
өзінше қисынды деуге болады. Бірақ бүгінгі таңда ... ... ... ... ете алатан тірі жан иесінің бірі және бірегейі – ол
тек адам. Сондықтан адам ... ғана орын ... ... ... осы сала бойынша оң нәтижеге әкелетін жалғыз-ақ мүмкіндік деуге
болады. Бірақ ... ... ... адам ... сай ... қою ақиқат шындыққа жараса бермейді. Әрбір зерттеуші адам өз ... ... ... ... алмайды. «Адамның басы» зерттеушілерге
қайсыбір «қара жәшік» тәріздес. Ал адам ... ... алу ... ... барынша дәл айқындауға нейролингвистика ғылымының
жетістіктері әлі де ... ... ... ... өз ... ... «адам басында қалайша шешім табылатынын» жүзеге асыруға
ниеттенгендері-мен, олар сөйлеу қызметін функционалдық ... ... ... аса ... ... жасанды интеллект жүйесі мәтінді “түсіну” үшін ол ең ... ішкі ... ... ... ... ... ғана ... мән-
мағынасы қажетті түрде бейне-ленеді. Мұндай ауыстыру жұмысын жүзеге асыру
үшін жасанды интеллекті жүйесі қайсыбір ... ... ... ... ... интеллектімен айналысатын мамандар бұл ақпаратты білім деп
атап жүр. Көпшіліктің мақұлдауы бойынша білім ... ... ... тіл ... білім және әлем туралы білім. Білімнің соңғы түрін
энциклопедиялық білім деп те ... ... ... ... дәл ... ... ... барынша
күрделі, тіпті мүмкін де емес деуге болады. ... ... бұл ... ... ... ... тіл туралы білімге морфологиялық,
синтаксистік, семантикалық ... ... Бұл ... ... мен ... аралығындағы негізгі байланыстар арқылы мәтін құрылымын
анықтауға мүмкіндік туғызатын мәліметтер. Ал мәтінді ... ... ... ... әлем ... ... ... жатады.
Табиғи тілдегі мәтінді түсінуге арналған ... ... ... тек тіл туралы білімдер-мен ғана қанағаттануға
талаптанған болатын, бірақ көп ұзамай-ақ ... ... ... ... орта ... білімнің де қажеттігі айқындалды.
Әртүрлі адамдардың әлем туралы білімі айтарлықтай ... ... ... Сол сияқты мұндай жағдай әртүрлі жасанды интеллект жүйелеріне де
қатысы бар. Ал бұл ... ... ... өз әсерін тигізбей
қоймайды. Сондықтан да әр адамның бір ғана мәтінді ... ... ... алады. Бұл айтылғандарға мәтін үзінділерінен көптеп мысалдар келтіруге
де ... ... ... өзі ... сөз болған критерийдің
субъективтілігінің тағы бір дәлелі деуге болады.
Тіпті ең қарапайым деген ... ... ... үшін айтарлықтай көп
көлемдегі әлем жайлы білімді пайдалануымыз керек болады. Егерде тіл туралы
білімді азды-көпті ... ... ... ... туатына қарамай,
әлем туралы білім қорының шексіздік сипаты оны ... ... ... ... бола тұра, адам баласының әлемді тану мүмкіндігі де
күннен-күнге ... ... ... ... ... ... түсіну жүйесін
құруда әлем туралы білімге қатысты кейбір принциптік мәселелер ... ... ... ... ... мүмкін болмағандықтан, жұмыс барысында
олардың ең қажеттілерін алдын ала болжау да аса ... ... ... ... ... аса шағын пәндік салаға бағышталған,
сондықтан ондай жүйелер тек шектеулі тақырыпты ... ... ... ... ... ... ... жасаудың өзінде де алынған нәтижелер
шындықтан әлі де болса ... ... ... ... бір ... ... – оқыту жүйелерін
(обучающие системы) құруға байланысты. Бұл ... ... зор ... ... оның ... алу жүйесі арқылы мәтін ішінен жаңа ақпаратты
тауып, бұрыннан жинақталып ... әлем ... ... ... қоса ... бар. Егер ... ... қажетті ақпарат жеткіліксіз болып
жатса, оның күңгірт (түсініксіз) жерлерін анықтау үшін ондай жүйе тұтынушы
адамға қосымша ... ... ... қорын жинақтауға мүмкіндігі бар.
Бірдей көлемдегі білім қоры бар жүйелер алғашқы ... ... ... болуы мүмкін.
Бірақ әлем туралы білім қорын жинақтау жолдарына байланыссыз (тәуелсіз),
мәтінді ... ... ... ...... ішкі ... яғни мәтіннің мән-мағынасының құрылымын құрастыру. Әдетте мұндай
құрылым мәтінді автоматты түрде өңдеу кезіндегі әрекеттерге ... ... ... машиналық аударма, автоматты рефераттау және т.б. орын
алатын ... ... және ... ... ... ... ... келеді.
Құрастырылған құрылымды жүйенің қарсы әрекетін туындату үшін де
қолдануға ... Оған ... ... ... әрекет түрін таңдау
және т.б. Әрине, ... ... ... зерттеулерді жүзеге асыру тек
тілшілердің үлесіне ғана тиісті емес, ... ... ... да ... ... ... ... қажет етеді. Мысалы, психолог-тардың
– әрекет үлгісін анықтауда, логика мамандарының – ... ... ... т.б. ... ... ... ... зерттеу бағыттары
практикалық тұрғыда әртүрлі мамандықтардың мүдделеріне ... ... олар ... ... мамандарды қатыстыра отырып, кешенді ... асуы ... сөз ... мәселелердің бәрін бірдей қанағаттандыратын ортақ
шешім әлі де болса табылмай ... ... жеке бір ... ... аса
тар шеңбердегі мәселелердің шешімдерін табуға арналған талпыныстар көптеп
кездесетіні белгілі. Мәселен, егер адам мен ... ... ... ... ... болса, онда ол шектеулі пәндік сала бойынша, ал
егер ... ... ... үшін ... ... қажет болса, онда ол нақты
мәселенің шекаралығында (шахмат ойынындағы ... ... ... ... ... бүгінгі таңдағы ойлау әрекетінің жалпы теориясы жаңадан ғана
дамып келеді деп қорытынды жасауға болады.
Әдебиет
Моделирование ... ... в ... ... / ... А.Е. ... и А.С. Нариньяни. М., 1987.
Панков И.П. Искусственный интеллект//Прикладное языко-знание: Учебник.
отв. редактор А.С.Герд. СПб.: Изд-во С.-Петербург. ун-та, 1996. С. ... Э.В. ... с ЭВМ на ... ... М., ... С.Я. Понимание естественного языка в системах искусственного
интеллекта//Лингвистические проблемы функциональ-ного моделирования речевой
деятельности. Вып. V. Л., 1982. С. ... Э. ... ... М., 1978.
Оқу лексикографиясының ғылыми пән
ретіндегі ерекшелігі
Егемен еліміздің орта және жоғары оқу ... ... ... тілде оқыту аса күрделі және ... ... ... ... талап етіп отыр. Осыған байланысты басты мәселенің бірі
... ... мен оқу ... ... ... ... негізделген қазақ тілінің жалпы лексикалық қорын және салалық
пәндердің терминологиясын құрастыру.
Қазақ тіліндегі әр салалық пәндерге қатысты терминдерді ... орыс және ... да ... ... халықтарының озық
тәжірибелеріне сүйенетін күрделі жұмыстар ... тұр ... ... Атап
айтар болсақ, халық ауыз әдебиетінің бай мұрасы мен қазақ халқының ... ... тән ... ... ... мен ... оқырманның
жас ерекшелігіне, білім деңгейіне қарай сөздіктер мен оқу ... ... білу ісі ... асар ... ... ... алмасақ та, оның өзіне тән метатілі болатыны мәлім.
Метатіл ұғымына тек терминдер ғана емес, ... ... ... да ... ... ... қалыптасуына сөздіктердің де әсері ... ... тіл ... ... саласын теориялық және
практикалық негіздемесі бар ғылыми пән ... ... жөн ... ... мен ... Жұбанов бастап дамытқан қазақ тіліне
қатысты терминдер белгілі дәрежеде қалыптасқанымен, басқа ... ... ... ... әлі де ... ... қажет ететіні
белгілі. Сондықтан да оқулықтарды, сөздіктерді пайдалана отырып, олардың
түсініктемесін, ... ... ... ... отыр.
Қазіргі кезеңде қазақ тілінің сөздік қоры жаңарып, тіл ... ... ... ... мен ... де уақытқа сай өзгеріске
ұшырауда. Жарық көріп жатқан сөздіктерде соңғы жылдары пайда болып ... және орыс ... жаңа ... мен байырғы сөздердің түсіндір-
мелері мен қолданыстары енгізілуде. Сол ... ... ... ... ... нормаларына сәйкес және күнделікті қарым-қатынаста, ... жиі ... ... де орын ... ... қиындық тудыратын
қазақ немесе шет тілінің сөздері мен сөз ... ... ... ... ... ... ... ескертпелер
мен шартты белгілер арқылы көрсетіп беру жұмысы да атқарылуда. Әртүрлі
мақсатты ұстаным ... ... ... ... ... ... ... кеңінен таралған қазақтың мақал-мәтелдері, сөздердің негізгі және
ауыспалы мағыналарын айқындайтын сөз ... ... ... ... сөздер қатарларына ерекше көңіл бөлу ойластырылуда.
Әрине, қазақ тілінің лексикография саласының дамуына тіл ... орын ... ... іргелі еңбектер негіз болғаны мәлім: «Қазақ
тілінің түсіндірме сөздігі» (1-10 том, А., 1974–86), ... ... ... ... (А., 1977), Н.Т.Сауранбаевтың
жетекшілігімен ... ... ... ... (М., ... жетекшілігімен жарық көрген «Жаңа атаулар» (А., ... ... Тіл ... институты лексико-графтарының
құрастыруымен және ... ... ... ... ... ... ... (А., 1999), «Қазақша-орысша сөздік» (А., 2001),
«Орысша-қазақша ... (А., 2005) және ... ... ... ... Мемлекет-тік терминологиялық
комиссиясының әр жылдары ресми бекіткен түрлі сала терминдері жинақталып,
дүркін-дүркін жеке ... ... ... тұру да дәстүрге айналды. Осындай
лексикографиялық жұмыстардың нәтижесі ретінде 1976, 1979, 1990 ... ... ... А.Әбдірахмановтың құрас-тыруымен шыққан ... ... ... 1996 жылы жарық көрген Б.Қалиев пен Ш.Құрманбайұлының
«Орысша-қазақша және қазақша-орысша терминдер сөздігі», ... ... 1998 жылы ... пен ... және 1999 ... ... құжаттар жинағы-ның басын қосып, 2002 жылы басылып ... ... ... ... ... ... орысша-қазақша,
қазақша-орысша сөздіктердің 31 томы «Рауан» баспасынан ... ... ... Осы ... қатарына 1998 жылы «Ғылым» баспасынан шыққан
Б.А.Жұба-новтың 25677 сөзді ... ... ... ... орыс ... ... бойынша) «Химиялық сөздікті», А.Салқын-бай мен Е.Абақанның
авторлығымен ... ... 1998 жылы ... ... ... ... пен А.Рақышевтың 1999 жылы «Атамұра»
баспасы-нан жарық көрген орысша-қазақша «Медициналық ... ... Сол ... ... пен Р.Шойбековтың «Русско-казахский словарь»
атты сөздіктің (А., 1996), 2002 жылы ... ... ... 30000 сөзді
қамтитын мектеп оқушылары мен жоғары оқу орындары студенттеріне ... ... аса сөз, ... ... Э.Ережепова,
Г.Әбдіжапарова) және 2006 жылы Астанада жарық ... ... ... «Қазақша-орысша және орысша-қазақша оқушыларға,
студенттерге ... ... (14000 сөз) де ... және орыс ... ... аса ... лексикографиялық еңбектер екені белгілі.
Осы бағыттағы аталған және басқа да аталмай ... ... ... ... оқыту процесінде, әсіресе жоғары білімді, білікті
мамандар дайындауда игі көмегін тигізері сөзсіз. ... ... ... ... ету үшін ... ... мен ... араласуымен қазақ тілінің оқулықтарын, оқу құралдарын,
көптілді аудармалы, түсіндірмелі және энциклопедиялық сөздіктерін ... ... ... ... ... ... ... мектеп оқушылары мен
студенттерге арналған қолымызда бар бірқатар сөздіктерде, оқулықтар мен оқу
құралдарында әлі де болса теориялық тұрғыда ... ... ... та ... ... назарына ұсынып отырған еңбегімізде осындай
кемшіліктерге ... жол ... ... оқу лексикографиясына қатысты
кейбір теориялық және практика-лық мәселелерді сөз ... жөн ... ... жалпы лексикографияның жас саласы болып саналатыны
белгілі. Солай бола тұра, оның да өзіне тән жақсы ... ... ... бар. ... ең алғашқы оқу лексикографиясының орталығы тек 1966
жылы ғана құрылып, Мәскеудегі А.С.Пушкин атындағы Орыс тілі ... ... ... ... ... кезде аталған сектор орыс ... және ... ... сөздіктерін құрастырудың
теориялық және практикалық жұмыстарын кең көлемде атқаруда.
Оқу лексикографиясының ... пән ... ... тән ерекшелігі, оның
жалпы лексикография, лексикология, семасио-логия психо- және әлеуметтік
лингвистика және т.б. ... ... ... ... қатысты
мәселелерімен тығыз байла-нысты болуында. Сондықтан оқу лексикографиясы
дәстүрлі жалпы ... ... ... мынандай көптеген
әдістемелік факторларды ескеруді қажет етеді: оқыту кезеңдеріне қатысты
сөйлеу әрекетінің ... ... ... үшін ... ана тілі ... екендігі және қажетті тілдік ортаның болу-болмауы, жас
ерекшелігі мен ... ... ... ... ... және т.б. мәселелер.
Осы аталған лингвистикалық және әдістемелік факторлар тек ... ... ... ... ғана оқу ... ... ана тілін не шет тілдерін үйретудегі оқу сөздіктеріне ... ... ... беруге болады. Лексикографияның жалпы теориясы
принцип-терін орынды ... ... ... үйрету жолындағы ескірген
әдістерге жол бергізбей, ішкітілдік және тіларалық ... ... ... ... және т.б. ... айқындауға
мүмкіндік туындайды.
Әдістемелік факторларды ескеру негізінде мына жайттар анықталады
(Марусенко, 1996, 309):
1) ... ... ... ... ... және т.б.);
2) сөздіктің типі (біртілдік немесе аударма);
3) сөзтізбе көлемі (минимум сөздік, орта немесе ... ... ... құрылымы, ондағы лексикалық материалдың берілу әдіс-
тәсілі (эквиваленция, дефиниция, безендірілу, лексика-семантикалық топтағы
басқа сөздерге қарама-қарсылығы), синонимия, анонимия, ... ... ... ... орфоэпиялық және стильдік ерекшеліктері
және т.б.
5) полиграфиялық орындалуы.
Лексикографияның жалпы теориясын дұрыс ескеру тілдік ақиқаттықты шынайы
көрсете ... ... ... Ал ... ... оқу сөздігіндегі
ең маңызды деген жайт-тарды, мысалы, сөздіктің тілді үйренуге бағытталуын,
белгілі оқыту кезеңі мен ... ... ... яғни оның қызметін
анықтайды.
Оқу лексикографиясының тәуелсіз лингводидактикалық пән болуының ... тіл ... мен ... өзара тығыз байланыстылығы мен өзара
қатыстылығында жатыр.
Шынында да, егер қазіргі түсінікте, оқу лексикографиясы тіл білімінің ... жас ... бола ... практикалық тұрғыдан алғанда оны бұрыннан келе
жатқан сала деуге де болады. Бұлай тұжырымдау үшін кез ... ... ... ... ... деп ... жөн ... еді. Лексикограф,
яғни сөздік авторы оқулықтың авторы тәріздес, қоғам (ұжымдық тіл ... ... адам ... ... ретінде қызмет етеді. Сондықтан кез ... ... ... – жеке адамның санасындағы ... мен ... ... аралығындағы айырмашылықты жоюға талпыныс жасайды деуге
де болады.
Қолданбалы тіл ... ірі ... ... ... ... ... төрт ... бөліп қарастырады:
1. Тіларалық қатынасты ұйымдастыруға байланысты. Мұндай қызмет көбінде
екітілді сөздіктер мен тілдескіштер арқылы іске ... ... ... ... үшін және мағынасы қиын сөздерге түсініктеме
беру арқылы.
Сөздіктің ... ... ... ... ... немесе екітілді сөздіктер, глоссариялар, тілдескіштер қолданылуы
мүмкін. Оқыту процесі мынадай мәселелерге қатысты болады:
а) сөйлеу тілінен айырымы бар көне ... ... ... ... Мысалы, ол ежелгі дәуірге қатысты тіл немесе басқа да тілдерге –
латын, ежелгі грек тілі, Еуропа-дағы ортағасырлық ескі ... ... ... ... араб тілі және т.б. ... ... мүмкін;
ә) шет тілдеріне;
б) ана тілге.
3. Ана тілін сипаттау мен нормалауға байланысты. Мұндай қызметтер, ең
алдымен, түсіндірме ... ... және ... қиын ... және т.б. ... біртілдік сөздіктер арқылы іске асады.
4. Тілдерді зерттеу ісіне байланысты. Мұның негізінде ... ... ... ... әртүрлі типтері құрастырылады (Гак,
1977).
Лексикографияның ... ... ... ... ... ... сатыларын былай жіктеуге болар еді:
1. Сөздікке дейінгі кезең (Еуропада – ХV ғ. дейінгі кезең). Бұл кезеңде
сөздік ... ... ... ... не оқулық
тарауына қатысты берілетін қысқаша сөздік), ... ... ... ... ... ... мәдениет тілінің түсінуге қиын сөздерінің
мағынасын ашу.
2. Сөздік түзудің ... ... ...... ғасырлар). Бұл
кезеңде лексикондар (белгілі қызмет аясына ғана тән сөз қоры) мен тіларалық
қарым-қатынас және мәдениет ... ... мен шет ... ... үшін ... ... ... өмірге келді.
3. Лексикографияның дамыған кезеңі (Еуропада – XVIII ғ. ... ... ... ... типтерінің, әсіресе, түсіндірме сөздіктердің
шыға бастауымен ерекшеленеді ... 1996, 310). ... ... ... ... ... ... төрт түрлі қызметін
іске асыруды мақсат етеді.
Сонымен, оқу лексикографиясы сөздік құрастырудың алғашқы даму ... ... ... ... ... Себебі, бастапқы кезеңдердегі
сөздіктердің аттарының өзі-ақ, олардың дидактикалық міндеттерін ... ... ... латынша-ағылшынша сөздік «Promptulorium parvulo-
rum» деп ... яғни ... ... сөз ... ... ... – «Commentarius puero-rum», яғни ... ... ... деп және т.б. аталған. Бері келе мұндай
сөздіктердің оқуға бағыттағыш ... ... ... ... ... ... ... этимологиялық сөздіктер типтеріне ауыса бастайды.
Лексиканы оқыту мақсатының нысаны етіп алуға арналған ... ... ... В.В.Морковкин мынандай негізгі бес аспектіні бөліп
қарастырады (Актуальные проблемы …, 1977, 31-35):
1. Оқу ... ... ... ... мәселелер, әсіресе
сөзтізбе құрылымын талдау мен оқу ... ... ... мәселелер
толық зерттелді деуге болады. Бірақ бұл зерттеулердің негізгі мақсаты әр
типті сөздіктерде орын алатын ұқсастық пен ... ... ... семантикасын анықтаудың тәсілдері және тағы
басқалар.
2. Лексикалық минимум сөздіктері. ... ... ... ... ... ... ... барынша зерттелді деуге болады. Соның
нәтижесінде оқу формасына қарай ... ... ... ... ... оқу процесінде лексикалық минимумның барлық
артықшылығын ... ... үшін ол ... ... жүзеге асуы және
оқу барысының барлық кезеңдерін түгел қамтуы қажет. Әрине, бұл ... әлі де ... ... ... келеді.
3. Лингвостатистикалық зерттеулер. Мұндай зерттеулердің нәтижелері,
әдетте, жиілік сөздіктер мен үлестірімді жиілік сөздіктер ... ... ... ... ... ... түрлерінде көрініс табады.
4. Лексикографиялық типтегі лексикаға қатысты оқу құрал-дары. Әртүрлі
тілдерге арналған мұндай оқу құралдары ... ... ... ... Бірақ
олар, теориялық тұрғыда, әлі де болса зерттеу нысаны бола алмай ... ... ... ... ... ... жақтары әр
тақырыпқа қатысты пәндік сөздіктерде, жинақтық ... ... ... ... ... қарастырылады. Қандайда болсын оқулықтар
үшін лексикалық аспект өте-мөте маңызды деп ... ... ... ... ... тәжірибесінің теориялық негіздемесі
орын ала бермейді.
Жоғарыда ... оқу ... ең ... ... ... нақты оқу кезеңдеріне қатыстылы-ғымен, оқудың мақсаты мен
міндетіне және т.б. ... ... Оқу ... ... ... ісінде арнайы мақсат қоюмен ерекшеленеді. Яғни болашақ лексикогра-
фиялық талдау үшін қажет болатын тірек бірліктердің ... ... ... ... ... ... әрі шағын, әрі жеткілікті сипатта
болуы қажет. Бұл мақсат тек ... ... ... квантитативті
параметрлерін, грамматикалық тұрпатын және ... ... ... ең ... ... мен сөз ... ... қатаң түрде
есепке алу арқылы ғана жүзеге асады. ... ... ... ... мен ... жағдаятын қамтуды тексеру қажеттігі де туындайды.
Өкінішке қарай, тәжірибе ... ... ... ... көбінде орын ала
бермейді.
Оқу сөздігінің сөзтізбе көлемі оның белгілі бір ... ... ... ... ... ... сөздіктегі лексика осы тілдік
ұжымның әр мүшесі үшін ... ... ... болуы қажет. Аталған
мәселені шешу үшін мәдениеттің және ғылым мен ... ... ... қамтылған ең кіші сөйлеу қызметінің моделі құрастырылуы керек.
Мұндай түсіндірме сөздік-анықтағыш ... ... ... ... ... мұндай сөздік пассивті немесе жеке индивидтердің активті
сөздік қорының ... ... да, оқу ... активті типіне
жатады.
Кез келген оқу ... ... ... ... ... яғни кең ... лексикалық минимум бола тұра, ол ... ... ... Бір ... ... сөздік нақты
бағыттағы мәтіндерді және оқыту кезеңіне қатысты ... ... ... ... Ал ... ... ... кез келген мәтінді түсінуге
мүмкіндік туғызатын нақты материалдар да орын алуы ... Бір ... ... ... ... және т.б.) ... ... типі қойылған талапты орындай алмайды.
Сөздіктің әр деңгейіне тән сөздер бірнеше топ ... ... ... 1996, ... ... ... ... құрайтын және кез келген мәтінде кең
қолданыс табатын – ... ... ... ... ... ... және сол себепті нақты
тақырыпқа, сөйленіс жағдаятына байланыссыз келетін – жиілігі ... ... ... ... ... жағдаятпен тығыз байланысты болатын –
тақырыптық, жағдаяттық сөздер. Бұл категорияға ... ... ... ие ... ... сөйлеу мәнмәтіндерінде қолданылады. Сөздікке тек
әртүрлі категориядағы (құрылымдық, ... ... ... ғана кең ... ... түсінуге мүмкіндік туғызады.
Оқу сөздігінің құрылымдық бөліктерінің өзгешелігі. «Үлкен» ... ... оқу ... ... ... екі ерекшелікпен
сипатталады: лексикалық бірліктерге түсініктеме берумен (семантикалау) және
ол бірліктердің пара-дигматикалық, ... ... ... ... әдіс-тәсілдерімен.
Лексикалық бірліктерді семантикалау түсіндірме оқу сөздігінің маңызды
құрылымды бөлігі болып табылады. ... ... ... ... дәрежеде
басқа да сөздіктер типіне де ... ... оқу ... ... аударма баламалары арқылы, ал түсіндірме сөздіктерде
мұндай семантикалау – анықтамалар арқылы ... ... Оқу ... құрылымдық бөлігі саналатын анықтама: шағындық, көрнекілік және
қарапайым сөзге саятындай талаптарға сай келетіндей болуы керек.
Шетел ... ... ... сөздіктерде қайсыбір ұғымға
түсініктеме беретін анықтамаларында таныс сөздердің шағын ... ... жөн ... Бұл ... ... ... ... және осылардың
негізінде сөздіктің басқа да лексикалық бірліктері анықталады. Мысалы, ... ... (West, 1965) ... 24000 сөздің мағынасы көлемі 1500
сөздерге тең ... топ ... ... ... Сол сияқты
француз тілінің негізгі лексикалық тобын қамтитын ... ... 55 сөз ... және ... сөздіктің 1374 сөздері бойынша
басқа сөздердің мағыналық анықтамалары ... ... ... ... ... ... ол «минимум
сөздіктер» негізінде ... ... ... ... ... ... ... өзгешеленеді. Бірақ мұндай олқылықтар
семантикалау әдісінің ... ... ... ... деуге болады.
Оқу сөздіктері үшін аса маңызды мәселе сөздердің ... ... ... ... көрсете білу. Үйренуге тиісті ... ... ғана ... ... ... оның ... қолданылуына кепіл
бола алмайтындығы белгілі. Ана тілі мен шет ... ... ... ... ... ... ... сөз тіркестерін
туындатады. Ірі филологиялық сөздіктерде сөзқол-даныстардың ерекшеліктері
жайлы, яғни ... ... ... ... бола ... ... ... осындай мәліметтер бере алатын, сөздердің ең
ықтимал норма-тивті байланысын бейнелейтін оқу ... ... и др., ... ... ... қарама-қарсы қойылған, бірақ ортақ
белгісі бар немесе ... ... ... кез келген лингвистикалық
бірліктер тобы екені белгілі. Міне ... ... ... ... ... ... ... топтар көрініс
табады.
Оқу сөздіктерінің типологиясы. Типологиялық тұрғыда оқу ... ... ... ... қызметі тұрғысынан;
2) сөздіктің экстралингвистикалық параметрі бойынша;
3) сөздіктің ішкі лингвистикалық параметрі бойынша.
Оқу ... ... ... жалпылама және мамандандырылған
сөздіктер деп те ажыратылады. Бірінші сөздік ... ... ... да, ал ... ... тек ... ғана арналады. Мысалы, мектеп оқушыларына, филолог-
студенттерге, филолог емес ... ... және ... ... ... әрбір сөздік-тің өзіне тән
ерекшелігін анықтайды. Мысалы, олардың ... ... ... ... оның кейбір элементтерінің ғана энциклопедиялық
сөздікке енгендігі бойынша. Осы ... ... ... ... ... ... мәдениеттің заттық сипаты, рухани
мәдениеттің ... ел тану ... және ... ... ... ... ... бейнелену сипаты. Яғни «әлем
бейнесінің» әртүрлі жекелік, ... ... ... ... ... параметрлер жалқы есімдердің, мақал-мәтел-
дердің, қанатты сөздердің ... және т.б. ... үшін ... рөл ... ... параметрлер негізіндегі сөздіктер типологиясы тілдің
сөздік құрамының типологиясын бейнелеуі қажет. Кез келген тілдің сөздік
құрамы ... ... ... қажетті сөзді тез іздеп табу үшін
лексиканың жүйелік сипатын ескеретін стратегияны туындатып ... ... ... ... ... деген сөзді барлық сөздік құрамының ішінен
іздемей, тек оның кішігірім бөлігінің ішінен, ... ... ... ... лексика-семантика-лық топ ішінен және т.б. іздеу мүмкіндігі
туындайды. Оқу лексикографиясының теориясы, ең ... ... тіл ... ... ... бойынша, аспектілік сөздіктер жүйесін құруды
қалайды. Сол арқылы ... ... ... ... ... ... ... қысқарады.
Бұл мәселе сөздіктің көлеміне, оларды ұйымдастыруға, сөздіктегі әрбір
лексикалық бірлікті сақтайтын ақпарат көлеміне, ... ... ... ... құру ... ... бар. Яғни бұл мәселе кешенді
(жан-жақты) сипатқа ие деуге болады.
Қазіргі кезде халықаралық қатынас ... ... ... ұлттық
мемлекеттердің пайда болуы және бұрынғы отарлықта қалған ... ... ... ... ... ... қарым-
қатынасқа және тілдерді оқытуға байланысты қызметтерін ... ... ... ... ... өндірісті интеграциялау кезеңінде
әртүрлі түсініктерді бірізге ... ісі де аса ... ... Сондықтан
егемен Қазақстанның халықаралық деңгейге ... және ... ... ... таңдағы ғылым мен технологияның әртүрлі салаларында ғылыми
және өндірістік ақпараттармен ... ... ... ... кең ауқымды қамтитын көптілді сөздіктер шығару қажеттілігі де
туындауда. Жақын болашақтағы лексикография-лық ... ... ... әр ұлттық тілдер-ге, соның ішінде қазақ тіліне қатысты да
практикалық маңызы зор жүйесі құрылуы мүмкін.
Сонымен, оқу ... ... пән ... ... ... сөз болған мәселелер және де осы бағытқа қатысты ... ... ... ... ... ... ... оқу лексикографиясына
байланысты көптеген әрекеттерді компьютер көмегімен толық автоматтан-дырып,
олардың электронды түрлерін көптеп шығару жүзеге асар еді.
Әдебиет
Актуальные ... ... ... М., ... В.Г. О ... ... развития лексикографии (учебная и
общая лексикография в ... ... // ... ... ... М., ... З.Ө., ... О. Қазақша-орысша және орысша-қазақша
оқушыларға, ... ... ...... 2006. – 208 б.
Жұбанов Б.А. Химиялық сөздік ағылшын, неміс, орыс және қазақ тілдерінде.
Алматы: Ғылым, 1988. 200 б.
Исмағұлова Б., Ережепова Э., ... Г. ... ... ... ... ... Алматы: Аруна, 2002. 416 б.
Марусенко М.А. Учебная лексикография // Прикладное языкознание: Учебник
/ Отв. ... ... СПб.: ... ... ... – 528 ... Т., Рақышев А. Медициналық сөздік (орысша-қазақша). Алматы:
Атамұра, 1999. 312 б.
Регинина К.Б., ... Г.П., ... Л.И. ... ... языка. М., 1980.
Салқынбай А., Абақан Е. Лингвистикалық түсіндірме сөздік. – Алматы:
Сөздік-Словарь, 1998. 304 б.
Gougenheim G. ... ... de la langue ... ... M. An ... ... Dictionary. London, 1965.
Ғылыми-техникалық лексикография
және арнаулы сөздіктер түрлері
Қазақ тіліндегі ғылыми-техникалық стиль және оған тән ... ... ғана ... ... ... болады. Себебі техникалық ғылымдардың
қазақ тіліндегі ... ... ... ... түрлі монографиялық
зерттеулер, оқулықтар, мақалалар, баяндамалар, тезистер, патенттер т.б. сан-
салалы еңбектер арқылы танылады. Ал бұл ... саны мен ... ... әлі де ... ... ... бөлуін қажет етеді. Ана тілімізде
жарық көре бастаған жаңа бастама-ның нәтижесінде тілімізге жаңа ұғымдар ... жаңа ... келе ... ... ... ... тілінің
жалпы лексикография саласының жаңа бағыты ... ... ... да өз ... құра ... ... болады.
Үнді-еуропа тілдерінде, соның ішінде орыс тілі бойынша аталған бағыттың
өзіндік даму тарихы мен теориялық және ... ... ... осындай жайттарды ескере отырып, осы еңбекте ... ... ... ... ... сөздігін құрастыруға
қойылатын кейбір талаптарға қысқаша тоқталмақпыз.
Арнаулы сөздіктерді құрастырудың теориясы мен практи-касы ... ... ... ... ... ... жүр. ... сөздіктер арқылы баспа материалдары мен әртүрлі мекеме орындарының
іс қағаздарын-да көрініс тапқан терминдер мен әр ... ... ... номенклатуралық деректер жайлы түсініктеме мен анықтамалар алуға
болады.
Арнаулы сөздіктер белгілі бір сала ... мен ... ... үшін ... ... сала ... ... біртілді
және аударма терминологиялық сөздіктер, идентификаторлар ... ... ... ... мен ... Арнаулы сөздіктердің екінші тобына, яғни электронды машина-
лардың қажеттіктеріне – түрлі ... ... ... арнал-ған
ақпараттық-іздестіру тезаурустары (Тезаурус...) және ... ... ... ... ... ... ... (Убин) әртүрлі
типтері (негіз сөздердің, тіркестер-дің, қосымшалардың) жатады.
Кез келген тілдің дәстүрлі түсіндірме ... ... ... ... ... ең алдымен, белгілі білім аясы мен
техникалық саланың маман-дарына ... ... ... ... ... ...... білімді мамандар мен
ғылыми әдебиеттерді аударумен айналысатын кәсіптік аударма-шыларға арналып
құрастырылады. Жоғары ... ... ... ... тек қажетті
деген сөзді тауып алуға ғана мүмкіндік туғызып қоймай, сонымен бірге оның
ұғымын ... және ... ... ... ... синонимдік
сөздер мағыналарын ажыратуға да мүмкіндік туғызады.
Ғылыми мақалаларды бір тілден екінші тілге ... ... ... ... ... және ... ... сөздіктер де аса қажет (Берков; Убин).
Ғылыми-техникалық терминологиялық ... орта және ... оқу ... ... әр ... өндіріс орындары мен
ауылшаруашылық аясындағы сан-салалы мамандарына және радио мен ... және т.б. ... ... деп те ... ... Сол
сияқты, мектеп оқушыларына арналған ... ... де ... шығарылып жүр. Бұл сөздіктердегі деректерді оқырманға ұсыну
тәсілінде оқушының жас ерекшелігіне ... ... бөлу ... ... ... ... ... сөздікте қызықтыру элементтерімен
бірге суреттердің, сызбалардың орын алуы. Соңғы кездерде ғылыми-көпшіліктік
терминологиялық сөздік-термен қатар бөлек ... ... ... ... арнаулы ғылыми сөздіктер де жарық көре бастады. Әдетте, мұндай
сөздіктердің ... ... ... ... ... ... жасалады.
Қолданылу аясына қарай, тіркейтін, түгелдейтін – «узус» ... ... ... көздейтін – регламенттеуші сөздіктерін, оқу
жұмысын көздейтін – мәлімет беру, ... ... ... жарық көруде (Герд, 1973; 1996).
Тіркеу міндетін атқаратын немесе «узус» атты сөздіктер ... ... ... ... ... бар. Ол сөздіктер
сол кезеңге және қарастырылып отыр-ған білім саласына тән ... ... ... ... және нормативті емес деп екіге
ажыратылады. Нормативті терминологиялық сөздік-терге айқын түрде мысал ... ...... ... ... мен ... ... сөздігі.
Стандарт терминдердің анықтамалары бойынша олар – ... ... ... ие ... ... типтегі терминологиялық сөздіктер.
Терминологиялық стандарттардың құрамы – ... ... және ... бөлік-терінен тұрады.
Кіріспе бөлікте стандарттың таратылу аясы, стандарттау нысанын ... ... ... терминдер, синонимдер мен аударма баламалары
жайлы мәліметтер беріледі.
Стандарттың негізгі бөлімінде осы стандартқа қатысты қабылданған ұғымдар
жүйесіне ... ... ... мен ... ... ... ... әр білім саласы бойынша ... ... ... түрде шығарып тұратын ұсынылған
(бекітілген) терминдердің жинағын да жатқызуға болады. ... ... ... ... ... ... ... және аударма
баламалары да беріледі.
Нормативті терминологиялық сөздіктерді ... аса ... ... ... ... бір ғана терминдік жүйеге қатысты болуымен бірге
олардағы терминдердің ... ... ... ... ... бекітілуі
қажет.
Арнаулы ғылым-техникалық терминологиялық сөздіктерді құрастырудың алға
қойған мақсатына қарай, олар – ақпарат-таушы және ... деп ... ... сөздікке мысал ретінде ақпарат-тық-іздестірудің
тезаурустық ... ... ... Ақпараттық-іздестіру тезаурусы деп
біртілді қадағаланып отыратын және лексикалық ... ... ... ... ... ... Бұл ... бір ғана тілдің лексикасына
негіз-деліп, ақпаратты өңдеу мен іздестіру ... үшін ... ... ол – ... ... ... ... жеңілдететін сөздік түрі. Ондай тезаурус терминдер арасындағы
мағыналық, семантикалық қатынасты да толық ашуға жәрдем етеді. ... ... ... бірлігі – терминдер мен дескрипторлар. Оның
әліпбиленген лексика-семантикалық бөлігі – бір ... ... ... ... ... ... сөздік мақала термин-
дескриптордан бастама алады да, ал одан ... ... ... ... беріледі және негізгі дескриптормен грамматикалық
немесе ассоциативті ... ... ... да ... ... ... сөздіктерге жататындар: классификаторлар,
рубрикаторлар, жиілікті сөздіктер және ... жүйе ... ... ... ... мен техниканың жүздеген нысан
атаулары және олардың сипаттамалары беріледі. Мұнда ең ... ... ... ... ... пен ауылшаруашылық
өнімдер атауларын және т.б. ... ... ... терминологиялық
сөздіктер ішінен әсіресе рубрикатор-сөздіктер маңызды рөл атқарады.
Рубрикатор-сөздіктерді сала ... мен жеке ... үшін ... ету ... ... құжат деп те атауға болады.
Рубрикаторлар, көбінде, өндірістік саланың негізгі бағыттарының
жүйеленген ... және ... ... мен ... ... ... ... өзіне тән маңыздылығы – кейбір бөлектелген
терминдердің жиіліктерінің қамтылуы. Сөздіктің ең бір аса ... ... ... тақырып-тық сипатта қамтылуы. Егер ... ... ... аяны ... болса, онда ол көпсалалық сөздік деп аталады. ... ... ... шығуынан тарсалалық сөздіктер жасау қажеттігі
туындайды. Мұндай ... ... ... ... ... ... құрастыру да аса ... ... ... ...... бір сала ... анықтама
құралы болу және барлық терминдерді қамтумен ... ... ... ... ... ... ... ғылыми және тәжірибелік
жұмыстары үшін аса қажет деп саналады.
Терминологиялық түсіндірме сөздікте ғылым мен техника-ның дамуынан пайда
болатын ... жаңа ... ... ... берумен қатар, ол
ұғымдардың анықтама-лары да қамтылуы қажет.
Терминологиялық сөздіктердегі мәліметтерді реттеуде дәстүрлі әліпбилік
және ұялы әдістермен ... ... әдіс те ... табады. Яғни
мәліметтерді реттеуде терминнің мәтіндегі жиі немесе сирек кездесу сипаты
да ... ... ... ... ... ... ... сөздіктер
біртілді және екітілді, үштілді және ... ... ... ... ... ... Түсіндірме сөздіктерді жасаудағы негізгі ұстаным –
терминнің жаңа мағынаға ие болуы.
Терминологиялық сөздіктердің әртүрлі типтерінің ... ... ... ғалымдар мен маман-тәжірибешілер-дің қаламынан жарық көрген
белгілі бір білім саласына қатысты ... ... ... ... ... Сонымен бірге қажетті материалдар-дың
қатарына жоғары оқу орындарының ірі ... да ... ... тек осындай оқулықтарда ғана ғылыми ұғымдар мен ... ... және ... ... ... ... мен ... да сөздік-
терде берілген салалық терминдердің ... ... ... сөздіктерде орын алуы қажет.
Ғылыми-техникалық терминологиялық сөздіктердің лекси-калық қорына
қосымша ретінде реферативті ... ... ... ... ... мен іс ... ... де қамтылып алынады.
Аса «қысылған» және шоғырланған түрде берілген ... ... ... ... жеткілікті түрде түсініктеме бере алады.
Сол сияқты, Ресейдегі ғылыми-техникалық әдебиеттер мен құжаттарды аудару
орталығының жүйелі түрде шығарып ... ... ... терминов» атты
еңбектің материал-дары да терминологиялық сөздіктер үшін ... ... ... ... ... жөндеуге қатысты және т.б. салалық,
ведомстволық нұсқаулар мен ... ... ... ... ... ... сөздік жасаудағы атқаратын
рөлі де айтарлықтай ... ... түзу ... ... ... таңдалып алынған
терминдер негізінде ... ... ... ... ... ... ... сөз, сөз тіркес,
қысқартулар, символдар және олардың тіркестері. Әдетте ... ... таза ... ... түзіледі, яғни әрбір сала
мамандарының жеке көзқарасындағы негізгі және ... деп ... ... ... ... ... әдіс ғылыми әдебиеттерді талдауға
негізделмеген, тек қана субъек-тивті пікірлік ұстаным екені белгілі.
Ғылыми-техникалық ... ... ... ... маман-
лексикограф ең алдымен баспаға дайындалып жатқан еңбектің хронологиялық
шеңберін анықтап алуы ... ... жаңа ... мысалы, есептеу
техникасы, радиофизика, биофизика үшін мұндай мәселе онша өзекті болмауы да
мүмкін, себебі, ондай сөздікке енетін кез келген ... ... ... ... Ал ... ... – физика, механика,
математика, химия, биология, география, геология және көптеген ... ... ... ... Бұл ... орысша мәтіндері
өзінің тарихи дамуында 150–200 ... ... ... Осы ... ... ... табатын терминдердің хронологиялық тәртібі
маңызды мәселелер қатарына жатады.
Аталған ... ... және ... ... ... ... ... ол ертеректегі мәтіндерді дұрыстап оқи білу,
оның мағынасын дұрыс түсіну және бір ... ... ... ... ... қатысты деуге болады. Ежелгі терминдердің де ... ... ... ... ... мәселе әр уақытта да өз
құндылығын жоймайтыны белгілі.
Кейбір ғылыми кітаптар мен мақалаларда өткен кезеңдердегі ... ... ... болып жатады. Мысалы, ХІХ–ХХ ғасырлардағы
ғалымдардың зерттеулеріндегі ұғымдар мен концепцияларына көңіл бөліну ... ... ... ... ... ... қатысты болады.
Егер мұның бәрі тек қана табиғи тіл арқылы ғана іске асатынын ... ... ... қорды таңдап алу кезеңдік сипатта
болатынына және тіл туралы ғылым тарихының өзі де ... ... ... көз ... ... орыс тіліндегі ғылыми-биологиялық мәтіндердің тарихы мынадай
кезеңдерге бөлінеді:
1) XVIII ғ. ... ХІХ ғ. ... ... – орыс ... мәтіндердің бастапқы қалыптасу кезеңі;
2) ХІХ ғ. 50–60-шы жылдары мен ХХ ғ. бастапқы кезеңі (10-20-шы жылдар);
3) ХХ ғ. 10–20-шы жылдары мен ... ... ... ... ... ... ... сөздік құру барысында ХХ ғ.
алғашқы жылдарына дейінгі биологияға қатысты терминдерді ... ... ... болмайды (Герд, 1986; 1996).
Әрине, терминологиялық сөздікті пайдалану кезінде сол ... ... ... ... оның ... дейінгі мәліметтер табылып жатса, әртүрлі
сөздіктермен әрекет етудің қажеттігі болмас еді. Әрі тарихи тұрғыда ... ... ... әрі ... ... ... ... рөлін атқаруға қатысты төмендегідей екі түрлі маңызды ой-пікір
бар.
Біріншіден, ол – ... ... ... ... күрделі және әрдайым
құбылып тұру сипаты, ұғымдар иерархиясының күрделі эволюциясы, ... мен ... ... өзгеру сипаты, ұғымдар арасындағы терминдердің
тұрақсыз үлестірілуі, терминологиядағы ... ... ... ... лексикалық параллельдерін ескере отырып,
оқырманға қазіргі терминология жайлы молынан мәлімет беру ... ... даму ... қамтитын өзінше бір бөлек арнаулы
сөздік болғаны жөн.
Қалай болғанда да терминологиялық сөздіктің хронология-лық төменгі шегі
жайлы мәселе әлі де ... өз ... ... тұр. ... ... ... ғ. ... жылдары ма немесе ХІХ ғ. мен ХХ ғ. аралығы ма? Оны тек нақты
білім және ғылым ... ... ... ... даму ... ғана ... болады (Герд, 1973; 1996).
Терминологиялық сөздіктердің сөзтізбесін ... ... ... ... жолы – нақты ғылым мен ... ... ... ... ... ала ... ... мәтіндерді логика-ұғымдық
тұрғыда талдау тәсілі ... ... ... ... ... қажетті шарт деуге болады.
Терминологиялық сөздіктердің құрылымы жайлы мынадай екі негізгі мәселені
атауға болады:
1) терминологиялық сөздіктегі ... ... ... ... ... сөздіктегі жеке фрагменттердің құры-лымы жайлы
мәселе.
Бірінші мәселеге байланысты ... ... ... ... материалын
ұйымдастыруға қатысты ғылыми-техника-лық лексикографияда ... ...... ... идеографиялық жалпы
принциптер қарастырылады.
Терминологиялық сөздіктердің ... ... ... ... белгілі. Бұл ұстаным кез келген ... ... ... ... ... ... жағынан көптен бері өзін-өзі ақтап
келеді.
Осы айтылғандарға ... ... ... практикалық
мұқтаждығынан аңғаратынымыз, ол терминоло-гиялық сөздіктердегі ... тек ... ... ... ... ғана ... бірге логика-ұғымдық негізде, яғни ұғымдардың ... ... ... ... принципте жасалуы-ның қажеттігі. Бұл
жердегі идеографикалық принципті қайсыбір ... ... ... ... жазу
деп түсіну керек. Мұндай принцип ... ... ... ... даму
қисынына сәйкес келуімен бірге, терминді мағынасы ... ... ... ... да ... ... ... нақты ғылымдар мамандарына,
көбінде, қайсыбір ұғымның қалай және қандай сөзбен аталатыны ... ... ... ... ... байланысы бар екендігін білу қажет
болады. Маманның ... ... және ... ... ... ... ... жағынан ұқсас болып келетін ертеректердегі
зерттеулердің ... ... ... де ... мүмкін
(Герд, 1996).
Идеографикалық принциппен құрастырылған терминоло-гиялық сөздіктің
негізгі құрамы – сол ... ... ... ... ... ... ол ... түрде берілген және ... ... ... ұғым ... ... Аталған ұғым сөздіктің жалпы ... ... ... өз ... ие ... ... ... тезаурусында
(Roget’s thesaurus…, 1978) сөздік мақаланың басы ұғымның коды ... ... сан) және осы ... ... тірек сөзбен басталады. Тірек сөзден
кейін сызықша және сөз ... ... ... ... сол ... беріледі.
Доризайфтың неміс тілінің идеографиялық сөздігінде (Dorn Sejf, 1958, S.
211) әрбір сөздік мақала белгілі бір тақырыптық топтағы ... ... әрі ... ... ... ... ... жатқан осы ұғымды
білдіретін сөздің синонимдік баламалары берілген.
Ғылыми-техникалық терминологиялық ... жеке ... ... ... ... ... ... мақала, көп
жағдайда, мынадай бөліктерден тұрады (Герд, 1996, 297-280):
1) сөздік мақаланың аты;
2) терминдердің грамматикалық сипаттамасы;
3) терминнің қолданысына ... ... ... мен ... ... ... ... семантикалық сипаттамасы.
Әліпбилік принципте түзілген терминологиялық сөздік ... ... және ... ... құрылымына ұқсас болып келеді.
Терминология-лық сөздіктерде сөздік ... аты, ... ... ... да, олар тек ... ... ғана ... сөз тіркестер,
сөздер мен символдардың комбинациясы, аббревиатуралық қысқартулар ... ... ... ... ... ... ... сипат-тамасын беру оның мағынасының
логикалық ... ... ... ... терминологиялық сөздіктердегі
балама-сы арқылы іске асады. Терминнің әрі ... әрі дәл ... ... оның ... құрылымын сипаттаудың ең бір
тиімді жолы деп саналады.
Терминологиялық сөздіктерде ... ... ... ең ... ... ол әрбір ұғымның типіне қарай, бірізділікті сақтай отыра, алдын
ала белгілі параметрлерге сүйену. Терминнің толық түрдегі лексикографикалық
анықтама-сын ... ... ... ... ұстаным еткен жөн: логика-
ұғымдық сызбаға алдын ала талдау ... ... шығу ... ... ұғымға
тән маңызды белгілерді анықтау, осы ұғымның басқа ... аясы ... ... ... ... ... ісімен айналысатын аудармашыға қажетті сөздің
баламасын табумен қатар оның синонимдерін де іздеп табу қажет ... ... ... тұрғыда кеңірек танып, сөздікте ... ... да ... ұғымды білдіру-білдірмеуіне көз жеткізу керек
болады (Берков;Убин).
Ғылыми-техникалық ... ... ... терминнің
анықтамасын тұжырымды етіп беру үшін мынадай ережелерді басшылыққа алған
жөн саналады (Герд, 1996, 298-300):
1. Термин ... ... ... ... мен нысандар анықтама ішінде
қамтылуы қажет және, керісінше, анықтамада сөз болатын барлық ... ... ... ... ұғымдар мен нысандарға сәйкес келуі қажет.
2. Терминнің анықтамасында пайдаланылатын белгілер қарастырып отырған
тақырыптық ая бойынша ең ... және ... ... ... ... ... басқа бір терминнің анықтамасына ... ... ... егер ол ... ... тағы да ... ... анықта-масына жүгінсе, оның шегі табылмай, қайта оралып алғашқы
терминге келуіміз де мүмкін.
4. Анықтамада пайдаланылған терминдер осы сөздік ішінде ... ... ... да ... және бірізді түсінігі болуы шарт. Егер
анықтамада ... ... ... ... ... ... ... немесе ол жалпы-пәндік термин болса, онда арнайы ... ... жөн. ... ... ол терминнің түсінігін қандай әдебиеттен
оқып-білуге болатыны айтылуы керек.
5. Терминнің нақты мағынасын ашатын ... ... үшін оның ... ... ... ... жете ... аса маңызды.
6. Терминдердің анықтамалары, көптеген жағдайда, сөздермен қатар,
математикалық және ... ... мен неше ... безендірілулер арқылы
көрініс табады.
7. Әр елдің тілдеріндегі бір ғана терминнің ... ... ... ... болмауы мүмкін. ... ... ... ... бір ... сүйенетін болсақ, оның қай ... ... ... ... ... ... ... сөздіктерде терминнің
семантикалық сипаттамасы синонимия, антонимия, ... ... ... ... арқылы толықтырылуына әрі
кеңейтілуіне болады.
Ғылыми-техникалық терминологиялық сөздікте нақты білім, ... ... ... ... ... табуы қажет. Ғылыми мәтіннің
семантикалық мазмұнын дәл ашу, сол сала ... ... ... ... ... ... ... түсінігін сипаттау сол ғылыми сала
маманының ісі де, ал оны барынша дәл және ... ... ... ... ... ... Ал ... терминологиялық
сөздіктің сапасы сала маманы мен тілші-лексикограф маманының бірлесе әрекет
жасауының нәтижесі деуге болады.
Жоғарыда аталған арнаулы ... ... ... ... ... тұжырымдар қазақ ... ... ... оң ... тигізеді деген ойдамыз.
Әдебиет
Алексеев П.М. Статистическая лексикография. М., 1975.
Берков В.П. Вопросы двуязычной лексикографии. М., 1973.
Герд А.С. ... ... ... Л., ... А.С. Научно-техническоя лексикография // Прикладное языкознание:
Учебник. Отв. ... ... СПб.: ... С.-Петербург. ун-
та, 1996. С. ... ... ... М., ... И.И. ... ... словарь. М., 1989.
Лексикография саласындағы
автоматтандыру тәсілі
Лексикографиялық нысанның ерекше түрі ... ... ... ... ... ... ... болуы бірнеше себептермен
түсіндіріледі. Біріншіден, ол ... ... ... ... лексикографтар мен аудармашылардың еңбек өнімді-лігін арттыру
жолдарын іздестіру қажеттігін ұғыну деуге болады.
Лексикография саласы адамның қызметтерінің ішіндегі ең бір көп ... ... ... ... ... ... Сөздіктердің кейбір түрін түзу
жұмысында оны сапалы аяқтап шығу үшін бірнеше онжылдықтардың өтуі ... ... ... ... ... ... ... қатысты болуы кездей-соқ жағдай
емес. Неше түрлі сөзтізбелерді, ... ... ... ... мен ... ... ... сай өмірге келтіру үшін
оларды ЭЕМ көмегімен түзудің қажеттігі қазіргі ... дау ... ... ... ...... мәтінмен әрекет етуінде
оның еңбек өнімділігін арттыру. Мысалы, лексикографиялық түсініктеме ... ... тіл ... ... ... және ... жұмыстарын
автомат-ты сөздіктер арқылы іске асырған жөн. Яғни ... ... ... ... ... ... ... айырықша сөздік түрі деуге болады. Оның ...... ... ... жүйесінде қолданыс табу.
Кез келген автоматты сөздіктердің ... ... ... ... ... Мұндай сөзтізбе семантикалық баяндау ... ... ... ... ... ... бірге тілдік базаның бірден-бір
құрастырушысы да бола ... ... ... ... ету жүйелерінде
түзілетін сөздіктер өз құрамында тиісті білім базасына (тезаурус, ... ену ... ... ... ... сөзтізбе-лерді сақтай
алады. Ал машиналық аударма жүйелеріндегі сөзтізбелер мәтінге лексикалық
және синтаксистік талдауды іске ... үшін ... ... ... және ... ... ие лексикалық бірліктерді өз
құрамында қорландырады. ... ... ... ... әртүрлі мағыналарды,
синтаксистік және семантикалық ережелерді ... ... де өз ... енгізуілері қажет. ... ... ... ... жүйесінің білім базасын құрайды.
Кез келген тәжірибелік жүйе жұмысы да өз құрамында білім базасына жол
салатын сөзтізбе болуын ... ... ... өз жадына ендіруге бейімделген жүйелердегі
сөзтізбе құрамында сөзтұлғалардың жазылуы мен оның транскрипциясы да орын
алады.
Түсіндірме типті ... ... ... ... сөздік жобасының
принциптеріне сүйене отырып анықталады. ... ... ... ... ... ... ... арналған болғандықтан,
олардың көпшілігі терминологиялық лексиканы қамтулары тиіс. Ірі автоматты
аударма сөздіктің нәтижелігін арттыру үшін оған ... ... ... ... ... ... қажет. Яғни жақын тақырыптық аядағы
аса жиі қолданыстағы жалпы лексика мен жалпығылымдық, ... ... ... ... ... Жалпы-лексикалық қор, ең алдымен,
техника саласындағы мамандарға ... ... ... ... ... ... өз саласына қатысты лексиканы жақсы ... ... ... ... қажетті дәрежеде біле бермейді.
Автоматты сөздіктің міндеті ... ... ... ... жасау болғандықтан, оның құрамына ... ... ... ... ... ... жататындар: стандарттанған және
ұсынылған, сол сияқты ұсынылмаған, тұрақтанған ... ... ... терминдер.
Автоматты сөздіктің құрылымын анықтау жолында мынадай негізгі ... ... ... ... ... ... ... бірлігінің тұрпатын анықтау;
2) тілдік бірлікті сипаттауға қатысты ақпарат жиынтығын анықтау;
3) автоматты сөздік ... ... ... ... ... таңдау.
Автоматты сөздік үшін оның сөзтізбесінің негізгі бірлігін таңдау маңызды
мәселе болып саналады. Жалпы ... ... ірі ... сөзтізбенің
негізгі бірлігі – негіз сөз ретінде алынады. Ал әрбір сөзге қатысты ... ... ... ... ... ... ретінде немесе басқы
тілдік бірліктітердің тіркесімдік сипатына мысал ретінде беріледі.
Автоматты аударма сөздікке қатысты сөзтізбенің негізгі ... ... ... ... ... ... сипатта болулары
қажет. Сөзтізбедегі лексикалық топтың 80 пайызы сөз тіркестерден тұратыны
да ... ... Ең ірі ... ... сөздік, көпшілік жағдайда,
дәстүрлі терминологиялық сөздіктерге жүктелетін мәселелерді шешуге ... банк ... ... Мұндай автоматты аударма сөздіктерде
дәстүрлі ... ... ... сөз тіркестерінің жоғарғы
шегі анық болмауынан, оларда сөз тіркестер саны тұрақсыз болып ... ... ... ... дербес мақала ретінде жеке сөйлемдер мен
мәтін үзінділері де есепке алынады.
Аударма ... ... ... мен ... аталған
түрлері, әдетте, дәстүрлі лексикографияда қолданыла бермейді. Ал автоматты
сөздіктер үшін мұндай тәсіл белгілі ... ... ... ... ... мәтіндер бойынша жартылай автоматтанған аударма жасау тұстарында
автоматты аударма сөздіктер өздерін тиімді құрал ... ... ... заң ... ... белгілі бір мәтін бөліктері онша
өзгеріссіз қайталанып ... ... ... ... ... ... ... аса күшті ЭЕМ
негізінде ... ... ЭЕМ ... ... көлемді сөз
тіркестерінен тұратын тілдік ақпараттармен нәтижелі әрекет ете ... ... ЭЕМ ... ... оның ... ... ... байланысты
екендігін ескере отырып, оны үнемді пайдалануды әр уақытта ескеру қажет.
Екітілді және көптілді лексикография жағдайында сөздік бірлігін ... ... ... және ... ерекшеліктерімен анықталады.
Айырғыш, аналитикалық, кейбір жағдайда флективті-аналитикалық тілдер
типтерін өңдеуге қатысты тез әрекет ... ... ... «Мәтін –
Автоматты сөздік» өзара әрекеттесу сызбасы өзін-өзі ақтап жүргенін ... ... ... ... ... белгілі бір сөзге тіркелген ... ... үшін ... ... дейінгі морфологиялық талдау
алгоритмінің көмегіне сүйенбеуге де болады. Сонымен ... ... ... ... мәтіндегі «егіздерімен» теңдестіру аса
үлкен жылдамдықпен іске ... Ал ... ... ... тілдердің автоматты сөздіктерінің бас ... ... ... ... ... көлемі кенет ұлғаяды да мәтін бойындағы
сөзтұлғаны ... ... ... ... ... ... ... орыс тіліндегі зат есім сөз 12-ге дейін, ал
етістік сөз, егер түр корреляциясын есепке ... ... 188 рет ... ... екен. Түркі тілдерінде есім түріндегі тілдік бірлік
саны, теориялық жағынан алғанда, тұлға өзгерісіне шексіздікке дейін ... ... ... ... ... компрессиялау (қысу)
қажеттігі туындайды.
Бұл мәселенің шешімі екі түрлі тәсілмен іске асуы мүмкін:
1) лингвистикалық (алгоритмдік);
2) техникалық.
Линвистикалық тәсілде негізгі назар ... ... ... және оның ... ... және ең ыңғайлы баламасын табуға
әрекет етіледі. Синтетикалық, флективтік және ... ... ... ... компрессиялау тәсілдері қолданылып жүр. Олардың ішінен ең
нәтижелі деген әдіс ... ... ... ... ... сөздігі
ретінде қалыптастыру болып табылады. Мұндай автоматты сөздіктерді, әдетте,
тілдік бірліктің екі түрі ... сөз ... ... негіз сөз және ерекше
тұлға. Басқаша айтқанда олар сөз негізінің ... ... ... ... ... жасалған бір сөздің тұлғалары) тәсіл ... ... ... тұлға бірліктер автоматты сөздіктің ... ... ... ... ... ... ... тілдер үшін парадигма ретінде тек жалғыз негіз
сөзді ғана енгізу ... бола ... Бұл ... тек ... қолдану кезінде де жеткіліксіз.
Дамыған флексиясы бар орыс тілінің лексикалық жүйесін ... ... ... ... ... Мысалы, А.И.Герцен атындағы
РМПУ-дың инженерлік зерт-ханасы зерттеп дайындаған және СИЛОД жүйесінің
өзегі ... ... орыс ... ... ... ... ... сөздер
мен типтік парадигмдер сөздігі негізінде құрылған. Ал GETA ... ... үшін орыс ... ... жеті ... іске қосу ... қарастырылған: алғашқы екеуі – екі негіз сөздер сөздігі, келесі екеуі –
өзгеріске ұшырамайтын сөздер мен ерекше тұлғалардың, тағы да ...... ... ... және ... бір ...... тіркесім
сөздігі.
Сөздік мақаланың құрамы әртүрлі автоматты аударма сөздіктерде өзгеше
және олардың ... ... ... 99-ға дейін құбылып отырады.
Аталған ... әр ... ... және ... ... автоматты аударма сөздік өзінің сөздік мақаласының ішінде ... ... ... ... басқы сөз, оның бір немесе
бірнеше шеттілдік ... ... ... тақырыптық қатыстылығы және оның
шеттілдік баламалары, грамматикалық ақпарат, формалданбаған түсінікте-мелер
немесе стандарттанған дефинициялар, мәнмәтіндер, лексикалық тіркесім, басқы
сөздің семантикалық ... ... ... коды ... ... стильдік мәнері (бояюы), лингвогеографиялық шектелуі, тірек
сөздер (егер басқы лексикалық бірлік сөз ... ... ... көздер,
сөздік мақаланың авторы, датасы, әртүрлі қызметтік ақпараттар.
Сөздік мақаланың ... ... ... ... қатынастар арқылы мақаланың өзіне тән жазылу ерекшелігі
анықталады.
Деректер базасында орын ... ... ... ... морфологиялық,
синтаксистік, семантикалық және функционал-дық деңгейлерде сипаттамалар
жиынтығы ретінде көрініс ... ... және ... ... ... ... ... мағынасын анықтау үшін
және оның сөйлемдегі синтаксистік қызметін белгілеу ... ... ... ... ... ... ... баян етеді
де, ал функционалдық ... ... ... ... ... ... анықтайды.
Қазіргі кездегі мәтінді автоматты өңдеу жүйелерінде лексикалық бірліктің
жоғарыдағы сипаттамаларына тиісті орын беру мақсатында сөздік мақалалардың
төмендегідей үш түрі ... ... ... алдын ала белгіленген, бірыңғай қатал құрылымды сөздік мақала.
Бұл құрылым ... ... ... ... ... ... ... қамту әрекетін алдын ала қарастырады. Мұндай тәсіл лексикалық
бірліктерді баяндаудың барлығына ... ... Оған ... ... және функционалдық өлшемдері де қоса беріледі. Аталған тәсіл
бойынша лексикалық ... ... тек ... ... ғана
шектелуі мүмкін. Бұл жағдайда лингвистикалық ақпараттық базаға семантикалық
ақпарат ... ... жеке ... ... енгізіледі.
Осындай мақала құрылымында ақпараттың барлық типтері мен олардың байттық
көлемдік шегі ... ала ... ... Егер ... нақты типі
анықталмаса, оның орны «бос» күйінде сақталуы қажет. Мұндай қатал ... ... ... ... ... көлемі 225 байт алатын SYSTRAN
жүйесіндегі мақаланы ... ... Бұл ... ... ... ... ... ретінде құрылған. Әрбір сөздік мақала өз бойында ... ...... ... ... ... ... лексикалық
бірлікті баяндау тәсілі (жаңадан қосу, түзету, ...... ... негізді баяндау (описание);
В – септік жалғаулар жайлы морфологиялық ... ... ... және ... – меңгеруге қатысты мәліметі бар синтаксистік кодтар;
Д – семантикалық кодтар;
Е – сөз алдында ... ... ... ... ... сөз ... бұл орын бос ... керек);
F – балама ерекшеліктерін баяндауды қамтитын негізгі аудармалар.
Сөздік мақаланы құрудың мұндай әдісі ондағы ақпаратты оңай ... мен ... ... ... ... ... тудырады. Себебі
автоматты сөздікте әрбір ақпараттың алдын ала ... өз ... ... ең ... ескерілмеген жаңаша типті ақпаратты базаға
енгізу сөздік мақаланы, сөздікті және базаның өзін түбегейлі ... ... ... ... автоматты өңдеу жүйелерінде лексикалық бірліктің
барлық сипаттамалары толық қамтылғаны жөн болады. Әрине ... ... ... ... ЭЕМ-ның қомақты жадын алуымен бірге автоматты
сөздікті орналастырудың қиындық тұстарына әкеп ... ... бола тұра ... көбінде, ақпаратты екінші рет қайталаудан сақтандырады.
2. Оң жақ шегі ... ... ... ... ... ... мақаланың
баяндалуы – «таңба – мағына» принципі бойынша жүзеге ... ... ... ... ... ... бірізді сызба арқылы жүргізіледі
және лексикалық бірлікке қатысты барлық ақпаратты ... ... ... ... ... саны нақты мәліметтердің типіне
байланысты болып келеді. Ал лингвистикалық бірлікті баяндау ... ... ... ... ... ... ... функцио-налдық және т.б. көзқарастағы
сипаттамаларға сүйенеді. Әрбір ... ... ... ... ... қарай, белгілер саны жекеленіп алынады. Мысалы, зат есімді
актуалдаудың функциясын атқаратын детерминативтер класы осы ... ... ... ... ... ... ... сөздің ішкі
топтары, өзгеріп түрленуі, орналасу қалпы және ... ... «оң жақ ... ... болуы мақаланы тек ЭЕМ-ға
(компьютерге) дайындау кезіне ғана сәйкес келеді. Ал ... ... ... ... ... алғашқыдай қатаң құрылымға ауыстыр-ылуы
керек.
3. Иерархиялық құрылымдағы сөздік мақала. Бұл тәсіл ... ... ... ... ... ... шығаруды алдын ала көздейді.
Мұндай жағдайда ... ... ең аз ... ... ... түрдегі тіркелген ақпараты бар сөздікке ену тізімі және мағыналар
сөздігі.
Лексикалық бірліктің ... ... ... ... қолданылу
мүмкіндігін ескере отырып, оның барлық ... ... ... ала ... яғни ... ... және ... анықталады. Мәтінді автоматты өңдеудің барлық түрлерінде тікелей
қолданылатын жоғарғы деңгейдегі сипаттамалар мақала ... ... ал ... ... ... ... семантикалық) жеке файл
түрінде көрініс табады. Мұндай жағдайда сөздік мақалада ... ... ... ... ... ... мақала құрылымындағы «енетін» сөздік құрамына
жататындар: басқы лексикалық бірліктің өзі ... ... ... ... ... ... типоло-гиялық ерекшелігіне, грамматикасына
байланысты лексика-синтаксистік код; сөздің әртүрлі заттық аяда атқаратын
қызметінің ерекшелігін анықтайтын ішкі тіл ... ... ... ... ... ... яғни сөзтізбе өз құрамында лексикалық
бірлікті және сөйлемге алғашқы синтаксистік (синтагмалық) талдау жүргізуге
қажетті морфологиялық ... ... ... ... ... ... деңгейі – әрқайсысына синтаксистік және морфологиялық
ақпарат тіркелген лексикалық бірліктің өзінен ғана тұруы ... Бұл ... деп ... ... екі ... тұрады (Беляева, Герд, Убин, 324-
с).
Енді автоматты аударма ... ... ... ... ... ерекшеліктеріне тоқта-лайық.
Бұл мәліметтер Бүкілодақтық аударма орталығында (ВЦП) зерттеліп, сөздік
мақаланың құрылымына енгізуді көздейді. Сөздік мақала 13 ... ... зона ... ... ... ақпаратпен өзіндік ереже бойынша
толтырылады.
1-зона. Сөздік мақаланың атын ... ... ... Бұл зона ... ... ... ... жүзеге асады және оны ... ... ... орындалады. Мақаланың аты ретінде: морфема, жеке сөз,
канондық тұрпат-тағы сөз тіркесі немесе ... ... ... ... Толық
омонимдер үшін рет саны тіркелген әртүрлі сөздік мақалалары құрылады.
2-зона. Сөздік мақаланың атынан кейін оның лексика-грамматикалық ... ... ... Бір ... лексикалық бірліктер сөз
таптарына ... ... ... ... Бұл ... ... ... бірнеше категориялық белгілері бойынша тағы да ішкі
кішігірім топтарға ... Сөз ... ... сөйлем ішіндегі
атқаратын қызметіне қарай типтік түрлерге бөлінеді.
2а-зона. Орыс тіліндегі аударма эквиваленттің лексика-грамматикалық
класын анықтайтын ... ... орыс ... аударма эквивалентінен кейін
оның лексика-грамматикалық класы жазылады. Орыс ... ... ... ... ... енуі ... мақаланы «керісінше»
орын ауыстыру үшін қажет, яғни шет тілі – орысша сөздік мақаладан автоматты
түрде, керісінше, орысша – шет тілі ... ... ... ... Морфо-грамматикалық ақпарат зонасы. Бұл зонада басқы ... сөз ... ... құру ... ... да, ... кез келген мәтіндік тұрпатты іздестіру мүмкіндігі туады.
Морфо-грамматикалық ақпарат зонасында басқы лексика-лық ... жазу ... ... ішкі зона ... Мұндай
мүмкіндік жеке тұрған сөздерге де, сөз ... де ... ... Орыс ... ... ... ... зонасы. 2а-
зонадан кейін 3а-зона енгізіледі. Яғни лексика-грамматикалық кластан ... ... ... ... ... ... ... Тақырыптық рубрика (сөзбасы) мен стиль зонасы. Бұл ... және ... ... беріледі. Ондай белгілер көмегімен басқы
бірліктің осы ... ... аясы мен ... ... Осы ... ... ... кірме лексиканың дереккөзіне сілтеме жасалуы мүмкін.
Осындай белгілер мен таңбалардың ... ... ... стилистикалық
ерекшелігі бар монотема-тикалық сөздіктерді немесе ... ... ... ... ... ... ... Әрбір орыс тіліндегі аударма
эквивалентінің алдында осы аударма ... ... ... ... индексі тұрады. Бұл индекс лексикалық бірлік алынған
лексикографиялық дереккөздің сенімділігімен анықталады. ... ... үшін орыс ... ... ... ... ... қабылданған:
А – қайсыбір стандартта (ГОСТ, ОСТ, халықаралық стандарт) бекітілген
немесе оның қолданысын ... ... ... ... ... ... – аударма эквиваленті сенімді және апробациядан өткен ...... ... жаңа терминдер дәптерінде, ... және т.б. ...... ... ... ... баспадан шықпаған
аудармаларда кездескен немесе ... ... ... ... Орыс ... ... ... зонасы. Бұл зона канондық
тұрпатта жазылған сөз немесе сөз ... ... ... орыс
тіліндегі аударма эквиваленттер ... ... ... ... ... орыс ... аударма эквиваленттері бірдей нөмірмен
жазылады, ал басқы бірліктің әртүрлі ... ... ... ... ... ... ... лексикографияда баламасыз лексика деген ұғым бар. Мұндай
лексикаға басқа тілдерге аударылмайтын ... ... ... лексика басқа елдерде жоқ ұғымды білдіретін жалпы ... ... ... ... әлі ... ... жаңа терминдік лексика
болуы мүмкін.
Егер жаңа термин өзінің аударма баламасының мағынасын ашып жатса, оны
орыс тіліндегі ... ... ... ... ... ... ... мақала бір қалыпқа түседі.
7-зона. Түсіндіргіш белгілер (таңбалар) зонасы. Түсіндіргіш белгілер
немесе ... ... ... ... ... үшін және
олардың мәтіндегі қолдану ережелерін сипаттау үшін қажет. ... ... ... ... таңдап алуға да жәрдемі бар. Сөздік
мақалаларын «кері қарай аудару» ... яғни ... ... түрде қалыптастыру жағдайында түсіндіргіш ... ... ... ... ... баламасында да өз орнын ... ... ... бірлікке қойылатын талаптарға сай,
семантикалық терминдер негізінде де көрініс табуы мүмкін. Яғни орыс ... ... ... бас актанттың орнында қандай семанти-калық топтың
өкілі тұратынына нұсқайды.
Семантикалық таңбалар басқы лексикалық бірліктің және оның ... ... ... да ... ... мүмкін.
Лексикалық таңбалар орыс тіліндегі аударма эквивалентті және басқы
лексикалық бірліктің ... ... ... ... ... анықтай алады.
Синтаксистік таңбалар орыс тіліндегі аударма эквивалент-терді басқарудың
синтаксистік ... ... Бұл ... ... орын мен басқы
бірліктің осы мағынадағы грамматикалық әрекетінің ерекшеліктері тұрғысынан
сипатта-лады.
8-зона. Түсінік беру ... ... ... ... үшін ... беру ... қолдануға болады. Автоматты аудару
сөздігі жүйесінде омонимдік және ... ... ... ... беру ең бір ... ... болып табылады.
9-зона. Басқы бірліктің қолдану жағдаятына мысал келтіру зонасы немесе
тілдік бірліктің ... ... ... ... ... ... ... қолдану мүмкіндіктері орыс тіліндегі аударма
эквивалентінде тиісті мысалдармен қамтамасыз етілуі мүмкін.
10-зона. Фразеологиялық зона. Басқы сөзді немесе сөз ... ... ... ... орны ... ... ... жазуға
арналған ішкі зона (подзона) бөлініп алынады.
Мәтінде ... ... ... ... ... жиі ... ... жағдайда лингвистикалық бірліктердің жазылу түрінің санына
қарай, сөздік мақала саны құрастырылады.
11-зона. Сөздік мақаланы құрастырушының немесе ... ... ... ... аты және ... аты.
12-зона. Жазба материалдың немесе пайдаланылған деректердің ... ... ... аударма балама-сына сөздік мақалада оның ... ... ... ... ... ... ... редакциялау мезгілін тіркейтін
зона: жылы, айы, күні.
Жоғарыда сипатталған 13 зонаға ... ... ... ... ... «Автома-тизация в лексикграфии» атты ... ... ... ... ... ... с. ... түсінігінің синтаксистік, семантикалық көпмағына-лығымен “күресу”
үшін және нөлдік деңгейдегі ... ... ... ... ... ... ... қолданылады. Мұндай сөздік бойынша мәтіндегі
сөздер тізбектерін бөліп алып, оларды ... ... ... ... ... ... мағынасы әрбір элементтің мағыналарының
жиынтығы еместігі ескеріледі.
Лингвистикалық ақпараттар ... ... ... сөз ... сөздігі дараланып немесе автоматты сөздікпен бірге енуі мүмкін.
Бұл ... (сөз ... ... ... ... ... құралдардағы тілдік деректердің жеке ... ... ... ... ... ... ... машиналық аударма кезінде мәтін мағынасын
тануға қиындық туғызатыны белгілі. Бұл қиындықты семантикалық ... ... шешу де оңай ... ... ... ... аудару
үшін сөз орамдары сөздігін машиналық аударма жүйесіне енгізу қажеттігі
туындайды.
Сөз ... ... ... сегменттер шекарасын бөліп алу үшін
статистикалық критерийлер ескеріледі. Мысалы, сөз ... ... ... ... ... жасалған әртүрлі жиілік
сөздіктердегі аса жиі қолданылатын сөз ... ... ... ... ... сөз тіркестерінің аударылу критерий-лері де қоса ... ... сөз ... ... сөздігінде бастапқы мәтін
үзіндісінің тікелей аудар-масымен сәйкес келе бермейтін мәтін үзінділері де
қамтылады.
Тілдің ... ... ... ... ... ... ... модуль
ретінде бірнеше тәсілдермен құрылады:
а) белгілі ережелер негізінде біріктірілген семантикалық ... ... ... ... ... (байласымды) семан-тикалық желілер
ретінде.
Әдетте, күрделі автоматты аударма жүйелерінде бірнеше ... ... ... ... ... Себебі әр тақырыпқа қатысты лексиканың
бір-бірімен қиылысу мәселесінің шешімін табу ... ... ... ... іс ... саналады. Өндірістік автоматты аударма жүйесін
құрастырушылар аталған ... ... мән ... осы ... ... ... лексиканы тақырып бойынша топтастыру ... ... ... іске қосуда. Автоматты аударма жүйесіндегі лексиканы
тақырыптық топтауға негіз ретінде ғылыми-техникалық ақпараттың ... ... ... ... ... (рубрикаторлары)
алынған.
Машиналық аударманың автоматты сөздігінің қатаң түрде нақты тақырыптық
аяға ... ... ... ... тілдік бірліктердің
көпмағыналығын ажыратуға және терминдерді аудару мәселесін стандарттауға
мүмкіндік тудыра-ды. Нақты тақырыптық аяға ... ... ... келген жүйесі үшін бірден-бір қажет. Ал егер автоматты сөздіктің
көпаспектілі ... құру ... ... онда ... ... ... аяға қатыстылығын ажырату ... ... ... ... ... белгі-код енгізіледі. Сол код арқылы лексикалық
талдау кезінде тілдік бірліктің аударма баламасы таңдалады.
Көптілдік автоматты ... ... ... ... қағидасы
ретінде автоматты сөздіктегі әр тілге қатысты тілдік бірліктердің ... ... ... ... Өндірістік автоматты аударма
жүйесінде тілдердің санына қатыссыз лексикааралық ... ... үш ... ... ... ... ... бірлік үшін басқа тілдерге қатыссыз, тек нақты осы
тілдің өз мүмкіндігі (құралдары) ... ғана ... ... сөз жайлы
мәліметтер, грамматикалық ақпарат, лингвистикалық және т.б. да ақпараттар);
2. Аударма ... ... ... екі ... ... тілдік
бірліктеріне ортақ болып келетін сөздік ... ... ... ... ... ... ... аударма баламаларына
ортақ болып келетін сөздік мақала құрастыр-ылады.
Сөздіктің «керіқайтқыштық» қасиеті ... ... ... қалауына
қарай, екі түрлі тілдің қайсысын болса да автоматты жүйеге ... ... ... тіл деп ... орындарын еркін ауыстыруға болатын мүмкіндігі
деп тұсіну ... ... ... жүйесінде керіқайтқыштық мәселесі екі түрлі
деңгейде қарастырылады – тілдер деңгейінде және жеке лингвистикалық ... ... ... ... ... ... түрінде
сөздікке енген тілдердің қайсысын болса да сұраныс тілі ретінде және жауап
тілі ретінде ... ... бар. Ал ... бірлік
деңгейіндегі керіқайтқыштықты (лексикалық керіқайт-қыштықты) бір ... ... ... және ... ... қолдану мүмкіндігі деп ұғыну
қажет.
Барлық ірі автоматты аударма жүйелері жарым-жартылай ... ... ... ... ие ... ... Ал ... аударма
жүйесінің керіқайтқыштық қасиетке ие болмауы, оның аса үлкен ... ... ... бірге олардың аударма терминологиялық сөздіктермен ... ... ... ие ... белгілі.
Автоматты аударма жүйесінің керіқайтқыштық қасиеті оны дәстүрлі түрдегі
аударма лексикографиясындағы кейбір автоматтандыру жұмыстарында ... ... ... ... ... уақытты үнемдеу сипаты ондағы
тілдерді, сөздік ... ... ... және одан шығатын тілдері
ретінде, автоматты түрде орындарын ауыс-тырып тұруына ... ... ірі ... ... ... ... ерекшелігі олардың
көптілділігі. Мысалы, 20 жылдай бойы ... ... LEXIS атты ... қазіргі кезде мынадай лексикалық топтарды өз ... ... ... ... ... ... дат және португал тілдері. Сол
сияқты, EURO DICAUTOM автоматты аударма жүйесі алты түрлі ... ... дат, ... ... ... және француз тілдері. Ал қазіргі
кезде ТFАМ автоматты аударма жүйесі тоғыз түрлі ... ... ... ... көлемді тілдік бірліктерімен аударма жұмыстарын ... ... ... ... ... (ВЦП) ... сөздігі және
Дрездендегі техникалық университеттің терминоло-гиялық ... өз ... ... ... ... ... ... француз және орыс тілдері.
Дәстүрлі аударма сөздіктеріне қарағанда автоматты сөздік динамикалық
қасиетке ие, яғни олар ... ... мен ... мақаланың
көлемділігіне қарамай, оларға қажетті түзетулерді тез және еш ... ... ... ... – ғалымдардың лексикалық топты таңдау
жұмысымен тұрақты айналысуларының ... ... ... ... ету ... бәрінде де өз жалғасын тауып ... ... ... ... ... ... және оны жаңа ... толықтырып,
сөздік мақаланың кез келген тұстарын әрі түзетіп, әрі ... ... ... ... орын ... ... ... мен сөздіктің
қызметі кезіндегі түрлі түзетулерді қабылдау мүмкіндігі – ... ... ... және ... ... ... табатын
бірден-бір сипаттамасы.
Соңғы жылдары аса кең орын ала ... ... – ЭЕМ ... ... ... кезде Шекспир, Ронсар, Пушкин
және т.б. классиктердің шығарма-лары ... ... ... арқылы танысуға мүмкіндік туындап отыр.
Сөзнұсқағыш сөздік дегеніміз әліпби ретімен реттеліп жазылған ... ... ... ... ... ... сөз ... сөздігі. Конкорданс-сөздік аталған мәліметтерді өз ... және ... ... ол ... ... сөзге қатысты мәнмәтіндер де
бірге қамтылып отырады. Түсіндірме сөздіктерге ... ... сөз ... анықтауға қатысты түсініктеме беру және қажетті
деген мысалдармен ... ... ... ... ... лексикографты көптеген әрекеттерден
босатады. Мысалы, оған жататындар: сөзтізбені таңдау мен ... ... ... ... және т.б. Егер кез ... ... ... күшімен қажетті деген толықтырулар жасалынатын болса,
ондай сөздік түсіндірме ... ... ... ... ... ... ... талдай келе, мынадай тұжырым
жасауға болады. Қазіргі кезде ең тиімдісі – ... және ... ... ... ... ... «сұрақ-жауап» ұстанымында
құрылған конкорданс типтес сөздікті жобалау және оны іске ... ... ... ... ... қажетті деген шығармалар мәтінін
компьютер жадына бір-ақ рет енгізіп, одан кейін өз ... ... ... ... өз ... ... мүмкіндігі бар. «Деректер
банкісі» деп аталатын мұндай жүйелер мәтін ішіндегі ақпараттың тек ... ... және ... тексеріп қоймайды және сонымен бірге
тиісті сөздің барлық қолданысы жайлы, әрбір ... ... ... ... ... жайлы және шығармалар жиынтығы жайлы ... бере ... ... ... қызметі ежелгі жазба
ескерткіштерге, жеке авторлардың ... ... ... ... жүйе ... әр ... жазылған мәтіндерге барынша
бейімделе алады.
Сөздік-анықтағыш қызметін атқаратын автоматтанған лингвистикалық
деректер ... ... ... еш күмән туғызбайды және мұндай
мүмкіндіктің “ауылы” да аса алыс ... ... ... құру ... ... конкорданстар
жүйесін құру болсын бұлардың бәрі де өзекті жалпы-филологиялық мәселе екені
айқын. Мұндай жүйелерді ... ... ... үшін ... ... және ... ... мамандарының тығыз
түрде одақтасып, бірлесе жұмыс атқарулары қажет ... ... ... ... мен ... қызметін
ғылыми-техникалық әдебиеттер мен ... ... ... ... ... ... оларды жүзеге асыру бірнеше функционалды элемент-
терден тұратын терминологиялық банк ... яғни ... жүйе ... ... ... еді. Бұл жүйелердің негізінде барынша аз мезгілде,
оңай ... және ең ... ... ... ... жинақтау,
сақтау және тарату жұмыстарын іске асыруға ... ... ... мен ... ... да ... (Франция, Швеция,
Бельгия, Канада) әртүрлі білім салалары ... ... ... ... банкін құруға байланысты жұмыстар кең түрде
өрістей бастады. Келесі кезекте ... ... түрі – ... ... ... іске қосу ... ... автоматтанған ақпараттық-терминоло-гиялық жүйенің
қызмет атқаруының негізінде – ... мен ... ... ... қамтитын «термин-дердің анықтағыш ... ... Бұл ... ... ... дереккөзінің рөлін ғылыми-
техникалық терминдер мен анықтамаларға арналған мемлекеттік және ... ... ... ... ... жинақтары атқарады.
Негізінде, терминологиялық деректер банкі, бір жағынан, ұғымдар мен
терминдер туралы және олардың қалай ... ... ... ... ... жүйе ... ал ... арнайы
мәтіндерге арналған автоматтанған ақпараттық сөздік-анықтағыш ... ... ... ... екі ... аспектіде қарастыруға болады.
Ең алдымен, бұл автоматтанған ақпараттық жүйенің белгілі бір түрі деуге
болады. Бірінші ... ... ... ... ... ... ... тұрғысынан қарастырылатыны белгілі. Сондықтан
мұндай көзқарасты ... ... ... ... ... ... мәселелермен айналысуға тура келеді. Яғни пәндік білім аясын
таңдау мен ... ... ... ... қатынасы, тілдерді, материал-
дарды, сөзтізбені қалыптастыру әдісін және т.б. таңдап алу мәселелерімен
айналысуды ... ... ... тек ғылыми-техникалық лексикогра-фиядағы, әсіресе,
терминологиялық сөздіктерді құрастыру ісін-дегі жинақталған материалдарды
өңдеу мен сұрыптау үшін ғана ... ... ... ... сөздік мақаланы
құрастыруда да аса қажет. Семантикалық жағынан ... ... анық ... ... ... ... Мысалы, оған жататындар:
құрал-аспаптардың, станоктардың, тетік пен құрылғылардың және ... Бұл ... ... ... нақты түрлерге бөлінеді. Ал
мұндай мәліметтер ... ... ... сипаттауға қажетті
өлшемдердің нақты моделін алдын ала ұсынуға мүмкіндік жасайды. ... ... ... үшін ... мынадай сипаттары ескерілуі
қажет: атқаратын қызметі, тұратын орны, бөлшектер құрамы, ... ... мен ... Ал ... ... ... ... – тегі,
жынысы, морфологиялық және биологиялық ... ... ... ... ... Аталған параметрлер жалпы және жекелік сипатта
да айырым табады. Сонымен қатар әрбір білім ... ... ғана ... процестері, әрекет аясы және т.б. ажыратылады. ... ... ... анықтаудағы ұстайтын ұстанымы бойынша
және ғылымның ... ... ... ... ... ... де
болады.
Бірақ терминологиялық деректер ... ... ...... ... автоматтанған жүйе екені айқын. ... ... ... ... ... ... ... анықтауға,
компьютерлік бағдарлама-ларды жазуға, компьютер мен тұтынушы арасындағы
диалогты іске қосуға қатысты мәселелермен ... ... ... ... ... ... ... табуына байланысты өндірістік және
өндірісаралық терминологиялық деректер банкі – барынша терең, ... ... ... құжаттық-фактографиялық сөздік-анықтағыш түріндегі
диалогтық жүйе.
Болашақта түсіндірме және ... ... ... мен ... құрастыру жұмыстарының және
терминологияны ... ... ... ... жұмысына қызмет
ету, ғылыми-техникалық аударма жұмыстарының бірден-бір негізгі бөлігі –
құжаттық-фактографиялық ... ... ... ... ... сөзсіз.
Қазіргі кездегі есептеу техникасының, қолданбалы ... ... ... ... мен ... ... автоматтанған
жүйелердің үнемді және тиімді болу мүмкіндіктеріне нұсқайды.
Негізінде терминологиялық деректер ... ... ... ... ... сөз таптарына, сөз тарихына, мәтіндегі қолданысына
сілтеме жасалғандарын қосып есептегенде, ... ... да ... ... ... ... ... жүйесі терминдік
сөзге қатысты мұндай әр деңгейдегі ... ... ... ... ... қайнасып жатқан ұғымдық мәліметті де қамтиды.
Әдебиет
Беляева Л.Н., Герд А.С., Убин И.И. ... в ... ... ... Отв. ред. А.С. ... СПб.: ... ... 1996, С. 318-333.
Лингвистическая концепция терминологического банка ... ... ... ... // Под ред. А. С. ... М., ... Ю.Н. ... машинного перевода. М., 1983. 232 с.
Марчук Ю.Н. Машинный ... как ... и ... М., ... И.П., Волкова И.Н. Банки терминологических данных. М., 1987.
Попов Э.В. Общение с ЭВМ на ... ... 360 ... G.D., Hanna F.K. Semantic Networks – a General Definition and a
Survey // Information Technology. 1983. Vol. 2, № 4. P. ... B. Aspects of ... ... in 1979: Conference for
Japan IBM Scientific Program. ... 1979. 50 ... B. La ... ... a Grenoble // Documents de
linguistique quantitative. № 24. Paris, 1975. 184 p.
Wang W.S. – L., Chan S.W., Ts’ou B.K. Chinese ... and ... ... 1973. 118. P. ... ... ... көлемін ықшамдауға қатысты аннотациялау мен рефераттау ұғымдары.
Ғылыми және ... ... ... ... ... ... байланысты, оны тұтынушының өзіне қажетті деген мәліметтерді
түпнегіз құжаттар жиынтығынан дәстүрлі ... ... тез ... тауып алу
әрекеті қиындыққа соқтыруда. Сондықтан түпнегіз құжат бойынша ... ... ... ... ... етеді. Әдетте, оларға
библиографиялық сипаттаулар, аннотациялар, рефераттар және ... ... ... ... Екінші реттегі құжат – түпнегіз
құжаттағы ақпарат мазмұнын ықшамдау немесе «қысудың» (компрессиялаудың)
нәтижесі болып ... ... қысу мен ... ... үшін ... ... ... мәтін орнында тек олардың
тақырыптарының аттары ғана қалып ... Ал ... ... ... ұтатынымыз аз. Себебі, аударма құжаттағы ақпараттың көлемі мен
оның мазмұны түпнұсқа құжатпен барабар болуы ... ... ... ... айтылымдарды қысқарту арқылы көлемді ықшамдау ... ... ... мұндай әдіспен де көлемді ықшамдау тұрғысынан
ұтатынымыз аз. Ақпарат мазмұнынан аннотация мен реферат алу кезіндегі ... ... ... жоғарыда аталған библиография мен ... ... ... көлемдік жағынан олардың орта шенінде
деуге болады.
Аннотация мен ... ... ... ... айырым табады.
Аннотацияның қызметі – толығымен нұсқағыш-тық. Себебі, аннотацияда түпнегіз
құжаттағы ақпарат мазмұнын толық ашпаса да, сол ... ... ... ... Ал ... ... келетін болсақ, ол ақпараттың мазмұнына
нұсқаумен бірге, қысқаша ақпарат беру ... де ... Яғни ... мазмұны рефератта (азды-көпті болса да) толық ... ... ... ... ... ... аннотация мен реферат (indicative
abstract) құрастыруда ақпараттың көлемдік ... ... ... нұсқағыштық қызметі аз көлемді қажет етсе, ал реферат оған қарағанда
(өз рөлін толық орындау үшін) әлдеқайда көп ... ... ... ... ... гуманитарлық ғылымдарға қатысты рефераттарға тән. Алайда
рефераттардың көлемін дәл анықтау ... бола ... ... ол ... ... ... келеді. Мысалы, оған жататындар түпнегіз
құжаттың сипаты (мақала, монография және т.б.), ... ... ... ... ... түпнұсқа құжаттың тілі (сирек
пайдаланылатын тілдердегі құжаттар егжей-тегжейлі рефератта-лады), ғылыми
типі немесе пәндік ая түрі ... ... ... қоғамдық ғылымдар
аясы) және т.б.
Интеллектуалды рефераттау. Түпнұсқа құжат ... ... ... адам ... ой ... ... арқылы, әдетте,
маман адам (референт) арқылы орындалатын рефераттау әрекетін ... ... ... журналдардың басым көпшілігінде осындай әдіс орын
алады.
«Интеллектуалды» ... ... ... ... ... ... ... субъектінің адам екені мәлім. ... ... ... ЭЕМ көмегімен атқарылатын автоматты
рефераттау әдісі ... ... ... жүр және ... ... ... рефераттау әдісінің рөлі мен сұранысы барынша артуда.
Рефераттау мәселесін жеке қарастырғанда автордың өзі ... ... мен сол ... ... ... ... (abstract) ажырата
білу аса маңызды. Бірінші рефератты түпнегіз құжат бойынша ... ... және онда ... ... иесінің түсінігіндегі ең маңызды деген
аспектілері бейнеленеді. Әдетте, авторлық реферат түпнұсқа құжатқа ... ... ... ... шолу ... ... ... Бірақ
мұндай реферат әр уақытта жасала бермейді және тіпті де барлық авторларға
бірдей тән ... ... ...... мазмұны жайлы оқырманды
ақпараттау болып табылады. Мұндай ақпараттау ... ... ... ... ... аз ... табады. Авторлық реферат ешбір
іздестіру ... ... Ал ... ... ... ... қызметін де атқарады. Себебі «қолмен іздеу» ... ... ... ... ... өлшемі) рефераттың мазмұнына
қатысты анықталады. Кейбір ... ... ... ... ... ... рефераттар көбінде ашық түрде жарнамалық
сипатқа ие. Сондықтан авторлық рефераттар бойынша құжаттың ... ... ... айту қиынға түседі.
Авторлық рефераттар көлемі жағынан, әдетте, референт-тердің құрастырған
рефераттары көлемінен ... аз ... ... ... ... ... ... нақты нәтижелері келтіріле бермейді.
Рефераттық журналдар (РЖ). Қайсыбір пәндік аяны ... ... ... ... ... ... тақырыбы бойынша немесе
автордың аты-жөні бойынша реттелуі мүмкін. ... ... ... ... ... деп ... кітап түрінде
дайындалады. Библиографиялық ... ... ... ... ... ... ... мүмкін. Осының нәтижесінде әдебиеттердің
аннотацияланған библиографиялық көрсеткіші құрастырылады.
Әрбір ғылым саласына қатысты библиографиялық сипаттаулар каталогтық
кәртішкілер ... де ... ... ... жасалады. Каталогтық
жәшіктерге бұл кәртішкілер автордың аты-жөні бойынша немесе білім салалары
арқылы әліпби тәртібіменен реттеліп қойылса, олар ... ... ... деп ... ... ... ... көрсеткішімен
бірдей дәрежедегі қолмен орындалған (автоматтанбаған) ақпарат-іздестіру
жүйелері деп те ... ... ... ... да осы ... ... ... Бұлайша жүйелеудің негізінде – білім универсумын (әлемдік
білімді) қалаған дәлдік дәрежесін ... ... ... мен пәндік аяларға
бөлу принципі жатыр. Қажетті деген ... ... алу ... ... ... ... журналдар да қолмен жүзеге асатын
(автоматтанбаған) қарапайым ақпарат-іздестіру жүйе-сінің қатарына жатады.
Қазіргі кезде, әлемдік деңгейде ... ... мен ... ... ... ... ... қолданыс тауып жүр.
Мысалы, кеңес ... ... ... ... ... ... ВИНИТИ және РЖ ИНИОН түрлерін атауға болар еді ... одан ... ... журналдарды, мысалы, РЖ ВНИИМИ, РЖ ВИНТИСХ және т.б. ... ... ... ... ... мен дәл ғылымдар құжат-тарын, РЖ ИНИОН ... ... ... ... ... журналдардың
деректері сыртқы пішін жағынан – форматы бойынша, ал іштей – рефераттардың
құрылымы мен ... ... ... ... РЖ ... ... РЖ ... қарағанда көлем жағынан барынша шағын ... және ... ... ие болып келеді. Басқаша айтқанда рефераттың бастапқы жағында
түпнұсқа құжатында ... ... ... ... да, ал ... ... нәтижелер аталады. РЖ ИНИОН көлемі РЖ ВИНИТИ рефератының
көлеміне қарағанда бірнеше есе көп (10 есе және одан да көп) және ... ... ... ... ... ... Себебі, қоғамдық
ғылымдар мәселесін бірнеше тармақтарға қисындас-тыру немесе шағын түрде
қорытындылау мүмкін бола бермейді, ал ... ... ... ... алуы аса ... деп саналады.
Рефераттық журналдарда кез келген құжаттың рефераты жеке-дара ... Ол ... ... бас ... және шығу ... ... библиографиялық сипаттауды да бірге қамтиды. Мұндай жағдай
библиографиялық сипаттау ... мен ... ... ... ... ... тудырады. Рефераттардың ең көп тараған үш түрін ... ... ... (ағылш. conventional abstract): бас ... ... ...... ... ... ... реферат;
2) бірінші орында тақырыпқа қатысты сөйлем орналасқан ... реті ... ... ...... ... ... сипаттау. Мұндағы «тақырыптық сөйлем» дегенді, ақпараттық
тұрғыдан қарастыр-ғанда, ең маңызды деп саналатын реферат мәтінінен ... деп ... ... ... ... «бас тақырып» орналасқан реферат. Оның реттілігі
мынадай: бас тақырып – тақырыптық ...... ...... (бас ... ... реферативтік журналдарда осы аталған рефераттардың қайсыбір түрі
қолданылады. Мысалы, “Chemical Abstract” реферативтік журналда ... ... ал ... атты ... журналда – рефераттың 1-типі қолданылады.
Рефераттау жайындағы әдебиеттерде интеллектуалды рефераттың ең ұтымды
(оптималды) нұсқасын таңдауға қатысты мәселе ... рет ... ... ... ... ... ... қай құрамдас бөліктерінің қандай
реттілікте ... ... ... ... ... деуге болады. Бірақ
көптеген тәжірибелердің нәтижелеріне сүйенсек, алдын ала ... ... ... ... ... нұсқасы болмайды. Шындығында, түпнұсқа
құжаттың бір ғана мәтіні бойынша әртүрлі ... ... ... ... ... олардың бәріне де қанағаттанар-лықтай деген баға
берілуі мүмкін. Сондықтан бұл мәселеге соңғы ... ... ... жүр: ... ең ... нұсқасын іздестіруден гөрі, құжаттың бір
ғана мәтіні бойынша белгілі бағыттағы ... ... ... ... реферат құрастырылғаны жөн. Құжат мәтінінен ... ... ... ... ... ету ... ... жүйелерін
құрастыруда көптеп қолданыс таба бастады.
Автоматты рефераттау. Автоматты рефераттау жүйесін ... ... ... ... ... ... ... қайсыбір түрі орын алады деген тезиске сүйенеді. ... ... ... ... ең ақпаратты деген фрагмент-терді
айқындау зерттеу жұмысының басты міндеттерінің бірі ... ... ... ... сәйкес, ақпараттың көпшілігі мәтіннің мынадай
тұстарында шоғырланады:
1) мәтіннің бір нүктесінде;
2) мәтіннің бірнеше фокалды немесе ... ... ... кез ... ... ... мүмкін, сондықтан оның қатаң
түрде анықталған орны жоқ.
Ең көп ... ... ... ... ... көп ... ... мәтін орны – тірек нүктелер. Ондай нүктелер, ... ... ... ... ... Дәлірек айтсақ, ондай орындарға:
тақырып, кіріспе, тұжырымдар, қорытынды, ұсыныстар жатады. Ал ... ... ең ... деп ... мен қорытындыны атауға болады.
Бірақ бұдан да ... ... ... ... ол бойынша ең көп ақпарат
бөліктері мәтіннің барлық жерінде азды-көпті ... да ... ... ... ... ... те ... ақпараттық бөліктерін
айқындау үшін барынша мұқият зерттеуден өткен ... ... ... ... кезде мәтін мен оның бөліктерінің әртүрлі белгілеріне
сүйенетін көптеген әдіс-тәсілдер қолданылып жүр. ... бәрі ... ... ... ... ұстаным етеді: ең алдымен ... ... ... ... ... ең ақпаратты деген
сөйлемдер, сөз ... және ... ... ... ... кең ... тауып жүрген түрлеріне жеке тоқталайық.
Статистикалық-дистрибутивті әдістер. ... ... ...... ... (морфема мен сөздердің) мәтін
ішіндегі үлестірілу заңдылығын (тізбектеліп келу ... ... ... деп те атайды. Аталған әдіс мына ... ... ... тілдік бірліктің мүмкін болатын ... ... мен ... ... деректерін (немесе статисти-касын) дистрибуция
(тіркесімдік) тұтастығы деп ... Ал ... ... ... ... ... әрекеттердің
объективтілігі мен алгоритм-делуін, яғни бұл әдіс-тәсілдердің автоматтану
мүмкіндігін қамтамасыз ... ... ... ... ... тануда), статистикалық-комбинаторлық ... ... мен ... және семантиканы зерттеуде кең қолданыс тауып
отыр.
Автоматты жолмен рефераттау мақсатында қолданылатын жалпы статистикалық-
дистрибутивтік ... ... ... жеке ... ... болады. Ең алдымен ондай жеке әдіске ғалым Х.П.Лунның ұсынған
әдісін ... ... Ол ... қарастырып отырған құжат үшін ең
ақпаратты деген ... ... ... ... ... ... сөздер жиынтығын қамтитын сөйлемдер жатады. Бұл жағдайда сөйлемдердің
мәтіндегі орналасу орны ... ... ... ... құжаттың кез келген жерінен алынуы мүмкін. Сөйлем ... ... ... деп, ... ... ... үшін ... мәнді болып келетін кез келген сөзтұлға тізбегін атайды. ... ... ... ... мағыналық қатынас ескерілмесе де, ол толық
автоматтандыру мүмкіндігімен ... деп ... ... ... ... оның ... ... жасалған. Мысалы, В.А.Осваль-дтың әдісі бойынша, сөйлемнің
ақпараттылық дәрежесінде тек ... ... ... қарай шоғырлану
сипаты ескеріледі. Басқаша айтқанда бұл ... ... ... ... ... ... сонымен бірге осындай шоғырланудың сандық сипаты
да есепке алынады. Ал ... ... ... ... сөздердің
шоғырлану саны үшке тең немесе үштен көп болса ғана ондай ... ... ... ... ... ... ... шоғырланған
тірек сөздер жиілігі құжат ішіндегі сөздердің орта жиілігінен үлкен болатын
шамасы ғана ескеріледі. ... мен ... ... ... ... ... немесе тірек сөздердің бірге кездесу мүмкіндігін
есепке алу мен арнайы матрица арқылы өзара ... ... ... ... ... ... кездесу» принципін ұстаным ету басқа да ғалымдардың
(мысалы, А.Я.Шайкевичтің) ... ... ... ол ... бұл
әдіс-тәсілді рефераттауды автомат-тандыру мақсатында емес, тек семантиканы
зерттеу әдісі ретінде қолданғаны белгілі.
Статистикалық-дистрибутивтік әдіс ... ... ең ... ... ... қарапайым жолмен бөліп алып, оларды ... ... ... ... ... іздестіру аясын шектеу
мақсатында статистикалық-дистрибутивтік әдіс позициялық (орналасу тәртібін
ескеретін) ... ... ... да ... ... ... ... мәтін үзіндісінің
ақпараттылығы мен олардың құрамындағы тірек сөздердің арасында тікелей ... ... ... ... ... Әрине, мұндай байланысты
анықтау ісі барынша күрделі мәселенің қатарына жатады. Сондықтан бұл әдіс,
бір ... аса ... ... ... ... ... ... бермейді. Сонымен бірге тек қана статистика-дистрибутті
әдістемеге негізделіп ... ... әр ... ... ... ... қисынды сипатта көрініс таба бермейді. Аталған рефераттың
интеллектуалды рефератқа қарағанда кемшілік ... ... ... қарай, статистика-лық критерий басқа ... ... ... ... ... ... ... әдіс
бөліп алынған мәтін үзіндісінің мазмұндық жағы ... ... ... ... оның ... ... жайлы тек жобалап қана айтуға
болады. ... ... ... ... ... ... мән-мағыналық
жағын арнайы жүргізілетін әрекеттер арқылы нақтылауға болады. Мұндай әрекет
түріне мәтін үзіндісін ... ... ... белгілеу барысын
жатқызуға болады. Аталған индикаторларды көпшілік жағдайда мағына-лық
аспект деп атайды да, ал оған ... ... ... ... ... ... ... аспектілер жиынын ұсынуы мүмкін, бірақ солардың ішінен
жиі қолданылатындары: зерттеу пәні, мақсаты мен зерттеу әдісі, ... ... ... ... оның ... ... қолдану
аясы, түйіндері, нәтижелері, ұсыныстар және т.б. Кейбір ... ... ... ... ... ... әдісінің құндылығы белгілі. Ол әдіс ... ... ... және ең ... деп ... болатын
сөйлемдер мен мәтін үзінділерін енгізуге мүмкіндік туындайды. ... ... ең ... деп ... ... ... ұсынылған вариантын» және «түйіндерін» жатқызуға болады.
Маңызды аспектілер қатарына, көбінде, тақырыпта ... ... ... ... әдіс ... ... ... мәнділік зоналарды бөліп алуға
және олардың әрбіреуіне ... ... ... ... жазуға
мүмкіндік туғызады. Салмақтық коэффициенттің шамасына ... сол ... ... ... не ... ... шешіледі. Аспектілік әдісті
статистикалық-дистрибутивті әдіспен бірге де қолдануға болады.
Аспектілік әдіс бойынша құрастырылған ... ... ... ... да, ... ... дәрежеде ақпарат беретін
бірнеше мәтін үзінділерінен ... ... ... байланыссыздық
дәрежесін мәтін-дік байланыстар әдісін қолдану арқылы төмендетуге болады.
Мәтіндік байланыстар ... ... ... ... тек ... ... ... сипаттары мен мазмұндық
аспектілері арқылы ғана анықталып қоймайды, ол сонымен бірге басқа ... ... ... мен ... ... ... Көптеген
ғалымдар-дың (В.Е.Берзон, С.М.Приходько, Э.Ф.Скороходько, И.П.Севбо және
т.б.) ұсынған автоматты рефераттау моделі ... ... ... ... мол және мәнділігі жоғары деп саналатын сөйлемдерді таңдау
әдісін қарастырайық. Бұл әдіс бойынша байланыстардың санын ... ... ... шама алдын ала берілуі қажет. Осы ... ... ... ... ... ... ... бар.
Мұндай әрекет бойынша рефераттың көлемін өзгертуге болады. Әрине, мұндай
жағдайда сөйлемдердің сипаты ... де ... ... тағы бір жақсы нұсқасында мәтіндегі ... ... ... единицы) эксплицитті және имплицитті түрлері
өзара ажыратылып қарастырылады. ... ... ... ... мазмұн
фразадан тыс бірлікке эксплицитті болып келетін бірінші сөйлемнің үлесіне
қатысы бар. Бұл сөйлем, көпшілік жағдайда, ... ... ... сөз ... ... тыс ... ... келетін «бірінші
сөйлемнің» ақпараттылығы сол бірліктің ұзындығының артуына қарай ... ... ... ... ісі ... ... барынша
байланыстық және толықтық сипатта бейнелейді. Бірақ осындай ... де ... ... сапалық жағынан интеллектуалды рефераттан көп
төмен тұрады.
Құрамдастырылған әдістер. Мәтіннің ең ақпаратты деген ... ... ... қолданылатын әрбір жеке әдістің іштей өзіне ғана тән
шектеулері болатыны ... ... ... ... ... ... жету үшін әр ... тиімді жақтарын бөліп
алып, оларға құрамдастыру ... ... жөн ... ... ... ... ... ішіндегі сөздің ... ... ... ... ескерудің маңыздылығына нұсқайды. Сол сияқты
мәтін бойындағы сөйлем бірлігін ... оның ... бір ... ал басқа
бір жағдайда олардың мәтіндік байланыстылығын ... етіп алу ... да ... ... ... кем ... Тағы бір ғалымдар тірек
сөздердің аралық қашықтығын, тақырып құрамына енген тірек ... ... ... ... қажеттігін де баса айтады. Ал морфологиялық тұрпат
(форма) пен сөздің ... сөз ... ... ... жайлы
факторлар өте сирек сөз болады.
Нәтижелік рефератқа енуге тиісті ақпараттық мәнді мәтін ... ... ... алу ... ... реттілікпен қолданылуы қажет.
Мәселен, лексиканың статисти-касын анықтауға арналған әдістер ең ақпаратты
деген сөйлемдерді немесе ... ... ... ... бөліп алу үшін
қажет. Сонымен бірге мұндай ... алу ... ... ... ... ... ... нақтыланып, түзетіліп отырулары қажет. Бірақ
рефераттың мәтіндік қисындылығына фразааралық ... ... ... ғана қол ... ... ... ... әдістерін қолдану
тәртібі төменнен жоғарыға қарай бағытталған ... ... ... ... ... ... мынадай реттілікке негізделеді: лексика – сөйлем –
шепі ... ... ... ... сөйлем жиындары – фразааралық
байланыстар – ... ... бұл ... ... бағытпен де, яғни
жоғарыдан төменге ... ... ... түрі де қолданылуы мүмкін. ... ... ... құжаттың толық мәтініне бастапқы ... ... ... ... да, ... ... ... аясында
орныққан орнына қарай немесе аспектілік жағынан сипатталған сөйлемдер
бөлініп ... ... Ең ... ... ... өту жолы
қарастырылады. Аталған екі ... ... ... ... екі
әдіс-тәсіл ретінде жарыстыра қолдануға да болады.
Интеллектуалды және автоматтау әрекеті бойынша құрастырылған рефераттар.
Интеллектуалды ... ... ... – тұтынушыны қажетті
ақпаратпен қамтамасыз ету немесе оның ... ... ... ... ... ... ... адам болғандықтан, яғни
оның ақпараттық қажеттігін өтеу. Әрине, мұндай рефераттар ... ... үшін ... асуы ... мысалы, құжаттарды қол күшімен немесе
автоматты түрде индекстеуге, терминологиялық ... мен ... ... ... ... ... ... шыққан мезгілі мен орны) анықтау және т.б. мақсаттар үшін қолданыс
табуы мүмкін. Бірақ бұл ... ... ... да ... үшін негізгі емес, жанама деректер.
Ал автоматты түрде рефераттаудың мақсаттары интеллек-туалды рефераттау
мақсатынан көпшілік жағдайда ерекшеле-неді. Әрине, ... ... ... яғни ... мұқтаждығын қанағаттандыру үшін арналған болуы
мүмкін. Бірақ машина арқылы жүзеге ... ... ... ... ... ... ... келмейді.
Машиналық рефераттар көбінде индекстеу мақсатында қолданылады. Сонымен
бірге мұндай мақсатқа байланыссыз немесе ... аз ... ... ... ... ... көрініс табатын рефераттар да сай
келе беруі мүмкін. ... ... ... негізгі талап – құжатты
индекстеуге қажетті тірек сөздер санының ... ... ... ... ... деген терминмен аталып ... ... ... бір ... ... ... ... болады. Бұл бағыт бойынша мәтінге пәндік салаға сәйкес
келетін индекстер ... ... ... Бұл жағдайда рефераттың байланыс-
тылық сипатының жоғары дәрежелі ... ... те ... ... ... ... бір лексикалық тұрғыда өзекті
саналатын рефераттар, ал интеллектуалды рефераттар – дискурс бойынша ... ... ... ... олар ... мәтін өлшемдерін
қанағаттандыра алатын реферат түрі деуге болады.
Бұл аталған айырмашылықтар аса ... ... ... машиналық рефераттың өлшемдерін интеллектуалды рефераттың
параметрлеріне жуықтататын автоматтанған ... ... құру ... ... ... шықпайды. Мұндай мақсатқа жету үшін автоматты түрде
рефераттаудың әртүрлі әдіс-тәсілдер мен ... ... ... бірге,
олардың үйлесімділік жағын да ескеру қажет болады. Қорыта айтқанда, мұндай
бағытты ұстаным ету – ... ... ... сай келеді және қажетті
деген прагматикалық бағытты қамтамасыз ете алады.
Ә д е б и е т
Бондаренко Г.В. Об ... ... ... анализа структуры
целого текста для автоматического индексирования и реферирования // Научно-
техническая информация. Сер. 2. 1975. №5.
Гендина Н.И. ... ... ... ... с ... тестовых признаков // Научно-техническая информация. Сер. 2.
1979. ... С. И. ... ... ... ... опирающиеся
на характеристики внутреннего состава фрагмента // Семиотика и информатика.
Вып. 9. М., 1977; ... ... ... фрагментирования
текста, их теоретико-текстовые и психолингвистические предпосылки //
Семиотика и информатика. Вып. 10. М., ... В.И., ... Э.А. ... в ... ... ... совершенствования лингвистических и структурных характеристик
// ... ... и ... Сер. ... М., ... Э.М., ... В.Е. ... сверхфразовые связи и их
инженерно-лингвистическое моделирование. Кишинев, 1986.
Карасев С.А. ... ... ... ... ... и ... ... (АНАСИН) // Научно-техническая
информация. Сер. 2. 1978. №5; ... ... ... ... ... // ... информация. Сер.
2. 1978. №8.
Леонов В.П. О методах автоматического реферирования (США, ... ... ... Сер. 2. 1975. ... А.И., ... Б.В. Алгоритм индексирования текстов взвешенными
ключевыми словами по методу семантической фильтрации // Научно-техническая
информация. Сер. 2. 1972. №6. С. ... Н.А., ... Л.В., ... Т.В. и др. ... ... и ... // ... науки и техники. Т.7. М., 1983.
Севбо И.П. Структура связного текста и автоматизация реферирования. М.,
1969.
Скороходько Э.Ф. Семантические ... в ... и ... // ... ... ... (М), 1974. №23.
Шайкевич А.Я. Дистрибутивно-статистический анализ в ... ... и ... ... ... М., ... ... жүйесі
Соңғы 20 жыл ішінде танымдық ой-сана мен ... ... ... өмірге жаңа ғылым саласы – информатика ілімі келді.
Бір ... ... ...... ... мен өңдеудің
жалпылама заңдылықтарын қарастыратын ғылым. Екіншіден, оны ... ... ... жаңа саласы деуге де болады. Информатика ілімінің
өмірге келуі мен даму деңгейлері ең ... ... ... ... ... ... техникасы мен байланыс құралдарының дамуына тікелей
қатысы бар. ... ... ... ... ақпаратпен
жабдықтандыру мәселесі автоматтанған жүйелердің кеңтүрде қолданыс табуы-мен
сипатталады. Қазіргі кезде деректерді электрондық әдіспен өңдеуге қатысты
жүйелер ... ... шеше ... ... ... тіркеу,
статистикалық тіркеу, баспа жұмыстарының есеп-қисаптары және ... ... ... мен ... мәселелер.
Ғылыми-техникалық прогрестен туындайтын ең бір маңызды салдар – ақпарат
көлемінің бұрын-соңды ... ... ... ... мен ... сан ... өсуі қажетті деген мәлімет-
терді тауып алу мәселесін кенеттен ... ... ... байланысты
ақпарат-іздестіру теориясы ... ... ... ... ... жұмысында жүзеге асты. Ақпарат-іздестіру жүйелерінің
қол күші арқылы іске асатын механикаландырылған және ... ... Ең ... ... ... ... ... қажетті деген құжатты тауып алуды механикалық сәйкестендіру арқылы іске
асыратын ... ... ... ... ... перфокарталар,
суперпозиция-лық карталар, шеттері перфорацияланған перфокарталар және т.б.
қолданыс тапты. ... ... ... ... ... ... ақпарат-тық-іздестіру жүйесін өмірге
әкелді. Телекоммуникациялық құралдардың дамуы үлестірілген ... ... ... ... ... ... және әлемдік
ақпараттық инфрақұрылым тұтастығын жасауға өз әсерін тигізді. ... тек ... ... ... ... іске ... ... бойында сақтаған мәтінді (құжат, оның бөліктері, фактографиялық
жазба) іздестіруге арналған ... ... ... ... ... жүйенің басқа жүйелерден негізгі ... ... ... ... ... нәтижесінде
алынған деректердің мағыналық мәнін ашу мен ол ... ... ... ... ... Яғни ... жүйесі –
мәтіндерді (құжаттарды) немесе мәліметтерді (фактыларды) сақтау ... ... ... мен ... ... ... табылады.
Ақпарат іздестірудің мәні және негізгі терминдер. Ақпарат-іздестірудің
мәні – құжаттың мазмұны мен ... ... ... ... Ал екі ... ... ... дегеніміз мәтіндердің мағыналық жақындық
(ұқсастық) ... ... ... ... ... ... пен
сұрату ұғымдарымен бірге) релеванттылық ұғымы (ағыл. relevant – ... бар) ... ... ... ... ұғымын бір мәтіннің
екінші мәтінге сәйкестік дәрежесі – құжат пен сұратудың ... ... Ал ...... ... пен ... ... де түсінік табады. Релеванттылық ... ... ... және ... реле-ванттылық түрінде де екіге ажыратылады.
Мағыналық ...... ... байланысты табылған құжат-тың
ақиқаттық сәйкестігі. Ал ... ...... ... ... ... ... Бұл жердегі іздестіру бейнесі
мен іздестіру ұйғарымының түсінігі дегенді құжаттың негізі мазмұны ... ... ... ... бейнелеу деп ұғынған жөн.
Жоғарыда аталған мағыналық және ... ... ... ... ...... іске қатысты) түрін де
ажыратады, яғни құжат мазмұнның ... ... ... ... Ал ... ...... индивидтің немесе ұйымның нақты
мақсатқа жету ... ... ... ... ... ... ... түрінде көрініс табады және ол ақпараттық сұрату деп аталады.
Ақпараттық ... ... ... ... ... ... дәрежеде
дәлме-дәл сипаттай алмайды. Себебі, ақпараттық мұқтаждықты тұжырымды етіп
айтудың субъективтік сипатта болуы әртүрлі қиындықтарға ... ... ... ... ... ... яғни ... пен дәлдік сипаттары негізделеді. Іздестірудің
толықтық өлшемі деп ақпараттық жиымда (массив) ... ... ... ... ... ... ... жалпы санына қатынасын
атайды. Ал іздестірудің дәлдік ...... ... ... ... алынған барлық құжаттар санына қатынасы.
Іздестірудің нысаны мен алға қойған мақсатына ... екі ... ... орын ... ... және фактографиялық. Осыған
сәйкес ақпарат-іздестіру жүйесінің де құжаттық және ... ... ... ... іздестіруде тұтынушыға ұсынылатын нысандар ретінде
қажетті мәліметтерді өзінде сақтайтын құжаттың өзі ... ... ... ... ... ... берілді. Ал
фактографиялық іздестіру түрінде ақпаратты сақтау мен ... ... ... мәліметтер (нысандар, процестер, құбылыстар және т.б. ... ... ... ... ... ... ... жүйелер арасында айтарлық-тай айырмашылық болмайды.
Сондықтан ... ... ... да атап ... болады. Мұндай жүйелерде
құжаттық және фактографиялық ақпараттар бір ғана нысанаға қатысты болады.
Құжатты іздестіруде фактографиялық ақпарат ... ... ... ... ... ие болатын құжаттық іздестірудің
бір түрі ... ... ... ... ... ... тәсілі құжаттың тек библиографиялық ... ... ғана іске ... ... ... ... ... басылым түрі, авторы
және т.б.). Әдетте, құжаттық ақпарат-іздестіру жүйеде ... ... қоса ... ... көріністе беріледі. Ондай жиым-
дарға жасалатын сұрату бейнесі көбінде фактографиялық сипатта болады.
Ақпараттық іздестірудің негізінде құжаттағы ақпарат бейнесін сұратудағы
ақпараттың ... ... ... ... Сондықтан олардың мазмұн
көрінісін іздестіру жүйесіне «жіберу» мәселесін шешіп алу қажет болады.
Ол үшін құжат пен сұратудағы негізгі ... және ... ... баяндауға арналған мамандандырылған арнайы тіл – ... тілі ... ... ... ... автоматтандырылған
ақпарат-іздестіру жүйелерінде қолданыс табатын барлық ақпарат іздестіру
тілі мынадай үш типке бөліп қарастыруға болады:
1) ... ... ... ... негізделген – ақпарат іздестіру
тілінің топтастыру типі;
2) сөз ... ... ... ... табатын лексикалық
бірліктердің тізбесіне негізделген – ... ... ... ... ... ... аядағы нысандар «белгі-мағына» мазмұнындағы білім
моделіне негізделген – ақпарат іздестіру тілінің нышанды-белгілік типі.
Құжат немесе сұрату мазмұндарына ... беру ... ... ... ... ... тілі арқылы сипаттау (жазу) кезінде құжат ... ... және ... ... ... ... ... іздестіру
тілінде жазылған құжаттың негізгі мазмұны құжаттың іздестіру бейнесі деп
аталады. Ақпараттық мұқтаждықтың ... ... ... ...... деп, ал оның ақпарат іздестіру тіліндегі көрінісі – сұратуды
іздестіру ... ... ... ... деп ... ... ... іздестіру дегеніміз іздестіру жиы-мындағы іздестіру
ұйғарымына сәйкес келетін ... ... ... ... ... ... ... айқындау арнайы формалданған ережелер
арқылы іске ... Олар ... ... ... ... ... сәйкестіктің критерийі (өлшемі) деп аталады. Бұл ... ... ... мен ... ... ... ғана сөз ... оны мағыналық релеванттылықпен ешқашан шатастыруға болмайды.
Шығарылу критерийінің ең қарапайым түрі ... ... ... мен ... ... ... ... сәйкестігі немесе, дәлірек
айтқанда, сұратудың іздестіру бейнесінің толық түрде ... ... ... ... ... ... ... іс жүзінде құжаттың
іздестіру бейнесі мен сұратудың іздестіру ... ... ... ... деп те қолданыс табуда.
Шығарылу критерийіне қойылатын талап, көбіне, оның ... ... ... ... сондықтан бір ғана ақпаратты іздестіру тілінің
екі түрлі мүмкіндігі жайлы немесе бұл жерде ... және ... ... ... ... ... болады. Бұл жағдайда, сұрату тілі
іздестіру мен шығарылу ... ... ... түрдегі арнайы
мүмкіндіктерді өз құрамына ... ... ... ... ... адам мен ... аралығындағы жүйе
немесе «адам-машина» жүйесі болып саналады. Сондықтан абстракты ақпарат-
іздестіру жүйесі (логика-семантикалық құрал) мен ... ... ... ... ... ... атпен айырым табады.
Осыған қарай, ақпараттық қызметтің: «сұрату – жауап» пен ... ... ... ... ажыратылады. Бұлардың біріншісі бойынша өткен
кезді шола қамтитын жиым құжаттары ... бір ... ... ... ... ... ... іздестіру тәсілі, әдетте, «ретро»
(ретроспективный – өткенді шолатын) деп аталып жүр. Ал ... ... ... ... ... ... ... – жаңадан түскен құжаттар ... ... ... ... ... ғана күші бар) ... алдын ала
қарастырылады. Орыс тілінде сұратудың мұндай тәсілі – «профиль» деп ... мен ЭЕМ ... ... ... ... және «диалогты»
тәртіп жолдары өзара өзгешеленеді. Біріншісі, яғни «пакетті» тілдесу
таңдалып ... ... ... тәсіліне тән болса, екіншісі – диалогтық
тәртіпке – «ретро» тәсіліне тән. Пакеттік тәсілде ... жолы ... ... ... ... бойынша бір мезгілде орындалады.
Диалогтік тәсілде іздестіру кезіндегі аралық нәтижелер ескеріліп,
қажетті ... ... ... дейін тұтынушы (немесе арнайы
дайындалған маман) ЭЕМ-мен диалогке түседі, яғни ... мен ... ... ... ... ... ... қай жолы болса
да, тұтынушыға ұсынылған нәтиже – құжат, ... ... ... баяндау, мүмкін, референтпен бірге), немесе бірінші
дәрежелі қажетті құжат болуы мүмкін.
Ақпараттық іздестіру ... ... ... ... қарай,
мынадай құрама бөлшектерге ... ... ... ... ... ... және ... іздестіру, сөздіктерді түзу, статистиканы
анықтау, іздестіру нәтижелерін өңдеу және қажетті деген құжатты ұсыну.
Аталған қызметтерді іске асыратын құралдар мен ... ішкі ... деп ... жүр. ... ішкі ... жабдықтаудың мынадай
негізгі түрлерін атауға болады: ақпараттық жабдықтау; ... ... ... жабдықтау; программалық жабдықтау; технологиялық жабдықтау.
Ақпараттық жабдықтау – құжаттар мен сұратулардың ... ... ... ... ... мен топтастырудың құралдары мен тәсілдері.
Лингвистикалық жабдықтау – ... ... ... ... мен ұсыну критерийінен тұратын логика-семантикалық аппарат.
Техникалық жабдықтау – ... ... мен ... ... ... ... жабдықтау – ЭЕМ арқылы ақпарат-іздестіру жүйесінің барлық
функцияларын іске асыратын программалық мүмкіндіктер.
Технологиялық жабдықтау – автоматтанған және ... ... ... ... ақпаратты өңдеу әрекеттерінің баяндалуы
(описание).
Ақпарат-іздестіру жүйені ... ... ... ... ... міндетін орындауға арналған логикалық және
лингвистикалық құралдар мен ... ... ... ... ең ... ... ... тұрады – арнайы тілдер
(оның ішінде ... ... ... қоса ... осы тілдерге
аударудың ережелері және оларды қолдану ... ... ... ... ... үшін ... сөздіктер, қалыптар ... ... ... құрастыры-лады. Лингвистикалық жабдықтаудың
ұғымына ... ... ... шығарылу критерийі,
математикалық логика мен жиындар теориясының құралдары да бірге енеді.
Лингвистикалық жабдықтауға негіз болатын – ... ... ... ... ... ... және ... функцияларды
атқаратын көптеген басқа да таңбалық жүйелерге қарағанда, ақпарат іздестіру
тілі алғашы-нан-ақ ... ... ... ... ... ... ... тілінің айырықша ақпаратты-іздестіру қыземтін
сөз етуге болады.
Ең жақсы деген ақпарат іздестіру ... ... ... ... ... ... ... күштілік», яғни құжаттар мен
сұратулардағы негізгі тақырыпты ... ... және дәл ... бір ... яғни ... іздестіру тіліндегі әрбір жазбаның
(запись) бір ғана мағынаға және әрбір ... ... ... тілі арқылы
біркелкі түсінікке ие болуы;
3) ашық жүйе сипатында болуы, яғни тілдің ... ... ... ... ... тұру ... келген жазба тіл, ең аз дегенде, үш түрлі компоненттен тұрады:
әліпби, сөздік және грамматика. Бұл ... ... ... ... ... орын ... Әртүрлі ақпарат іздестіру тіліндегі лексикалық бірліктерді
жазуға арналған графикалық белгілер жүйесі, яғни оның әліпбиі өз ... және орыс ... араб ... ... ... және арнайы
символдарды сақтайды. Ақпарат іздестіру тілінің тілдік ... ... деп ... және ... ... ... ұғымдар мен ұғымдар
топтары да бірге саналады.
Тілдік бірлік ... ... ... ... ... ... ... деп атайды. Бұл қатынастар екі түрлі болып
кездеседі: синтагматикалық (мәтіндік) және ... ... ... ... ... мәнмәтінде (яғни осы құжатта
немесе ... ... бір ... ... болатын тілдік бірліктердің
араларындағы қатынастар.
Парадигматикалық қатынастардың туындауы үшін ақиқат әлемінің нысандары
мен құбылыстары ... ... ... ... ... ... ... шарттылығы алынады. Табиғи тілдегі шағын
ұғымдық ... ... ... қатынастардың бірінші типіне ғана
қатысы бар ... ... ... ... ... бар ... іздестіру тілін «грамматикалы ақпарат іздестіру
тілі», ал мұндай ... жоқ ... ... ... ... ... тілі» деп атайды. Парадигматикалық қатынастар тілдің
сөздік құрамына қатысты болады. Табиғи ... ... ... ... ... сөздікте парадигмати-калық қатынастар нақты
түрде ... ... ... ... ... ... тілінің жалпы
классификациясын сөз ететін болсақ, ... ... ... тілінде тілдік бірлік ұғымдары, ... ... ... орын алады. Ақпарат іздестіру тілі теориясында қарапайым ұғымдар
кластарының қиылысу-лары арқылы құрастырылған күрделі ... ... деп атап жүр. ... ... ... ... ... мен индекстеу ережелеріне қарай, алдын ала ... және ... ... ... ұғымдар бар. Оның біріншісінде, құжаттарды
индекстеу, оларға алдын ала құрылған күрделі ... ... ... де, ал ол ... аттары іздестіру бейнесіне айналады. Егер
іздестіру бейнесі қарапайым кластардан тұрып, ал координация амалы ... ... ... ... арқылы құру) тек нақты іздестіру
кезіне ғана сай келсе, ... ... ... тілін соңынан
координацияланған деп атайды.
Аталған ... ... ... ақпарат іздестіру тілінің жалпы
классификациясын мынадай түрде беруге ... ... ала ... ... ... тілі.
1.1. Иерархиялық классификациялар.
1.2. Әліпбилі-пәндік классификациялар.
1.3. Фасетті (біржақты) ... ... ... ақпарат іздестіру тілі.
2.1. Дескрипторлық тілдер.
2.2. Семантикалық тілдер.
2.3. Синтагматикалық тілдер.
Алдын ала координацияланған ... ... ... ... ... да ... ала беріледі. Әрбір атауға қатысты табиғи тілдегі оған
сәйкес келетін ұғымның ... ... көп ... иерархиялық классификация. Мысал ретінде әмбебап ондық
классификацияны, ГАСНТИ-дың рубрикаторын, ... ... ... және т.б. ... ... ... классификация жасауға
ұғымдарды бөлшектеу тәсілі негіз болып отыр. Классифика-цияда әрбір класс
арнайы код арқылы белгіленіп, олар тұрақты және ... ... ие ... ... тілі ... ... ... негізгі кемшіліктері мыналар:
1) көпаспектілі индекстеуді қамтамасыз ете ... ... ... ... ... мен ... дамуынан әрдайым артта қалып отыруы.
Иерархиялық классификациялау негізінен кітапханалар мен ... ... ... ... жүйеге келтіру жұмыстары үшін
қолданылады.
Әліпбилі-пәндік және фасетті классификациялар ... ... ... ... категориялары мен пәндік ... ... ... тізіміне негізделеді.
Әліпбилі-пәндік классификацияларда ұғымдар атаулары табиғи тілдегі
сөздермен аталып, әліпбилік тәртіппен орналасады. ... ... ... ... ... ... Бұлардағы негізгі тақырып
сәйкес пәндік атпен белгіленіп, негізінен жүйелі каталогтерге ... ... ... қолданылады.
Фасетті классификация негізінде бір ғана жиындағы заттарды әртүрлі
негізде топтау принципі жатыр. ... ... бір ғана жиын ... ... ... ... құрылады. Фасетті классификациялау
көпаспектілі индексация жүргізуге мүмкіндік тудырады. Негізгі категория-лар
– классификациялау ...... деп ... (ағылш. faset – аспект).
Айталық, әртүрлі материалды ... ... ... «материалдар»
фасетін құрайды, процестерді белгілейтін терминдер жиыны – ... және т.б. ... ... әрбір терминін фокус деп атайды және
қолайлылық үшін оны қайсыбір код арқылы (цифрмен) белгілейді. ... ... ... деп те ... ... классификациялау үшін арнайы төрт фасетті бөліп
алуға болады. Олар: жанр, метраж, түс және ... ... ... ... ... ... ғана сипаттайтын терминдер аталады. Сонда, кез
келген фильмнің іздестіру ... төрт ... ... ... төрт
термин-белгіден тұратын болады. Классификация сызбасында және оған ... ... ... ... ... ... белгіленеді.
Мұндай орналасу жағы реттеліп, белгіленген тізбені фасеттік ... ... ... ... ... ... ... үлкен қиындық
туғызатындығынан, олар тек шағын пәндік сала үшін ғана ... ... ... ... жүргі-зілетін индексациялау
әдістемесі де аса күрделі. Сондықтан автоматтандырылған ... ... ... іс ... кең ... таба ... ... семантикалық және синтагматикалық тілдердің де практикалық
қолданысы ... ... ... ішінен кең танымал болған Перри – Кенттің
семантикалық ... ... ... ... ... тілдерге тән
ерекшелік – ұғымдар мен айтылымдарды нақты ... ... ... ... орыс ... атаулары: «семанти-ческие множители,
термы, реляторы, предикаты, сущности» және т.б.
Дескрипторлық тілдер. Автоматтандырылған ... ... ... ... дескрипторлы типті ақпарат іздестіру тіліне қатысты
болады.
Дескрипторлық тілдерді құрастыруға координаттық индекстеу принципі негіз
етіп алынады. Бұл ... ... ... ... ... ... тізбесі, яғни қарапайым ұғымдардың аттарын ... ... ... ... сөздер қайсыбір ойша құрылған «n»-өлшемді
пәндік-тақырыптық кеңістіктегі координаттардың орнына ... ... ... ... механикаландырылған ақпарат-іздестіру жүйесін
құрастыру жағдайында пайда болған. Мұндай жүйелердің ең ... деп ... ... ... ... жүйесін айтуға болады. Бұл
жүйеде құжат пен сұрату мазмұндарын баяндау индекстері ретінде ... ... ... ... ... ... слова) қолданылады. Мұндай
сөздердің (УНИТЕРМДЕР) барлығы да ... ... ... ... ... ... құрамы алдын ала емес, тек индекстеу процесі
кезінде тікелей құрастырылады. Шағын ... ... ... ... ... ... екі ... орын алатын тәрізді: құжатты
индекстеуде – потенциалды (ойша) ... және ... ... ... ... ... процесі құжаттың іздестіру бейнесін іздестірудің
алдын ала жазылып қойылған терминдерімен сәйкестендіру арқылы іске асады.
Мысалы, «кітапхана» және ... ... ... тар ... жаңа ұғым – «кітап-ханаларды автоматтандыру» ұғымы
туындайды.
Құжаттар мен сұратуларды тірек ... яғни ... ... ... ... ... индекстеу кезінде ақпарат іздестіру тілін
лексикалық бақылау қажеттігі туындайды. Лексикалық бақылау – ... ... ... ... мен біркелкі қолданбауы-ның
теріс әсерін барынша азайту мақсатында қолданылатын ... ... ... негізгі мақсаты – мәтіндегі берілу тәсіліне ... пен ... ... бейнелері ұғымдарының бірмағыналы түсінігін
қамтамасыз ету. Бұл жердегі лексикалық бақылау термині сөздіктік бақылау
сөз тіркесімен ... ... ... ... тілінде
лингвистикалық бірліктерді нормаға келтіру үшін барлық маңызды тірек сөздер
мен дескриптор-лардың тізімі, ашық ... ... ... ... ... сөздік қолданылады. Парадигматикалық қатынастары қамтылған
дескрипторлық ...... ... ... ... ... – қор)
деп аталады.
Тезаурус арқылы іске асатын лексикалық бақылаудың мәні ... ... ... ... сипатты бақылау;
2) омонимдік сипаттың басын ашу;
3) бір сөзге ғана қатысты оның ... ... ... ... ... бәрінің басын біріктіру.
Лексикалық бақылауды құраушылардың әрбіреуіне қысқа-ша тоқталайық.
1. Синонимдерді бақылау ... ... ... ... ... ең ... қызметі деуге болады. Мұндай әрекеттің
барлық синонимдері тек бір ғана лексикалық ... ... ... ... деп ... және дескрипторлық тілдің ... ... ... ... ... және оған ... ... жатқан сөздер шартты эквиваленттіліктің тобын құрайды. Синонимдер
қатарына мыналар қосылады:
– толық синонимдер (радар – радиолакатор, ЭВМ – ... ... ... ... ... ... (ақпарат іздестіру жүйесі);
– мән-мағыналық (смысл) жағынан бір ғана мағынасымен ... ... ...... ...... Лексикалық бақылау омонимдерді (омографтарды) және көпмағыналы
сөздерді ажыратуды да өз міндетіне ... ... ... ... әртүрлі
кодтарды (шартты белгілерді) сәйкестендіру арқылы іске ... ... ... ... ... ... (цифрлық) әліпби арқылы жазылады
немесе таңбалар (белгілер) жүйесі арқылы беріледі, ... ... ...... ... литье (предмет) – литье (процесс),
меркурий (металл) – Меркурий ... ... ... ... омоним-дерді ажыратпау ақпараттық жағынан көп кедергі (информа-
ционный шум) келтірмейді.
3. Мәтінде кездесетін сөзтұлғалар тірек ... ... ... индекстеу
процесінде осы тірек сөздің (дескриптордың) сөздік формадағы нормаланған
түріне (мысалы, атау ... ... ... ... шартты
эквиваленттіліктің бір ғана класына бір лексеманың грамматикалық формасына
сайып қоймай, сонымен бірге әртүрлі ... ... ... сөз ... ... ... ... мағына негізінде (гиперлексема)
біріктіріледі. Мысалы, сверло (тескіш) – сверление (тесу) және ... ... ... ... ... ... қызметі –
ақпарат-іздестіру жүйесінің нәтижелігін, яғни толықтығын және ... ... тек ... және ... қатынастарды
қолдану арқылы қол жеткізуге болады.
Мәтіндегі лексикалық бірліктер арасындағы байланысты ... ... ... үшін ... ... ... рөлдер мен байланыс көрсеткіштері енгізіледі. Рөлдер көрсеткіші –
қайсыбір дискриптор мәтінде (және оған ... ... ... ... ... ие ... анықтайды және грамматикалық ... ... ... ... ... ... ... «мате-рияны», «ортаны» атауға болады. Көрсеткіштер құжатты
іздес-тіру бейнесіндегі сәйкес ... ... ... ... ... ... бейнесіндегі дескрипторлардың қайсы-лары өзара
байланыста ... ... ... ... ... анықтайды. Олар да ... ... ... ... ... айрықша символдармен белгіленген. Рөл мен
байланыс көрсеткіштерін қолдану дәлдік ... ... ... Рөл мен байланыс көрсеткіштерін пайдалану арқылы құжаттарды
индекстеу қосымша еңбек сіңіруді қажет етеді. Одан ... де неше ... ... ... ... әдетте, рөл мен байланыс көрсеткіштері
іс жүзінде қолданылмайды, ал олардың орны басқа тәсілдермен толықтырылады.
Парадигматикалық ... ... ... қатынастар бойынша
ақпарат іздестіру тіліндегі лексикалық бірліктер арасындағы мән-мағыналар
(смысл) байланысы ... ... ... ... ... ... әлеміндегі нысандар арасындағы қатынастарға тәуелді болады. Бұларға
иерархиялық қатынастармен бірге көптеген ассоциа-тивті қатынастарды (бөлік
– бүтін, зат – ... ...... және т.б.) ... ... ... ... байланыстар нақты түрде (эксплицитті) тезаурус-тарда
белгіленеді. Ақпараттық-іздестіру тезаурусы – белгілі білім ... ... ... моделі.
Ақпараттық-іздестіру тезаурусын құрастыру аса көлемді және күрделі
жұмыстың нәтижесі деуге болады және оның ... ... ... ... ... ... аумағын қамтуды айқындау;
– мәтіндік деректерді жинастыру;
– тірек ... ... ... ... қалыптастыру).
– лексикалық бірліктерді шартты эквиваленттік кластарға топтау;
– лексикалық бірліктің араларындағы парадигматикалық қатынастарды
анықтау және ... ... ... ... ... және ... (нұсқағыштарды) құру;
– ақпараттық-іздестіру тезаурусын қалыптастыру.
– экспертиза мен тіркеу жұмыстарын орындау.
Ақпараттық-іздестіру тезаурусын құрастыру кезінде қосымша құрал ретінде,
әдетте, ЭЕМ қолданылады. Оның ... ... ... мен ... ... анықталады. Тезаурусты қалыптастыруда тұтынушы
сұра-нысын қанағаттандыруға аса көңіл бөлінуі қажет. Оның тұрпаттық сипаты
мағыналық жағынан қажетті ... ... және ... оған ... ... ... алуды қамтамасыз ету көзделеді. Әдетте
ақпараттық-іздестіру ... екі ... ... ... ... тізімі және оның сөздік мақаласымен
(ұясымен) қоса есептелетін сөздік бөлігі, басқаша айтқанда ол ... ... де ... ... ... дескриптордан басқаша, әдетте, ол төрт
ішкі жиыннан тұрады:
– тірек синоним-сөздер;
– «жоғарыда орналасқан» («вышестоящие») дескрипторлар (осы ... ... ... ... орналасқан» (нижестоящее) дескрипторлар (осы дескриптормен
«тек-түр» қатынасында ... ... ... ... ... ... жеңілдететін әртүрлі көрсет-кіштер (барлық
дерек ... ... ... сөз тіркестерінің элементтері үшін
пермутациялық көрсеткіш, жиіліктік көрсеткіш және т.б.).
Тезаурусты құрастыру жұмысында қиыншылық тудыратын жеке бір ... ... сөз ... ... ... процесі, яғни қол күші әрекетімен орындалатын құжаттың
іздестіру бейнесі мен ... ... ... ... ...... ... деп аталатын арнайы
нұсқаулықпен анықталады. Солай бола ... ... аса ... ... ... ... көптеген жағдайда индекстеудің сапалығына
тығыз байланысты. Ал оның өз тарапынан, ақпараттық-іздестіру тезаурусының
және индекстеудің ... ... ... тікелей қатысы бар.
Индекстеудің ... ... ... әрекетіндегідей индекстеудің
толықтық ... және ... ... ... Ең ... ... ... дәрежесі құжаттың іздестіру
бейнесіне енгізілген дескрипторлар санымен, ал индекстеу дәлдігі – олардың
«сапасымен», дәлірек айтқанда ... ... ... ... (сұратудың) мазмұнына жақындық дәрежесімен анықталады. Бұл
сипаттамалар өзара кері ... ... ... Индекстеудің
толықтық дәрежесі мен іздестіру ... ... ету үшін ... ... ... тәсілі қолданылады. Молынан индекстеу
ұғымын құжаттың іздестіру бейнесі мен ... ... ... ... ... тәуелді болып келетін ... деп ... ... ... ... ... құрастыру, ақпаратпен алмасу қажеттігі және
іздестіру нәтижелігін арттыру мәселелеріне байланысты индекстеу әрекетін
автоматтандыру проблемасы ... ... ие ... ... ... мәселесін зерттеу ең алғаш Г.Лун (H.Luhn) және
П.Баксендейл (P. ... және ... ... есімдерімен тығыз
байланысты.
Қазіргі кезде іске қосылған индекстеуді автоматтандыру ... ... ... ... ... ... түрде жасалатын интеллектуалды
индекстеу жүйелерінен ешбір кем түспейді.
Жалпылама ... ... ... ... ... лингвистикалық бірліктерді таңдап алып, оны құжаттың іздестіру
бейнесіне ... ... ... ... ... ... таңдап алу «оң сипатты» (мағыналы сөздер сөзтізбесі) немесе «теріс
сипатты» (мағынасыз сөздер ... ... ... бойынша
орындалады.
Индекстерді автоматтандыру жүйесіндегі ... ... ... ... талдау әдістері негізінде тілдік бірліктерді канондық
түрге келтіру арқылы іске ... ... ... сөзтұлғаларды нормалау
әдісінің тікелей іздестіру әрекеті кезінде де ... түрі ... ең көп ... түрі ... – қию ... ... маскілеу).
Бұл әдіс сұрату кезінде іздестіру термині ретінде тілдік бірліктің тек
мағыналы бөлігі (негіз ... ... ... ... ғана ... түрде индекстеуге қатысты қиындықтар тікелей ... ... ... ... ... бойынша қажетті деген
ақпаратты тауып алуды қамтамасыз ететін ақпараттық іздестіру жүйелерінің
өмірге келуін ... ... ... ... ... ол
іздестіру жүйесінің шектеулі табиғи тілге негізделген түрінің кең таралуы.
Оларды тезауруссыз типті жүйе деп те атайды. ... ... ... ... ... ... мынадай екі түрлі ерекшелікпен
айырым табады:
– лексикалық бақылаудан бас тарту;
– құжаттарды индекстеуді автоматтандыру.
Мұндай ақпарат-іздестіру жүйесінде координаттық индекс-теу үшін ... ... сөз ... ... ... бұл ... біз
парадигматикасы мен сөздігі тұрақты түрде белгіленбеген дескрипторлық
ақпаратты іздестіру тілімен әрекет етеміз. ... ... ... бұл ... ақпарат іздестіру тілінің екі варианты қолданылады:
біріншісі – табиғи тілдің тірек сөздері мен сөз ... ... ... ... – жоғары дәрежелі логикалық өңдеу (сұратуды молынан ... ... ... ... ... жүйесінен бастама алады. Мұндай тезаурустың
қызметі мен қолданудағы ұтымдылығы жайлы ... ... ... ... ... ... ... жүйелердің де өзіне тән
құндылығы бар. Ең ... ... ... аса ... ... ... Ешбір тезаурус табиғи тілдің лексикалық әралуандығын толығымен
қамти алмайтындығы ақиқат шындық ... ... ... индекстеу процесі
құжат мазмұнын толық ашпайды, ал, тіпті, кейбір жағдайларда мазмұн өрескел
бұрмаланады. Әдетте, ... ... тар ... көпаспектілі
сұратулар басым болып келеді. Сол себепті табиғи ... ... ... ... бар, ... олар ... ... ерекшелік
сипатқа ие. Ал тезаурус ешқашанда ... ... ие бола ... бірге, әдетте, әртүрлі ақпараттық-іздестіру тезаурустары да ... ... ... ... ... ... өзара сәйкес келу
проблемасы ақпарат-іздестіру жүйесі үшін негізгі мәселе болғанын да ... ... Бұл ... ... табу үшін ... ... қолданыс
тапты, солардың ішінен аралық тілді құрастыру тәсілі де орын алған болатын.
Бірақ бұл мәселенің ... ... бұл ... ... ... ... ... күн тәртібінен алып тасталды.
Ақпарат-іздестіру жүйелеріне баға беруге ... ... ... қарағанда, мәтін арқылы іздестіру жүйелері
өзінің көптеген көрсеткіштерімен тезаурус ... ... ... Негізінен, ондай көрсеткіштерге дәлдік дәрежесінің ұлғаюы ... ... ... тән ... ... Бұл ... да. ... тіл
арқылы іздестірудің ең жақсы нәтижелеріне жету үшін табиғи тілге ... ... ... ... ... болды. Ол үшін ақпарат-іздестіру
жүйені екі түрлі мүмкіндіктердің (механизмдердің) ... деп ... ... ... және мағынаны сәйкестендіру. Бұл механизмдердің
«күштілік» деңгейі бір-біріне ... ... ... ... егер ... ... мағына ажырату күштілігін арттыратын болсақ,
міндетті түрде мағына-ның сәйкестік механизмінің күшін де ұлғайта ... ... ... ... мен ... ... әрекет-тері
мағынаны сәйкестендіру қызметін жеңілдетеді.
Ақпарат-іздестіру жүйесіне құжаттардың (рефераттардың) толық ... ... ... ... ... мен ... ... қатынастарды толық сақтап қалуға мүмкіндік туғызады. Байланыста
тұратын мәтіндер бойынша ... ... ... ... ... ... айырмашылығы – әрбір сөзтұлға-ның мәтіндегі дәл
орнын көрсету ... Яғни бұл ... ... деп ... ... кездескен абзацтың нөмірі, сөйлемнің ... ... ... ... және т.б. ... ... ... дәл орнын («адресін»)
білу сұрату мен іздестіру алгоритмінің арнайы мәнмәтіндік операторлар тілін
туындатты. Аталған операторлар тілі ... ... және ... ... ... ... деректерді («позициялық оператор-лар»)
пайдаланады. Ал бұл жағдай ... ... ... ... ... және ... тәсілмен қолдануға мүмкіндік
туғызады. Мұндай ақпарат-іздестіру жүйесі – сызықтық грамматикалық жүйе деп
аталады. Ондай жүйелерге ... ... ... РАСПРИ деп аталатын
қолданбалы программалар пакеттерін мысал ... ... ... ... ... ... ... бірге қолдану жолы
қарапайым әдіс-тәсілдер арқылы терминдердің жалған координатымен ... ... ... Ал ... ... сөзнұсқағыштық жағдай үлкен
көлемді мәтіндер бойынша іздестіру жұмыстарын жүргізу ... ... ... ... ... ұйғарымын құрастыру
сатысында мағынаны сәйкестендіру (және толықтықты арттыру) ... ... ... ... ... ... жүйелерінде сұратуларды
молынан индекстеу жұмысы іске асады. Онда ... ... ... ... немесе мағына жағынан жақын жатқан терминдер тіркеліп
жазылып, ... ... ... ... ... пішіні
орын алады.
Ақпарат-іздестіру жүйесін лингвистикалық жабдықтаудың маңызды құрамдық
бөлігі ретінде әрқилы сөздіктерді атауға болады. Олар ... ... ... ... ... мен ... жүйеге енгізу
кезінде орын алатын ... ... ... ... ... және т.б.
жағдайларда қолданыс табады.
Мәтіндердегі қателерді автоматты түрде тауып алу әдістемесін екі үлкен
топқа ... ... ... ... бақылаудың полиграмдық
(көпграфемалық) әдістері және ... ... ... ... Бірінші
жағдайда, қатені тауып алу құралы ретінде қарастырып ... ... ... ... ... үшәріптік тіркестер алынады. Екінші жағдайда
мәтін бойындағы сөздерге жасалған ... ... ... ... ... ... салыстырылады. Соңғы әдістің, яғни сөздік әдісі
бойынша іздестіру мен қателерді өңдеу жұмыстарының тиімді ... ... ... ... ... ... ... сөздіктің көлемі мен
талданатын мәтіндерді қамту толықтығына ... ... ... ... арналған ішкі жүйелердегі негізгі орын ... мен ... ... ... ... ... әрекеттерге
беріледі.
Ақпарат-іздестіру жүйесін лингвистикалық жабдықтау ... ... ...... ... құрастыру мен іске қосуға қажетті
құралдар мен ... ... ... ... ... ... қызметі ұғымына енеді.
Шығарылу критерийі. Құжат пен сұратуды бір-біріне сәйкестендіргенде
құжаттың ... ... ... ... ... ... болады.
Осындай әрекеттің нәтижесінде сұрату бойынша ... ... ... ... ... ... ... қабылдау керек. Мұндай шешім
– шығарылу критерийі арқылы ... ... ... ... ... сәйкестік критерийі деп те аталады. Сонымен, шығарылу критерийі
немесе мағыналық сәйкестік критерийі дегеніміз құжат пен сұратудың формалды
релеванттылық ... ... ... ... бейнесі мен сұратудың
іздестіру бейнесі ... ... ... ... ... ... ... жүйесінде қолданылатын барлық шығарылу
критерийлерін екі үлкен топқа бөліп қарастыруға болады. Олар: есептелінетін
(вычисляемые) және логикалық.
Есептелінетін ... ... ... ... ... ... Бұған құжаттың іздестіру бейнесі мен сұратудың іздестіру бейнесінің
көлемге қатысты сипаттамалары да қамтылады. Бірқатар критерийлер ... ... ... теоретикалық-жиындық амалда-рына
негізделеді. Мұндай қиылысу шамасы пайыздық мөлшерде анықталуы мүмкін. ... ...... ... ... мен ... ... толық сәйкес келуі. Бірақ мұндай сәйкестік аса қатал шарт ... ... ... қиылысу шамасының қайсыбір ... ... ... 50%) ... Ал бұл ... ... сатыда тек
релеванттылықтың деңгейі ғана тұрады. Шығарылу ... ... ... ... ... мен ... ... бейнесіне енетін
терминдердің бірдей дәрежедегі маңыздылығына келіп саяды. Бұл жағдайда
шығарылу ... ... ... ... (формула-мен)
анықталады:
,
мұндағы Ni – құжаттың іздестіру ... мен ... ... ... іздестіру кезіндегі сәйкестік саны; Nz – сұратудың
іздестіру бейнесіндегі терминдердің жалпы саны.
Сонымен қатар, көпшілік жағдайда әртүрлі терминдер, әсіресе ... ... бола ... ... ... ... қатысты
«салмақтылық» немесе «салмақ» ұғымы туындайды. Терминдердің ... ... ... ... деп ... жүр. ... ... әртүрлі
болуы мүмкін. Олардың ең қарапайым түрі ... ... ... ... ... ... ... іздестіру ұйғарымындағы
дескрипторды белгілі санмен ... ... осы сан – ... деп аталады. Ол осымен қатар, тұтынушы салмақтар қосындысының
«табалдырықтық» мәнін алдын ала көрсете алады. Сонымен ... ... ... ... де ... ... Бұл әдіске құжаттарды
автоматты түрде индекстеу әдісін де жатқызуға болады. Мысалы, ... ... ... ... ... қарастырылуы мүмкін. Осы
құжаттағы сөздердің қатынастық жиіліктері барлық құжаттағы ... ... ... асып түсу ... құжаттың негізгі
мазмұны тұрғысынан аса маңызды деп саналады. Ал ... бір ... ... іздестіру бейнесіне қосу мақсатымен құжаттың ең маңызды ... ... ... және т.б.) ... ... ... ... тіркеліп жазылады.
Құжаттың іздестіру бейнесі мен сұратудың іздестіру бейнесінің сәйкестік
дәрежесін анықтайтын шығарылу ... ... ... ... ... ... жағдайда, әрбір «құжат – сұрату» жұптары үшін
векторларды салыстыру әдісінің ... ... ... ... шығарылады. Осының нәтижесінде ... ... ... ... кему ... реттеуге және шығарылатын
құжаттардың санын айқындауға мүмкіндік жасалады. Құжаттың саны алдын ... ... ... байланысты болады.
Қазіргі кездегі көптеген тәжірибелердің нәтижелері негізінде іздестіру
коэффициенті қолданыс табатын барлық ақпарат ... ... ... ... отыр. Бірақ іс жүзінде логикалық коэффициентке
негізделген ақпарат-іздестіру жүйелері ... ... ... ... ... ығыстыра бастады. Мұндай жүйелер сұратудың
іздестіру бейнесі логикалық – «И», «ИЛИ», «НЕ» ... ... ... тілінің мағынасындағы сөздер &, V, ┐ таңбаларымен белгіленеді).
Осының нәтижесінде бір ғана ... ... ... ... ... іздестіру тілі жайлы сөз етуге мүмкіндік туады. Оның
екіншісін ... ... ... алгебра) негізделген сұратудың арнайы
тілі деп ұғыну керек. Мұндай ... егер сөз ... ... бар ... ... сөздер немесе ... ... «1» ... ... ал ол сөз ... ... жоқ болса «0» (нөль – «жалған») мәнін қабылдайды. Егер ... ... ... ... осы ... қатысты «шындық» мәніне
тең болса, онда табылған құжат сұратуға релевантты, яғни олардың ... ... ... деп ... жағдайда іздестіру ұйғарымы конъюнктивтік нормадағы формалық
(дизъюнкциялардың конъюнкциясы) түрде ... ... ... тұратын терминдерді «ИЛИ» (немесе) (дезъюнкция) операторлары
арқылы байланыстырады. Ал «И» (мен) (конъюнкция) операторы арқылы ... ... ... ... ... ... терминдерді)
өзара байланыста ұстайды. Булелік ... ... ... ... ... ... түсінікті пішіндегі логикалық
қисындылығын қамтамасыз етеді.
Сонымен бірге, ... ... ... ... ақпарат-
іздестіру жүйелерде тұтынушыға ұсынылатын құжат-тарды маңыздылығына қарай
реттеу мен олардың көлемін бақылау қиындық туғызуда. ... ... ... ... қол жеткізе алмауына байланысты ақпарат-іздестіру
жүйесіндегі шығарылудың логикалық крите-рийінің «жеңісін» тек уақытша ... ... ... ... іздестіру жүйелерін-де бірінші және
екінші құжаттық «нұсқалар» ажыратылады. Бірінші «нұсқа» ретінде ЭЕМ жадында
сақталатын ... ... ... ... ... ... бейнесі) түсінік табады. Екінші «нұсқа» – әдетте, ЭЕМ-нан ... ... ... ... ... ... ... қазіргі кездегі ЭЕМ-дардың жадының ұлғаю сипаты толықмәтіндік
деректер базалары санының көбеюіне әкеп ... да, ... ... ... ... ... құжаттар бірігіп, біртұтастық көрініс тапты.
Қазіргі заманға сай ақпарат-іздестіру жүйелері кең ... ... ... ... ... ... етуге арналатыны белгілі.
Сондықтан олардың электрондық тұрпатының көрінісі арнайы халықаралық және
мемлекеттік стандарттармен айқындалады, яғни басқаша ... олар ... ... ... кездегі ең кең тараған халықаралық стандарт
– ISO 2709 ... ... ... ... ... жазылған барлық
құжаттар мынадай бірыңғай құрылымға ие:
– жазу маркері – ... ... ... және ... ... ... ... сақтайтын, алдын ала белгіленген тұрақты
ұзындықтағы өріс;
– анықтағыш – ... ... ... деректердің әрбір библиографиялық
бөліктеріне қатысты мазмұн элементтерінің жиынтығы;
– деректер элементтерін бойында ұстайтын деректер аясы (область данных).
Әрбір құжаттың толығуы ... ... ... ... семантикасы, берілу тұрпаты) арнайы унификациялауды, яғни
бірізге келтіруді қажет етеді. Мұндай ... кең ... ... ... жататындар (USMARC, UNIMARK және т.б.)
Техникалық және программалық жабдықтау. Техника-лық және программалық
жабдықтау – ... ... ... іске ... ... ... біз тек ... түрде ғана тоқталамыз.
Ең алғашқы ақпарат-іздестіру жүйелері адамның қатына-сымен ... ... ... жүйелер болатын. Қазіргі заманғы ақпарат-іздестіру
жүйелері ЭЕМ-ның негізінде іске ... ... ... ... ... ... талап – олардың тез әрекет етуі мен ... ... ... ... ... мүмкіндіктерінің барынша
артуы көпшілікке мәлім, яғни қазіргі заманғы ЭЕМ-ның әрекет ету жылдамдығы
(секундына ... ... ... ... және оптикалық дискілер
жадының көлемі мега, гига және терабайт-тармен өлшенеді. Практиалық тұрғыда
қарастырғанда ... ... ... кез ... ... жүйесін
құруға мүмкіндік туғызады. Ақпараттың ... ... ... ... ... ... бар терминалдық құралдар және әрқилы қағаз бетіне
шығаратын құралдар (принтерлер) тез басу ... ... ... де ие. ... ... ... әдетте, байланыс
желілерінің және программалық-аппараттық комплекстердің негізінде ақпаратты
қашықтықтан ... де ... ... Ақпараттың көлеміне және ақпарат-
іздестіру жүйенің мақсатына ... ... ... ірі әмбебапты ЭЕМ-дар
мен персоналды компьютерлер негізінде де ... ... ... ... ... үлестірілген базалар мен деректер
банкілерін ... ... ... локалды желілерге біріктіріледі.
Ақпарат-іздестіру жүйенің қызметін сүйемелдейтін программалық
жабдықтауды ... ... ... ... ... болады: жалпы жүйелік
программалық жабдықтау және қолданбалы программалық жабдықтау. Қолданбалы
программалық жабдықтау нақты ақпарат-іздестіру ... ... ... асырады: ақпаратты енгізу, бақылау, сақтау, ... ... ... ... ... және ... іске асыратын әдістер
көпшілік жағдайда лингвистикалық және ақпараттық жабдықтауға ... ... ... программалық жабдықтау мәселесін зерттеуде
деректер моделі мен ... ... ... ... ... ... орын ... Деректерді ұйымдастыру тәсілін таңдау
әртүрлі факторларға ... ... ... ... ... ... ... енгізу жиілігіне, өзгерістердің сипаты мен динамикасына,
техникалық құралдардың мүмкіндігіне, іздестіру режиміне (ИРИ, ... ... мен ... критерийіне. Деректерді ұйымдастыру
тәсілдері ішінен деректерге еркін «кіру» ... ... және ... ... ... ... ... (кірудің) негізінде, ол
берілістерді біртіндеп, яғни бірінен кейін бірін алып ... ... Ал ... әдіс бойынша деректерге «қол жеткізу» үшін ... ... және ... ... ... ... кез келген
деректі тез табуға мүмкіндік жасайтын қосымша файлдар (деректер жиыны)
құрастырылады.
Ақпарат-іздестіру ... ... ... ... ... іске қосу үшін ... тілдер мен операционалдық амалдар
жүйелерінің құрамына енетін ... ... ... Іс жүзінде
негізінен арнайы міндет жүктелген ... ... ... ... ... ... ... іздестіруге арналған
қолданбалы программалар пакеттері ... ... ... ... көп ... ППП ... және COS/ISIS қолданбалы программалар
паке-тін атауға болады. Бұл пакеттер, әдетте, іздестіру жүйесінің өзегін
құруға мүмкіндік ... және ... ... ... ... ... ... қажетті құралдар;
– деректер базасын толықтыру мен оған ... ... ... ... ... мен іздестіруді құрастыруға қажетті құралдар;
– тұтынушы мен деректер базасы аралығындағы ... ... ... ... ақпаратты шығару құралдары.
Аталған пакеттер тікелей «кіру» әдісі бойынша тез іздестіру ... ... ... өзгерген) файлдарды (индекстерді) құруға
мүмкіндік береді. Инвертте-лінген ... ... ... ... ... ... ... болады. Ондай элементтерге мәтіндік
өрістің ... да ... бар. ... кез ... сөзі сол
мәтіндегі «мекен-жайымен» («адресі») бірге инверттелген файлда ... ... ... ... ... терминдердің мәтін
бөлігінің қажетті деген жеріне (мысалы, ... ... ... үшін
мәнмәтіндік (позициялық) операторларды қолдануға мүмкіндік туады. Бұл
әсіресе ... ... үшін ... деп ... Ең бір ... ... жүйесі ретінде АРТЕФАКТ жүйесін атауға
болады. Бұл жүйеде сөзтұлғаларды морфологиялық нормалау, ... ... ... ... тілі ... ... ... іске асады.
Мәнмәтіндік операторлар іздестірудің сапалылығы мен ... ... ... сөз ... ... ... жасайды. Іздестіру
мүмкіндігін арттыру үшін форматтық өріс бойынша іздестіру ... ... ... Бұл ... ... ... салыстыру операторлары
(үлкен, кіші, тең және т.б.) арқылы қосымша ... ... ... ... ... отырып, форматтық өріс бойынша орындалатын
іздестіру механизмі фактографиялық іздестіру кезінде де қолданылуы мүмкін.
Солай бола тұра, фактографиялық ақпараттық-іздестіру ... ... ... құжаттық іздестіру жүйесін де құру үшін деректер база-сын басқару
жүйесі қолданылады.
Автоматтанған ... ... ... – нақты
деректердің (фактілердің), белгілі нысандардың қасиеттері және т.б. ... ... ... ... Автоматтанған фактографиялық
ақпараттық-іздестіру жүйені сипаттауда, әдетте, деректер базасы теориясының
терминологиясы қолданылады. Себебі, ол ... ... ... ... ... ... жүйені іске қосудың
практикалық жағы қазіргі кезде осы ... ... іске ... ... ... ЭЕМ ... сақталатын деректер мен олардың арасындағы
қатынастардың жиынтығы деп ... ... ... бір ... ... «ақиқат болмыстың үзіндісінің» моделі немесе оның ақпараттық бейнесі
деуге болады. Ал деректер базасында сақталатын құбылыстар, деректер ... ... және т.б. ... ... ... ... деп ... Басқа
сөзбен айтқанда, нысан – біртұтас күйінде тұжырымдауға болатын деректер
базасындағы ақиқаттықты бейнелейтін элемент. Мысалы, ... ... ... ... механизмнің бөлшегі, өндірістің қызметкері және т.б. алуға
болады. Кез келген ... ... ... ... ие ... ... ... нысанның белгілері немесе атрибуттары деп ... ... ... ... да, ал ... ... нысан – осы атрибуттар жиыны деп саналады. ... ұшақ ... ... ... ... сипаттай алады: рейс нөмірі, ұшақтың типі,
сапарға аттану пункті, ... ... ... ... ... ... сапардың аяқталу уақыты, ұшақтың әуеде болу уақыты, билет құны ... ... жазу ... ... ... онда ... нысан бір
«жазба» (запись) түрінде көрініс табады. Әрбір жазба атрибутқа сәйкес
келетін өрістерден ... ... ... ақпараттық жүйелерді кейде нысанды-
белгілік ақпараттық жүйе деп те ... ... ... ...... нысандардың жиыны (атрибуттар жиыны) және олардың аралық байланысы.
Деректер базасын құрылымдық тұрғыда қарастырғанда әдетте оны үш ... ... ... және реляциондық.
Деректік базаның құрылымы «шежірелік» (бұтақ таралымы) принципіне
негізделсе, оны иерархиялық құрылымдық ... ... деп ... ... базаның құрылымы еркін желі ... ...... ... ... болмақ. Иерархиялық ... ... ... ... іске ... үшін жан-жақты зерттелген
математикалық ... кең ... ... Ал ... құрылымдағы
деректер базалармен әрекет ету соңғы кезде көптеген қиындықтарға ... ... ... деректер базасына қарағанда иерархиялық деректер
базасы бойынша іздестіру жұмысын ... аса ... ... ... кез келген ақпаратты иерархиялық ... ... бола ... Сол себепті егер ақпаратты баяндау тәсілі
иерархиялық сипатта ... ... ... ... жұмыстары иерархиялық
деректер базасына қолданылуы керек. Соңғы кезде жиі қолданыс тауып жүрген
реляциялық деректер базалар ... ... ... ... көрініс
табады. Ал кестелер арасындағы байланыс – айқыш сілтемелер арқылы іске
асады.
Деректер базасы бойынша жұмыс ... ... ие болу үшін ... ... ... ... ... жұмысты қамтамасыз ететін
программалар топтамасын деректер базасын басқару жүйесі деп ... ... ... жүйесінің құрамы әртүрлі деректер базалармен жұмыс
істеуге мүмкіндік тудыратын барынша әмбебаптық сипаттағы ... ... деп ... ... ... ... ... базасының құрамдық жағын
құрастыруды, деректер базасындағы ақпараттық өзгерісті (модификацияны),
деректер базасындағы ақпаратты іздестіруді, ... ... ... шығарылуы мен басқа да қосымша ... ... ... Осы ... ... тоқталайық.
Деректер базасының құрамын құрастыру. Деректер базасын зерттеп, іске
қосу ... оның ... ... көп ... ... ... сақтау
мен өңдеу нәтижелі болу үшін қандай ... ... ... қажеттігі,
деректер базасында қандай нысандардың типтері орын ... ... ... ... ... ... типтері үшін оларды айқындайтын атрибуттар
топтамасы анықталуы керек болады. Сонымен бірге ... ... ... ... ... ... типтері де анықтауды қажет етеді. Барлық
нысандардың типтері бейнеленген және әрбір нысан ... ... мен ... ... ... ... ... тапқан сызбаны жалпы
концептуалдық сызба немесе деректер моделі деп атайды.
Әдетте, деректер базасын зерттеу онда ... ... ... аяны ... және ... концептуалды сызбаны бейнелеуден
басталады. Деректер базасын басқару жүйесінде ... ... ... ... ... ... құрылымы жайлы ақпаратты енгізу
мүмкіндігі ойластырылуы керек. ... ... ... атрибуттың деректер
типін анықтау қажеттігі (программалау мағынасында) туындайды.
Әдетте деректер базасын құрастырғанда артықтық сипаттағы ақпараттың оның
жадында ... жөн деп ... ... ... ... ... артық болмайтын (неизбыточная) деректер жиыны деп анықтайды. Бірақ
іс жүзінде мұндай нәтижеге жету оңай ... ... ... ... ыңғайлы болуы үшін ақпараттың артықтығы қолайлы деп те саналады.
Мысалы, ұшақ ... деп ... ... мынадай атрибуттары ұшу уақыты,
қону уақыты және ... болу ... ... ... ғана белгілі болса, үшінші
атрибутты әр уақытта есептеп шығаруға болады. Бірақ егер біз ... ... ... ... ұшақ ... сипаттамаларының әрбіреуі
бойынша жүргізу қажет деп санасақ, үш түрлі атрибуттың да орын ... ... ... ... өзінде де, жалпылама жағдайда, ақпарат артықтығының
аз мөлшерде болуына талпынуымыз қажет.
Деректер базасындағы ақпараттың ... ... ... ... жад ... ... етуде ғана емес, ең алдымен, деректер
модификациясының өзгеріске ұшырау ... ... ... қосымша
бақылау әрекетінің қажеттігі болуында. Сондықтан зерттеушілердің тұжырымдау-
ынша, ... ... ... тек ... ... ғана ... жөн деп саналады.
Деректер базасындағы ақпаратқа өзгерістер (модификациялар) енгізу.
Деректер базасын басқару ... ... ... ... ... өзгерістер енгізуге мүмкіндіктері болуы қажет. Ондай өзгерістердің
типі мынадай болуы мүмкін: жаңа жазбаны (новая ... ... жаңа ... бар ... ... бар жазбаның атрибут мәнін өзгерту. Деректер
базасының құрылымын ... ең ... ... ... ... Іс
жүзінде деректердің жалпы концептуалдық сызбасының идеалды түрін (өзгеріске
жатпайтын) алдын ала болжамдау мүмкін бола бермейді. ... ... ... ... кейбір нысандар қажетсіз, ал қайсыбірінің жетіспеуі
немесе артық болуы, тіпті кейбір тәуелділіктерді басқаша түрде ұйымдастыру
қажет болады. ... ... ... ... ... базасының
құрылымын өзгерту тұсында ... ... ... ... сақтап қалу
мүмкіндігі жасалуы қажет.
Ақпаратты іздестіру. Деректер базасын басқару жүйесі қызметінің ішінде
ең бір маңызды деп ...... ... бойынша жүргізілген
іздестіру әрекеттерінің нәтижелі болуын қамтамасыз ету. ... ... және тез ... ... ... ... деп ұйғарым жасалады. Ал ол
үшін ... ... ... ... ... ... ... тізбе деректері бойынша іздестіру әрекетінің ойдағыдай нәтижелі
болатындығы белгілі. Ал егер деректер ... ... ... ... ... деген нысанды тауып алу үшін барлық деректер жиынын толығымен, яғни
басынан аяғына дейін қарастырып шығуға тура келеді. ... ... ... ... ал уақытты үнемдеу үшін іздестіруді ... ... ... ... жөн ... Бұл ... әдетте тек
инверсияланған индекстік файлдарды құрастыру ... іске ... ... ... мәні мен қажетті деген жазба түрлеріне сілтеме
жасайтын ... ... ... орын ... ... сипаттағы
ақпаратты индекстік файлдар өз бойында сақтайды. Сондықтан ... ... ... үшін ... ... ... жүйесінде
ақпаратты өзгертуге (модификациялауға) қажетті ... ... ... жөн. ... ... олардың мәндері бойынша тез тауып алу үшін оның
өзіне ғана сәйкес ... ... ... ... қажет. Яғни деректер
базасын басқару жүйесінде ондай міндетті ... ... ... ... ... ... сөз. Мәні бойынша атрибутты тез
іздестіру мүмкіндігін оның «кілті» немесе кілттік атрибуты деп ... ... ... ... ... ... реттегі кілт, ал
басқаларын екінші реттегі ... деп ... ... бірінші реттегі
кілттің өзіндік ... ие ... ... жазбаның бірмағыналы
теңестірулерге мүмкіндігі болуына талпыну ... ... ... ... ... әртүрлі жазбаларда қайталанып тұруы мүмкін. Сондықтан
бірінші реттегі кілт бойынша іздестіруді ұйымдастырудың ... ... яғни ол ... ... ие. ... ... ... жүйесі
іздестіру жұмысын кілттік атрибуттардың мәні бойынша ғана емес, сонымен
бірге кілтсіз атрибуттар ... де іске ... ... ... ... ... жылдамдығы кемиді. Деректер базасында ақпаратты
іздестіруге қатысты ... екі ... ... сұратулар орын алады.
Бірінші тип – ... ... ... ... ... ... ... реттегі кілт) іздестіру. Сұратудың бірінші типіне мынадай мысалды
келтіруге болар еді: «Егер ұшақтың рейс ... ... ... ... ... оның ұшу ... ... табуға болады?». Ал сұратудың екінші
типі нысанды ... ... деп ... ... ... мәні ... әрекетін атайды. Мысалы: «Егер ұшақтың қону пункті (жері) белгілі
болса, оның рейс ... ... рейс ... ... ... ... сұрату түрі күрделі болатын болса, ондайларды бірнеше қарапайым
сұратуларға бөліп қарастыруға ... ... ... ... ... ... Әдетте деректер
базасын басқару жүйесі бірнеше қосымша қызметтерді қамтиды. ... ... ... негізінде табылған ақпаратты тұтынушыға қолайлы түрде
(мысалы, кесте ...... ... ... ... ... бірге
деректер базасын басқару жүйесі көптеген есептеу жұмыстарын да орындай
алады. Мәселен, мынадай ... ... ... ... ... ала қанағаттандыратын қанша нысан бар?».
Деректер базасын басқару жүйесінде басқа да ... ... ... ... өз ... ... ... болуы қажет.
Мысалы, оған жататындар: ақпаратты жүйелік «жаңылысу» ... ... ... ... ... кездейсоқ қателерінен және қажеттікке қарай
кейбір жүйеге рұхсатсыз кіруден сақтандыру жұмыстары.
Деректер базасының теориясы автоматтанған ... ... ... ... ... және ... құралдары ретінде
көрініс табатынын да айтуға болады.
Әдебиет
Дейт К. Введение в системы без ... М., ... / Под ред. ... М., ... Ф. ... ... М., ... Дж. Организация баз данных в вычислительных системах. М., 1980.
Москович В.А. Информационные языки. М., 1971.
Панков И.П., ... В.П.. ... ... / ... ... ... отв ... СПб, 1996.
Солтон Дж. Динамические библиотечно-информационные системы. М., 1979.
Сэлтон Г. ... ... ... и ... ... ... Т., Фрей Дж. ... структур баз данных. М., ... А.И. ... в ... ... поиска. М., 1975.
Автоматтанған оқу жүйесінің
негізгі ұстанымдары
Оқытуды компьютерлендіру ісі қазіргі кездегі ... ең бір ... ... ... ... бірге бұл білім беру жүйесінің алдында
тұрған күрделі мәселелерінің біріне айналуда. Тек ... ... ғана ... (уәжділік, мативация) сипатының жоғарғы деңгейінің
негізінде оқып-үйрету әсерінің нәтижелігін түбегейлі ... ... ... беру ... ескі ... әдіс-тәсілдеріне жұмсалатын адам
еңбегі (инемен құдық қазғандай) есептеу техникасына, яғни ... ... адам ... бір рет қана ... еңбегі оқып-
үйренушінің қалауынша компьютер көмегімен сан рет қайталануына ... ... ... ... педагогтың еңбегін мүлде қажетсіз
деген ұғым туындамауы керек. Бірақ автоматтандыру әдісі оқытушыны «қара
жұмыстан» – ... ... ... оны ... ... ауыстырады. Ал мұндай жұмыстарды адам (мұғалім) ... ЭЕМ ... ... зор ... ... жылдам орындай алады.
Оқытуды автоматтандыру барысы, ең алдымен, автоматтанған оқу ... ... ... құрастырып алып, тек содан кейін ғана оны ... ... ... ... оқу ... ... ... қажетті техникалық
құралдар жиынтығы мен оқыту программаларының дестесін (пакетін) ... ... ... тек ... бір ... ... яғни ... оқушы арасындағы әрекеттесудің бір ғана сеансын өткізуге икемделген.
Мұндай тәсіл біржақты ... ие, ... «оқу ... ... ... ... ... оқыту (үйрету) программалары оқу жоспарына ... ... ... оқу ... ішкі құрылымдық көрсетімімен
тұтастық кешенін құрайтын мағынада түсінік алуы керек. Мұндай тұтастықта
қарастыру келесі екі ... ... ... ... және ... ... мен ... автоматты түрде таңдау.
Дидактикалық материал ретінде компьютерлік программаларды ... ... ... ... кең ... ... ... деректері
қарастырылады. Екінші негіздік жайт – автоматтанған оқу жүйесі шеңберінде
әрекет ету кезіндегі үйренушілердің ... ... ... ... яғни оқу ... нәтижелерінің деректер базасы.
Дей тұра, автоматты түрдегі даралық оқыту программасы-ның да белгілі
дәрежедегі құндылық жағын ... ... ... ... автоматтанған
оқу жүйесі құрамына енетін дара оқыту программасының нәтижелігі әр уақытта
жоғары сатыда тұратынын ... ... ... ондай компью-терлік
программалар даралық оқыту мен топтық оқыту ... бір ... ... әрекеттесу мүмкіндік-терін ескере құрастырылғаны жөн
болады.
Жалпы жағдайда, ... оқу ... ... мынадай негізгі
компоненттерден тұруы керек (Жарков, 60):
1) оқытудың техникалық құралдар кешені;
2) оқыту программаларының дестесі;
3) пәндік ая бойынша білім ... ... ... ... ... ... ... оқу жүйесі әртүрлі пәндерді оқыту барысында пайдаланылуы
мүмкін. Оның қызметі сол ... ... ... ... ... ... Бұл ... негізгі қызметтеріне жататындар:
– оқытудың өзіне тікелей қатысты жағдайлар;
... ... ... оқу ... ... ... бөліп құрастыру оқыту
программаларын жобалау мен құрастыру кезінде аса маңызды: ... ... ... ... диалог формасын (егер
диалог алдын ала қарастырылса), ... ... ... ... ... оқыту программамен өзара әрекеттесу сеансынан бұрынғы және
кейінгі әрекеттерін анықтайды.
Автоматтанған оқыту жүйесінің негізгі ұстанымдарының бірі ... ... ... ... болғандықтан, яғни аяқталған оқыту үзіндісін жүзеге
асыру мүмкіндіктерінде оқыту ... үш түрі де ... ... ... ... орын алуы қажет. Тек осы аталған ... ... ... ғана ... ... оқыту жүйесі толықтық
сипатқа ие ... ... тек бір ғана ... ... ... ... қамту алгоритм-дерге жүктелетін мәселелердің ... ... ... ... ... үш ... программалар үшін дидактикалық материалдар
пайдалану тәсілімен ... ... ... дәрежеде қамтылуы қажет. Ал
бұл жайт дидакти-калық материалдардың (программада пайдаланылатын мәлімет-
тердің құрылымы) ... ... ... ... ... ... ... немесе әмбебеп тілде жазылған көрінісіндегі бірыңғай деректер
өздерінің түрліше атқаратын қызметіне ... ... ... ... ... асуы ... ... “әмбебеп тілде жазылған
көрініс” дегенді, деректер мен оларды ... ... ... ... ... ... деп түсіну қажет. ... ... ... ... ... адам ... үнемдеу ақиқаттығынан
басқа, ол материалдарға (ұқсас және қайшылықсыз) өзгерістерді тек бір ... ... ... ... ... программалар арқылы оқып-үйренушілер
(обучаемым) ... ... ... ... яғни ... тиісті ақпарат ала алады. Оқып-үйренушіге қажетті ақпарат
беру тәсілі деректер жиынын айрықша ... ... ... ... ... ... орналастыруды, аса маңызды ақпаратты ... ... ... ... ... бір қалыптағы «жансыз» мәтіндік ақпаратты
қажетті графиктер арқылы, компьютердің әуендік және ... да ... ... «жан ... оқып-үйренушінің жадында сақтау мүмкіндігін
арттыру. ... ... ... танысқан ақпарат үзіндісіне қайта
оралып, жаттығуына да жағдай жасалуы қажет.
Жаттығуға қатысты программалар өз құрылымына бөлек ... ... ... ... білім базасына немесе оқу материалының ең қиын
деген және біркелкі қате жіберілетін үзінділері бойынша түзілген жауаптар
жүйесіне айрықша ... ... ... ... Сонымен бірге оқып-
үйренуші мен программа әрекеті арасындағы ... ... ... де жөн ... ... ... ... барысында, оқып-
үйренуші тарапынан кеткен қате-лерді атап көрсету, тіпті программаның
күрделігіне қарай, ол ... не ... орын ... да ... ... жөн ... ... жұмысы кезінде әрбір тапсырманың жауаптары
деректер базасының оқыту барысы ... ... ... ... ... ақиқат және кездейсоқ қателерді аса ұқыптылықпен ажырата білу
керек. Бұл жайт лингвистикалық оқып-үйрету программа-ларында аса маңызды
деп ... ... ... ... ... салдары күрделі қателерге
әкеп соғуы мүмкін.
Егер программада бағалау қызметі жүзеге асатын ... ... ... да ... ... ... яғни кеткен қатенің «салмақ» деңгейін
анықтау және орындалған тапсырма нәтижелерін статистикалық өңдеуден өткізу
қажет ... оқу ... ... ... қызмет-терді бөліп алып
қарастыруға болады. Ондай қызметтерге төмендегілерді жатқызуға болады
(Жарков, 62):
– оқу ... ... ... Егер ... оқу ... ... ... базасы орын алса, онда мұндай қызметтің
маңыздылығы арта ... және ... ... ... ... әсерлігі де барынша өседі.
– оқып-үйренушіні ақпараттау қызметі. Егер ... ... ... ... өз ... ... ... ақпаратты алуына мүмкіндік туса,
бұл қызмет толық көлемде жүзеге асады.
– диалогты ендіру қызметі. Диалогты пайдалану үшін жан-жақты зерттелген,
қажетті ... ... ... мен тани білетін табиғи тілге барынша
жақын келетін жасанды тіл құрастыру қажет.
– оқып-үйренуге қажетті стратегия мен тактиканы ... ... ... ... ... ... ... икемдеу қызметі үшін оқыту
әрекеті бойынша құрылған деректер базасын пайдалану орынды деп ... ... ... ... ... түріне қарай
үлестірілу сипаты да ... ... ... Мәселен, нәтижелерді тіркеу
қызметін жүзеге асыру тек бақы-лаушы ... ғана ... ... ... ... программаларға қатысы жоқ деуге болады.
Оқыту жүйесін құрастыруға байланысты ... ... ... ... қызметтерге қажет деп саналатын бірнеше ... ... ... ... ... автоматтанған оқу ... ... ... ... ісіне кешенді түрдегі қатынас-тың (подход)
жоқтығы. Оқытудың кешенділік ұғымын ... ... ... толық араласу жағдайы деп түсіну қажет. Егер автоматты ... ... ... сипатта болып, оқу курсының тек
бірнеше бөлімдерін ғана қамтитын болса, ол нәтижелі бола бермейді.
2) Тілді оқытып-үйрету ... ... ... болуы қажет. Осықан
байланысты оқыту программасын құрас-тыру кезінде оқып-үйрету ... ... ... әр ... ... қатысты болуын мақсат етіп
қойған жөн болады. Мұндай ... ... ... ... ... ... нәтижесінде үйренушіде тек статикалық
аспектідегі тіл жүйесі туралы түсінік қана ... ... ... әртүрлі тілдік бірлік-тердің қызметі туралы да түсінік пайда болады.
Мысалы, оқушы жаңа атаулы ... ... ... үстінде, оларды
бірден әртүрлі синтаксистік құрылымдарда да ... ... ... ... бірге оқып-үйренуші атаулы бірліктердің валенттілік
пен тіркесімдік қасиеттерін де сәйкес игере алады.
3) ... ... ... ... үйретілетін тілдің ең ірі
және жиі кездесетін құбылыстарын көрсете ... оқу ... ... ... тұрады; екіншіден, үйренуші жағынан басқаруды қажет ететін
программаларда (мысалы, білім базасымен ... ... ... ... ... дайындықсыз-ақ диалог жүргізуді ұйымдастыру қажет болады;
үшіншіден, компьютерлік программамен жүзеге ... ... тілі ... тілге
барынша жақын дәрежеде жүргізілуі керек.
Үшінші жағдай қайсыбір нақтылауды қажет ... ... ... ... жүйелерде ағылшын тілі немесе соған ұқсас келетін ... ... ... ... ... ... жаңадан
үйренушілер үшін ана тілінің негіз болғаны жөн. Үйренуге (үйретуге) ... ... ... ... тілінің алынатынын ескерсек, оның интерфейсі
ретінде, басқаша айтқанда компьютер мен адам ... ... ... ... ... тілі ретінде қолдану үшін ағылшын тілін аздап
болса да игеру қажет болады.
4) Табиғилық және вариативтілік принциптері бір-біріне ... ... ... ... ... ... ... құрылымдарды жүзеге асыру арқылы
бір ғана немесе бір-біріне ұқсас ... ... ... ... ... ... мүмкіндік тудырады. Олардың қайсыбірін
таңдап алу, оқу барысында бейнеленетін ... ... ... ... оқу ... ... ... деңгейін арттыруға мүмкіндік туындатады. Бірақ мұндай уәждік
(мотивациялық) жоғары ... оқу ... ... ... ... мен адам арасындағы диалогты жүзеге асыру ... және ... ... ... яғни ... ... ... ғана жетуге болады.
Автоматтанған оқу жүйесін жобалау мен жете ... ... ... ... табу ... ... ... таңдау және оны топтау (әр сабаққа, тақырыптарға үлестіру);
– диалогтың сценарийін жете ... ... ... ... ... ... программаның дизайны;
– жүйедегі өзара әрекеттікті ұйымдастыру (оқып-үйретуге кешенді тәсілді
жүзеге асыру);
– “деректер көрсетімі тілін” жете зерттеу;
– пәндік сала және ... ... ... қажетті интерфейс бойынша
деректер базасын ... ... ішкі ... ... оқу ... ... ... емес.
Автоматтанған оқу жүйесінің функционалды өзегін ... ... ... үйренушінің оқыту програм-мамен әрекеттесу барысы,
шындығында да, автоматтанған оқу ... ... ... асады. Міне, осы
әрекеттесу ғана оқыту әсерлігінің аса жоғары ... ... ... ... ... ... ... жиыны бойынша топтастырылуы мүмкін.
Олардың ең маңыздылары мыналар (Жарков, 64-66):
1) Оқып-үйренушінің ЭЕМ-мен (компьютермен) тікелей әрекеттесуіне ... ... ... ... Кең ... алғанда, оқытуға
қатысты программалар түр-түрге бөлінеді, бірақ олардың бәрі бірдей оқыту
қызметін атқаруға ... ... ... программалар қосым-ша
сипатта мынадай қызметтерді атқара алады: оқу барысы жайлы ... ... ... ... ... ... ... қызметтерін есептеу құралдарына ... ... ... ... ... мен ... қызметтерінің нәтижелерін
тіркеу және оларды техника жадында сақтау. ... ... ... мен ... ... ... оқу ... жасау әрекеті, есеп беру
жұмысын атқару және ... ... ... ... ... ... ... үшін компьютерлік
программа қандай қызметтерді атқаруына қарай: бақылау, қажетті әрекет түрін
көрсету, оқып-үйренушінің әрекетін бағалау және т.б. ... ... ... ... тек оның ... ғана тән ... ие,
сондықтан олар бір ғана алгоритмдік тәртіп бойынша жүзеге аспайды; ... үшін ... ... ол ... ... ... қатысы болмайтын
кейбір таза формалды әрекеттер (процедуралар). Мысалы, терезелік интерфейс,
жинақтауыштағы ... ... ... ... ... ... да программаның безендіру құралдары, оқып-үйренушімен диалог
ұйымдастыру құралдары және ... ... оқу ... ... қарай: дағдылы (обычное), тапсырмаға
ену (погружение); тапсырманың жағдаятына ену;
4) Оқу программасында диологтың орындалуына және оның формасына ... ... оқу ... ... ... ... ... маңызды құрал ретінде диалогты алуға болады; бірақ ол
тағы да бір аса ... ... ие: бұл – ... ... ... связь) жүзеге асыратын бірден-бір құрал. Осының
негізінде қандай да ... ... ... оқу ... ... аспайды. Оқып-үйренуші жағынан да программаның орындалу ... және оның ... ... де ... алу ... диалогсыз
мүмкін емес. Диалог ескерілмеген оқыту ... ... ... оқып-үйренуші әбден енжарлық күйде қалуға мәжбүр болады.
Диалог қайсыбір табиғи тілдің (ана тілі ... ... ... ... ... ... ... жасанды бұйрықтар жүйесі негізінде
құрылуы мүмкін. Анығы, оқыту программаларында ... ... ... ... ... да аса ... ... жасанды интеллект деңгейіне көтерілу
қажет болатындықтан, ол көптеген қиындықтарға әкеп соғады; сонымен бірге
оқып-үйренушілер ... ... ... ... ала ... алуы ... және ... тіл тек бірен-сараң оқыту ... ... ... оның ... ... жүйесінде орын алғаны аса мәнді.
5) Оқыту программасының орындалу барысын оқып-үйренушінің өзі ... ... ... Бұл ... ... (линейное) және тармақты
алгоритмдер ... сөз ... ... ... ... яғни сызықтық
алгоритмдерде программаның сценарийі ... ... ... ала
берілген бақыланылатын және ұқсас әсерлер ... ... ... жоқ. Екінші жағдайда, яғни тармақты алгоритмдер жағдайында аталған
реттілік ... ... ... ... ... бар. ... ... оқу барысына қатысының белсенділігін арттырады.
6) Оқып-үйренушінің даралық ерекшелігінің ескерілуіне қарай. ... ... ... ... ғана тән ... ... гөрі, оқып-
үйренушінің деңгейіне қатысты қайсыбір сандық сипаттама деп ... ... ... табатын деңгейлер саны барынша үлкен болуы да мүмкін (кейбір
жүзеге асырылған автоматтанған оқу ... оның саны ... ... ... ерекшелікті ескеру оқыту тәсілінің дербес болуын таңдаудан
туындайды, яғни ол толығынан алғанда, оқу ... ... ... ... ... Мұндай әр оқып-үйренушінің дара мүмкіндігін
есепке алу, программаның іске қосылмай тұрған кезінде, яғни алдын ала ... ... ... да ... ... ... бір ... деңгейге өтуге мүмкіндік туады. Мұндай ауысу әрекеті аса қарапайым
немесе аса күрделі тапсырманы таңдайтын оқып-үйренушінің қалауы ... ... асуы ... және ... ... ... ... барысында
алдыңғы әрекеттердің ойдағыдай жүруін автоматты талдау ... да ... ... ... ... субъективтілікті (өзіндік сипатты) жою
тұрғысынан автоматты талдау тәсілін қолдану ең ұтымды деп саналады;
7) Оқып-үйренушінің ... ... ... ету ... қарай.
Әрине, мұндай мүмкіндік білім базасымен әрекет жасауды жүзеге асыратын
программаларды ғана сипат-тай алады, яғни ... ... ... ... ... ... ... болып саналады.
8) Автоматтанған оқу жүйесінде программалардың орындалу нәтижелерінің
тіркелу жағдайына қарай. Бұл ... ... ... да ... нақты оқып-үйренуші мен автоматтанған оқу ... ... ... ... ... ... қамтамасыз ете алады. Мысалы,
әрбір оқып-үйренушіге қатысты қайсыбір программаның ... ... Ал бұл ... ... ... ... ... тақырыптың сырт
қалуынан және қайталануынан сақтандырады. Сонымен бірге нәтижелерді тіркеу
ісі оқып-үйренушінің білім деңгейін оқу барысында ... ... ... ... ... материалдардың программа мәтінінде немесе оған тәуелсіз
деректер берілісінде орын алуына ... ... ... ... ... бір ... ... әрекет етуге мүмкіндік туады. Осының
нәтижесінде оқыту жүйесін программалауға жұмсалатын адам ... мен ... ... ... ... ... ... үнемделеді.
Осы айтылғандарға байланысты автоматты оқу ... ... шеше ... және икемділігі мол деректер көрсетімі тілін (язык
представления данных) зерттеп құрастырудың маңыздылығы арта түсуде.
Ә д е б и е ... ... ... на базе ЭВМ / Под. ... Минск, 1980.
Жарков И.В. Автоматизированные обучабщие системы // ... ... / отв. ред. ... СПб.: ... ... ... 1996. ... Э.Л. ЭВМ в обучении иностранным языкам в вузе. М., 1988. 103 б.
Пиотровский Р.Г. Компьютеризация преподавания языка. Л., 1988.
Рыбаков Ф.И., ... И.Н., ... Л.В. ... с ... ЭВМ. М., ... А.Я., ... В.А., ... Ю.И. Подготовка информа-ции для
автоматизированных обучающих систем. М., 1986. 174 б.
Фадеев С.В. ЭВМ в ... ... ... как ... ... 81 б.
Автоматты (машиналық) аударма
Сөйлеу әрекетінің қайсыбір түрі қайта туындалатын ... ... ... тобына жатады.
Жалпылама айтқанда, адам баласының сөйлеу әрекетінің негізгі үш ... ... ... Ал ... ... барабар туындату үшін
кибернетикалық модельдер-дің де ең кем дегенде үш типі ... ... ... кезіндегі адамдардың тілдік әрекеті. Бұл жердегі
коммуникация процесін кең ... ... ... яғни ... ... ... ғана ... сонымен бірге белгілі ортада – баспа, радио,
теледидар және т.б. арқылы тілдесуін де қамтиды. Осы типке ... ... ... ... – әртүрлі эксперттік жүйелерде модельденетін
диалог түрі;
2) қайсыбір ... ... ... ... ... ... қоса
есептегендегі тілдік әрекет. Мұндай әрекет типі оқыту жүйелері арқылы
модельденеді;
3) шет ... ... ана ... және керісінше аудару тұсындағы
адамның тілдік әрекеті.
Машиналық аударма жүйелері кибернетикалық ... ... ... ... ... ... әрекеттің үшінші типі арқылы іске асады. Сондықтан
аударма ісі электронды-есептеу машиналарының (ЭЕМ) ... ... ... ... ... әрекетінің, яғни сөйлеу-ойлау қызметінің моделін
машиналық ... ... ... ... ... екі түрлі таптастыру
параметрлері бойынша анықталады:
– автоматтандыру дәрежесі, яғни компьютерге жүктелетін ... ... ... ... ... айырып қарастыру керек (Кулагина, 1979,
3):
1) аударма жұмысы толығымен немесе ... жуық ЭЕМ ... ... аударма жұмысын аудармашы атқарады да, ал ЭЕМ ... ... ... ... ... ... ... тауып алу жұмысында).
– аудармашы адамды қатыстыру стратегиясы, яғни аударма ... ... ... арқылы орындалады да, ал аудармашы ... ... яғни ... ... әр ... ... ... аяғында)
редакциялық жұмысқа қатынасады (Machine Translation, 1987, 12-13).
Аудармашының сөйлеу әрекетінің ерекшелігі мынаған саяды: бастапқы ... бір ... ... ... да, ал ... қызметтің нәтижесі ретінде
– мағыналық жағынан аударылуға тиісті мәтінге барабар, басқа тілдегі мәтін
болып табылады. Басқаша ... ... ... ... түрде мәтін
түрінде ұсынылуы қажет. Ал басқа бір тілдік әрекет типтерінде, ... ет күші ... ... ойлау қызметі, білімді қорландыру және ... ... ... түрінде болуы міндетті емес.
Аталған ерекшелік автоматты аудармаға белгілі принциптік ... ... ... ... ... ... ең жақсы деген
(идеалды) көрінісі берілді.
«Х» тіліне талдау жүргізу мен оны ... ... – «Х» ... ... және ... ... ... «Х» тіліндегі
мәтіннің мазмұнын ашу. Ал «Ү» тіліне ... ... ...... ... мәтінін құрастыру (немесе оны синтездеу) деп ... ... ... сол ... сөздігі мен грамматикасы негізінде ашылады.
ЭЕМ-сыз дәстүрлі аудармашының мәтінді ... ... ... ... ... орын алуы ... түрде байқалмағанымен, автоматты
аударма жасау процесінде ондай тәсіл бөліктері міндетті түрде орын ... ... ... ... ... ... Автоматты аударма процесінің
идеалдық құрылымы
Ал сызбадағы «өзгерту» топтамасының қажеттілігі ең қарапайым жағдайда да
айқын ... ... ... ... «Х» ... ... ... жағынан екінші тілдің («Ү») сөздік бірлігімен және екі тілдің
(«Х» пен «Ү») ... ... да ... ... ... тұрған
жағдайда да (тіпті сөздердің орналасу тәртібіне дейін) тиісті өзгерістердің
жасалатыны белгілі. Негізінен алғанда, ... ... ... ... ... сөйлем ішінде дұрыс орналасу тәртібі өзгертуді
қажет етеді.
Бірақ жоғарыда қарастырылған жайт идеалды жағдаятына сай және ... ... ... мен ... тән ... ... Сонымен бірге
мұндай жағдаят тек әрбір нақты тілдер жұбы үшін ғана ұтымды деуге ... екі ... ... ... мен ... құрылымдары
бойынша басым көпшілік тілдерге жоғарыда ... ... ... айту ... Оған ... – әртүрлі тілдердегі көп мағыналы сөздер
көлемінің сәйкес келмеуі. Лексикалық сәйкестіктің ең соңғы бұзылу ... ... ... ... ... ... ... олар тұрмыстық
бұйымдарды, мәдениетті сипаттайтын сөздердің екінші ... ... ... ... орын ... ... жағдай лексикалық элементті
сипаттау немесе калькілеу үшін оның ... ... ... ... етеді.
Басқаша айтқанда, мағынаға сәйкес келтіру үшін қажетті деген өзгертулерді
(өңдеулерді) жүргізу керек болады.
Егерде аударма мәселесін, ... ... қоса ... ... бұзылуы тұрғысынан қарастырсақ, онда оның ... ... жұбы ... ... ... ... деп ... қажет.
Яғни екі тіл арасындағы ... ... ... ... сөздер
тәртібі және т.б.) мазмұнды ашу құралдарын сәйкестікке келтіру деп түсіну
керек ... ... ... ... мәселесін шешу жоғарыда
көрсетілген ... ... ... ... ... аударма
жүйесінде орындалуын қажет етеді. Сәйкестікке келтіру ... ... ... ... ... ... ортақ болуы тілдің
сызықтық және таңбалық сипаттарына негізделеді (Ф. Де ... Ал ... ... ... ... ... халықтардың ойлау қызметін
таңбалау мен қоршаған ортаның физикалық ортақ қасиеттерінің ... ... ... ... ... ХХ ғасырдың екінші
жартысынан бастап әр ... ... ... ... ... қарқындап өсуі, екіншіден, ғылыми-техникалық прогресс үшін оларды
меңгеру қажеттігіне қатысты әлеуметтік себептер ... ... ... ... ... аударма жұмысының даму барысына ... ... ... ... ... аударма мәселесінің шешімін табуды және оның
ұтымды жолдарын іздестіруді қажет етті. Бұған ең ... ... ... ... ... ... мәтіннің құрылымын
зерттеудегі таза формалды талдау ... ... ... ... ... ... ... грамматикасы және лексика-ның көмекші сөздері
мен ... ... және ... да осы ... ... ... ... болғанымен, салалық мәтіннің арнаулы лексикасы таныс
бол-мауы мүмкін.
Шеттілдік мәтінді аударудағы оның тұрпаты ... ... ... ... ... ең ... аудармашының іс-әрекетін зерттеу
нысаны ретінде алуға бірден-бір себепші болды. Сонымен, мұндай ... ... ... ... ... ... «шеттетіп», тілдің
семантикасын арнайы талдамай-ақ, формалды тұрғыда аударма баламасын ... ... ... ... ... ... ресми түрде 1949 жыл
саналады. Тілді формалды тұрғыда қарастыра отырып, ... ... ... ... ... ... оны ... жолымен іске асыру идеясы аталған мезгілден де көп бұрын бастама
алғаны белгілі. Мысалы, ... ... ... аударма-жазба машинасы
жайлы мәлімет «Үава таа» газетінде 1924 жылдың 24 ақпанында шағын хабарлама
ретінде жарық көрген ... ... 1962). 1933 жылы ... ... бір ... ... ... аудару машинасын
ойлап шығарғаны үшін арнайы патент ... да ... ... 1959).
Аударма жасауда екі немесе одан да көп тілдердің бірліктері арасындағы
мағына сәйкестігін анықтау үшін алғашында механикалық ... ... ... ... ... ... ғылымға тек ХХ ғ. 50-
жылдарында ғана белгілі бола бастады. Ең алғашқы машиналық аударма жүйелері
АҚШ-та пайда болды. ... ... ... машиналық аударма жүйесін
құрастыру-ға жалпытілдік көзқарастағы криптография (шартты белгілер-мен
жазылған құпия жазу) ... ... мен ... ... ... ... соғыс кезінде әр елдерде, әсіресе Англия мен АҚШ-та
құпия хаттардағы шифрлы жазуды үйреншікті ... ... ... ... да және ... де ... ету ... көптеген нәтиже-
лерге қол жеткені белгілі. Мысалы, гитлерлік ... ... ... мен ... жай жазуға айналдыратын «Ультра» атты
дешифровалды машинаның құрас-тырылғанын айта кетуге болады.
Лингвистикалық ... ... ... ... ... ... келтіру дегеніміз, ол лексикалық қоры белгісіз ... ... әлі ... шет ... ... ... ... барабар деуге болады. Мұндай аударма жұмысы бір ... ... ... ... ... әрекетімен бірдей келеді.
Маман-дешифровщиктердің пайымдауынша, шифрланған (кодталған) хабарды ... ... ... қарағанда бір табиғи тілдегі мәтінді екінші табиғи
тілге аудару әрекеті жеңіл деп бағаланады. Себебі, қазіргі ... ... ... ... мен ... ... ... өзіне
ғана тән лексикалық, морфологиялық және ... ... ... ... деуге болады. Ал есептеу техникасы ондай сөздіктер ... ... ... бағдарламаға сай өз жадында орналастыра
алады.
1946–1947 жылдары ЭЕМ арқылы машиналық аударма жасау идеясы Принстонның
ғылыми-зерттеу ... ... ... ... ... ... және т.б.). Ең ... бұл идея дешифровка ісінің американдық маманы
Уоррен Уивердің меморандумында бірізді шешімге келтірілді. Ал 1949 ... ... ... ... өз ... ... ... тіл
және есептеу техникасы мен дешифровка салаларындағы екі ... ... ... ... ... аударманың принциптік мүмкіндігін мүлде бөлек
тілдердің ұқсас қасиеттерімен және әр ... ... ғана тән ... ... ... ... ... У.Уивердің пікірі
бойынша, қытайша жазылған ... ... ... ... ... басқа ұлттық тілдердегі кітап деп түсінген жөн ... ... ... машиналық аударманың өзінше бөлек ғылыми бағыт ретіндегі даму
кезеңі ... ... ... алады. Бұл бағытты, шартты түрде,
негізгі үш кезеңге бөліп қарастыруға болады (Hutchins, 1986; ... ... 1983, 91; ... және т.б., 1989, 4-5). ... ... ... былайша айырым табады:
1-кезең: 1949 жылдан бастап 60-жылдардың ортасына дейін;
2-кезең: 60-жылдардың ортасынан 70-жылдардың аяғына дейін;
3-кезең: ... ... ... ... үш ... бөлуге негіз болған ғылым мен техниканың дамуындағы
қол жеткен нәтижелер екені белгілі. Міне, солардың ішінен ... ... ... аударма жүйесін жабдықтау мәселелері
айрықша орын алады.
У.Уивердің ... ... ... ... 1949 жылы Вашингтон
университетінде құрылған ғылыми орталықтың зерттеулерінен ... ... ... бастама алады. 1950 жылы А.Д.Буттың ғылыми
жетекшілік етуімен ... ... ... ... Кеңес
Одағында 1955 жылы ... КСРО ... ... ... ... ... ... ең бірінші
машиналық аударма орталығы ашылады.
Осы кезеңде ең алғашқы зерттеушілерді үміттендіретіндей ... ... ... ... жүргізілген болатын. Мысалы, 1954
жылы АҚШ-та Джорджтаун ... ... Леон ... GAT ... негізінде құрастырылған орыс тілінен ағылшын
тіліне аударатын ... ... ... жұртшылық назарына ұсынылды. Бұл
бір тілден екінші тілге ЭЕМ (IBM-701) арқылы орындалған ең алғашқы аударма
тәжірибесі ... ... ... бұл ... ... ... атпен тарихта қалды (Машинный перевод, 1957, 171-б.). ... ... ... ... ... (бір ... жұпқа
қатысты жүйелер) тексерістен өткен болатын. Жүйе сөздігінің көлемі бар
болғаны 250 ... ғана ... ал оның ... тек алты ... ғана ... (Machine ... 1987, р. 22-23). Кеңес
Одағында француз тілінен орысшаға аударатын ... ... ... ... ... мен И.А.Мельчуктың авторлығымен
1955–1956 жылдары құрылғаны осы сала ... ... ... 1956). Бұл ... негіз сөздер сөздігі 1236 сөз, ал сөз ... 250 ... ... Аударма бірлігі ретінде толық сөйлем түрі
есептеледі. Морфологиялық талдау алгоритмі жалғаулардың кестесімен ... ... ... ... ... сөздеріне қажетті деген
грамматикалық ақпаратты тіркейді. Бұл ... ...... ... ... ... (блогі) болуында. Орыс тіліндегі фразаны
синтездеу топтамасында сөздердің орналасу тәртібінің дұрыстығын тексеру
мүмкіндігі ... ала ... ... ... Т.Н.Молошнаяның
жетекшілігімен ағылшынша-орысша аударма жасау жүйесінің алғашқы жобасы
ұсынылды (Молошная, 1960).
Жаңа бағыттың ... ... ... ... ... ... ... көрініс тапты және машиналық аударма
проблемасымен айналысатын бірнеше ірі ... ... мен ... ... ... ... ... 60-жылдарының басында олардың әр
елдегі сандық көрсеткіші мынадай: ФРГ – 22, АҚШ – 21, ... – 10, ... ...... Фран-ция – 5, Чехославакия – 4, ... ...... ГДР мен Италия – 2-ден. Осындай топтар Бельгияда, Болгария-
да, Израильде, Канадада, Люксембургте және т.б. ... де ... ... ... ... 1967, 509).
Машиналық аударма жұмысының бастамасы жалпы алғанда ... ...... зерттеудің жаңа бағытын ашты, ал программистер күн
тәртібіндегі күрделі және аса ... ... ... ... ... Бұл ... тіл мен аударма процесіне қатысты барлық мәліметтерге
қол жеткендей сезінілді. Сондықтан егер оларды формалды пішінге келтіру ... ... ... ... әмбебаптық жүйесі құрылып, ... ... ... тез ... ... ... ... Бірақ
бастапқы және кейінгі тәжірибелердің нәтижелері бұл мәселенің шешімі
ойлағандай оңай табылмайтынын байқатты.
Солай бола ... ... ... тек машиналық аударма аясындағы
зерттеулерге ғана ... ... ... ... ... тілдің теориялық
және құрылымдық жағына да көңіл аударуға ынталандырды.
Қорыта айтқанда, автоматты ... ... ... ... ... ... болды. Себебі, аталған кезеңде ... ... ... ... зерттеудің болашағы сараланып, жолдары
айқындалды. Мысалы, автоматты сөздіктерді құрастыру, ... ... ... ... мен синтаксистік құрылымы, яғни
сөздердің сөйлемдегі тіркесімі, фразеологизм-дердің жасалу жолдары ... ... да ... ... ... мезгілдерде, бүгінгі таңда да аса маңызды деп ... ... ... ... ... зерттелді:
синтаксистік тәуелділік пен тікелей құрастырушыларды, болжамдық талдауды,
көпвариантты синтаксистік талдауды, ... ... ... ... және т.б. әдіс-тәсілдерді ескере отырып, талдау
жүргізу жақтары қарастырылды.
Терминтану саласындағы ... ... мен ... моделін талдаудан толық сөйлемнің құрылымдық байласымын
анықтауға болатындығы байқалды. Мұндай құрылымның көпмағыналығының басын
ашып алу үшін ... ... ... ... (қара: ЛМУ-дың
математикалық лингвистика зертханасындағы ... пен ... ... ... ... GETA атты ... топ –
Centre d’études pour la tradution autmatigue, жетекшісі ... ... ... ... ... «күші» ұғымы ұсынылды (The Rand
Corporation Automatic Language Data Processing Croup. Santa ... ... ... ... ... ... ... варианттарының
артықтық деңгейі айырым тапты (Автомат. перевод, 1971. с. ... ... ... ... ... құрылы-мына негізделеді
(Национальное бюро стандартов США, ... ... ... ... ... рук. ... ... әрбір сөзге
оның барлық байланыс мүмкіндігі жайлы ақпарат тіркеледі. Талдау тәртібі
(процедурасы) ... ... оңға ... ... шығу ... бойынша
жүргізіледі. Осының нәтижесінде әрбір кезекті сөздің “өлшемінің” алдыңғы
сөз бойынша жасалған болжамға сай келетіндігі тексеріледі. Егер ол ... сай ... ... ... ... сол ... қарай ауысады.
И.Родестің ғылыми тобында бірварианттық талдау қарастырылады, яғни ... ... сол ... орналасқан бірінші сөз сәйкестік «иесі» деп
саналып, кез келген сөйлемге тек бір ғана ... ... ... ... ... бірнеше вариант-тарын есепке алуға
мүмкіндік туғызатын көпварианттық талдау-ды бір қадам алға басу деп санауға
болады (С.Куно, А.Эттингер, ... ... ... ... ... сөздің синтаксистік потенциалды мүмкіндіктері-нің
молдығының арқасында синтаксистік байланыста тұратын ... ... ... негізге алынады. Көпварианттылық ... ... 2100 ... мен 82 ... ... ... ... диаграммасы тікелей құрастырушылар моделі негізінде ... ... ... ... ... варианттар іріктеліп, олардың
көпшілігі әртүрлі сүзбе-лер көмегімен сан ... ... ... ... көпвариантты фразаның синтаксистік құрылымы-на тән
екімәнділік ақиқаттығынан гөрі, оны таңдалып алынған варианттарды ... ... ... ... деуге болады. Міне, бұл жүйелердің
осалдығы да осында. Дегенмен, синтаксистік болжам жайлы ... өзі ... ... ... Бұл ... қазіргі кездегі кейбір грамма-тикалық
болжамдарға сүйенетін автоматты ... ... ... ... және
т.б., 1982; Откупщикова, 1982).
Атап айтуға тұратын жайт – ... пен ... ... ... қою ... ... ... бірінші кезеңі үшін
ерекше маңызды болуы. Бірварианттық талдауда кездейсоқтыққа ... ... ... ... құрылымы дұрыс болмай шығуы мүмкін, ал ... ... ... мүмкін-дігі бұл жүйелерде ... ... ... ... ... бұзылу қаупі бар:
құрастыр-ылған құрылымдардың саны вариантты дұрыс таңдау мүмкінді-гінен де
айтарлықтай үлкен болуы ... ... ... ... ... ... аударма жүйесі) мәтін
мазмұнын түсіну үшін аударуға тиісті фразаның ... ... бір ... ... ... Ал фразалардың көпмағыналығы мәнмәтін бойынша өз
шешімін табатыны белгілі, сондықтан сөйлемдердің нақты мағыналарын ... ... ... ... жағдаятқа қатысты толық ... және ... ... ... байланысты болып
келеді. Мұндай семантикалық мәліметтер машиналық аударманың ... ... ... үзінділер түрінде ғана көрініс тауып, толығымен
қолданыла қоймады. ... ... ... ... тиісті лингвистикалық
мәліметтермен жабдықтау ісі әлі де болса толық зерттелмеген болатын.
Конфигурациялық талдау әдісі аударылуға тиісті мәтінді ... ... сол ... ... ала ... ... ... конструкциялар
жиынымен салыстыру тәсіліне негізделеді (Каф. матем. Лингв. ... ... 1963; ... 1961. Каф. ... и ... Лингв.
МГУ; Дрейзин, Рашитов, 1961. Группа авт. перевода ИЯ АН СССР; Молошная,
1960 және т.б.). Егер ... ... ... ... ... ... ... конфигурацияларының біреуімен сәйкес
келсе, онда ... ... ... деп ... және ол әрі ... ... ықшамдалған түрінде көрініс табады. Синтездеу әрекетінде
анализдеу кезінде ... ... ... ... ... оған
сәйкес келетін конфигурация-сымен салыстырылады.
«Фулькрумдер» әдісі бойынша ... ... ... ... ... бөліктерге ажыратылады. Осының негізінде кез ... ... әдіс ... ... рет ... ... ... біріктіруге болады. Әрбір кезекті циклдық қарастыру кезінде
талдаудың ... ... ...... ... Анықталған
фулькрумдер синтаксистік конструкциялардағы негізгі және «басқарушы» сөздер
тобына жатады. Олардың құрылымы мен ... ... ... ... ... ... автомат. Перев. фирмы Bunker Ramo-
Woldridqe Inc, Canoqa Park, Calif., рук. ... ... ... ... фразаның синтаксистік құрылымын тану үшін
берілген сөйлем көрінісіндегі синтаксистік ... ... ... бөлу ... ... ... Н.Сейгер).
Корреляциялық талдау кезінде әрбір сөзге индекстер жиынтығы тіркеліп
жазылады. Олардың әрбіреуі сол ... ... ... ... бар ... ... байланыстылық (корреляция) мүмкіндігін бейнелендіреді.
Корреляцияның (өзара ... ... ... ... ... төмендетіледі. Мысалы, сөз, семантика және т.б. саты-ларға
төмендейді.
Осымен бірге зерттеушілер ... ... ... үшін ... ... ... ... бастады. Соның ішінен толық мәтіндердің
антецедент–зат есімдермен арақаты-насын анықтайтын ережелердің ... атап ... ... ...... ... Мәселен,
есімдіктен бұрын тұратын есім сөз, ал есімдік осы есімге ... 1961; ... ... 1967, с. 235 к сл.).
Қазіргі кездегі жоспарланып жатқан машиналық аударма ... екі ... бір ... екінші тілге аударатын – бинарлы және бірнеше
тілдерден бір тілге немесе бірнеше ... ... ...... ... ... бірінші түрінің әр уақытта артықтық сипаты
адам баласының аудару ... ... және ... ... ... бинарлық сәйкестіктерін анықтаудың теория-лық және практикалық
мүмкіндіктерінің табиғилық жағдаяты-нан туындайды. машиналық ... ... ...... тиісті “кіретін” тілге талдау
жүргізу кезінде олардың қасиеттеріне қатаң түрде ... ... және ... ... ... ... ол тәуелділіктің күрделене
түсетіндігі.
Көптік аударма ... ... ... ... ... ... ... талдау мен жинақтаудың тәуелсіз алгоритмдерін
құрастыруға жол ... ... ... ... ретінде
түсіндірілетін көптік аудармадағы тіл ... саны n(n-1) ... ... Бұл ... n – ... ... қатысатын тілдер
жиынының саны.
Көптік жүйлерді ... ... ... мен ... ... ... аралық-тіл идеясын (интерлингва) ұсынды (Машинный
перевод, 1957).
Көптік аударма жасаудағы «аралық-тіл» идеясын іске асыруда ең ... ... ие ... ... ... ... аты ... тұрарлық (Андреев, 1957). Н.Д.Андреев жетекшілік ... ... ... осы ... ... ғылыми еңбектерінің
жарияланғаны осы саладағы мамандарға мәлім. Осы ... ... ... мен
шетелдердің ғылыми орталықтарымен басқа да ғылыми топтар арасында аралық-
тіл мәселесіне қатысты ой-пікірлер қызу ... ... түсе ... ... ... ... ... негізінде табиғи
тілдердің табиғатында конгруэнттік сипаттың болмайтындығы жайлы ... Яғни ... ... ... ... сол ... ... емес элементтердің (артикльдер және т.б.) алынып тасталуы мен
көптеген тілдер үшін конгруэнтті элементтердің (етістіктің үш ... ... ... және т.б.) ... ... қажеттігі туындайды. Сондықтан,
аталған мәселеге арналған алғашқы зертеулерге аралық-тіл өзінің құрылымы
жағынан табиғи ... ... ... ... терминдерімен баяндалады.
Әр тілдің бірліктері бойынша грамматикалық мағыналары-ның, грамматикалық
категорияларының және ... ... ... ... ... ... ... қорытындылаушы қасиеттерінің белгілі болуына
қарамай, семантикалық теорияның қолданбалы тұрғыда ... ... ... ... ... ... кедергі жасады (Мельчук,
1959; Автомат. Пер., 1967). ... ... ... ... ... ... ... ЭЕМ-ның көмегімен 18 шет
тілдерінен орыс ... ... және ... ... ... ететін шағын
дәрежедегі тәжірибе жүргізілді.
Аралық-тіл идеясын өмірге әкелу мақсатындағы сан ... ... ... ... бір ... ... ... машиналық аударма
тарихында айтарлықтай өз орнын ала ... ... ... ... тұрғыдан
қарастырғанда оның себебі аралық-тілдің грамматика мен ... ... деп ... ... ол тек ... тұрғыда, семантикалық барабарлық түсінігінде көрініс ... ... ... ... ... жасаудың төмен ... айта ... оның ... тиісті мәтіннің маңызды
сипаттамаларының назардан тыс қалып қоятындығын айтады: ... ... және ... ұстанымы, талдаудың актуалдығы және
т.б.
Машиналық аударма жүйесіндегі аралық-тілдің ... ... ... зерттеулердің практикалық тұрғыдағы көзқараспен түсіндіретін
болсақ, ол өзгеріс енгізу кезеңдерінің әдеттен тыс күрделілігінен, ... ... ... ... ... ... жад ... мен
әрекет жылдамдықтары көрсеткіштерінің төменгі ... ... ... ... ... ... ... жүйесін құру жағдайында
да теріс әсерін тигізді.
Қазіргі кезде аталған кедергілер әртүрлі ... іске қосу ... ... ... ... мәселесіне қызығушылықтың екінші айналымы –
жасанды интеллект жүйесін құрастыруға байланысты. ... тек осы ... ғана ... ... ... саласында зерттеліп жатқан
мәтіннің мазмұнын түсінетін ... ... жол ... ... ... ... ... өзінде-ақ аралық-тіл арқылы машиналық аударма
жұмысын жүзеге ... кез ... ... ... ... арманы,
жоғарғы мұраты деуге болады. Солай бола тұра, аралық-тіл мәселесін зерттеу
семантикалық ... ... ... ... мен мәтіндерінің
семантикалық көрінісін анықтау жағдаяттарының даму процесіне зор ықпалын
тигізді.
Машиналық ... ... ... ... ... ... – аударылған және аударылатын ... ... ... ... бен ... ... ... екендігін мойындау;
аударылатын сөйлемнің мән-мағынасының үйлесімділігі мен ... ... ... ... болып табылады.
Машиналық аударма жүйлерін құрастыру аясындағы жүргізіліп ... ... ... ... ... зерттеушілердің
ойлағанындай практикалық нәтиже алынбады. Аударманың тұтынушы сұранысын
қанағаттандыра ... ... ... құру ... нәтижесіз болуының
үлкен зардабы байқалды. Мысалы, зерттеушілердің бір бөлігі ... ... ... бас ... Осы бағытта жұмыс істейтін бірнеше
топтың зерттеу әрекет-терінің тоқырап қалуына себепші болған АҚШ-тың Ұлттық
Ғылым академиясының арнайы ... әуе ... ... машиналық
аударма жайлы жасаған ... ... ... ... де өз рөлі ... Осының зардабынан көптеген ғылыми ұжымдар
ұйымдастыру мен қаржылық қиындықтарға әкелді (Кулагина, 1979, ... ... ... болу ... ... ... ... да,
машиналық аударма идеясының жүзеге асу мүмкіндігіне сенімсіздік білдіруі
де, ... ... ... аудару мүмкіндігіне күмән туғызуы
да себепші болды. Ал ... ... ... оның ішінде, әсіресе поэзия
мәтініне байланысты машиналық ... ... ең ... ғалымдар
қарсылық пікір білдірген болатын. Оған шығарманың көркемдік, бейнелік жағын
ұстаным етудегі кейбір тілдік заңдылыққа қайшы келу ... ... ... ... байланысты И.Бар-Хиллелдің көзқара-сына тоқтала кетуге
болады. Ғалым ... ... ... ... ... аударма
мүмкін емес және оны утопия деп санаған. И.Бар-Хиллелдің ... ... ... негізгі кедергі сөздердің көпмағыналығы ... ... ... ... ... ... формалды көрсеткіштердің
болмауы. Бұл қиындықтардың шешімі тек әлем туралы ... ... деп ... (Бар-Хиллел, 1962).
Жоғарыда айтылған сенімсіздік пікірлер әлем бойынша машиналық аударма
мәселесімен айналысатын топтар санын ... ... ... ... аяғында 100 топтан 38 ... ... ... ... ... 1979, ... машиналық аударманың болашағына сенімді, дәйекті көзқарастағы
ғалымдар қажымай, шаршамай-шалдықпай жоспарлаған ... ... ... сала мамандарына мәлім. Енді машиналық аударманың екінші
кезеңі басталды. Машиналық аударма мамандары зерттеудің теория-лық ... ... ... лингвистикалық модельдер жасауға, жүйелі және
функционалды грамматика жазу мәселесіне кірісті. Бұл ... ... ... ... назар аударылды. Бірінші ... ... ... ... бағышталған жүйе құрудың мүмкіндігі
анықталды.
Бірінші кезеңде зерттеле бастаған формалды грамматика-ның модельдері:
теоретика-көптік ... ... ... ... ... ... ... мен семантикалық модельдер
және т.б. ... ... ... аударма мәселесінің зерттелуі ... ... оның ... яғни түсініктеме берілу жағына
көбірек көңіл бөлінді, ... ... ... жеке ... ... азды-көпті толық түрдегі ... ... ... ... ... олар автоматты талдаулардың іргелі алгоритм-
дері бойынша да сыннан өтті деуге болады.
Екінші кезеңге қатысты ... ... атап ... ... ... ... да ... түрде зерттелуі және жоғары
сапалы аударма жасауға қатысты ... ... ... ... ... шешілмейтіндігін толық мойындау.
Соңғы айтылған жайтқа байланысты, яғни ... ... ... ... аударма жүйелерінде талдаудың ... ... ... енгізу арқылы (мысалы, ФРАП), ал
екіншілерінде – алдын ала ... ... ... ... ... ... ... тізбесі арқылы мәселені шешу ...... ... ...... ... ... инвариантын ұсыну арқылы және осыған әкелетін ... ... ... және т.б. ... ... ... ... жұмыстардың екінші кезеңде жалғасуымен бірге, ол кезең аударманы
автоматтандыруды тәжірибелік сынан ... және оны ... ... қоса сипатталады.
Сөздік пен базалық алгоритмдердің көлемдерін ... ... жүйе (GAT) және ... ... түрлері даму үстінде болды
(мысалы, SYSTRAN жүйесі). 1976 ж. бұл ... ... ... ... ... ... тапсырылды. Аталған
жүйеде негізі синтаксистік ... ... ... ... ... ... 1985). ... бен синтездің бір-біріне барынша
тәуелсіз болуынан оларды басқа ... ... ... де ... ... ... 70-жылдарынан бері зерттеліп келе жатқан Гренобльдық
орысша-французша аударма жүйесінің (GETA) ... түрі ... ... ... ... алуды көздейтіні мәлім. Бұл жүйе
бойынша семантикалық, синтаксистік, ... және ... ... ... өңдеулер (трансформаций) жүргізе ... ... ... ... ... ... (поверхностная форма) көрінісін анықтауға
мүмкіндік туады. Көпдеңгейлік талдау өңдеудің 11 ... ... ... құрылады. Мысалы, аналитикалық тұлғаны ... ... ... есім ... ... және т.б. Мұндай
әрекеттер антецеденттерді іздестіру мен ... ... ... синтаксистік және логикалық фунцияларды анықтауға дейін ... ... ... жүйе ARIANE атты дамыған ... ... ие ... ... ол жүйе мен ... ... ... базасы арқылы алдын ала қарастырумен ... ... мен ... ... де аса ... ... қолданыс
тапты.
TAUM жүйесінде (Монреаль университеті, Канада, жетекшісі – ... ... ... ... ... деңгейінде
жүзеге асады (Синтаксический компонент ..., 1981). Аталған жүйе лексика-лық
және құрылымдық ... ... ... ... трансфер топтамасына
(блогына) ие. Оған лексемаларды аудару, француз тіліндегі ... ... үшін ... ... (дерево) кейбір
бөліктерін өңдеу, етістіктің шақтық түрін және меңгеру ... ... ... ... ... ... (бағдарламаны) жазу
тілі ретінде А.Кольмер құрастырған Q (Quebec) тілі ... ... 1981, с. 92). Бұл ... ... ... мен
икемділігі (талдаудың алғашқы болжамын аяғына дейін сақтау, ережелер-дің
қолдану тәсілдерінің ... ... және т.б.) ... ... ... ... тудырады.
TAUM жүйесі 1968 жыл мен 1980 жыл аралығында белсенді түрде дамып,
нәтижесінде 1977 ... ... ... жүйе жыл сайын 5 млн. сөз
көлеміндегі мәтіндерді аударуды жүзеге ... ... жүйе ... ... (Machine ... 1987, р. ... ... университетінің алгебралық және ... тобы ... ... ... жай сөйлемдерді ағылшын
тілінен чех тіліне шектеулі сөздік бойынша аударма жасайтын ... ... ... ... ... 1981, с. 84). Бұл
жүйеде талдау процесі ... төрт ... ... ... ... ... ... синтаксистік талдау, аудару. Синтаксистік
талдау синтаксистік ережелердің әрекет ету аясының ... типі ... ... ... ... ... ... және әрі қарай
оның көлемі біртіндеп ... ... ... сырт ... ... дейін өседі. Сондықтан мұны әдеттегі ... ... ... жағдайына жатқызуға болады. Осыған байланысты синтаксистік талдаудың
өзі де бірнеше кезеңге бөлінеді. ... ... ... (нерегулярный)
синтаксисті, мағынаны дұрыс ашуға қажетті сөйлемде жоқ ... ... ... үшін ... деп аталатын грамматика
енгізілген. Синтаксистік қатынастарға семантикалық түсініктеме беру тәсілі
кең түрде қолданыс тапқан.
Шамамен алғанда, 1970 ... ... SUSY ... ... жұмысы
басталады (Синтаксический компонент..., 1981, с. 90). Аударма жасау процесі
деректерді алдын ала дайындаудан, ... ... және ... ... ... жасау әр тілдердің грамматикасына тәуелсіз
сипаттау принципіне негізделеді, сондықтан жүйеге жаңа тілді қосу ... ... ... ... сан ... ... Неміс, орыс,
ағылшын және француз тілдерін ... ал ... ... ... ... ... жұмыстары жүйелі түрде жүргізілді. ... ... ... ... ...... жұмысының нәтижесі деуге болады.
Сөздіктер жүйесі (талдау сөздіктері, семантикалық ... және ... ... ... ... семантикалық ақпарат үшін аса
маңызды болып келетін кез келген ақпаратты пайдалануға мүмкіндік ... ... ... ... ... құрастырылған: талдаудың бірінші бөлігі
«жоғарыдан төменге қарай» ... ... ... ...... қарай» өңдеуден басталады, ал үшінші бөлікте алдыңғы екі ... ... ... («жапсырылады»). Талдау соңында бұрыс
синтаксистік құрылымды өңдеу шарала-ры қарастырылған.
Машиналық ... ... ... топтардың сан жағынан аз
болуына ... сөз ... ... ... ... ... зерттеу
жұмыстарын аса нәтижелі деп сипаттауға болады:
а) лингвистикалық және ... ... ... ... машиналық аударма жүйелерінің жақсартылған ... ... ... ... құрастырылуы (Бүкілодақтық аударма орталығы,
А.И.Герцен атындағы ЛГПИ-дегі «Статис-тика речи» тобы);
б) автоматтанған талдау жүргізетін жүйелердің қарқынды ... ... ... ... ... ... мәндік дәрежеге қатысты
тәжірибелік ... ... ... ... және ... ... жетістіктері мен кемшіліктері бірдей дәрежеде сыннан өту
нәтижелері осыны байқатады.
Аталған кезеңде КСРО ... ... ... ... ... ... аударма жүйесі-нің жаңаша түрі ... ... ... ... ... ... ... аударатын
бұл жүйе 1967–1976 жылдар ... ... ... жетекшілігі
бойынша зерттеу жұмыстарын жалғас-тырды (Кулагина, 1979). ... ... ... ... жұмыстары былайша іске асты: жүйеге “кіретін”
ақпарат ... ... ... ... құрылымы (фраза бойынша
аудару), ал ... ... ...... сәйкестікте тұратын
орысша фразаның үстіңгі (поверхностный) синтаксистік құрылымы. Мұндай тәсіл
екі түрлі тілдердің сөздері мен ... ... ... мен
олардың құрылымдық сәйкестік сипатына негізделеді. ... ... ... ... таралымы (дерево) түріндегі фразалардың
синтаксистік құрылымдарының ... ... ... ... ... ... ... байланыстың 52 типі жеке түрде бөлініп алынады.
Көпварианттық талдауда сүзбе-ережелер жиыны қолданылады. Мұндай әдіс
арқылы ... ... күші мен ... және ... ... ортақ еместігі (совместность/несовместность связей),
құрылымдардың ... ... ... ... ... структур) ескеріледі. Сүзбелерді қолданудың ретіне ... ... ... ... алынған. Мысалы, алдымен
қарапайым сүзбе, сосын барып жалпы, күрделі, ал ең ... ... сай ... сүзбе түрлері қолданылған. Көпвариантты талдау
түрлеріне сүйене отырып, болжамдар жиыны ішінен ... ... ... бір болжамды құрастыруға мүмкіндік туындайды (Кулагина, 1979;
Синтаксический компонент..., ... ... ... ... ... ... жолында машиналық
аударманың алғашқы кезеңінде орын алған конфигурациялық талдау идеясы
қолданыс ... ... ... ... ішіндегі сөздердің әр алуан
синтаксистік қатынас ... ... ... сипаттайтын тікелей
доминация қатынасы (отношение непосредственной домина-ции) деп аталатын 31
қатынасы жеке ... ... ... ... талдаудың негізгі мақсаты
аударылатын сөйлемнің сөздері арасындағы синтаксистік байланысты анықтау
болып табылады. Ол үшін ... ... ... ... ... тіркеп жазу және оның мазмұнына ... ... ... ... ... ... ... жүйесінің мәтінді аудару,
реферат алу, ақпаратты іздестіру сияқты қолданбалы мәнімен бірге, теория-
лық жағы да аса ... ... ... ... ... ... ... бөліктің» әрекет ететін және эксперимен-талды ... ... ... ... ... ... 1967, с. 226; Мельчук,
1974).
Кезінде ... ... ... ... ... ағылшынша-орысша аударма жүйесі тәжірибелік тексеру
дәрежесіне дейін жетті ... және т.б., 1966). Бұл ... ... мен
жинақтауды бір-біріне тәуелсіз қарастыру мүмкіндігі есепке ... Ал ... ... беру ... ... – бірізділікке келтіру. Талдау
әдісі фразалық және көптік сипатта ... ... ... ... ... ... мәліметтер, оларды өңдеу
шараларынан (алгоритмдерден) жеке қарастырылды. Ал алгоритм ... ... ... ... ... ... жобалау, тарамдалу
(древесность), байланыстың міндеттілігі, ортақтығы және т.б. шарттарын
қамтамасыз ету ... ... ... ... жоғарыда аталған зертханада байланыстың тұйықталу
сипатына айырықша мән беру мен ... ... ... орыс ... ... құру және оны тәжірибелік сынақтан өткізу жұмысы
жүргізіледі (Кремнева және т.б., 1976).
Ю.Д.Апресянның жетекшілігімен ... атты ... ... аса
күшті жабдықталған французша-орысша аударма жасау ... ... ... 1981). Аударма үстіңгі (поверхностный)
синтаксистік құрылым деңгейінде жүргізіліп, мына принциптерге негізделді:
1) аударылуға тиісті тілдердің грамматикаларының ... ... ... ... атты ... ... негізінде құрылуы;
2) талдау мен жинақтау ережелерінің бір-біріне ауысу ... ... ... ... ... ... ... мен сөздікке қатысты сипаттаулардың алгоритмдер мен
программалардан бөлектік сипаты (аудармаға қатысты ережелерден ... ... ... тілдердің сипаттауларының тәуелсіздігі;
5) әртүрлі пәндік салаларға бейімделуінің әмбебаптылығы;
6) лингвистикалық білімді ... үшін ... ... (модель және
тіл) құру.
Бірінші кезекті ИНФ-ЭЛ жүйесі «ИРИС-50» ЭЕМ-да жүзеге асты.
Мәскеудегі М.Торез ... шет ... ... ... атты ... ... үшін көпаспектілі ағылшынша-орысша сөздік құрастырылды. Оның
мақалалары сөздік бірлігінің әр алуан лингвистикалық ... ... ... ... лексика-лық қызметі
жайлы мәліметтер, меңгеру моделіне қатысты аударма баламалары жайлы және
т.б. (Шаляпина, 1974).
Бұл ... АРАП атты ... ... ... ... жабдықталуының маңызды бөлігі ретінде түзілді (жетекшісі
–З.М.Шаляпина). АРАП жүйесі үшін ... ... ЯРАП атты ... ... аударма жүйесі үшін де қолданылды.
Аталған жүйелер үшін талдау жұмысы семантика-синтаксистік деңгейде
жүргізілді. Тілдік бірліктердің семантика-лық ... ... ... тіл ... ... ... лингвистикалық ақпараттар
біртиптік сөздік мақалалары түрінде көрініс ... ... ... ... ... ... және басқа да әр фразаны аударуға
жеткілікті белгілер түрінде ... ... ... ... ... ... кезеңінде бірнеше аударма
жүйелері құрастырылды. Олардың ... тек ... ғана атап ... жетекшілік еткен ФРАП атты французша-орысша автоматты аударма
жүйесі (Ленонтьева, 1987) және Ю.Н.Марчук жетекшілік еткен ... ... ... жүйе ... 1983).
ФРАП жүйесі аудармашының әрекетін модельдеуге арналған аса қызықты
талпыныс деуге болады. Аударылатын мәтін ... ... ана ... ... ... ... мәтін ішінде аудармашыға белгісіз
тілдік элементтердің кездесетіндігі де ... ... ... тұрғыдағы
мұндай зерттеудің мақсаты – таза грамматикалық тәсілдің «күшін» ... ... ... процесі қажетті фразаны талдау деңгейінің белгілі
сатысына сәйкес келетін көптеген топтамаларға (блоктарға) бөлінеді. ... ... ... ... ... ал ... ... ғана талдаудың семантикалық деңгейі іске
қосылады. Семантикалық деңгейдің грамматикалық деңгей ... сан ... ... ... ала ... ФРАП жүйесіндегі ... ... ... ... ... ... Бұл
жүйенің ерекшелігі – аса дамыған ... ... ... ... ... ... жұмысы аяқтал-ғаннан кейін ғана ... ... ... ... ... әр ... ... жүйелерді тәжірибелік сынақтан өткізу де алдын ала қарастырылған.
Грамматикалық және дамыған лексикалық талдауларға бағышталған ... де ... Онда сөз ... бірмағыналы және көпмағыналы
сөздер жеке ... ... ... тек сөйлем құрылымдары ғана
өзгеріске ұшырайды. Аталған жүйе іс жүзінде қолданыс табуда.
Белгілі ғалым, профессор Р.Г.Пиотровский ... ... ... ... тобы 1970 жылдан бастап машиналық аударма жүйесі бойынша
зерттеулер жүргізді. Бұл жүйе ... ... да ... болып саналатын
итеративті-стратификациялық тәсілге негізделеді. Мұндай әдіс ... ... ... ... сипаттау үшін ол кезеңдік сипатта
қарастырылуы қажет. Ленинградтағы А.И.Герцен ... ... ... ... ... 1975 жылдан бастап
зерттеле бастаған ... атты ... ... ... жүйе ... ... атқара бастады. Оның сөздіктермен және ... ... аса ... және құрамында трансфер қолданыс табатын грамматикасы
бар жүйе ... ... Осы ... ... және ... ... аударманың түрлері құрастыр-ылып, тәжірибелік сыннан
өтеді. Осы ... ... ... ... құрылымы мен мағынасын тануға мүмкіндік тудыратын
талдаудың фреймдік және тезаурустық ... ... ... ... ... 1983). Аталған жүйеде машиналық аударманың алғашқы
кезеңінде ұсынылған «фулькрумдар» ... ... түрі ... ... ... ... деңгейлік тұрғыда құрастыру ескерілген.
Машиналық аударма жүйелерін құрастырудың екінші кезеңін ... ... ... ... сипаттама-лары мен жалпы ерекшеліктерін
былайша атап кетуге болады (Кулагина, 1979; Hutchins, 1986):
1) ... ... мен ... деңгейдің толық дәрежеде көрініс
табуы;
2) талдау нәтижелерінің ... ... жайт ... ... ең ... деп саналатын біреуін ғана таңдап ... ... ... ... ... ... ... барынша
«жұмсақ» жүйеге ауысу мүмкіндігі. Соңғы жүйеде ... ... ... ... ... (Лейкина және т.б. 1986;
Кулагина, 1979).
Жоғарыда аталған жүйелердің сипаттамалары мен ... ... ... ұйымдастыруға оң әсерін тигізді. Басқаша айтқанда, олар
тілшілер мен математика мамандарына жүйенің ерекшелік аспектілерін ... ... ... ... ... себепші болды. Сонымен
бірге аталған жайт тілдің ... ... құру ... ... мен оны ... мүмкіндіктерін анықтауды қажет етті. Ал табиғи тілді формалды
сипаттау әдісі грамматикаларды бірізділікке ... ... ... машина-лық аударманың даму кезеңінің екінші сатысында әртүрлі
тілдерді сипаттау үшін ... ... ... ... ... ... ... (адекватно) сипаттауға мүмкіндігі мол жаңа
модельдер үлгісін құру қажет болды.
Сонымен, машиналық ... даму ... ... ... ... қатысты практикалық жүйелердің дамуымен, тәжірибе жинақтаумен, оны
іске қосумен, сөздік базасының кең ... өріс ... және ... ... да ... жабдықталған теориялық жүйелерді құрумен
сипатталады.
Қол жеткен практикалық және ... ... ... ... ... ... үшінші кезеңіне көшуге даяр екендігінің айғағы болып
саналды. Бірақ келесі сатыға өту жолы ... ... ... ала ... ... қажет еткені белгілі.
Біріншіден, 70-ші жылдардың аяғында ақпарат ағымы бұрын-соңды болмаған
қарқында дамиды. ... ... және ... ... бір ... 2,5 ... сөзге дейінгі мәтіндерді аударып отыруға ... Егер ... 1966 ж. ... ... ... шығыны 22 млн.
доллар болса, 1981 ж. ол шығын 200 млн. ... ... ... ... ... аудармашылардың айлығын санамағанда, тек тапсырыс бойынша
орындалатын ... ... ... ... ... ... жұмсалған екен.
Бірақ ақпарат ағымының (ғылыми-техникалық мәтіндер, патенттер, құжаттар мен
арнаулы ... ... ... ... болуына байланысты оларды тек
дәстүрлі жолмен, яғни аудармашылар күшімен аударып шығу ... емес ... ... ... ... ... ... техникалық стильдегі
мәтіндерді аударуды жеңілдету мен жетілдіру маңызды мәселеге айналып отыр.
Екіншіден, спеллер типті ... ... ... мен оларды баспа мен лексикогра-фиялық ... іс ... сол ... ... ... жүйесінде (word processors) күшті
терминологиялық банктерді пайдалану – «лингвистикалық» автоматтанған ... ... ... ... ... ... ие болу мүмкіндігінің
кепілі.
Үшіншіден, машиналық аударманың жаңа кезеңіне ... ... ... алғы шарт ... ... техникасының дамуына байланысты барынша
жағдай жасалуы – дисплейлердің пайда болуы, ... ... ... ... ... дербес ЭЕМ-ның күш-қуатының өсуі және т.б. Міне,
осының бәрі теоретика-лингвистикалық зерттеу-лерге көзқарасты ... оны ... ... ... ... аударма жүйелерін құрудың бірінші және екінші кезеңдерін
сипаттауда, біз ... ... ... жұмыстарына айырықша назар
аудардық. Ал енді машиналық аударманың қазіргі кезеңін ... үшін ... ... мен ... ... ... пайда-лануға
байланысты негізгі теоретикалық және техникалық ... ... ... ... тоқталайық. Әрине, машиналық аударманың мұндай
негізгі мәселелерін талқылау машиналық аударма ... ... ... да сөз ... ... ... мәселе мынадай мүмкін болатын үш түрлі теориялық стратегияларды
талқыға салуды қажет етеді:
– тікелей бинарлық машиналық аударма;
... ... ... ... ... аудару, сонымен бірге олардың грамматикалық
мүмкіндіктерінің ерекшеліктерін іске асыру.
Тікелей бинарлық аударма машиналық аударманың ... ... ... да, сол ... ... аударманың көптеген практикалық жүйелерінің
негізгі страте-гиясына айналып отыр. Мұндай тәсіл нақты тілдік жұпқа, яғни
қос тілдерге бағышталады (GAT, SYSTRAN ... және ... ... ... орталығында зерттелген АРМАС жүйесі). Бинарлық аударма
әрекеті кезінде сегменттердің шекарасын анықтау мен ... ... ... ... сөйлемдерге қарапайым өзгертулер (трансформация)
жүргізіледі.
Бұрынырақ зерттелген машиналық аударма жүйесін құрастыру тәжірибесі ... ... ... ... аса ... ... қоры мен ... (редакциялау) тәсілдерінің негізінде деуге болады. Оған Джорджтаун
универ-ситетінің GAT жүйесі мен оның ... ... ... ... ... ... жеке лексика-морфологиялық және семантика-синтаксистік ... ... ... іске ... ... ... жүйенің лингвистикалық және программалық жабдықталуын тек
нақты тілдер жұбының ерекшеліктеріне ғана ... ... ... ... ... ... ... де қатаң түрде көңіл бөлуді
қажет етеді. Егер тіл жұбтарының бір ... ... бір ... ... ... ал кейбір жағдайларда программалық жабдықтауларды
да қайта құру ... ... ... ... ... арқылы аударма) әдісі де
машиналық аударма дамуының екінші ... ... ... ... пайдаланатын бұл стратегияны қолдану – түрлі ... ... ... бар ... жүзеге асырудың мүмкін еместігі
жөніндегі теориялық болжамға негізделеді. Мұндай ... түрі ... ... жұмсалымдар жолымен анықта-луы мүмкін: лексикалық,
морфологиялық, синтаксистік құрылымдар деңгейінде ... ... ... ... және ... деңгейінде сипаттау.
Түрлі деңгейдегі талдаулар кезінде “кіретін” ... ... ... ... ... таралымнан базалық грамматикалық
бірліктер ретіндегі басты астырт құрылымға (к ... ... ... ... ... және одан әрі ... бағыныңқы таралымға өтеді.
Мұндай кезде тек белгілі бағыныңқы таралымға қатысты қайта құру ... ... ... ... ... ... ... мүмкіндік тудырады. Бұл мәселенің шешімін табу машиналық аударма
кезінде міндетті емес, өйткені ... ... ... ... беру ... ... ... яғни ЭЕМ-
нан шыққан аудармамен әрі қарайғы жұмыс істейтін маман аудармашының үлесіне
тиеді. Трансферді қолда-нудың ... ... ... ... ... ... ... жүйесін қолданатын бірқатар ресейлік ұжымдарға да
тән болып келді.
Аталған жүйелерде аударманың негізгі үш ... ... ... ... ... ... және жинақтау (синтаз). Әрбір саты ... ... ... ... ... ... SUSY атты жүйеде
талдау әрекеті 8 ... ... ... ... ... ... ... құрастырылады және “шығатын” сөйлем-нің
таралымы жайлы мәлімет 8 субпроцессордан тұратын трансфер ... ... ... кезеңінде бұл таралым үш субпроцестің өзара әрекеттесуінің
нәтижесінде аралық-тілдегі ... ... ... ... Осыған ұқсас
тәсілдер трансфермен әрекет ететін басқа да жүйелер түрлерінде қолданылады:
CADA, GETA, TAUM-METEO, ... ... EUROTRA ... ... СИЛОД
(MULTIS) жүйесі, А.И.Герцен атындағы РГПУ-да зерттелген ФРАП, АРАП, ЭТАП,
ЭТАП-2, STYLUS және ... ... ... ... ... жанында 1982
жылы машиналық аударманың дамуының үшінші кезеңінде ... ... ... қаланды. Аталған жүйенің тілдері: ағылшынша, ... ... ... ... ... ... ... Бұл
жоба БЭЖ (ЕЭС) елдерінің тоғыз ресми тілдері үшін ... ... ... және 72 ... жұбы ... ... жасау қарастырылды.
Аталған тілдердің қайсысын болса да аударуға ... ... ... деп ... ... қатынастардың семантикалық
түсінігі беріледі. Мәтін семантикалық бағыныңқылықтардың түзілістері ... ... ... олар астырт септігі типінде (типа глубинных
падежей) болуы мүмкін. Бұл ... ... атап ... тұрарлықтай жайт – бір
тілдің интерфейстік құрылымының басқа тілдегі осындай құрылыммен сәйкес
келмеуі және ... ... ... ... ... ... ... ана тілінің аясында аударма жасайтын әрбір маман
талдау мен жинақтау тәсілдерінен басқа трансфердің 8 ... да ... ... мақсаты – өндірістік машиналық аударма жүйесінің бастапқы
үлгісін жасау. EUROTRA ... іске ... ... ерекшелігі, оның
қадамдап әрекет етуі. Әрбір қадамды жасаудан бұрын алдыңғы ... ... ... ... пайдаланатын жүйелерге ЭТАП-2 атты жүйе де жатады (Апресян и
др. 1989). Бұл жүйе ағылшынша-орысша ... ... ... алады. Бұл
идеологиялық тұрғыда қарастырғанда ИНФ-ЭЛ ... ... түрі ... сөздіктермен жабдықталған – нақты бір пәндік салаға ... ... ... ... ... ... ... мүмкіндігін тілдік модельдің жан-жақты ... ... ... жүйе ... ... жекелік (трафареттік)
және сөздіктік деп үшке бөлініп қарастырылады. Жүйеде 45 жай (элементарлық)
предикаттар мен 5 синтаксистік қатынастар орын ... ... ... ... мен ... баға беру ережелері ұсынылған синтаксистік
болжамдар ішінен тек біреуіне ғана ... ... ... ... ... талдаудың әртүрлі деңгейінде “кіретін” сөйлемнің
құрылымын сипаттайтын ішкі ... ... ... ... ... ... басты құрылымға (к глубинной ролевой структуре)
жүйелі түрде көшу жолы мен одан әрі қарай “шығатын” ішкі ... ... ... Осындай жағдайда белгілі ішкі тармақтар үшін қайта
құру әрекеттері сөйлем түсінігін модельдемей-ақ, машиналық аударма жасауға
мүмкіндік ... ... ... ... ... ... мәселесінен
тыс жатады, өйткені машиналық аударма мәселе-сіндегі астырт (глубинный)
түсініктеме алу адам ... яғни ... ... сала ... ... да ... ... машиналық аударма жүйелерін іске қосатын мұндай ... ... ... дамуының екінші кезеңінде пайда болған СИЛОД
жүйесінде де қолданыс ... ... ... ... ... ... компьютерлерде аударма жұмысын атқарады. машиналық аударманың барлық
процесі лексика-морфологиялық және семантика-синтаксистік субпроцестердің
композициясы ретінде ... ... ... ... ... ... ... мен сөздік бірліктерін ... ... ... және ... ... ... сөздік топтамасынан
сөздікке қатысты ақпараттар шығарылып алынады. Мұндай ... ... ... ... ... ... және ... пішіндегі аударма
баламалары (переводные эквиваленты) жайлы ақпаратты айтуға болады. Бұл
кестеде ... ... оның ... ... сәйкестікке
қойылады. Сәйкестіктің дәлдігі конверсиялық және/немесе омонимдік ... ... ... ... ... ... және семан-
тикалық сипатына дейін анықталады. Мәтінді талдаудың барлық деңгейлеріндегі
берілісі сияқты, ... ... ... ... қолданылуы мүмкін
(машиналық аудармада, аннота-циялауда, рефераттауда және т.б.). Егер
машиналық аударма жайлы ғана ... ... онда ... бұл ... ...... және фразеоло-гиялық тұрғыда жолма-
жол (подстрочник) аударылған мәтін.
Семантика-синтаксистік өңдеудің нәтижесінде құрылымды тіларалық деңгейде
қайта құру ... ... Ол үшін ... ... ... ақпарат іске қосылады, одан кейін барып грамматикалық ... ... ... ... ... ... (компоненттер) мәтін ішінен алынатын тік ... ... ... ... ... сөйлем құрылымының әртүрлі деңгейлерінде
жүйелі түрде жүзеге асады: топтар деңгейі, функционалды ... ... ең ... сөйлем деңгейінде (Беляева, 1986; Апресян ... 1989, ... 1990). ... ... ... ... мен
лексикалық бірліктің өзара байланысы белгіленеді. Келесі ... ... ... ... ... ... ... келетін функцоналды
сегменттерге біріктір-іледі. Бөлініп алынған сегменттерде мәтінді кестелік
көрініске ... ... ... құру ... ... асады.
Функционалды сегменттер деңгейінде алынған нәтиже – ... ... ... машиналық аударма болып саналады. Толық түрдегі семантика-
синтаксистік талдау сөйлем деңгейінде ғана іске асады.
Талдау мен ... ... ... ... ... ... рөл ... өйткені тек осының негізінде ғана ... ... ... ... ... ... әрекетінде актанттар жиыны,
меңгеру моделінің мүмкіндігі жайлы және т.б. ақпараттарды бойында сақтайтын
етістіктің лексика-синтаксистік сипатталуы негізгі рөл атқарады.
Осы ... ... ... ... ... ... автоматты
сөздіктер мен грамматикалардың жинағы ретінде жүзеге асады. Жүйенің негізгі
пішін үйлесімділігінде үндіеуропа және ... ... ... ... мүмкіндіктері алдын ала қарастырылған. Мұндай мүмкіндік барлық
«кіретін» ... ... ... құрылымына және «шығатын»
орыс тілінің бірыңғай ... ... ... машиналық аударма жүйелерінің трансферді пайдалануы дәл
осы стратегияны таңдаудың мақсатқа сай екендігін ... ... ... ... ... ... даму ... мен есептеу техникасының
жаңа мүмкіндіктері машиналық аударманың үшінші стратегия-сына қызығушылықты
жаңаша түрде жандандыра ... ... ... ... стратегиясы машиналық аударма
прагматикасына білім базасын құрудағы машиналық ... мен ... ... бейнелейді. Машиналық аударманың даму сатысының
бірінші кезеңінде қолданылатын аралық-тіл ... ... ғана ... ол өз ... айтарлықтай озды – оның пайда болуы машиналық
аударманың жаңа кезеңі деуге болады. Мысалы, аралық-тілді қолдана ... ... CMU ... Утрехте зерттелген DLT жүйесі,
Японияда – JETR, АҚШ-та – SAM және ... ... ... ... ... ... ... машиналық аударма жүйесі мен жасанды интеллект
жүйесін бір-біріне қисындастыру мәселесі – сөйлем мағынасын немесе тұтас
мәтіннің мазмұнын ... және оның ... ... ... ... ... үшін ... білім базасын қолданудың қажеттігімен түсіндіріледі.
Жасанды интеллект жүйесінің аралық деңгейі болып саналатын ұғынудың
(понимание) ... ... ... ... базалық
құрастырушыларға негізделеді:
– ұғым түйіндері (узлы-понятия) мен байланыс типтері жайлы сөз ... ... ... құрастыруды қажет ететін білімді тануға
көмектесетін тілдер;
– “белгі – мағына” принципі бойынша қайта құруды ... ... ... ... ... ... ... білімді танытатын тілдер
саналады. Осыған қатысты талдаудың ... ... ... ... және ... ... ... толықтырылатын сөйлем мағынасын
таныту. Аударманы жүзеге асыру әрекетінде «кіретін» тілдің ... ... ... ... ... құру ... ... Әрине
мұндай аударма нәтижесі шын мағынасындағы аудармадан гөрі, ... ... не ... ... ... ... беру ... ұқсайды.
Осындай жағдаятта білімді танытатын тілді ... өзі ... ... ... ... ... ... семантикалық
желісі мен «шығатын» фразаның ішкі берілісінен қайта туындауға ... ... ... ... асырады. Осылайша қайта
туындату (генерация) белгілі үлгі ... ... ... және ... Бұл ... ... ... қарамай, ол тек
тәжірибелік деңгейде ғана ... ... ... оның ... ... аса ... семантикалық желі құруға қажетті
лингвистикалық негіздемесі мен программалық құралдары әлі де ... ... ... ... ... ... қолданыс табуы оның
эксперименттік дәрежесінен ... ... ... ... сай ... ... ... жұмыс орнына
айналуына жағдай жасайды (Machine Translation, 1987; Апресян және ... ... ... қазіргі сатыдағы даму ерекшеліктерін
қарастыра келіп, оны әр ... ... ... баға беру ... ... ... машиналық аудармаға қатысты ондай топтаулар ... ... ... ... ... ... тікелей байланысты.
Қазіргі кездегі машиналық аударма жүйелерінің зерттелуі мен қолданылуы
мына жайтты ... ... ... ... ... және олардың
функционалдық критерийлері бойынша салыстыру мынаған саяды:
1. Жүйенің прагматикасы. Машиналық ... ... ... немесе
эксперименттік дәрежеде құруға байланысты оның негізгі сипаттамасы мен
талдау әдістемесін таңдау түрлері ерекшеленеді. Бұл ... ... ... ... ... ... машиналық аударма жүйесінде бір
тілдер жұбына 20000 сөздік мақаладан кем болмау) анықтайды. Мысалы, Bravice
– Weidner LOGOS, GAT, ... және т.б. ... ... мақала көлемі
көрсетілген мөлшерден кем емес. Бұл шартқа бағынбайтын жалғыз жүйе – ... Оның ... ... ... ... тең, ... бұл ... мәтіндердің тақырыптары қатаң түрде ... ... ... ... сөздіктер «төменгі» жағынан
шектелмеген, яғни ... 200 ... ... ... ... ... ... жүйе аударма жұмысын атқара алады.
Өндірістік машиналық аударма жүйесін құрудың мақсаты анық – ... ... ... ... ағымдарынан машиналық аударма алу.
Машиналық аударманың өндірістік жүйелері мынадай талаптарға сай ... Жүйе ... ... ... ... ... алынатын
нәтиже сапасының ойдағыдай болмауына қарамай, тұтынушы оны өз қажеттігіне
пайдалана алатындай мүмкіндігі ... ... ... ... ... ақпараттың сапасының төмен болуы, көбінде, жүйенің сөздіктермен
толық жабдықталмауына байланысты болып ... ... ... ... ... ... ... аудармалар әрі қарай маман аудармашының
қолынан қайта түзетіліп, сапасы жақсартылады. Осыған ... ... ... ... ... ... ... тираждануы (таратылуы). Аударма жүйесінің қолдану аясы кең
болуы үшін оның программалық және ... ... ... ... ... ... ... бірге жүйеде басқа тақырыптық аяға
және тілдерге көшу әрекетін жеңілдетуге қажетті әмбебаптық модель-дер ... ... ... икемделінуі (адаптациялануы). Машиналық аударма жүйесінің
нақты тұтынушының мұқтаждығына және ... ... ... ... мүмкіндігі болуы қажет.
– Уақытша параметрлердің оптималдығы (ауқымды-лығы). Машиналық аударма
жүйесінің аударма жасау жылдамдығы ... ... ... ... көлемімен немесе жүйені ... ... ... ... жұмыс әрекетімен сәйкес келіп отыруы қажет.
– Тұтынушыға жайлылық (комфорттық). ... ... ... ... ... және диалогтік режимдері үшін аса
қолайлы болуы шарт.
Эксперименттік жүйелерді құрудың мақсаты ... ... ... ... ... ойлау-сөйлеу қызметін модельдеу болып табылады.
Тек осы аталған тұрғыда ғана машиналық аударма мен ... ... ... ... келе алады. Эксперименттік жүйелер мен оларды
құрастырушы ғалымдар машиналық аударманың көшбастар рөлін атқарады да, ал
олардың қол ... ... ... ... ... ... ... Саарбрюкен университетінің SUSY атты эксперимент-тік
жүйесін құру арқылы алынған нәтижелері бойынша MARIS атты ... ... және SUSANNAH атты ... ... ... орны
зерттеліп, жасалуда.
2. Жүйенің автоматтану дәрежесі. Практикалық тұрғыдан қарастырғанда,
машиналық аударма жүйелерінің ... да ... ... араласуын қажет
етеді. Бірақ бұл өлшемді қолдану ... екі ... ... ... ... ... ... ететін машиналық аудармадан
бастап, аудармашы-адамға көмек ... ... ... ... жұмыс орны жайлы Бүкілодақтық аударма жасау ... СПАС атты ... ... да, бұл ... ... ... ... аударма жұмысына
тарту стратегиясы – жүйе арқылы алынған нәтижені редакциялау немесе
машинасыз ... ... ... ... ... ... аса күшті
сөздіктер мүмкіндігін пайдалану. Осыған қарай редакциялау кезеңі мен ... ... ... Мысалы, машиналық аударманың өндірістік жүйелерінде
аударылған материалдың 20 пайызын қамтитын бөлігі үшін соңынан ... ... кең ... қолданылады (ALPS, ENGSPAN, LOGOS,
METAL, SPANAM жүйелерін салыстыр). Әсіресе, бұл жайт ... ... ... өңдеуді қарастыратын жүйелерге тән болып келеді.
Машиналық аударма нәтижесі, ең алдымен, әрі қарайғы өңдеулерді қажет
ететін бастапқы ... ... ... ... ... ... ... зерттеуші ғалымдар арнайы сервистік жүйені құрудың және
практикалық ... ... ... нәтижелігін бағалау үшін ондай
сервистердің деңгейлік дәрежесінде де ... ... ... байқауда.
Мұндай сервис, әдетте, ... ... ... ... ... ... ... (автоматтанған лексикондарды) және
т.б. өз құрамында сақтайды.
Ақпарат ағымының жаңа толқыны ... ... ... ... кең түрде қолдану қажеттігін айқындап отыр, сондықтан қажетті
ізденістер барысында жоғарыда ... ... ... түрде ескерілуі
керек.
Ә д е б и е т
Автоматический ... ... гг.: ... / ... И.А. ... Р.Д. Равич. М., 1967, 516 с.
Автоматический перевод: Сб. статей / Под ред. и ... ... М., 1971. 357 ... Н.Д. ... перевод и проблема языка-посредника // Вопр.
языкозн. 1957 №5. С. ... Ю.Д., ... И.М., ... Л.Л. и др. Лингвисти-ческое
обеспечение системы «ЭТАП - 2». М., 1989. 295 с.
Бар-Хиллел И. Будущее машинного перевода // ... ... ... ... ... 1962. №4. С. ... А.Р., Ковригин А.Б. Исходный этап независимого ... ... ... предложения // Материалы по
математической лингвистике и машинному переводу. Вып. 2. Л., 1963. С. ... Л.Н. ... ЭВМ в ... ... ... Л., 1986. 84 с.
Беляева Л.Н., Откупщикова М.И.. Автоматический ... ... ... ... ... Отв. ред. А.С. ... СПб.: Изд-во С. –
Петербург. ... 1996. 528 ... В.А. ... ... ... анализа китайского
текста при машинном переводе // Машинный перевод. М., 1961. С. ... Ф.А., ... Р.С. ... синтаксического анализа татарской
фразы // Машинный перевод. М., 1961. С. 295-303.
Кремнева Н.Д., Морева В.Ю., Ульянова Г.С. ... ... ... ... ... с ... ... и порядка замыкания
связей // Лингвистические проблемы функционального моделирования речевой
деятельности. Вып. 3. Л., 1976. С. ... О.С. ... по ... ... М.,1979. 319 с.
Кулагина О.С., Мельчук И.А. Машинный перевод с французского языка на
русский // Вопр. языкозн. 1956. №5. С. ... Б.М., ... Т.Н., ... М.И. и др. ... перевода, разрабатываемая в ... ... ВЦ ЛГУ // ... ... 1996. № 1. С. ... Н. Н. ... ... перевода (ФРАП):
лингвистические решения, состав, реализация // Машинный ... ... ... ... ... системы автоматического перевода.
Вып. 271. М., 1987. С. 6-26.
Марчук Ю.Н. Проблемы машинного перевода. М., 1983; ... ... М., 1985. 199 ... ... Сб. ... М., 1957. 314 с.
Мельчук И. А. Работы по машинному переводу в СССР // Вестн. АН ... № 2. С. 43-47; Опыт ... ... ... ...... 1974. 314 ... Т. Н. Алгоритм машинного перевода с английского языка на
русский // Проблемы кибернетики. Вып 3. М., 1960. с. ... М. И. ... ... ... Л., 1982. 103 ... Д. Ю. ... ... 2-е изд. М., 1958. 72 с.
Переводная машина в Таллине в 1924 г. // ... по ... Сб. 1. ... 1962.С. 95-96.
Переводная машина П. П. Траянского: Сб. матер. о переводной машине для
перевода с ... ... на ... ... ... в1933 г. /
Отв. ред. Д. Ю. Панов. М., 1959. 52 с.
Пиотровсий Р. Г. Инженерная ... и ... ... Л., ... с.
Синтаксический компонент в системах машинного перевода // ВЦП. Сер. ... ... ... ... ... ... Вып. 5. М., 1981. 130 ... З. М. Англо-русский многоаспектный автоматический словарь
(АРМАС) // Машинный перевод и ... ... Вып. 17. М., 1974. ... А. Л. ... ... ... местоимений третьего лица //
лингвистические исследование по машинному переводу. Вып. 2. ... С. ... Г С., ... М. И., Лейкина Б. М. и др. Система анализа
текста с ... ... ... ... // ... ... реализации систем автоматического перевода. Ч. 1. М.,
1982. С. 205-231.
Чижаковсий В.А., ... Л.Н. ... в ... ... текста. Кишинев, 1983. 163 с.
Hutchins W. J. Transiation: Past, Present, Future. Harwood, ... ... ... and ... Issues // Ed. by ... New York, 1987. 350 ... ісін автоматтандырудың
лингвистикалық негіздері
Баспа ісін автоматтандыру тек ... ... ... ... ... электронды есептеу машинаға (ЭЕМ-ға)
толығымен жүктеп қана қоймайды, сонымен бірге бірқатар ... ... ... ... де айналысады. Баспа ісіндегі
мәтінді ... ... ... ... ... сипатын
қысқаша түрде баяндайық.
Баспа ісін автоматтандырудың кезеңдері. Қазіргі кезде мұндай әрекеттің
мынадай кезеңдерін бөліп қарастыруға болады:
1) авторлық кезең (мәтін ... ... ... сақтайтын тетікке
көшіруі);
2) редакциялық кезең:
а) авторлық түпнұсқа мәтінге корректура ... ... ... ... ... ... ... корреспонден-цияларды өңдеу,
деректер базасынан ақпарат іздеу және т.б.);
3) құрылымдау кезеңі ... әр ... ... белгілеу: терме мен бет пішімі, шрифтер-дің кегелі мен
гарнитурасы және т.б.);
4) полиграфиялық қайта ... ... ... ... ... үшін ... полиграфиялық параметрлерді фототерім машиналары
арқылы сыннан өткізу);
5) таралымды белгілеу кезеңі, яғни ... ... дана ... ... шығару (егер басылым дәстүрлі қағаз түрінде болса);
6) тарату кезеңі (басылымды ақпарат сақтайтын тетік ... ... ... ... ... ... қорынан оқырманға ұсыну).
5-кезеңде тілдік деректер толығымен қатыспайды, ал басқа кезеңдерде оның
тек орташа дәрежесінде ғана ... бар. ... ... ең ...... ісін автоматтандыру кезеңдері хронологиялық жағы-нан ... ... ... ... Мысалы, шығарма авторы мәтінді өзі теріп,
алғашқы түзетулерді өзі жүзеге асыруы да мүмкін. ... ... ... баспа ісін автоматтандырудың әр кезеңінде де кездеседі.
Енді жоғарыда аталған кезеңдердің әрқайсысына байла-нысты лингвистикалық
жабдықтаудың ерекшеліктеріне тоқта-лайық.
Авторлық кезең. Бұл кезеңде ... теру үшін ... ... ... ... яғни ... теру мен оған ... жүргізуде
компьютерлік программаларды пайдаланады. Мұндай мәтіндік процессорларда
тілдің мынадай ... орын ... ... ... ... ... ... және қажеттікке қарай,
ол сөзді автоматты түрде оның синонимімен алмастыру;
2) қате ... ... ... ... ... ... ол сөздің сөздікте жоқ екендігін айқындау;
3) тұлғалық сәйкестік бойынша эталондық сөздіктегі сөзді ... ... ... ... ... ... осы авторлық кезеңде жүзеге асады,
ал екіншісі мен үшіншісі келесі кезеңдер-дің негізін құрайды, ... ... ... ... ... иесі қажетті деген мәтін элементтерін бөліктерге
бөліп алуы үшін ... ... ... ... ... ... мүмкіндігі бар. Егер автор ондай таңбаларды шығарма мәтініне
енгізбей ... ... ... ... ... ол міндетті техникалық
редакторлардың атқарулары қажет.
Сонымен бірге бұл кезеңде автордың машиналық ... ... ... ... және ... ... автономдық сипатта
қолданыуына да мүмкіндігі бар. Жүйенің ... ... ... қажетті деген сөздік мақаланы тез тауып алуына жағдай жасайды.
Редакциялық кезең. Бұл кезеңде баспа ісін автоматтан-дыру жүйесі мәтінді
өңдеуге қатысты ... ... мен ... ... жүзеге
асырады. Мәтінді өңдеу жұмысымен қатар редакциялық-баспа қызметі де
орындалады. ... ... ... ... ... ... ... және баспа ісін автоматтан-дыруда қолданылатын
басқа да ... ... ... ісін ... ... мен ... нысаны
ретіндегі шығармалар мәтіні мынадай элемент-терден ... жәй ғана ... ... яғни ... ... ... сөз
тіркестері, сөйлемдер, фразадан тыс тұтастық; топтамалар, яғни ... және т.т.; және ... яғни ... ... ... ... ... яғни математикалық өрнектер мен кестелер;
– шығарма аппаратын құрастырушы мәтіндер (титулдық бет, ... ... және ... ... ... яғни ... элементтерінің таңбалары ... ... ... бұйрықтар.
Редакциялау кезеңінде баспа ісін автоматтандыру ... ... ... ... ... екі түрлі амалын атауға болады:
1) мәтіндерді түпнұсқаға сәйкестендіру;
2) мәтіндерді қазіргі кездегі тілдік ... ... ... ... ... бірінші процесті корректура жүргізу деп, ал ... ... деп ... Корректура жасау мен редакциялау істерінде де екі
түрлі әрекеттерді ажыратуға болады:
а) бақылау амалы, яғни ауытқуларды табу;
ә) қайтақұру ... ... яғни ... ... ... түзету.
Бұл айтылғаннан мынадай қорытынды шығаруға болады: ... ... ... барлық мәтін көлемі алынады да, ал қайтақұру нысаны ретінде
– ауытқулар түрлері орын ... ... ... ... ауытқулардың түрлеріне жататындар:
а) бұрмалаулар (түпнұсқадан айырым табатын ауытқулар);
ә) қателер (нормадан ауытқу);
б) қате ... ... ... да және ... да ... ... редакциялау барысында бақылауды қажет ... ... ... және т.б.) ... ... ... ... емес, тек
лингвистикалық және психолин-гвисти-калық түрлері ғана орын ... ... ... ... нормалық топ түрлерін бөліп қарастыруға болады:
а) тізімдер (мысалы, неше түрлі сөздіктер, қысқартулар тізімі ... ... ... ... ... ... мен ... кезіндегі тыныс белгілерді
қою үлгісі);
б) құрылымдар немесе модельдер ... ... ... ... моделі);
в) параметрлер (мысалы, бір бетте қатарынан төрт тасымалдың бірдей
кездеспеуі немесе ... ... 600 ... ... ... ... ... автор мәтіннің сапасын анықтау
үшін мынадай шарттардың орындал-ғаны ... ... үшін – ... ... бұрмалану дәрежесі мына өрнекпен
анықталады:
Е=e/M,
мұндағы е – мәтінде кездесетін ... ... М – ... ... ... мәтін көлемі;
– редакциялау үшін – қателесу дәрежесі:
S=r/M,
мұндағы r – ... қате ... ... ... ... мен ... ... ерекшеліктеріне тоқта-лайық. Мұндай ерекшеліктердің ең
алғашқысы ретінде мәтінді ... үш ... атап ... ... ... ерекшелікке жататындар:
– корректураның алдын алатын әрекет (предкорректура) және редакциялаудың
алдын алатын әрекет (предредактиро-вание). Мысалы, ... ... ... ... ... интеркорректура (интерредакциялау), яғни ... ... ... мен ... ... корректурадан кейінгі әрекет (посткорректура) және редакциялаудан
кейінгі ... ... яғни ... құралдар арқылы
орындауға келмейтін жағдайдағы корректор мен редактордың амал-әрекеттері.
Екінші технологиялық ерекшелікке ... мен ... ... ... ... жатады:
– компьютерленген корректура және компьютерленген редакциялау (мәтіндік
процессор арқылы компьютер жадына жазылған мәтінге ... ... ... ... ... бақылау мен қайтақұру әрекеттері);
– автоматтанған корректура мен автоматтанған редакциялау ... ... ЭЕМ ... ... ... да, ал қайтуқұру әрекеті – корректор
немесе редактор арқылы);
– автоматтанған ... мен ... ... ... бақылау
мен қайтақұру жұмыстары ЭЕМ арқылы орындалады, ал адам қалыпты жағдаят
бұзылса ғана ... ... ... ... және де ... ... ... тиімділігін анықтау үшін мына өрнекті қолдану қажет:
E=(O1-O2)/O1,
мұндағы Е – ... ... ... О1 – ... ... бұрынғы
ауытқулардың саны, О2 – өңдеуден өткеннен кейінгі мәтіндегі ауытқулар саны.
Тәжірибеде дәлелденіп және ... ... ... ... отыратын жайт – мәтін ағымын өңдеу ... ... ... ... ... мүмкін еместігі. Сондықтан, ең дұрысы, өңделу
жұмысының ... ... ғана сөз ету ... ... немесе қате кету
дәрежесі). Осындай жағдайды ескере отырып, бұрмалану дәрежесі мен 1 1”мәтін
түріне қарай әдебиеттерде тиісті талаптар ... ... ... ең жиі ... ... ... атап ... Оларды машиналық қайтақұру және машиналық бақылау
әдістері деп екіге ажыратуға болады. Машиналық бақылау әдістері, іштей ... ... ... негізделген және белгіленген нормаға сай келетін
символдар тізбегіне негізделген деп екіге ажыратылады.
Шығарманың түпнұсқа мәтінін пайдалануға ... ... ... ... ... ...... (дублирование) әдісі. Оның мәні ... ... теру ... ... ... ... ... екі рет
түсіріп алып, олардағы әрбір символдарды ... ... ... ... ... Егер қайталанған мәтіндер ішінде бір
ғана позиция ... екі ... ... ... онда ... ... ... яғни сол позицияда қате бар деген сөз.
Мұндай ... ... ... ... ... жоғары және ол – 0,96-ға тең.
Нормаланған символдар тізбегіне негізделген ... ... ... көп ...... әдісі. Оның мәні мынада: қайсыбір тілдің
орфографиялық сөздігі ЭЕМ-ның есте сақтайтын ... ... ... ... ... ... ... сөзі эталон ретінде алынып отырған ЭЕМ
жадындағы сөздік бірліктерімен ... Егер ... ... ... онда ол сөз ... ... деп ... да, ал сөздік
бойынан табылмаса – потенциялды дәрежеде (барынша) бұрмаланған сөз ... ... ... ... нәтижелігі қайталау әдісіне қарағанда
төмен дәрежеде және ол 0,5 пен 0,7 аралығындағы шамаларға тең.
Бұл жерде мынадай сұрақ туындауы ... ... ... (орфографиялық
сөздік арқылы) мәтін көшірмесінің түпнұсқадан ауытқу жағдайын қалайша
бақылауға болады? Мұндай ... орын ... ... ... көшірме
мәтінінің түпнұсқа мәтінінен ауытқуы нормадан да ауытқу болып саналуына
байланысты. Қазіргі ... ... ... ... бойынша, қайтақұру
(реконструкция) әрекеті әр ... ... ... ... ... ... Яғни мәтіндегі бұрмалауларды автоматты түрде іздеп тауып, оларды
адам қолымен түзетуге болады деп ... ... ... бола ... ... үшін ... әрекетінің нәтижелілігін 0,8 бен 0,9
аралығында жүзеге асыруға болатын ... де ... ... ... бақылау нормаларының саны ... ... ... ... Бұл қуаттылық, айтарлықтай
дәрежеде, шығарма мәтіні элементтерінің осы мақсатқа қаншалықты сай таңбала-
нуына да байланысты болады.
Лингвистикалық ... ... жәй ... ... ... ... Мұндай бақылау әрбір сөзге ... ... ... ... және т.б.) қоса ... ... негізделеді. Лингвистикалық әдістердің ең қарапайым
түрлері сөздердің ... ... ... ... ... ... жиынды пайдалануға немесе, ... ... ... ... ... Күрделіленген әдістер сөздер арасындағы
грамматикалық байланыстың, тыныс белгілерінің, мәтінді абзацтарға бөлудің,
қысқартылған ... және сөз ... ... және ... ... ... ... нормалардың да барынша кең спектрі қолданыс табуда
(Мучник, 1985). Бұл нормалар белгілі оқырман қауымына ... және ... ... фразадан тыс бірліктердің мүмкін болатын максимум «ұзындығын»
белгілейді (бұларды тез оқырлық сипаттамалар деп те атайды). ... ... ... түрлеріне қарай, арнайы нормалар түрлері ... ... шет ... ... үшін мына жайттар
тексеріледі:
– мәтін жаңалығы, яғни ... ... ... емес ... ... ... барлық сөздер санына қатынасы (нормалық мәні – 0,015 пен
0,50 аралығында);
– мәтіннің ... ... яғни ... ... да ... санының оның жалпы сөздік қорына қатынасы (нормалық мәні – 0,237 ... ... ... ... ... (напряжение изложения), яғни оқушыға таныс
емес сөздер санының оның жаңадан меңгерген сөздерінің санына қатынасы.
Лингвистикалық жабдықтау ... ... ... да ... ... ... мұндай мақсат үшін әртүрлі
арнайы ақпаратты-іздестіру тілдері құрастырылады және олар ... ... ... хаттар (корреспонденциялар) өңделеді.
Құрастыру кезеңі. Бұл кезеңде басылымды құрастыру мақсатында тілдердің
екі түрі қолданылады:
а) полиграфиялық безендірудің ... ... ... элементтерін бөліп алуға қажетті таңбалар тілі (язык меток).
Бұл тілдер әртүрлі ұстанымдарға ... ... ... ... бұйрықтар саны, көбінде, 20 мен 100 сандарының аралығында орналасқан.
Көпшілік жағдайда ... ... ... ... ие ... бұйрық белгісі;
ә) бұйрық түрі;
б) бұйрық параметрі (өлшемі).
Мәтін элементтері таңбасының (меткасының) ... ... ... құрылымымен бірдей келеді. Бірқатар жүйелерде мәтін
элементтеріне таңбалар тілі (язык меток) қолданылмайды да, ал оның ... ... ... ... ... ... ... Бұйрық-
тар мен таңбаларды (меткаларды) мәтінді полиграфиялық қайта туындату
кезеңінен бұрынғы кезеңдердің барлығында да ... қоя ... ... ... ... ... Бұл ... баспа ісін
автоматтандырудың лингвистикалық ... ... ... ... ... ... ... тек бір ғана функция пайдаланылады.
Ол функция сөзді ... ... үшін ... ететін компьютерлік
программа түрінде ... ... ... программалар полиграфиялық
безендіру бұйрықтарын өтеу үшін арналған мәтіндерді өңдеудің ... ... ... ... ... программалары баспа ісін автоматтандырудың алдыңғы
кезеңдерінде қызмет ететін басқа да ... ... ... Мысалы,
мәтіндік процес-сорлар мен редакциялық-баспа жүйелерінде қолданылады. ... ... ... ... ... қойылатын талап полиграфиялық
қайта туындату кезеңіне қарағанда айтарлықтай қатал емес.
Сөзді тасымалдау алгоритмін екі үлкен топқа бөліп ... ... ... ... яғни бұл жағдайда компьютер жадында қайсыбір тілдің
тасымалданған сөздерінің эталондық нұсқасы сақталады. ... ... 20-40 мың және ... ... түрі ... оннан аспайтын тілдер)
қамтылады;
– сөздіксіз, яғни бұл жағдайда ... ... ... ... компьютерлік программа көмегі-мен жүзеге асады.
Әрине, сөздіктік әдіс бойынша тасымалдау ісі аса ... ... ... ету ... мен ... ... ... көптеп ұтылады. Ал
сөздіксіз әдіс уақыт пен жадыға байланысты ... ... ... ... өте төмен.
Сөздіксіз әдістер ішінен мынадай кішігірім топтарды бөліп қарастыруға
болады:
– морфемдік әдіс ... яғни ... ... ... ... ... ... морфемсіз әдіс арқылы, яғни тасымалдау белгісін буындар шекарасына
қарай немесе құрамында ... және ... ... ... ... болуына қарай қою.
– қисындастыру әдісі. Бұл әдіс бойынша тасымалдау белгісі сөзформа
құрамында ... ... және ... ... ... қарай қойылады.
Сөздіксіз әдістер арқылы жүргізілген зерттеулер нәтижесі бойынша, бұрыс
қойылған тасымалдар саны, кері функционал-дық ... ... ... ... ... ... қатысты болып келеді. Мысалы, ... ... ... ... ... ... саны 1,12 ... болса, онда қойылмай кеткен (жоғалған) тасымалдардың саны 48,41 пайыз
құрайды. Сондай-ақ, ... ... бір ... ... ... кеткен
(жоғалған) тасымалдардың саны 7,40 пайыз болса, бұрыс тасымалдардың саны
11,70 пайызға дейін ... ... және т.б., ... ... Баспа ісін автоматтандырудың бұл кезеңі бойынша арнайы
тасымалдау (немесе байланыс торабы) ... ... даяр ... яғни басылымдар нәтижесі тұтынушылар қауымына таратылады.
Басылымдар – мерзімсіз немесе мерзімді ... ... ... ... мерзімді басылымдарға “электронды” түрдегі журналдар мен газеттерді
жатқызуға ... ... ... ... түрлері бірқатар Батыс
Еуропа, Солтүстік Америка елдерінде және Жапония мен тағы да басқа елдерде
дәстүрге айналып отыр.
Баспа ісін ... бұл ... ... ... ... тұтас бір басылым құрастыру үшін, негізінен, ... ... ... ... ... бір
деңгейінде техни-калық себептерге байланысты тек 10 ... ғана ... ісін ... ... ... ... Мұндай құрылым автономды және жүйелі деп ... ... ... ... ... түсіндірме және
энциклопедиялық сөздіктер ... ... ... ... ... ... ... нормалардың жиыны және компью-терлік
программалар сақталады.
Деректердің тірек базасының құрамы ... ... ... ... орфографиялық сөздік-терден, морфологиялық,
синтаксистік, ... және ... ... ... және салалық), эталондық тасымал сөздіктерінен (әртүрлі тілдер
үшін), морфемалар тізімінен, өлшем бірліктері қысқартулар-ының ... ... ... ... тізімінен, мәтін элементтері
таңбаларының тізімінен, библиографиялық сипаттаудың ... ... және ... ... ... рубрикаторлары-ның
тізімдерінен.
Нормалар жиыны іштей мынадай лингвистикалық нормалар жиындарының деңгейі
бойынша бөлінеді: графемдер, морфемдер, фразадан тыс ... ... ... ... ... ... ... үшін
психолингвистикалық нормалар жиыны, төменгі дайындық деңгейіндегілерге –
тасымалдау ... ... ... ... үшін).
Компьютерлік программалар топтамасы мынадай құрамнан тұрады: авторлық
және редакциялық кезеңдеріне арналған ... ... ... ... ... ... үшін жазылған программалардан және
тарату кезеңіне арнайы жазылған программалардан.
Лингвистикалық жабдықтаудың құрастырушылары бөлек және ... ... ... ... ақпаратты сақтайтын сөздік құрамында
орфографиялық және синонимдік сөздіктер де бірге ... ... ... ... ... жабдықтаудың әрбір компонентін жеке бір
нысан ретінде қарастыруға болады.
Соңғы жылдары ... ... ... мен ... ... ... ... жүйесі деп аталатын жүйелер құрыла бастады.
Желі режимі бойынша да әрекет ете алатын мұндай ... ... ... ... қызметті қарастырылған кезеңдердің барлығында бірдей
(тарату кезеңін ... ... ... ... ... ... жүйесіне қойылатын негізгі талап – тек
бір ғана лингвистикалық сөздік бойынша әрі синоним ... ... ... әрі редакция-лауды, әрі сөздерді тасымалдауды жүзеге
асыру.
Міне, осы аталған мәселелерді ... ... ... ... ісін ... ... жаңа сипаттағы жоғары деңгейге
көтерері сөзсіз.
Әдебиет
Будаар Я. И., Карская С. Д., ... З. В. ... ... ... слов русского языка // Научно-техническая информация.
Сер. 2. 1985. № 12. С. 20-30.
Мартин Дж. Видеотекст и информационное ... ... М., ... ... В. С. ... и ... ... культуры письменной речи. М., 185.
256 с.
Партыко З. В. 1) ... ... ... и машинного редактирования.
М., 1983. 41 с. (Изд. дело: Обзорн. информ. / НИЦ «Информпечать». Вып.5);
2) Статистика ошибок при ... и ... ... М., 1989. 56
с. (Изд. дело: Обзорн. ... / НИЦ ... ... обеспечение автоматизированного издательского процесса /
Прикладное языказнание: Учебник, отв. ред. А. С. ... СПб: ... ... С. ... тілінің компьютерлік қорын (базасын) құрастыру жайлы
Кеңес Одағы кезіндегі кейбір ғажайып бастамалар заман өзгерісіне қарай
құбылып, ... ... ... ... ... ... басқаша
қалыптасып, әрі қарайғы жалғасы табылмай қалғаны ... ... ... ... Солардың бірі – түркі тілдерінің, оның ... ... ... ... қорын жасау мәселесі.
Осы айтылған мәселенің қысқаша тарихы мен мән-жайына тоқталайық.
Электронды есептеу машиналарының (ЭЕМ) көмегімен ұлттық тілдерді ... одан ... ... ... ... ... ... ХХ
ғасырдың 80-жылдарынан бастап тілдердің машиналық қорын (базасын) ... ... ... ... аса ... ... Осыған байланысты
1983 жылы Москвада шақырылған Бүкілодақтық ғылыми конференцияның ... орыс ... ... қорын жасау проблемасы алғаш рет қойылды.
Бұл ғылыми мәжілісте ЭЕМ-ның жадына түсірілетін тілдік ... ... ... қандай болуы тиіс екендігі, бірінші кезекте мұндай қор қандай
міндеттер атқаратыны, тіл ... ... ... ... ... ... көптеген мәселелер қаралған болатын. Сонымен бірге электрондық тіл
қорын дәйекті түрде тұтыну үшін ... ... және ... шаралардың
атқарылу қажеттігі де ортаға салынып, жан-жақты талқыланды.
Аталған ғылыми конференцияның ... ... ... қадағалау
мен жаңадан туындайтын мәселелерді шешу қажеттігінен 1987 жылы Москвада
ашылған Бүкілодақтық екінші ғылыми ... осы ... ... ... бас қосты. Бұл ғылыми ... ... және ... да ... ғалымдары қатысты.
Мәжілісте өткен төрт жыл аралығында орындалған жұмыстардың нәтижелерінің
сөз болуымен ... ... да ұлт ... ... ... ... байланысты соны мәселелер қарастырылды. Ерекше ... жәйт – осы ... ... ... ... ... ... тілдеріне
қатысты баяндамалардың қатарында қазақ тілінің машиналық қорын жасау
мәселесі де өз алдына ... орыс ... ... қорын жасау мәселесіне арналған екінші
ғылыми конференцияның шешімдерінде қазақ мәтіндерін ЭЕМ жадына енгізу және
оны автоматты ... ... ... зерттеу бағытындағы қазақ
ғалымдарының қол жеткізген нәтижелері ескеріліп, түркі ... ... ... ... орталық Қазақ ССР ҒА Тіл білімі институтының
құрамынан ашылсын деген дербес қаулы ... біз үшін ... ... ... 1988 ... ... ... Москвада Совет түркологтары
комитетінің XIV Пленумы ашылып, оның күн ... ... ... ... ... ... арнайы қойылды. Бұл ғылыми жиында негізгі
баяндамашылар ретінде Одақ ... ... ... Р.Г.Пиотровский,
А.М.Щербак, В.Г.Гузев өз ой-пікірлерін ортаға салып, ондай қор жасаудың
қажеттігімен ... алда ... ... да атап өтті ... ... Ал ... тілінің машиналық қорын жасау мүмкіндігі
жайлы мәселеге ... ... ... баяндама жасады
(Қ.Б.Бектаев, А.Қ.Жұбанов).
Тілдің машиналық қорының қажеттілігін алғаш дәлелдеп берген ғалым –
информатика ... ... ... А.П.Ершов тілдің машиналық қорын
құрастыру мәселесіне үлкен мән берген болатын (Ершов, 1979). Оған ... жылы ... мына ... ... «Орыс тілін сүйетін қоғамның (формалды
қоғам) танымынша, орыс тіл білімі ... ... ... жатқан Гулливер
тәрізді, сондықтан менің ойымша, оның оянатын және өзі ... бар ... ... кезі енді жетті. Ал ЭЕМ бұл ретте таптырмайтын қоңыраулы сағат
секілді» (Машинный фонд..., 7-12-б.). Бұл айтылғандар қазақ тілінің ... ... ... саласына қатысты әлі де өз ... ... Ал ... сол ... ... аса білгірлікпен
болжап, болашақ жасалатын орыс ... ... ... тіл жөніндегі
білімдердің аса қуатты концентраты (қоспасы) болады деп сенген.
Мұндай формалды компьютерлік жүйе ... ... ... әрі тең
көлемді болуы қажет, сөйте тұра ондай тілдік модель “анатомиялық” тұрғыдан
мүшеленген, ашық, бақылауға айқын, ... ... әрі ... ... деп ... Алайда қазақ тілін модельдеуге қатысты біздің
жетістіктерімізді үнді-еуропа тіл ... ... және ... ... ... ... ... ауқымымен салыстырып қарайтын
болсақ, біз өтпек жолымыздың әлі де бастауында тұрғанымыз айқын сезіледі.
Көптеген ғалымдардың ... ... ... біз ... тілінің
компьютерлік қоры» атты жүйенің түсінігі – көп ... әрі ... ... ... ... және оның ... міндеті
ақпараттық барлау мен тіл білімі саласындағы (жалпы филология бағыттағы)
зерттеушілік болуы тиіс. Ал ... ... қор ... методологиялық
негіздері ретінде мынадай екі тезисті басшы-лыққа алғанды жөн ... ... ... – тіл ... ... қандайы ... ... ... ... ал ...
лексикографиялық жағынан жүйеленген тілдік мәліметтердің барлығын ... ... ... ... ... ... (ақпараттардың) лексикографиялық пішінде көрініс
табуы олардың сөздік түріндегі жұмыстардың идеясына жақындайды, ал ... ... ... ... бірегей түйін немесе түп қазық
– жеке сөз, деп ... ... ... да, сөз өзінің ішкі-сыртқы
қызметтері жағынан және ақпарат сақтағыштық қасиеттерінің негізінде белгілі
бір жүйедегі сөз ... ... ... ... ... ... мөлшерде
өзіндік сегменттері болады және олар ... ... ... т.б. пішінде көрініс табады, яғни ол барлық тілдік
мәліметтер ... ... деп ... ... біз ана ... ... қорын құру методоло-гиясына орыс
тілінің машиналық қорын жасау тәжірибесіне ... онда ... ... сақтауымыз қажет:
1) қазақ тілі компьютерлік қорының негізгі ... ... ... ... ... қоры (иллюстративный фонд);
3) қазақ тілінің терминологиялық қоры;
4) қазақ тілінің академиялық сөздіктері мен ... ... ... тілінің лингво-статистикалық қоры;
6) қазақ тілінің лексикографиялық қоры;
7) қазақ тілі процессорларының қоры;
8) қазақ тіліне қатысты ... ... мен ... ... және тәжірибелік мәліметтерді бірлікте қамтитын
бағдарламалар қоры.
Аталған ... ... ... ... қоры ... ... жүйеленген банк ретінде де және тұтыну қажеттігіне сай қайта
жинақталған тұтас күйінде де ... ... ... ала ескерілуі
керек.
Қазақ тілі жөніндегі деректерді жинаудың, сақтаудың, талдаудың және
салыстыра ... жаңа ... ... ... ... дерек
көздерінің автоматтандыр-ылған сөздіктер мен грамматикалар тәрізді жаңа
түрлерін игеру ісі өмірге жанасымды және ... ... ... Әрине, бұл
үшін біз жалпыфилологиялық дәстүрлер мен мәдениетке, тілді танып білуге,
практикалық жаңа ... ... ... ... ... ... тілінің компьютерлік қорының құрамындағы «қазақ мәтіндерін
суреттеу қорының» мақсаттары мен міндет-тері қандай болмақ?
Біздің ұйғаруымызша, мұндай жүйелерде тұтас қалыптағы мәтіндер ... те және ... ... ... сол ... үзінділері, қор
ішінде тұрған ... ... ... ... статистикасы,
сөзнұсқағыштардың толық тізімдері, сөздерге телулі цитаталар, жиілікті және
кері әліпбилі сөздіктер көрініс табуы қажет.
Компьютерлік ... ... ... түпнұсқа мәтін-дерінің типіне
байланысты деп санай отыра, қазақ тілінің жүйесін ... ... ... әдебиет тілін, газет-журнал тілін, ғылым мен ... ... ... тілін, заң орындары мен сот мекемелер
тілін, оқу орындары тілін, сауда, дәріхана, ... және ... ... ... ... ... Әрине, қордың бұл түріндегі
компьютер жадына орналастыруға қиындық туғыза-тын сөйленіс ... ... сот ... ... ... ... ... сөйлесу т.т. сияқты ауызекі сөйлесу тілінің
үлгілерін жазып алу мәселесі.
Келесі бір қомақты мәтіндік бірлік – ол ... ... ... және іс ... мәтіні-нің негізгі өзегі терминдер
екені айқын. Жалпы сөйлеу тілінің аясындағы сөздер ... ... ... ... ... бір ... ... басқаша айтқанда,
терминдер өрісі болып табылады. Осы аяда өмір ... ... үшін ... ... сөз ... ... етене, ортақ болып келеді.
Осындай маңызды жұмыстардың келесі түрі – әр ... ... ... ... ала білу ... Осы ... тіліміздегі
диалектілік лексиканың біркелкі еместігін ескеретін болсақ, оларды
компьютерлік қорға қосу ... ... ... үшін ... жоқ ... ... олар бір ... ертедегі сөздер ... ... ... ... үлгілері болып келсе, екінші ... ... ... ... ... ... шектеліп қалған сөздер немесе
тіліміздегі жаңадан енген сөздер болуы да ықтимал.
Халық тілі сол ... ... ... ... соның бүкіл
болмысын барлық ерекшеліктерімен қоса қамту болашақ ... ... ... ... деп ... ... сияқты.
Жоғарыда сөз болған қазақ тіліндегі ... ... ... әрі ... ... күн ... тіл – ... тілі
және жер-су аттарының тілі немесе топони-мика.
Осы аталған тіл үлгілерін жинастырып, тіліміздің компью-терлік қорын
жасауда, оның бұл ... ... да ... мен арналары қамтылары
сөзсіз.
Формалды пішіндегі қазақ тілінің ... ... ... ... ... ең ... ... мыналар деп білеміз:
а) тұтынушыға қажет болған белгілі бір сөзді қандай тіл ... тіл ... ... қажет;
ә) іздеуге тиісті сөз қарастыратын мәтінде қамтылған ба, жоқ па?
б) графикалық және ... ... қоса ... сөздің мүмкін
болған барлық түрлері мен тұлғасы айқындалып болды ма?
в) ... бір ... ... ... ... ... ... сипаты анықталды ма?
г) белгілі бір сөз: қарастырып отырған семантикалық және грамматикалық
сипатта өткен дәуірлердегі, көне ғасырдағы мәтіндерде қолданылған ба, ... ... ... ... ... осы аталғандар қазақ тілінің компьютерлік қорын жасау мақсатындағы
күн тәртібіне қойылатын ең маңызды мәселелер болуы қажет.
Жоғарыда сөз болған Совет түркологтары комитетінің XIV ... ... ... ... ... ... ... кетейік.
Алғашында мәжіліске қатысушылар, тілдің машиналық қорының анықтамасы
төңірегінде пікір ... ... ... бір ... ... ... (компьютердің) араласуымен зерттелетін жекеленген мәселелердің
нәтижелерін, мысалы, жеке ... ... ... ... ... есептерді ... ... ... ... ... ... енгізілген мәтіндер мен
лексикографиялық материалдардың тұтастығын сол тілдің машиналық ... ... деп ... болмайтындығы баса көрсетілді.
Мәселен, ҚР БжҒМ А.Байтұрсынұлы атындағы Тіл ... ... ... саласы бойынша біршама ғылыми жұмыстар орындалды.
Оларды қысқаша былайша атап ... ... ... ... ... ... ... әдебиет пен оқулықтар
мәтіндерінің, алғашында ЭЕМ-ның, ... ... ... ... олар ... ... ... бағдарламалар құрастырылуының
негізінде әртүрлі жиілік сөздіктердің алынуы;
– М.Әуезовтің 20 томдық шығармалар жинағының ... ... ... және ... ... ... ... жиілік сөздіктерінің
жарық көруі;
– осы тәрізді жиілік сөздіктердің негізінде қазақ сөздерінің әр стильде
және әр көлемді ... ... ... ... сол ... статистикасының анықталуы;
– сөзтұлғалардың құрылымдық ... мен ... ... әр сөз ... ... ... қазақ тіліндегі негізгі сөз таптарының мәтін ... ... ... мен ... ... ... бағыну-
бағынбау жағдайларының анықталуы;
– қазақ ... ... атты ... ... ... іске қосылуы;
– қазақ тіліндегі мәтін мазмұнын оның тұрпатына қарай ... ... ... ... ... Тіл ... ... жоспарлы тақырыптар бойынша түзіліп жатқан
түсіндірме, екі тілдік, бір тілдік сөздіктер мәтіндерінің компьютер жадында
«сөздіктер қорын» ... ... ... осы ... ... ... біз ... тілінің компьютерлік
қоры деп атауымызға бола ма?
Жоқ. ... бұл ... жеке ... шеше ... ... мен ... файлдар жиынтығы және олар бір-біріне тығыз
байланыста болмай, тұтынушы сұранысына бейімделмегені әрі бір ... ... ... ... күрделі жүйе болмауынан
деп білеміз.
Жоғарыда сөз болып жатқан Пленум мәжілісінде ... ... ... қорын жасау қолданбалы ілімдердің мұқтаждығына сай
жүзеге асырылуы тиіс екендігі баса айтылды.
Өкінішке қарай, мұндай ... ... сөз ... ғана қалып, түркі
тілдерінің көпаспектілі машиналық қорын өмірге келтіру әлі де ... ... ... ... ... ең ... егеменді еліміздің мемлекеттік тіліне
айналған ана тіліміз – қазақ тілінің компью-терлік ... ... ... – жаңаша ойлап, жаңаша шешудің ең тиімді жолы деуге әбден-ақ болады.
Енді түркі тілдерінің көпаспектілі ... ... ... ... ... ... салаларына (блоктары-на) жалпылама сипаттама бере
отыра, сол идеяны қазақ тілінің ... ... ... ... ... болады-ау деген оймен, оның төменде аталатын тарамдарын оқырман
қауымға ұсынып отырмыз.
1. Алдымен құрастыруды қажет ... сала – ... ... ... ... ... терминоло-гиялық, жиілік және
аударма сөздіктерді қамтитын ... ... ... жүйе ... ... блок – лексикалық және ... ... ... ... ... ... (сызбалық)
қамтитын тілдік материалдардан құралады.
3. Фонетикалық блок – тілдің фонемалық құрамын анықтайды, әр ... ... ... ... ... ... ... тілдік бірліктердің фонемдік құрылысының ерекшелік-тері жөніндегі
деректер қамтылады. Мәселен, негіздер, фор-манттар, сөздердің ... ... ... т.б.;
ә) тілдің сингармонизм заңдылығы, сондай-ақ ... ... ... мен ... ... ... ... екпіннің орны көрсетілген түбір ... мен ... осы ... ... ... ... ... отыра, қажетті деген
сұранысқа толық та және тұжырымды жауап алу ... біз ... ... ... ... отырып, әрі жүйелі, әрі сапалы түрде
көрініс табатын ғылыми тұрғыдағы қазақ тілінің компьютерлік қорын ... ... ... жоба іске асып ... ... мынадай сұрақ туындауы
мүмкін: «Қазақ тілінің компьютерлік қоры» жасалып болғаннан кейін ол ... ... ... ете ме, әлде ол тіл ... жаңа ... қосатын,
жаңа мәліметтер тауып беретін ғылыми зертхана тәрізді бомақ па?
Бұл ретте айтарымыз, екі жақты ... ... ... ... ... ... ... оның берер мүмкіншіліктері де
молырақ болмақ. Демек, «Қазақ тілінің компьютерлік ... ... ... ... ... мәліметтерді бойына жинақтаған тілдің
синхронды және диахронды процестерін модельдей ... ... ... болуы
қажет. Сонда ғана компьютерлік тілдік қор түрлі деңгейдегі тіл қабаттарымен
жүйелі негізде қызмет ететін болады. ... ... ... ... ... дегеніміз қазақ тілі ... ... ... ... ... ол «ақылды», мамандандырылған білім қоры. Оны
өзімізге дәстүрлі кітап ретінде де пайдалануға ... және ... ... ... бір мақсаттарда жүзеге асыра алады деген сенімдеміз.
Осы саладағы белгілі ғалымдардың тұжырымдауынша, компьютерлік тілдік қор
дегеніміз ғылым адамының өз зерттеу ... ... ... көз ... ... ... ... тілдік қор неғұрлым қомақты болса,
солғұрлым тіл құрылысының сырын тереңірек аша ... ... ... ... ... ... ... адамның білім өрісіндегі
«ақтаңдақтардың» бедер-бейнесі айқындала түседі.
Біздер де осы айтылғандарға қосыла келе, өз ... ... ... ... ... ... ... әлденеше есе
арттырады, шығармашылық қуат көздері ашыла ... ... бұл ... ... ... жүйелілік қасиеттерін жетілдіруге және тіл
жүйесін мұқият тануға жұмсалар еді деп ... ... ... бұл аталып
отырған тілдік қорды ... ... үшін оның ... ... яғни ҚР ... және ... ... Тіл комитеті деңгейінде
қаралуы қажет. ... ... ... филологиялық, ұлттық және мәдениет
дәрежесіндегі күрделі жүйені іске қосу – ... ... ... ... ... ... ... және т.б.) және тиісті қаражат мүмкіндігін шешуді талап етеді.
Сөз соңын, машиналық қор жайындағы идеяны осыдан ширек ғасыр бұрын, ... рет ... ... ... белгілі ғалымы А.П.Ершовтың сол
кездердегі айтқан сөзімен қорытындылағымыз келіп отыр.
А.П.Ершов 1978 жылы ... ... «Іс ... ... ... жүйесін жасау методология-сына» атты мақаласында: «Егер орыс
тілінің машиналық қорын жасау мақсаты ... ... ... ... ... ... қол ... табыстарымыздың бәрі
академиялық жаттығулар қалпында қалып қоймай, іс жүзіне ... ... ... ... ... ... шешілуі ғылым, мәдениет және қолданбалы
техникалық тәсілдер тұрғысынан мейлінше құнды болмақ. …Тілдің машиналық
қорын ... ісі ... ... ... іске ... озық ... өйткені тек осы жағдайда ғана толып жатқан ... ... ... ... өзегін озбырлар мен дүмшелердің қиянатынан аман
сақтап қалуға болады» (Ершов, 1979).
Әдебиет
1. Гузев В.Г., ... Р.Г., ... А.М. О ... ... ... ... // Советская тюркология. 1988. №2. C. 98-101.
2. Ершов А.П. К ... ... ... ... феномен
деловой прозы. Препр. №156, ВЦ СО АН ... ... ... ... фонд русского языка: идеи и суждения. М.: Наука, 1986. ... О Р Ы Т Ы Н Д ... ... ... ... бір ... компьютерді тіл
білімі саласындағы зерттеу жұмыстарында пайдалануға кедергі келтіретін
сияқты. Егер біз ... ... ... ... ескере білсек, тіпті
шешімі жоқ-ау деген көптеген мәселелердің де ... ... ма ... ... ... ... амалдар тілшінің орындай-тын
формалды іс-әрекетіне ұқсас және олар – көрініс деңгейінде тіл мен ... ... ... ... ... ... Сондықтан бұл
жердегі ең бастысы адам ... ... ... ... ... бөлшектеп
беріп, формалдау жолдарымен ұштастыра білуі ... ... ... ... тілдік парадигмалық көріністерді, фразалық тармақта-нудың
заңдылықтарын ашуды және т.б. ... ... ... іске ... ... тіл ... ... кезеңдеріне, әсіресе, лингвис-тикалық
ақпараттармен жұмыс істеу: оларды жинақтау, ... ... шет ... ... ... ... ақпараттық библиографиялық іздеу, қазақ
тіліндегі мәтіннен реферат алу және т.б. істерге логикалық роботтың (компью-
тердің) ... ... ... ... ... ... ... жатса,
бұл мәселе өндірістік дәрежеге дейін көтерілуі де мүмкін.
Ғылым мен техниканың ... тіл ... ... ... аясын кеңейте түскені бәрімізге мәлім. Тіл өзінің адамдар
арасындағы ... ... ... ... адам мен компьютердің
қазақ тіліндегі диалогын да жүзеге асыруы қажет деп білеміз. Осы себептен
жақын болашақта ... тіл және оның ... ... ... ... коммуникативтік жүйе негізін құрайды деп
сенім білдіруге әбден ... ... ... жүйеде – тіл, өзінің адам
баласының ... ... ... ... басқаша, өзіне жат қалыпқа түсіп, компьютердің тізбектік-
алгоритмдік субстратына ... ... бұл ... ... тіл ... ... ... қиыншылықтар туғызуы мүмкін. Осы
себептен, қазіргі тілдік зерттеулердің, ... ... ... ... ... ... ... және толық болуын барынша талап
ету қажет.
Тіл қызметінің ... сөз ... ... тіл ... «инженерлік
лингвистика» деп аталатын жаңа саласында қарастырылады.
Инженерлік тіл білімі, негізінен, электрондық машина ... үшін ... ... тіл ... мен оның ... қызметін
(функциясын) модельдеу мәселелері-мен айналысады.
Тілдік объектілерді жасанды ... ... ... ... тек қана жоғары
дәрежедегі техникалық база болуы жеткіліксіз. Біздің ... ... ... ең ... ... және ... теория құрылуы
қажет. Сондықтан да әрбір зерттеушінің тәжірибе жүзінде алған ... ... ... баға ... ... айналуы керек.
Инженерлік тіл білімінің қажеттігін дәлелдейтін проблема-лық бағыт-
бағдарлардың ең негізгісі – ... ... ... ... ... білу
және табиғи тіл мен жасанды тілдерді семиотикалық жағынан ... ... ... ... ашық жүйеге жататын ... ... ... ... ... ... жүйедегі қарым-қатынас-тарды
зерттеу – инженерлік тіл білімінің методологиялық және ... ең бір ... Бұл ... ... ... табуы –
семиотика, информатика, компьютерлік бағдарлама жасау және математикалық
машиналар теориясы, ойлау ... ... ... ... ... ... ... лингвистиканың тіл біліміндегі басқа да пәндер қатарынан тең
дәрежеде орын алуы – ... ... мен ... ... жүргізген тәжірибелерінің, теориялық ... деп ... жөн. ... ... қазақ тілінінің «Статистикалық
лингвис-тика» және «Инженерлік ... ...... кандидаты, филология ғылымдары-ның ... ... ... және ол ... ... ... ғылыми
ізденістерімен тығыз байланысты. Сол сияқты, қазақ тілі ... ... ... ... ... ғылыми ізденістерімен көзге
түсіп жүрген техника ғылымдарының докторы, профессор А.А.Шәріпбаевты ... ... ... еді. ... ... ... ... тілін инженерлік
лингвистика әдіс-тәсілдерімен қарастыруда, мемлекеттік тілімізді оқытудың
(үйретудің) автоматты ... ... ... және ... ... ... ғылыми негізін құру жолының бастамасы болатынына ... ... ... ... ... ... қандай
материалдық ортада жүріп жатқанына мән бере бермейді. Ал ... ... ... яғни ... ... ... ... ерекше-ліктері стратегиялық және технологиялық ортаға тікелей
қатысты. Сондықтан тілдік мәліметтерді компьютер ... ... ... адам ... миы мен ... ... құрылымды-
функционалдық сипаттарын салыстыра отырып, оларға тән қасиеттерді ескерген
жөн. Олай дейтініміз, тіл білімі саласындағы электрондық ... мен ... ... ... көптеген тілшілер мен математиктер ғылыми
әдебиеттер бетінде өз ойларын білдіріп ... де, тіл ... ... ... ... ... әлде де бірізді емес. Мысалы, біреулері
ЭЕМ-ның жады мен жылдамдығын місе тұтпаса, ал басқалары – компьютер ... ... ... ... ... күрделі-
күрделі мәселелердің болаты-нын сөз етіп, қалай ... да ... ... ... да жоқ ... ... ... барынша дамыған кезінде, оның жадының
көлемі, жылдамдығы туралы сөз ... да, ... ... ... ... ... ... түрлі сөздіктер түзу) себеп болып, қазақ
тілін зерттеуде компьютерлік тіл ... жолы ... ... бұрынғыдан да бәсеңсігенге ұқсайды.
Адам мүмкіншілігіне қарағанда, компьютер, сырт кедергіге қарамай,
жадындағы ақпаратты әрі ... әрі ... әрі ұзақ ... ... қажетті ақпаратты тез арада қағаз не монитор бетіне шығарып бере
алатындығы көпшілікке мәлім. Ал ... ... ... ... ... ... жұмыс жасауда адамның ми қызметі оның физиологиялық және
психикалық қалпына байланысты болатын ... ... ... ... жат
деуге болады.
Инженерлік тіл білімінің даму болашағын сөз ... ... ... ... ... ... стратегиясын анықтауда және үйлесімді
технологияны таңдауда, тек қана ... ... ... ... белгілі шеңбер-дегі тіл білімі мен нейрофизиологияның ... ... ... деп ... Бұл ... техниканың даму қарқынын ескере отырып, кибернетиканың, тіл
білімінің және ... ... ... ... ... ... болжай алатындай ғылыми көзқарас қажет.
Қазіргі кезде еуропа тілдеріндегі ... ... ... ... ... ... ... семантикалық деңгейлерін айқындайтын компьютерге арналып жасалған
алгоритмдер негізіндегі бағдар-ламалары іске қосылған.
Осы айтылғандардың негізінде төмендегідей сұрақ туындауы мүмкін.
Электронды ... ... ... ... түсіндіру
мүмкіндігі қай ... ... Ол тек ... ... ме? Әлде компьютердің мәтін мазмұнын ... ... ... ... ... ... бе? Компьютерлік
аударма проблемасына қатысты бұл сұрақты былай да қоюға ... ... ... бір сала ... ... ... әрі осы саланың маманы,
әрі тәжірибелі аудармашы болып табылатын адамның ... мен ... ... бола ма? Әлде компьютерлік аударма еш уақытта жоғары
сапалы ... оған ... ... ... ... ... қазіргі кездегі компьютерлік аудармалар әлде де ... ... ... етеді. Сондықтан да кибернетикалық автоматтың
мәтіндерді «адамша» аударуы бір адамның бойына біткен лингвистикалық білім
дәрежесімен және ... да ... ... ... ... ол
компьютер үшін жеткіліксіз. Болашақтың лингвистикалық компьютері бүкіл бір
ұйымға тән, әлеуметтік ... ... ... тән интеллектуалдық,
мәдени-әлеуметтік және лингвистикалық тәжірибелерді өзіне игеруі қажет.
Сонымен, хабардың берілу жүйесінің салалық тілдермен ... ... ... ... ... ... түсетіндігіне еш күмән
жоқ деуге болады. Ал ... тіл ... ... саласының тиісті
дәрежеде дамуын, оның қатаң ережеге ... ... ... тілдік
бірліктерді тануға қажетті формалды қасиеттерінің айқындалуы-нан, омоним
сөздер мен көпмағыналы сөздердің және ... ... ... ... мен
реттеу мәселелерінің өз шешімін дұрыс табуынан байқауға болар еді.
М А З М Ұ Н ... сөз |3 ... ... | |
| | ... |7 ... ... | |
| | ... ... ... | ... қызметінің ерекшеліктері |20 ... ... | |
| | ... ... ... құрастыруға | |
|қатысты мәселелер ... |28 ... ... | |
| | ... ... ғылыми пән | ... ... |39 ... |
|................................. | |
| | ... ... және | ... сөздіктер түрлері |52 ... ... | |
| | ... ... автоматтандыру |64 |
|тәсілі .... | |
| | ... ... ... |84 ... | |
| | ... ... ... |97 ... ... | |
| | ... оқу ... ... |129 |
|ұстанымдары ..... | |
| | ... ... ... |140 ... | |
| | ... ісін автоматтандырудың | |
|лингвистикалық ... |177 ... ... | |
| | ... тілінің компьютерлік қорын | |
|(базасын) |189 ... ... | ... ... | |
| | ... |199 ... ... | |
| | |
1 ... ... ... ... ... М.: ... ... учитель”, 2000. 226 с.
2 Прикладное языкознание: Учебник / Отв. Редактор А.С.Герд. СПб.: Изд-во
С.-Петербург. ун-та, 1996. 528 ... ... ... ... ... мәтін
«Ү» тілінің ішкі тілдік көрінісіндегі мәтін
«Х» тілінің ішкі тілдік көрінісіндегі мәтін
Мәтіннің мәнмағынасы ...

Пән: Автоматтандыру, Техника
Жұмыс түрі: Дипломдық жұмыс
Көлемі: 190 бет
Бұл жұмыстың бағасы: 1 300 теңге









Ұқсас жұмыстар
Тақырыб Бет саны
1.Қазіргі қазақ тілі лексикасының шығу арналары; 2.Өзге тілден енген сөздер; 3.Қазіргі қазақ тілі лексикасының стильдік мәні; 4.Лексикография7 бет
Лексикография туралы жалпы түсінік15 бет
Қазіргі қазақ тілі лексикасының шығу арналары. Өзге тілден енген сөздер. Қазіргі қазақ тілі лексикасының стильдік мәні. Лексикография12 бет
Қазақ және түрік тілдеріндегі астрономиялық атаулардың лексикографиялық деректердегі көрінісі мен семантикасы79 бет
Қазақ лексикографиясы: біртілді оқу сөздігін түзудің ғылым негіздері40 бет
Қазақ тіліндегі туыстық атаулардың мағыналық құрылымы мен лексикографиялану ерекшеліктері24 бет
Бүгінгі терминологияның даму сипаты5 бет
Лексикология туралы түсінік 5 бет
Маманның сөз сөйлеу ерекшеліктері. Маманның сөз сөйлеу мәдениеті. Белгілі кәсіби топтағы адамның дресс-коды6 бет
Сөздік құрастырудың техникасы18 бет


Исходниктер
Пәндер
Көмек / Помощь
Арайлым
Біз міндетті түрде жауап береміз!
Мы обязательно ответим!
Жіберу / Отправить


Зарабатывайте вместе с нами

Рахмет!
Хабарлама жіберілді. / Сообщение отправлено.

Сіз үшін аптасына 5 күн жұмыс істейміз.
Жұмыс уақыты 09:00 - 18:00

Мы работаем для Вас 5 дней в неделю.
Время работы 09:00 - 18:00

Email: info@stud.kz

Phone: 777 614 50 20
Жабу / Закрыть

Көмек / Помощь