«ҒЫЛЫМИ ЗЕРТТЕУДЕГІ АҚПАРАТТЫҚ-ІЗДЕСТІРУ ТЕОРИЯСЫ» курсын ОҚЫТУ ӘДІСТЕМЕСІ
КІРІСПЕ ... ... ... ... 3
1. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясының негіздері ... .. 5
1.1. Ғылыми зерттеудегі ақпараттық.іздестіру үдерісінің негіздері ... ... .. 6
1.2. Интернет желісіндегі ақпараттық.іздестіру жүйелері ... ... ... ... ... 23
1.3. Метаіздестіру жүйелері мен іздестіру машиналары ... ... ... ... ... ... ... 33
1.тарау бойынша қорытынды ... ... ... ... 30
2. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсын оқыту әдістемесі ... ... 44
2.1. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсының
оқу бағдарламасы ... ... . 44
2.2. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсы бойынша зертханалық жұмыстар ... ... .. 51
2.3. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсын оқыту әдістемесі 2.тарау бойынша қорытынды ... ... .. 65
ҚОРЫТЫНДЫ ... ... ... 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ
ҚОСЫМШАЛАР ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 68
1. Курс бойынша тест тапсырмалары ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 68
2. «Ғылыми зерттеулердегі ақпараттық.іздестіру теориясы» курсын
оқыту әдістемесі бойынша оқу құралының электрондық нұсқасы
1. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясының негіздері ... .. 5
1.1. Ғылыми зерттеудегі ақпараттық.іздестіру үдерісінің негіздері ... ... .. 6
1.2. Интернет желісіндегі ақпараттық.іздестіру жүйелері ... ... ... ... ... 23
1.3. Метаіздестіру жүйелері мен іздестіру машиналары ... ... ... ... ... ... ... 33
1.тарау бойынша қорытынды ... ... ... ... 30
2. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсын оқыту әдістемесі ... ... 44
2.1. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсының
оқу бағдарламасы ... ... . 44
2.2. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсы бойынша зертханалық жұмыстар ... ... .. 51
2.3. «Ғылыми зерттеудегі ақпараттық.іздестіру теориясы» курсын оқыту әдістемесі 2.тарау бойынша қорытынды ... ... .. 65
ҚОРЫТЫНДЫ ... ... ... 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ
ҚОСЫМШАЛАР ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 68
1. Курс бойынша тест тапсырмалары ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 68
2. «Ғылыми зерттеулердегі ақпараттық.іздестіру теориясы» курсын
оқыту әдістемесі бойынша оқу құралының электрондық нұсқасы
Ақпараттық-іздеcтіру бойынша зерттеулер – Д.Лахути, В.Решетников, И.Попов, А.Черный, Э.Гасанов, Ю.Шрейдер, И.Некрестьянов, И.Кураленок, В.Добрынин, А.Дубинский, А.Ермаков, М.Когаловский, А.Сокирко, G.Salton, K.Sparck-Jones, S.E.Robertson, G.K.Zipf, A.Singhal, M.Mitra, S.Lowrence, P.Foltz, E.Fox. I.Cho, R.Baera-Yates, K.Tajima, C.Van Rijsbergen, L.Gravano, J.Kleinberg және т.б. ғалымдардың жинақталған теориялық және әдістемелік қағидаларына негізделіп, дипломдық жұмыста жасалынған тұжырымдар мен практикалық ұсыныстардың «Ғылыми зерттеудегі ақпараттық-іздестіру теориясы» курсын оқыту әдістемесін жетілдіру мәселелерінде бүгінгі заман талаптарына сай қолданылуы тақырыптың өзектілігін айғақтайды.
Ақпараттық және телекоммуникациялық технологиялардың ендірілуіне байланысты «Бірыңғай ақпараттық білім беру ортасының даму» бағдарламасындағы білім беруді ақпараттандырудың келесі негізгі бағыттары: электрондық білім беру ресурстары, кадрларды ақпараттық қоғамға дайындау, білім беруді компьютерлендіру және коммуникациялық қамтамасыз ету, регионалды ақпараттандыру бағдарламаларына қолдау көрсету, білім беруде ақпараттық басқару жүйелерін дамыту айқындалған.
Электрондық кітапханаларды жасау қажеттілігі – Интернеттің шығуы және оның белсенді қолданысқа енуі үдерісіндегі ақпараттық іздестіру жұмыстарының түрленуімен түсіндіріледі. Ақпараттық іздестіру аумағы бойынша зерттеулердің актуалдылығы сонымен қатар, Интернет желісінде ақпарттарды іздестіру, сұранысқа жауап беруші құжаттардың қуаттылығы, «сәйкес емес» құжаттардың жиындарынан, өкінішке орай өте мардымсыз болады. Бұл ақпараттық-іздестіру әдістерінің сапасын арттыруға туындаған қажеттіліктің ерекшеліктерін зерттеп, оларды ескеру керектігін айқындайды.
Курстың мақсаты, студенттерге ұсынылған ақпараттық-іздестіру үдерісі курсының теориялық негіздерін , бірінші кезекте құжаттық және тағы басқа түрлі ақпараттық-іздестіру жүйелерінің, соның ішінде интернет желісіндегі ақпараттық-іздестіру жүйелерін пайдалану дағдыларын қалыптастырудан тұрады.
Ақпараттық және телекоммуникациялық технологиялардың ендірілуіне байланысты «Бірыңғай ақпараттық білім беру ортасының даму» бағдарламасындағы білім беруді ақпараттандырудың келесі негізгі бағыттары: электрондық білім беру ресурстары, кадрларды ақпараттық қоғамға дайындау, білім беруді компьютерлендіру және коммуникациялық қамтамасыз ету, регионалды ақпараттандыру бағдарламаларына қолдау көрсету, білім беруде ақпараттық басқару жүйелерін дамыту айқындалған.
Электрондық кітапханаларды жасау қажеттілігі – Интернеттің шығуы және оның белсенді қолданысқа енуі үдерісіндегі ақпараттық іздестіру жұмыстарының түрленуімен түсіндіріледі. Ақпараттық іздестіру аумағы бойынша зерттеулердің актуалдылығы сонымен қатар, Интернет желісінде ақпарттарды іздестіру, сұранысқа жауап беруші құжаттардың қуаттылығы, «сәйкес емес» құжаттардың жиындарынан, өкінішке орай өте мардымсыз болады. Бұл ақпараттық-іздестіру әдістерінің сапасын арттыруға туындаған қажеттіліктің ерекшеліктерін зерттеп, оларды ескеру керектігін айқындайды.
Курстың мақсаты, студенттерге ұсынылған ақпараттық-іздестіру үдерісі курсының теориялық негіздерін , бірінші кезекте құжаттық және тағы басқа түрлі ақпараттық-іздестіру жүйелерінің, соның ішінде интернет желісіндегі ақпараттық-іздестіру жүйелерін пайдалану дағдыларын қалыптастырудан тұрады.
1. Информатика. Базовый курс / Симонович С.В. и др. – СПб., 2007
2. Энциклопедия кибернетики /под ред.Глушкова В.М. В 2-томах. – Киев, 1975.
3. Попов И.И. Автоматизированные информационные системы (по областям применения). М., 2002. С. 10.
4. Михайлов А.И., Черный А.И., Гиляревский Р.С. Научные коммуникации и информатика. М., 2003
5. Михалевич В.С., Каныгин Ю.М., Гриценко В.И. Информатика (общие положения). – Киев, 2002.
6. Котов Р.Г., Якушин Б.В. Языки информационных систем. М., 2004. С. 47.
7. Лахути Д.Г., Лесскис Г.А., Пархоменко В.Ф. Система автоматического индексирования документов Скобки // Пресс-бюл. выставки-смотра НТИ-80. № 3. М., 1980.
8. Лахути Д.Г. Проблемы интеллектуализации информационно-поисковых систем: Дисс. в виде науч. докл. … док.тех.наук. М., 2000.
9. Информатика / Под ред. К.В.Тараканова. М., 2004.
10. Ланкастер Ф. Информационно-поисковые системы. М.,2002.
11. Соколов А.В. Семиотические проблемы релевантности // Труды ЛГИК. Т. 23. С. 89–103.
12. Черный А.И. Введение в информационный поиск. М., 1975. С. 19–20.
13. Лахути Д.Г. Оценка поисковых систем: Автореф. дис. ... к. т. н. М., 1971.
14. Губанов В.В., Захаров В.В., Коваленко А.Н. Введение в системный анализ. Л., 1988. С. 14.
15. Калман Р. и др. Очерки по математической теории систем. М, 2001.
16. Копылов В.А. Построение автоматизированных информационно-поисковых систем. М., 2004. С. 14.
17. Москович В.А. Информационные языки. М., 2001;
18. http://www.robotstxt.org/wc/active/html/. Имеется русский перевод описания на сайте WebClub.Ru (http://www.webclub.ru)
19. http://info.webcrawler.com/mak/projects
20. Захаров В.П., Пименов Е.Н. Естественно-языковой подход к созданию лингвистического обеспечения информационно-поисковых систем // НТИ. Сер. 2. 1997. №12. С.24–27;
21. Бородкин Л.И., Владимиров В.Н., Гарскова И.М. Азбука Интернета. Адресация в Интернете. Поиск информационных ресурсов в сети. В записную книжку //Новая и новейшая история. - 1999. - № 1. - С. 229-234.
22. Гасликова И.Р. Поиск информации в контексте //Информационные ресурсы Казахстане. - 1998.- №6. - С. 31.
23. Гитер Д.М., Лавринович М.Б. Использование Интернета для эффективного доступа к электронным и традиционным источникам информации: Доклад. НТБ. - 1999.- № 2.- С. 37-42.
24. Интернетте білім-ғылым ақпараттарын іздеу әдістемесі// М.Өтемісов атындағы Батыс Қазақстан мемлекеттік университеті Хабаршысы, №2, 2009. – Б.112-117
2. Энциклопедия кибернетики /под ред.Глушкова В.М. В 2-томах. – Киев, 1975.
3. Попов И.И. Автоматизированные информационные системы (по областям применения). М., 2002. С. 10.
4. Михайлов А.И., Черный А.И., Гиляревский Р.С. Научные коммуникации и информатика. М., 2003
5. Михалевич В.С., Каныгин Ю.М., Гриценко В.И. Информатика (общие положения). – Киев, 2002.
6. Котов Р.Г., Якушин Б.В. Языки информационных систем. М., 2004. С. 47.
7. Лахути Д.Г., Лесскис Г.А., Пархоменко В.Ф. Система автоматического индексирования документов Скобки // Пресс-бюл. выставки-смотра НТИ-80. № 3. М., 1980.
8. Лахути Д.Г. Проблемы интеллектуализации информационно-поисковых систем: Дисс. в виде науч. докл. … док.тех.наук. М., 2000.
9. Информатика / Под ред. К.В.Тараканова. М., 2004.
10. Ланкастер Ф. Информационно-поисковые системы. М.,2002.
11. Соколов А.В. Семиотические проблемы релевантности // Труды ЛГИК. Т. 23. С. 89–103.
12. Черный А.И. Введение в информационный поиск. М., 1975. С. 19–20.
13. Лахути Д.Г. Оценка поисковых систем: Автореф. дис. ... к. т. н. М., 1971.
14. Губанов В.В., Захаров В.В., Коваленко А.Н. Введение в системный анализ. Л., 1988. С. 14.
15. Калман Р. и др. Очерки по математической теории систем. М, 2001.
16. Копылов В.А. Построение автоматизированных информационно-поисковых систем. М., 2004. С. 14.
17. Москович В.А. Информационные языки. М., 2001;
18. http://www.robotstxt.org/wc/active/html/. Имеется русский перевод описания на сайте WebClub.Ru (http://www.webclub.ru)
19. http://info.webcrawler.com/mak/projects
20. Захаров В.П., Пименов Е.Н. Естественно-языковой подход к созданию лингвистического обеспечения информационно-поисковых систем // НТИ. Сер. 2. 1997. №12. С.24–27;
21. Бородкин Л.И., Владимиров В.Н., Гарскова И.М. Азбука Интернета. Адресация в Интернете. Поиск информационных ресурсов в сети. В записную книжку //Новая и новейшая история. - 1999. - № 1. - С. 229-234.
22. Гасликова И.Р. Поиск информации в контексте //Информационные ресурсы Казахстане. - 1998.- №6. - С. 31.
23. Гитер Д.М., Лавринович М.Б. Использование Интернета для эффективного доступа к электронным и традиционным источникам информации: Доклад. НТБ. - 1999.- № 2.- С. 37-42.
24. Интернетте білім-ғылым ақпараттарын іздеу әдістемесі// М.Өтемісов атындағы Батыс Қазақстан мемлекеттік университеті Хабаршысы, №2, 2009. – Б.112-117
Пән: Информатика, Программалау, Мәліметтер қоры
Жұмыс түрі: Дипломдық жұмыс
Тегін: Антиплагиат
Көлемі: 76 бет
Таңдаулыға:
Жұмыс түрі: Дипломдық жұмыс
Тегін: Антиплагиат
Көлемі: 76 бет
Таңдаулыға:
ҒЫЛЫМИ ЗЕРТТЕУДЕГІ АҚПАРАТТЫҚ-ІЗДЕСТІРУ ТЕОРИЯСЫ курсын ОҚЫТУ ӘДІСТЕМЕСІ
ДИПЛОМДЫҚ ЖҰМЫС
050111– Информатика мамандығы бойынша
ТҮРКІСТАН 2010
Ф-ОБ-001033
Қазақстан Республикасының білім және ғылым министрлігі
Қ.А.Ясауи атындағы халықаралық қазақ-түрік университеті
Қорғауға жіберілді
ДИПЛОМДЫҚ ЖҰМЫС
тақырыбы: ҒЫЛЫМИ ЗЕРТТЕУДЕГІ АҚПАРАТТЫҚ-ІЗДЕСТІРУ
ТЕОРИЯСЫ курсын ОҚЫТУ ӘДІСТЕМЕСІ
050111– Информатика мамандығы бойынша
Орындаған: студенті
Ғылыми жетекші: техн.ғ.к., доцент
ТҮРКІСТАН 2010
М А З М Ұ Н Ы
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . ... 3
1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясының негіздері ... .. 5
1.1. Ғылыми зерттеудегі ақпараттық-іздестіру үдерісінің негіздері
... ... .. 6
1.2. Интернет желісіндегі ақпараттық-іздестіру жүйелері
... ... ... ... ... 23
1.3. Метаіздестіру жүйелері мен іздестіру машиналары
... ... ... ... ... ... ... 33
1-тарау бойынша қорытынды
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 30
2. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... ... ... .. 44
2.1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсының
оқу
бағдарламасы ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... .. 44
2.2. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсы
бойынша зертханалық жұмыстар
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 51
2.3. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... .. 64
2-тарау бойынша қорытынды
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 65
ҚОРЫТЫНДЫ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 67
ҚОСЫМШАЛАР
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... ... ... ... ... ... ... ... ... ... 68
1. Курс бойынша тест тапсырмалары
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 68
2. Ғылыми зерттеулердегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі бойынша оқу құралының электрондық нұсқасы
... ... ... .67
К І Р І С П Е
Ақпараттық-іздеcтіру бойынша зерттеулер – Д.Лахути, В.Решетников,
И.Попов, А.Черный, Э.Гасанов, Ю.Шрейдер, И.Некрестьянов, И.Кураленок,
В.Добрынин, А.Дубинский, А.Ермаков, М.Когаловский, А.Сокирко, G.Salton,
K.Sparck-Jones, S.E.Robertson, G.K.Zipf, A.Singhal, M.Mitra, S.Lowrence,
P.Foltz, E.Fox. I.Cho, R.Baera-Yates, K.Tajima, C.Van Rijsbergen,
L.Gravano, J.Kleinberg және т.б. ғалымдардың жинақталған теориялық және
әдістемелік қағидаларына негізделіп, дипломдық жұмыста жасалынған
тұжырымдар мен практикалық ұсыныстардың Ғылыми зерттеудегі ақпараттық-
іздестіру теориясы курсын оқыту әдістемесін жетілдіру мәселелерінде
бүгінгі заман талаптарына сай қолданылуы тақырыптың өзектілігін айғақтайды.
Ақпараттық және телекоммуникациялық технологиялардың ендірілуіне
байланысты Бірыңғай ақпараттық білім беру ортасының даму
бағдарламасындағы білім беруді ақпараттандырудың келесі негізгі бағыттары:
электрондық білім беру ресурстары, кадрларды ақпараттық қоғамға дайындау,
білім беруді компьютерлендіру және коммуникациялық қамтамасыз ету,
регионалды ақпараттандыру бағдарламаларына қолдау көрсету, білім беруде
ақпараттық басқару жүйелерін дамыту айқындалған.
Электрондық кітапханаларды жасау қажеттілігі – Интернеттің шығуы және
оның белсенді қолданысқа енуі үдерісіндегі ақпараттық іздестіру
жұмыстарының түрленуімен түсіндіріледі. Ақпараттық іздестіру аумағы бойынша
зерттеулердің актуалдылығы сонымен қатар, Интернет желісінде ақпарттарды
іздестіру, сұранысқа жауап беруші құжаттардың қуаттылығы, сәйкес емес
құжаттардың жиындарынан, өкінішке орай өте мардымсыз болады. Бұл ақпараттық-
іздестіру әдістерінің сапасын арттыруға туындаған қажеттіліктің
ерекшеліктерін зерттеп, оларды ескеру керектігін айқындайды.
Курстың мақсаты, студенттерге ұсынылған ақпараттық-іздестіру үдерісі
курсының теориялық негіздерін , бірінші кезекте құжаттық және тағы басқа
түрлі ақпараттық-іздестіру жүйелерінің, соның ішінде интернет желісіндегі
ақпараттық-іздестіру жүйелерін пайдалану дағдыларын қалыптастырудан тұрады.
Дипломдық жұмыс кіріспеден, екі тараудан, қорытындыдан, пайдаланған
әдебиеттер тізімінен және қосымшадан тұрады.
Бірінші тарауда ақпараттық-іздестіру үдерісінің теориялық негіздері,
құжаттық, фактографиялық, интеллектуалдық типтері мен қамтамасыздандыру
жүйешелері және ғаламтор желісіндегі ақпараттық-іздестіру жүйелері және
олардың сұраныс тілдерінің ерекшеліктері сипатталған.
Екінші тарауда курстың оқу бағдарламасы, орындалатын зертханалық
жұмыстардың тізімдері, олардың сипаттамалары мен орындау нұскаулығы және
ҒЗ ақпараттық-іздестіру теориясы курсын оқыту әдістемесі – есептеу
техникалары және коммуникациялық құралдарының жәрдемімен ақпараттық
ресурстарды жасау, сақтау, өңдеу және ұзату әдістерін теориялық жағынан
жүйелеп зерттейтін ғылымның негізгі бағыттарының бірі ретінде ұсынылады.
1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясының негіздері
1. Ғылыми зерттеудегі ақпараттық-іздестіру үдерісінің негіздері
Ақпараттық үдерістер және жүйелер
Ақпарат деген сөздің өзі өзінің ішкі формасы бойынша (латын тілінен
аударғанда informaftion – хабар алу, хабарлау) қатынас, коммуникация
дегенді білдіреді. Материяның кез-келген формалары: өсімдіктер, жәндіктер,
жануарлар, адамдар ақпаратпен алмасады. Бізді ақпараттың және ақпараттық
үдерістердің адамзат қоғамында алатын орны туралы түрлері қызықтырады.
Ақпарат түрлі әдістермен алынады: тәжірибе нәтижесінде, қисындық түйсінге
ой жүгірте отырып, бақылаулардың немесе өлшемдердің нәтижелерін белгілеу
жолымен және т.б. Ақпарат пен мәліметтерді тіркелген дабылдар айырады. Бұл
жағдайда былай айтылады: ақрарат дегеніміз – бұл мәліметтердің көмегімен
оларды барабар әдіспен өңделу жемісі[1]. Ақпарат кез-келген нысан сияқты,
қасиеттерге ие. Информатика тұрғысынан аса маңызды келесі қасиеттер болып
табылады: обьективтік сенімділік, барабарлық, толықтық, қол жетімділік және
ақпараттың түйінділігі. Ақпарат ақиқат немесе жалған, негізделген немесе
ықтималды болуы мүмкін. Ақпаратты қарастырудың түрлі аспектілері бар:
прагматикалық, семантикалық, синтаксистік[2]. Ақпарат адаммен қоғамның
өмірлік қызметінің барлық саласына өтеді. Қазіргі кезде ақпарат адам үшін
энергетикалық, шикізаттық, немесе қаржылық ресурстардан мәні кем соқпайтын
айрықша ресурс деген көзқарас қалыптасты. Ақпараттық ресурстардың өсе
түсетін мәні информатика атауын алған жаңа ғылымның интенсивті дамуын
анықтайды. Оны есептеу техникалары құралдарымен мәліметтерді жасау, сақтау,
өңдеу және беру әдістерін жүйелейтін ғылым ретінде анықтауға болады, сондай-
ақ бұл құралдардың қызмет дандыру принциптерін де анықтайды. Информатикаға
қол жеткізудің пайдаланушылық деңгейінде ақпараттық жүйені жасау және
пайдалану байқалады әлеуметтік коммуникациялар жүйесі мәні бойынша әрдайым
ақпарат алмасу жүйесі болып табылады. Бұл жүйелер функциональды және
ұйымдастырушы компоненттерінен тұрады [3]. Біріншісінің аясында тікелей
ақпараттық үдерістер, яғни ақпараттық хабарларды жасау, сақтау, тарату және
пайдалану ұғынылады. Екіншіге ақпаратты жасаушылар, ақпаратты тұтынушылар
ақпараттық арналар мен ақпараттық жүйелер жатады.
Ақпараттық үдерістер мен хабарларды, функционалдық және ақпараттық
байланыстарды тұтынушыларға жеткізу мақсатында әлеуметтік коммуникациялар
жүйесінде жүзеге асырылатын жүйелі іс-әрекеттердің жиынтығы ретінде
анықтаймыз[4,5]. Сондай-ақ, ақпараттық жүйені ақпаратты жандандырудың және
ақпараттық үдерістерді қолдайтын ақпараттық өзара іс-әрекетті ұйымдастыру
компоненттері ретінде анықтаймыз. Мәліметтердің жиынтығын көрсете
ақпараттың алмасу, ақпараттық ағындардың бүкіл жүйесін бірыңғай
байланыстыра отырып, ақпараттық үдерістерді толықтырады. Әлдебір адамдар
немесе олардың топтары бір мезгілде ақпаратты тұтынушы және жасаушы,
жеткізіп беруші ретінде бола алады. Жалпы жағдайда ақпаратты аралық
тұтынушы және жеткізіп беруші ақпараттық жүйе бола алады.
Автоматтандырылған ақпараттық жүйені (ААЖ) ішкі техникалық,
бағдарламалық, алгоритмдік және тілдік құралдардың, сондай-ақ белгілі бір
ақпараттық үдерістерді тұрақты орындау үшін жасалатын, арнайы
ұйымдастырылатын ақпараттар жиыны ретінде анықтауға болады[6].
Тікелей ақпараттық жүйеде жүзеге асырылатын ақпараттарды қайта құру
үдерісін негізгі бес процедураға: енгізу, өңдеу, сақтау, іздестіру,
шығаруға келтіруге болады. Алғашқы екі процедура ақпараттың дерек
көздерімен және оларды алушылармен жүйелі байланысты қамтамасыз етіп,
ақпаратты алушыларменде жүзеге асырылады.
Ақпараттық жүйені екі топқа бөлуге болады. Арнайы тағайындалған
автоматтандырылған жүйе шеңберінде ақпараттық қамтамасыздандыру жүйесі
және дербес мақсаттық ақпараттық тағайындау және қолдану саласында бар
жүйелер. Біріншінің мысалы болып басқару жүйелері – автоматтандырылған
басқару жүйелері (АБЖ), мекемелердің автоматтандырылған басқару жүйелері
(МАБЖ), технологиялық үдерістердің автоматтандырылған басқару жүйелері
(ТҮАБЖ); зерттеу жүйелері – ғылыми зерттеулердің автоматтандырылған
жүйелері (ҒЗ АЖ), автоматтандырылған жобалау жүйелері (АЖЖ); шешім қабылдау
жүйелері және т.б. Дербес тағайындалған ақпараттық жүйе –
автоматтандырылған ақпараттық-іздестіру жүйесі болып табылады. Ақпараттық-
іздестіру жүйесі (АІЖ) реттелген құжаттар (құжаттар массивтері) жиынтығы
және ақпаратты сақтау және іздестіру үшін арналған ақпараттық технология –
мәтіндер (құжаттар) немесе мәліметтер (фактілер). АІЖ кез-келген белгілі
бір түрде ұйымдастырылған ақпараттарды ретпен іздестіру және сақтау. Оның
үстіне ақпараттық-іздестіру жүйесі автоматтандырылмаған болуы да мұмкін.
Бастысы – бұл мақсатты функция: ақпаратты сақтау мен іздестіру.
Сақтау нысанасы және сұраныс типіне байланысты ақпараттық-іздестіру екі
түрге бөлінеді: құжаттық және фактографиялық және тиісінше АІЖ-ның екі типі
құжаттық және фактографиялық түрі бар. Сондай-ақ ақпараттық-анықтамалық АІЖ
деп те аталады.
Құжаттық деп АІЖ аталады, егер мұнда құжаттар массивіне тақырыптық
сұраныс бойынша іздестіру іске асырылып, пайдаланушыға бұл құжаттардың
көпшілігі немесе олардың көшірмелері жеткізілсе. Құжат ұғымы жүйеден жүйеге
өзгеруі мүмкін. Жалпы жағдайда бұл әлдебір материялдық иеленушіде (қағаз,
фото, кинопленка, магниттік жад т.б) белгіленген (әдетте біршама белгі
жүйесі арқылы) әлдебір ақпараттық нысан және әлеуметтік коммуникациялар
жүйесінде кеңістікпен және уақытпен беру үшін тағайындалған.
Фактографиялық АІЖ тікелей нақты мәліметтерді (ғылыми техникалық
нысандардың эканомикалық сипаттамасымен, қасиеті, үдерістер, құбылыстар
мекен-жай, атау, сандық мәліметтер, т.б) сақтауды іздестіру мен жеткізіп
беруді іске асырады. Құжаттық және фактографиялық ең алдымен материалдарды
алдын ала интеллектуальды өңдеу дәрежесімен ерекшеленеді. Құжаттық жүйеде
сақтау мен беру нысандар жүйесі – тұтастай құжаттар (мәтіндер).
Фактографиялық іздестіруде сақтау мен беру нысандары – бұл белгібір нысан
немесе нысандар класы жөнінде мәләмет (фактілер) ұсынылатын арнайы формасы.
Бұл мәліметтер немесе енуде тікелей тіркеледі, немесе құжаттардан
(мәтіндерден) жазып алынады.
Мысалы, жарықтың жылдамдығы қандай-? деген сұраққа: құжаттық АІЖ-де
мақалалар мен кітаптардың тізімдері және мәтіндері бірілетін болады.
Оларда жарықтың жылдамдығы туралы айтылып, мүмкін, қойылған сұраққа жауап
болады. Ал фактографиялық жүйеде – оның қандай екендігі туралы әлдебір
формада хабар беріледі (секундына үш жүз мың километр).
Құжаттық және фактографиялық іздестірудің арасындағы басты мәнді
айырмашылық – құжаттардың семантикасына баруымен түзіледі және тиісінше
одан әрі іздестіру қажеттілігі үшін құжаттарды алдын ала өңдеу сипаты.
Құжаттық жүйеде – құжатта не туралы екендігі ал фактографиялықта жүйеде –
құжатта нақты не хабарланатыны талданады және жазылады. Тиісінше,
сұраныстың екі типін айыру керек: құжаттық (тақырыптық) – жарықтың
жылдамдығы туралы құжаттарды табу керек және фактографиялық – жарықтың
жылдамдығы қандайлығын табу.
Құжаттық жүйеде құжаттар тұтастай олардың тақырыптық, пәндік мазмұны
түрғысынан мәні жазылады. Бұл жағдайда құжат арналған негізгі тақырыптар
мен нысандарды тауып, атауы маңызды фактографиялық жүйеде нысандар
жазылады, олардың белгілері мен бұл белгілердің мағынасы белгіленеді.
Осы жерден жүйедегі жазу тілі мен жазуды сақтау әдістеріндегі айырмашылық
туады. Тиісінше іздестірудің әрбір түрі үшін өзінің іздестіру құралдары
қолданылады.
Фактографиялық жүйе құжаттар массивінде қатаң реттелген құрылғымен
жинақтау мен іздестіруді көздейді. Мұндай құрылым ақпараттық жүйеге енгенде
құжаттарды алдын ала интелектуальді өңдеу немесе мұндай құжаттардың дайын
күйінде нақты адам қызметінің саласында бар болуы, мысалы, есептік форма,
бланкілер, анықтамалықтар, кестелер т.б. Фактографиялық АІЖ ақпарат пен
іздестіруді жинақтауды тек нысанның бір типі бойынша және тек сұраныстың
бір типі бойынша қамтамасыз етеді. Мазмұны мен құрылымы бойынша сан алуан,
бірақ бұл саналуандылық әрдайым түпкі мәліметтерді сақтау мен іздестіруді
қамтамасыз ететін мейлінше дамыған фактографиялық жүйе қолданылады.
Сонымен бір мезгілде құжаттық және фактографиялық жүйелер арасында
елеулі айырмашылық жоқ. Көбіне нақты АІЖ аралас жүйелер үлгісін көрсетеді.
Мұнда фактографиялық ақпарат құжаттық іздестірудің қосымша құралы рентінде
және керсінше пайдаланылады. Құжаттық жүйеде мәтіндер (құжаттар)
фрагменттерге немесе өрістерге бөлініп құрылымдануы мүмкін, құжаттық
ақпаратты өңдеу мен беру жекеленген өрістер деңгейінде жүргізіле алады.
Құжаттық фактографиялық іздестірудің фактографиялық элементтермен сан
түрлілігі деб құжаттарды библиография элементтері бойынша жүзеге асыратын
библиографиялық іздестіруді санауға болады (автор, жылы, баспа орны, баспа
түрі, баспа, т.б). Библиографиялық сұраныс толығымен фактографиялық сипат
алады, мысалы, Атамұра баспасы 2004 жылы Мәдени мұра сериясымен
шығарған кітаптар. Мұндай сұраныс берілетін нысандар, мәлімет сияқты
бірыңғай сипатталатын белгілеуге жататын кітаптар (библиографиялық жазу,
сақтау шифрлары) мәліметтері сияқты кітаптардың өзі де бола алады. Сонда
бірінші жағдайда библиографиялық жүйе туралы, екіншіден кітапханалық
құжаттығы туралы айтады. Іс жүзінде нақты кітапханалық жүйе әрдайым
құжаттық сияқты фактографиялық түрлі типтегі бірнеше АІЖ-ның бірігуін
көрсетеді.
Тағы да жүйенің ақпараттық қисындық деп аталатын үшінші типіне де
бөлінеді. Бұл жүйелер сұраныстарға да жауап беріп, олардың ақпараттық
базада айқын түрінде жауабы жоқ. Жауап алуға әзірдің өзінде қолда бар
құжаттық немесе фактографиялық алгоритмдік туындайтын білім мен ақпараттың
экстралингвистикалық базасына жауап алуға көмектеседі. Бұл жаңа ақпарат
немесе сұранысқа жауап ретінде беріледі немесе іздестіру үшін қосымша
пайдаланылады. Бұл типтің теориялық жүйесі класс сияқты бұрыннан зерттеліп,
өңделеді. Практикада олар салыстырмалы түрде сирек және олардың кейбірі
АІЖ-ның дәстүрлі құжаттық және фактографиялық дамуын көрсетеді. Тұтастай
бұл жүйелер мүлдем әртүрлі. Олардың арасында интелектуальды-диалогтық АІЖ-
н, эксперттік жүйені, есептік-қисындық шешімдер қабылдау жүйесі (қолдануы),
білім базасы, жасанды интелект жүйесін атауға болады. Одан басқа мұндай
парасатты жүйелер автоматтандырылған сан алуан жүйелер құрамында ақпараттық
жүйешелер ретінде қолданылады және компьютермен табиғи тілде
(қатынас)өңделеді.
Ақпараттық-іздестіру жүйесінің даму кезеңдері
Ақпараттық-іздестіру жүйелері (АІЖ) нақты кез-келген белгіленген түрде
ұйымдастырылған ақпараттар қоймасы саналуы мүмкін. Мұндай жүйелердің
үлгілері ретінде кітапханалық каталотардағы архивтерді, картотека,
сөздіктер, анықтамалықтар және т.б. атауға болады. Ақпараттық-іздестіру
жүйесі – бұл кітаптардағы және тұтастай кітапханалардағы көрсеткіш болып,
ақпараттық іздестірудің мақсатты функцияларын орындайды және бұл үшін
белгілі бір түрде орналасуы және ұйымдастырылуы тиіс.
Ақпараттық-іздестіру жүйесі, басқа ақпараттық жүйелер сияқты
автоматтандырылмаған да бола алады. Бірінші арнайы ақпараттық-іздестіру
құрылысы мен жүйесі – құжаттардың іздестіру үлгілерін механикалық салыстыру
жолымен қажетті құжаттарды іріктеуді қамтамасыз ететін техникалық құралдар
болды. Бұл үшін перфокарталар, суперпозициялық карталар, жиегі
перфорацияланған перфокарталар, т.б. қолданылды. Бірақ, іздестіру жүйесін
іске асырудың негізгі құралы есептеу техникасы болып табылады.
Автоматтандырылған АІЖ-нің даму тарихы жарты ғасырмен есептеледі.Оны түрлі
көзқараспен, түрлі негіздермен зерттеуге болады. Бірақ, ең алдымен бұл даму
лингвистикалық қамтамасыз етудің дамуымен анықталып келді және бұдан кейін
анықталады да. Бұл жолда бірнеше негізгі кезеңді бөлуге болады.
АІЖ дамуының бірінші кезеңіне шартты түрде 1955-1965жж. жатқызуға
болады. Бұл кезде әсіресе ақпараттық жарылыстың проблемасы туралы белсенді
айтылды. Бұл проблема есептеу техникалары құралдарының дамуымен бірге
ақпаратты өңдеу, сақтау және іздестірудің жаңа әдістеріне
қызығушылыққа түрткі болды. Алғашқы автоматтандырылған АІЖ 60-ыншы
жылдардың басында-ақ пайда болды. Ақпараттық-іздестіру саласына
компьтерлерді ендіру үлкен перспективаларға жол ашты. Алайда бұл бастапқы
кезең буырхану және қосу ұзақ болған жоқ, эйфория сауығуға алмасты.
Толығымен автоматтандырылған интелектуальды іздестіру жүйесі жедел алу
мүмкін болмай шықты. Шектеулі, бірақ пайдалы іздестіру жүйесін жасауға
практикалық жұмыстар басталды. Сонда ғана құжаттық іздестіру өз пәні мен өз
әдістері бар жекелеген, айрықша міндеттерді көрсететіне сезілді.
Екінші кезең шарттылықтың белгілі үлесімен ХХ ғ. 60 ж. ортасы мен 70 ж.
ортасының арасына орналастыруға болады. Бұл жылдары компьютерлерді
библиотека жұмысына да ендіру басталды. Бұл ендіру қарапайым дағдылы
операцияларды автоматтандырудан басталды, алайда қауымдастықтың
кітапханалық қазынасында MEDLARS жүйесі және MARC форматы сияқты ірі
өзіндік жобалар пайда борлды. Бұл кезең үшін ақпараттық-іздестіру тілі
(AIT) және индекстік әдіске жоғары қызығушылық тән. Индекстеу сонымен бірге
қолмен жүзеге асырылды. Сол жылдардың типтік АІЖ-бұл адам –машиналық
жүйе мұнда құжаттардың мазмұнын талдау мен индекстеу қолмен
орыдалады, ал іздестіру машинамен жүргізіледі. Бұл іздестірулер
құжаттардың іздестіру бейнелерін және дескрипторлық сөздіктер
немесе тезаурустардың негізінде жасалған сұраныстың іздестіру
бейнелерін автоматты салыстырудан тұрды. Бұл АІЖ-лер әдетте, ақпаратты
іріктеу тарату тәртібін пайдаланды, және кітапханаларға байланыссыз
автономды жүйе ретінде қызмет етеді. Әсіресе бұл кеңестер одағы үшін
тән. Мұнда сол жылдары мемлекеттік ғылыми-техникалық ақпараттардың
автоматтандырылған жүйесі (ГАСНТИ) құралады.
Тұтастай бұл кезеңдегі жұмыс үшін АІЖ және АІТ дамуына АІТ-ті табиғи
тілмен салыстыру арқылы табиғи тін табу, нақты тілдер өңдеуге, индекстеу
әдістемесін өңдеу мен пайдалануға көп көңіл бөлінді. Мұнда Екінші
Крэнфилдтік эксперимент үлкен мәнге ие болды. Оның мақсаты
іздестірудің түрлі құралдары мен стратегиясының тиімділігін салыстырмалы
бағалау болды. Көптеген іздестіру құралдары парадигматикалық және
синтагматикалық қатынастарды белгілеу, синтаксистік байланыстарды тіркеу
және т.б жақсаруына әкелмейді, не негізгі сипаттамалардың (толықтық,
дәлдік) бірін елеусіз жақсарта отырып, екішісін байқаларлықтай нашарлатады.
Семантикалық және синтаксистік қуатты тілдерді қолданудың тағы бір себебі –
бұл қолмен интелектуальдық индекстеуден – автоматтандыруға өту.
Құжаттық АІЖ дамуының үшінші кезеңі шартты түрде 1975-1995 жж. жатқызуға
болады. Бұл жылдары, ғылыми пікірсайыстан соң және сыртқы технологиялық
факторлардың ықпалымен тезаурус емес деп аталатын жүйе немесе еркін мәтін
бойынша іздестіру жүйесі бұқаралық таралу алды (free-text searching
systems). Олардың ерекшелігі – бір жағынан, лексикалық бақылаудан бас
тарту және соның өзімен парадигматикалық тіркеуден бас тарту, ал екішіден –
контексті және синтагматикалық байланыстарды кеңінен пайдалану болып
табылады.
Сыртқы технологиялық факторлар машина оқитын мәліметтер базасы (МБ)
мәтіндік өрісті қоса отырып, құжаттардың қысқаша библиографиялық жазуларын
мазмұндайды – табиғи тілде көрінетін – тақырып, аннотация, реферат, және
керісінше бірқалыптандырылған лексикамен құжаттардың іздестіру бейнелерін
ұстанады. МБ әдетте бір орында – мамандандырылған мәліметтер базасын
ұйымдастырушы – генераторда құрылды. Бірақ басқаларында пайдаланылды,
өйткені құжаттарды бастапқы семантикалық өңдеу мен сұраныстарды өңдеу
үдерістері үзілген болып шықты. Бұл жағдайда ең оңтайлы болып жоғарыда
аталған жүйелер өзін көрсетті. Автоматты индекстеу саласында жақсы
нәтижелерге қол жеткізілді. Жүйелер пайда болды, мұнда автоматты индекстеу
енді өнеркәптік тәртіпте жүзеге асырылды (мысалы, Скоби АІЖ-де) [7].
Бұл кезеңнің зерттелуінің басқа бағыты – іздестіру моделі (мәніне сәйкес
өлшемді таңдау) және жүйені бағалау әдістері. Ықтималдық-статистикалық
моделге арналған зерттеулердің үлкен санына қарамастан, практикада
негізінен АІЖ-ні булевтік операторлар пайдалана бастады Булевтік жүйенің
басымдығын оның қарапайымдылығымен түсіндіруге болады. Булевтік
іздестірудің мөлдірлігі іздестірудің диалогтық құралдардың дамуымен сәйкес
келеді. Іздестірудің аралық нәтижелерін алу мүмкіндігі – іздестірулік кері
байланыс бойынша ұйғарымды түзеу мүмкіндігін қолданылған жүйенің көмегімен
іздестіру нәтижелерін қанағаттандыруға жеткілікті болып шықты.
Осылайша, 70-ж ортасында ең көп таралған және өнеркәсіптерде пайдалану
тәртібімен жұмыс істейтін жүйелер класының басымдығы қалыптасты және ұзақ
жылдар тұрды.
Бұл жүйелер класы келесі ерекшеліктерімен ажыратылады:
• АТ түйінді сөздер негізінде бұрынғы үйлестіруші типі.
• Булевтік қисын негізінде мәндік сәйкес қисындық өлшемі.
• Синтагматиканы тіркеу үшін арнайы контекстік операторлар.
• Еркін мәтін бойынша іздестіру (әдетте, ұсынылған рефераттар).
• Іздестірудің диалогтық тәртібі.
• Іздестірудің толықтығы мен дәлдігінің тиімділігін бағалау.
• Мәтіндердің кері байланысы негізінде іздестірудің басқару көрсеткіштері.
• ИРИ тәртібіндедегі іздестіру жүйесінің кең таралуы.
Бұл кезең үшін АІЖ өндіріс құрамына айналуы тән: мәліметтер құжаттық
базасы және сұраныс бойынша іздестіру машинамен оқуды жинақтауды жүзеге
асырады, қуатты коммерциялық ақпараттық қызмет пайда болады. АІЖ-ні
бағдарламалық қамтамасыздандыру нақты пайдаланушылар мен ұйымдар шарттарына
тез биімделетін салыстырмалы, қолданбалы бағдарламалар пакеттер түрінде
тарала бастайды. Тіл құралдарын бір ізге түсіру құжаттық массивтерді
алмастырудың бірыңғай қалыптарын жасауды білдіреді. Кеңестар одағында ГКФ
коммуникативтік форматы жасалды (1978-1979жж), одан соң МЕКОФ (1984-1985жж)
жасалды, бірыңғай бұйрықты тіл жасау мақсатында сұраныс тілдерін бір ізге
түсіруге әрекет жасалды. Түптің түбінде мұндай тіл жасалды да, бірақ жеке
тіл ретінде емес Z39.50 іздестіру хаттамасы құрамында жасалғанын айтуға
болады.
Құжаттық АІЖ дамытудың төртінші кезеңі 1990 жылдардың ортасында
басталды. Ақпараттық салада түбегейлі өзгерістер интернет желісінің
дамуымен байланысты өтті және электронды түрде құжаттық ақпарат көлемінің
шұғыл көшкін түрінде өсті. Бұл кезең үшін мыналар тән: базада жаһандық АІЖ
пайда болуы; электрондық құжаттарды ұсынудың арнайы тілдері; ақпараттық
массивтердің түрлік, тақырыптық, тілдік сан алуандылығы; толық мәтіндік
іздестіруге бейімделуі; өткен кезеңнің лингвистикалық қамтамасын
мұраландыру.
Қазіргі АІЖ-нің лингвистикалық компоненті техникалық және
бағдарламалықтан артта қалуда. АІЖ-ін өңдеу көбірек компьютерлік техника
бойынша бағдарламашылар мен мамандардың ісіне айналуда. Лингвистикалық
қамтамасыздандыруды жасау семантиканың, қолданбалы лингвистиканың және
ақпараттық-іздестіру теориясының көптеген проблемаларын зерттеу мен шешуді
талап ететін күрделі және кешенді проблема болып табылады. Құжаттық
іздестірудің бағдарламалық және техникалық қамтамасыздандыру саласындағы
жетістіктері түбегейлі түрде қазіргі ақпараттық жүйелердің өзгерген
бейнесімен әсер қалдыратындай көрінеді. Алайда, бұл жетістік іздестірудің
сапалы жағын бейнелейтін функциональды тиімділіктің көрсеткіштеріне сәйкес
емес. Қазіргі кездегі құжаттық ағынның қуаттылығы ерекшеліктері мынадай,
бұл ақпараттық жүйенің тиімді қызметін автоматтандыру ескі лингвистикалық
базада мүмкін емес және жаңа тілдік құралдар жасауға бағытталған
зерттеулерді талап етеді. ХХ-ғасырдың соңында электрондық құжат айналымына
толық құқығымен табиғи тіл енді. Бұл сондай-ақ ақпараттық жүйе саласында
бірінші кезекте оларды интелектуальдандыру бағытында жаңа теориялық және
практикалық өңдеуді талап етеді[8].
Құжаттық іздестіру негіздері
Релеванттылық және пертиненттік. Құжаттық типтегі ақпараттық-іздестіру
жүйесі реттелген құжаттар жиынтығын, сондай-ақ құжатты ақпарат сұранысы
бойынша сақтау, іздестіру және беру үшін белгіленген құралдар мен әдістер
жиынтығын көрсетеді. Құжаттық іздестірудің сан алуандығы заттық немесе
тақырыптық іздестіру болып табылады. Құжаттық АІЖ тақырыбы пәні бойынша
сұранысқа сай келетін құжаттар береді. Құжат, оның орталық пәні немесе
тақырыбы тұтастай ақпараттық сұраныстың ойлы мазмұнына сай келуі
релеванттылық деп аталады, ал екі және одан да көп мәтіндердің ой-пікір
жақындығы қасиеті (бұл жағдайда – құжаттық және ақпараттық сұраныс
арасында) – релеванттылық деп аталады. (ағылшынша relevant – тиісті, сәйкес
келуші).
Ақпараттық іздестіруде бұл құжатар мен сұраныстар топтары және АІЖ-нің
негізгі тағайындалуы құжаттар мен сұраныстардың мазмұнын салыстырудан және
олардың сәйкестігі немесе сәйкес еместігін туралы шешім қабылдаудан тұрады.
Бірақ АІЖ-нің бұл үшін құжаттар мен сұраныстардың мазмұнының формальді
түсінігі қалыптастырылады. Олар құжатты іздестіру үлгісі (ҚIҮ) мен сұраныс
іздестіру үлгісі (СIҮ) атауын алады және бір-бірімен салыстырылады. Сонда
релеванттылық бұл екі іздестіру бейнелерінің арасындағы қатынас деп
қорытынды жасауға болады. Екінші жағынан жоғарыда келтірілген
релеванттылықты анықтау әлдебір екінші машиналық бейнелер емес құжаттар мен
сұраныстардың өзін олардың пайдаланушы белгілі және қол жеткізерлік
түрінде сәйкестігі туралы айтылады. Бұл ұғым обьективті ме, немесе
субьективті ме деген пікірсайыс пайда болады. Сондықтан релеванттылықтың
екі түрі: мәндік және формалыдік туралы айта бастады. Ақпараттық сұраныстың
құжаттық мазмұнына сәйкестігін мәндік релеванттылық деп атайды, ал бұл
құжаттық іздестіру бейнесі берілген ақпараттық сұраныстың білдіретін
іздестіру нұсқауына сай келуі – формальды релеванттылықты құжаттық
релеванттылықтық деп аталады. Сондайақ формальды релеванттылықты құжаттық
релеванттығы, мәндік релеванттылықты-ақпараттың релеванттығы (құжат
мазмұнындағы ақпарат түрін алады) [9].
Ақпараттық қажеттілік ақпараттық іздестірудің негізгі ұғымдарының бірі
болып, іздестіруге сұраныс, адамдардың ақпаратты қажет етуінен туындайды.
Ол әлдебір міндеттер мен проблемаларды шешу үшін қажет (өзінің жеке
қызығушылығын қанағаттандыруды қоса отырып). Ақиқатында да, түрлі дәрежеде
барлық адамдарға тән, өзінің ақпараттық тұтынушылығын түпкілікті бірден
бара-бар білдіре алмауы мүмкін. Сондықтан, нақты АІЖ негізінен тек
құжаттарды іздестіруді қамтамасыз ете алады.
Ақпараттық сұраныс мұнда білдірілген ақпараттық қажеттіліктен едәуір
ерекшеленеді. Көптеген жағдайларда пайдаланушылар өзінің тұтынушылығын дәл
бейнелеуге қабілетсіз болып шығады. Мысалы паралельдік алгоритмдер сияқты
сұраныс жеткілікті түрде дәл емес болып шығады. Біріншіден, пайдаланушыға
паралельдік алгоритмдер немесе олар туралы ақпарат үлгілері ме, нақты не
қажет екені түсініксіз. Екіншіден, авторға барлық қолда бар ақпарат қажет
пе немесе тек бірнеше үлгілері қажет қажет пе және соңында қай сала –
теориялық немесе практикалық – пайдаланушыны қызықтырады. Осылайша,
пайдаланушы релеванттылық туралы пікірді шығара отырып меншікті ақпараттық
тұтынушылығы негізінде оны анықтайтын болады. Ол өте жиірек оның санасында
болады, сол кезде АІЖ сияқты релеванттылық туралы пікірді пайдаланушы
қалыптастырған сұрақ мәтіні негізінде шығарылады. Осылайша, релевантты
болу, шын мәнінде сол немесе басқа адамның тұтынушылығына сай келеді
дегендей білдірмейді. Кез-келген жүй берген құжатты екі аспектіде: сұраныс
берген пайдаланушының субьективті көзқарасы тұрғысынан (прагматикалық
әдіс) және оның табиғи тілде қалыптасқанындай сұраныс мәніне сай көзқарасы
тұрғысынан (семантикалық әдіс) қарастыруға болады. Семантика терминінде
релеванттылықтың семантикалық қатынасы сияқты пертиненттікті прагматикалық
қатынас сияқты анықтауға болады[10,11]. Алайда пертиненттік пен
релеванттылықты шектеу барлық проблемаларды шешпейді. Іс жүзінде жағдай
күрделірек, жалпы жағдайда ақпараттық іздестіруде бірінші топтың
нысандарында құжаттарда келесі мәндерді бөліп ұсынуға болады:
• құжат (физикалық мән, оны пайдаланушы АІЖ-нен ақпарат іздестіру
нәтижесінде алады);
• ақпарат (пайдаланушы құжатты оқи отырып біледі);
• құжаттық іздестіру бейнесі (құжаттың формальды көрінісі, ол іздестіруде
пайдаланылады және түрлі форма қабылдауы мүмкін тақырыптан түйінді сөздер
тізімінен, авторлар атынан, библиографиялық мәліметтерден,
аннотациялардан, үзінділерден және т.б тұруы мүмкін);
Екінші топ нысандарындағы сұраныста, келесі мәндерді бөліп көрсетуге
болады:
• проблема (пайдаланушы әлденемен қақтығысатын және өзінің рұқсат етілуі
үшін ақпарат талап етуін);
• ақпараттық қажеттілік (пайдаланушының санасында проблеманың көрінісі,
оның үстіне пайдаланушы проблеманы көз алдына дұрыс елестетпеуі мүмкін);
• ақпараттық сұраныс (табиғи тілде пайдаланушының ақпараттық
тұтынушылығының көрінісі);
• іздестіру нұсқаулығы (сұраныстың іздестіру бейнесі (СІБ) түріндегі
ақпараттық сұраныстың көрінісі және сұраныс тіліндегі іздестіруге
тапсырма).
Сонда, релеванттылықты құжаттық іздестіру бейнесінің іздестіру нұсқауына
(формальды релеванттылық) немесе құжаттық ақпараттық сұранысқа (мәндік
релеванттылық) немесе ақпарат пайдаланушы алған ақпараттық тұтынушулық
(пертиненттік) қатынасы сияқты қарастыруға болады. Релеванттылық әрбір түрі
туралы пікір қандай деңгейде қалған мәніне ықпал жасайды, деген сұраныс
туады.
Одан басқа, екінші топтағы жоғарыда аталған әрбір мәнге келесі үш
компонентті қосуға болады:
• тақырып (пайдаланушыны қызықтыратын пәндік салаға жататын нәрсе);
• міндет (табылған құжатта бойынша пайдаланушының қызметіне жататын нәрсе)
• контекст (тақырып пен міндетке жататын нәрсе, бірақ оның үстіне,
іздестіру мен іздестіру нәтижелерін бағалауға ықпал етеді).
Әдеттегідей, ақпараттық-іздестіру тақырыптық компонентке
шоғырландырылған, алайда тақырыптық сәйкестік жеткіліксіз болып ұсынылуы
мүмкін: Мысалы, пайдаланушыға міндетті орындау үшін пайдалануға болмайтын,
немесе оған белгілі сол ақпарат қажет емес. Немесе, бір жағдайда ол үшін
жалғыз құжат жеткілікті болады, басқа пайдаланушы өзінің сұраныс пәні
бойынша барынша көп әдебиетті алуға ұмтылады.
Сонда, басқа сөзбен айтылғанда, құжаттық іздестіру бейнесі (құжат,
ақпарат) бір немесе одан көп компонентке қатысты іздестіру нұсқауына
(пайдаланушылық сұраныс, ақпараттық қажеттілік, проблема) релевантты болуы
мүмкін: тақырыпқа жататын, міндеттер мен тақырыпқа жататынын релеванттылық
туралы, немесе барлық үш компонентке жататын релеванттылық туралы айтуға
болады.
Одан басқа уақыт факторы ескерілуі тиіс. Ақпараттық сұранысты
қалыптастыруда адам әрдауым өзіне қандай ақпарат шын мәнінде керек екенін
сезіне бермейді. Сондықтан оған берілген ақпараттық сұранысқа жауапты АІЖ
беретін құжаттардың мазмұны, бұл адамның өзінің ақпараттық тұтынушылығы
туралы түсінігін өзгерте алады немесе бұл қажеттілікті өрнектер
формасымен оның өзгертуіне мәжбүр етеді және оның өзімен релеванттылық
туралы пікірді өзгертеді. Релеванттылық- динамикалық құбылыс: бір және сол
сарапшы үшін құжат уақыттың белгілі бір сәтінде релевантты бола алады және
кейіннен релевантты емес, және керсінше. Құжаттардың арасында тәуелділік
бар: бірінші көрінген құжат келесісінің релеванттылығына ықпал дандыруі
мүмкін.
Демек, релеванттылықтың әрбір түрі төрт өлшемді кеңістіктегі нүкте
сияқты келесі мәндерімен қарастырылады.
• іздестіру бейнесі, құжат, ақпарат;
• іздестіру нұсқауы, пайдаланушылық сұраныс, ақпараттық қажеттілік,
проблема;
• пайдаланушы, тақырып, мәселе, контекст және олардың бар мүмкіндікті
комбинациясы;
• түрлі уақыттық интервалдар – проблеманың пайда болуынан оның шешілуіне
дейін.
Релеванттылықты анықтау әдістері. Релеванттылықтың түрлі түрлерін
анықтаудың әдістері туралы мәселе ашық күйінде қалуда. Пертинентікке
қатынастылығы айқын: оны ақпарат тұтынушы бағалауы тиіс, немесе сол басқа
құжат қаншалықты оның ақпараттық тұтынушылығына сай келеді. Мұнда
тұтынушының бағасы оның алдында тұрған практикалық сипатына, оның ғылыми
квалификациясының деңгейі мен басқа факторларына тәуелді.
Релеванттылық туралы бұл пікірді бес өлшем бойынша жіктеуге болады:
• құжаттық мәні, оның негізінде пікір шығады (іздестіру бейнесі, құжат
немесе ақпарат);
• сұраныстық мәні, оны сарапшы пікір шығару үшін пайдаланады (іздестіру
нұсқауы, пайдаланушылық сұраныс, ақпараттық қажеттілік немесе проблема);
• пікір шығарылатын компонент (тақырып, міндет, контекст);
• релеванттылық туралы пікір шығатын уақыт сәті;
• сарапшы типі (пайдаланушы және маман).
Релеванттылық – субъективті ұғым: түрлі сарапшылар релеванттылық туралы
түрлі пікір шығарады. Релеванттылықты бағалау үшін, бағалауда жетерлі
бірыңғайлықты қамтамасыз ететін формальды ережелер бойынша жүзеге асырылуы
қажет.
Релеванттылық туралы пікір өрнектерінің баламасы бар:
• Дихотомия (ия\жоқ);
• Шкалалар, мұнда релеванттылық туралы пікірлер үшін бірнеше мағына
болады;
• Релеванттылық шамасының сандық мағынасы.
Берілген проблематика бойынша жарияланымдардың едәуір саны бар.
Релеванттылық бойынша қазіргі жарияланымдар үшін жүйеге бейімделген
зерттеулерден түрлі іздестіру құралдары релеванттығына ықпалын табатын
жүйесіне бейімделген өту тән.
Ақпараттық-іздестіру жүйесінің құрамы
Ақпарттық-іздестіру жүйесі өзімен бірге сұраныс бойынша ақпартты сақтау,
іздестіру және беру үшін белгіленген құралдардың жиынтығы:
• ақпарттық массивтер (құжаттар, сұраныстар, метамәліметтер);
• ақпарттық-іздестіру тілі (АІТ), оны пайдалану және мәндік сәйкес келу
өлшемдерін, сондай-ақ басқа да бірқатар басқа лингвистикалық құралдарының
ережелерін қосатын қисындық-лингвистикалық аппарат;
• жүйенің функциясын (бағдарламалар, компьютерлер) іске асыруды қамтамасыз
ететін есептеу құралдары,
• оны пайдалануды (персонал, нұсқаулық-әдістемелік материалдар, т.б.)
қамтамасыз ететін құралдар.
АІЖ бұл құрамда нақты (жұмысшы) АІЖ деб[12], абстрактілі АІЖ-ден ерекше,
тек қана бірінші және екінші бөлігін қосатын айырмашылығын атайды. АІЖ
абстрактіден қисындық-лингвистикалық моделі туралы қалай айтуға болады, ол
бірінші кезекте іздестіру жүйесі мен сапасының типін анықтайды. Д.Г.Лахути
ақпараттық-іздестіру жүйесі (абстрактілі АІЖ) және ақпараттық-іздестіру
қызмет (нақты АІЖ) деп атайды[13].
АІЖ-нің құрамдас бөлігі жүйеше деп аталады. Жүйешеге бөлу өңдеу
мақсаттары сияқты, жүйенің қызмет дандыру технологиясын жазу үшін қажет
және пайдалы. Ол түрлі негізге ие болуы мүмкін. Әдетте АІЖ жүйешеге бөлудің
екі типін қарастырамыз: функциональдық принципі бойынша (функциональды
жүйешелер) және құралдар типі бойынша (қамтамасыздандырушы жүйешелері).
Қамтамасыздандырушы жүйешелер. АІЖ функциясын іске асыратын түрлі
құралдар қамтамасыз ететін жүйеше, немесе қамтамасыздандыру атауын алды.
Жинақталған түрде, бұлар жоғарыда аталған төрт бөлікті және нақты АІЖ-ін
құрайды. Көбіне бөлшек бөлуде мынадай жүйешелер бөлінеді: лингвистикалық
қамтамасыздандыру, ақпараттық қамтамасыздандыру, техникалық
қамтамасыздандыру, бағдарламалық қамтамасыздандыру, технологиялық
қамтамасыздандыру, кадрлық қамтамасыздандыру, т.б.
Ақпараттық қамтамасыздандыру – бұл ақпараттық массивтер (құжаттар,
сұраныс, метамәліметтер), сондай-ақ олардың жазылу, құрылу және жіктелу
құралдары мен әдістері.
Лингвистикалық қамтамасыздандыру – бұл қисындық-семантикалық аппарат, ол
ақпараттың іздестіру тілінен, қолдану ережесінен (индекстеу әдістемесі)
беру өлшемі және басқа тілдік құралдардан тұрады.
Бағдарламалық қамтамасыздандыру – бұл компорьютердің көмегімен
орындалатын АІЖ-нің барлық функциясын іске асыратын алгоритмдер мен
бағдарламалық құралдыр.
Техникалық қамтамасыздандыру – бұл ақпаратты сақтауды, іздестіру мен
жеткізіп беруді қамтамасыз ететін техникалық құралдар (компьютерлер,
телекоммуникация құралдары).
Технологиялық қамтамасыздандыру – бұл АІЖ-нің ақпаратын олардың жазылу,
ақпараттық-технологиялық схемасы және нұсқау-әдістемелік материалдарды қоса
өңдейтін автоматтандырылған және автоматтандырылмаған үдерістер мен
процедуралар орындалуының жиынтығы мен тәртібі.
Кадрлық (немсе штаттық) қамтамасыздандыру – бұл жүйемен өзара әрекет
жасайтын және оның пайдаланылуын қамтамасыз ететін адамдар (қызмет
көрсетушілер).
АІЖ-нің дамуының бастапқы кезеңінде ақпараттық-лингвистикалық
қамтамасыздандыру түрі жекелей қарастырыла бастады. Олардың арасындағы
шекарасы мейлінше жылжымалы. Жекелей алғанда көрініс пен ақпаратты жазу
тілін лингвистикалық сияқты, ақпараттық қамтамасыздандыруды де жатқызуға
болады.
Функциональды жүйешелер. АІЖ-гі әрбір жүйеше технологиялық үдерісте
белгілі бір функцияны: құжаттарды іске қосу, құжаттарды индекстеу,
сұранысты енгізу мен түрлендіру, сұраныстарды индекстеу, іздестіру, сөздік
жүргізу, статистика жүргізу, іздестірудің нәтижелерін өңдеу, құжаттар беру,
т.б. орындалады. Мұндай бөлік функциональды жүйеше деп аталады. Бұл жүйеше
АІЖ-нің моделінің құрылымын құрайды (және де үдерістік, операциялық деп те
аталады).
Сол кезде әрбір үлгі жекелей бағдарлама түріндегі интегральдық ұсақ
функциональды элементтерден тұратын өзінің құралдарымен жүйеше ретінде
құрылады. Мысалы, операциялық модуль Құжаттарды машинадан алдын өңдеу
және сұранысты қалыптастыру және іздестіру нұсқауын толтыру модульдерінен
тұрады.
Құжаттарды машинадан алдын өңдеу моделі, ол өз кезегінде мейлінше ұсақ
құрамдас элементтерге бөлуі мүмкін (операциялар): құжатты бірыңғайлау;
құжаттық қалыптық белгісі; метажазуды толтыру; индекстеу.
Сұранысты қалыптастыру және іздестіру нұсқауын толтыру моделі мынадай
элементтерден тұруы мүмкін: сұраныстың мәтінін анықтау; ақпараттық
қажеттілік; мәтін аясына бөлу; сұранысты индекстеу; мәндік кеңею;
іздестіруді шектеу тапсырмалары; нақты жүйенің сұраныс тілінде іздестіру
нұсқауын жазу.
Басқа жүйелерде, басқа жағдайларда бұл элементтердің бөліктері басқа
модульдерде (мысалы индекстеу, ендіру, сұраныстар тілінде іздестіру
нұсқауын жазу модульдерінде іздестіру модульінде, т.б. орындалуы мүмкін)
іске асырылуы мүмкін.
Құжаттық ақпараттық-іздестіру жүйесінің математикалық моделі
АІЖ жүйешелерінің композициялану әдістерін қарастыра отырып, енді жүйе
ұғымының өзін анықтаймыз. Жүйе мыналарға ие элементтер жиынтығы ретінде
анықталады:
• екі кез-келген жиынтық элементтерін элементтен элементке жалғастырып, ол
бойынша оларға өту құралына мүмкіндік береді;
• жиынтықтың жекелеген элементтерінің қасиеттерінен үздік қасиет (белгілеу,
функция) [14].
Ақпараттық-іздестіру жүйесі мұндай анықтамаға тұтастай жауап береді.
Кортеж анықтатамасын қолдана отырып, жүйені төмендегідей жазбалар
түрінде көруге болады:
У:{ { М }, { Х }, Ғ },
мұнда У – жүйе; {М } – элементтер жиынтығы; {Х} – байланыстар жиынтығы;
Ғ – жүйенің (жаңа қасиеті) функциясы.
Бұл жүйе жазуының ең қарапайымы. Жазудың күрделі жүйелердің түрлі
қасиеттеріне сәйкес сән-салтанатты жүйелілігінің 10-нан аса мүшесін
қамтитын қалыбы бар[15].
Жүйелер элементтері ретінде бірқатар маңызға ие нысандар (материалдық,
ақпараттық) әрекет етеді, бірақ олардың ішкі құрылысы бұл жағдайда
қарастырылмайды.
Жүйенің элементтері арасындағы байланыстар бір элемент екіншісіне әсер
дандыруін атайды. Ақпарттық жүйеде бәрінен көп бұл байланыстар мәлімет
берумен қорытындыланады.
Элементтердің белгілі бір тобы жүйенің жүйешедеп аталатын бөлігін
құрайды. Әрбір жүйешеөзімен бірге өзара мықты байланысы бар элементтер
тобын және әлсіз басқа топтардың элементтері (жүйеше) көрсетеді. Жүйешелер
жиынтығы олардың арасындағы байланыстарды ұсынумен жүйенің құрылымы деп
аталады.
Автоматтандырылған ақпараттық-іздестіру жүйелерінің формальды түрін
келесі көріністе жазуға болады.
У={{Мт},{Мч},{Мя},{Мн},{Мг},{Мх},{М і},{Х},Ғ}.
Мұнда Мт – техникалық құралдар (компьютерлер), Мч –адамның әрекеті мен
шешімі, Мя – тіл құралы, Мп – бағдарламалық қамтамасыздандыру, Мх –
технологиялық қамтамасыздандыру, Мі – жүйенің қалған құралдары, Х – жүйе
элементтері арасындағы байланыстар жиынтығы, Ғ – жүйе функциясы.
Жүйенің декомпозициясы мен сән-салтанатын анықтауды, жүйешені жекелеген
құралдарға бөле отырып, ал жаһандық мақсатты жергілікті ете отырып, одан
әрі күрделендіруге болады. АІЖ, барлық жасанды жүйе сияқты мақсатқа сай
жүйе типіне жатады. Кез-келген мақсатқа сай жүйені жобалау жүйенің алдында
тұрған жаһандық мақсатты, жүйешенің (модулдердің ) алдында тұрған
жергілікті мақсатты болумен және модулдің шығу сипаттамасының талаптары
сияқты әрекет етіп көрінеді. Сірә, мұндай әдісте жергілікті мақсаттарды
келісу және бөліктерді мақсатқа бағытталған жүйеге біріктіру айрықша
маңызды. Келісу әдетте күрделі, нашар қалыптасатын процедура екенін
байқаймыз.
Автоматтандырылған АІЖ түрлі типтер элементтерінен тұратын және олардың
арасындағы түрлі байланыстарға ие күрделі жүйе деп аталатын класқа жатады.
Құжаттар мен сұраныстар
Құжат сөзі латынның documentum – куәлік сөзінен шыққан. Құжаттық
ұғымы уақыт өткен сайын өзгереді, құжаттық жаңа формалары тұрақты пайда
болады. Сондай-ақ ескі формалар өзгерістерге төзеді. Қазақстандің
мемлекеттік стандартына сәйкес құжат адам қызметінің фактілері,
оқиғалары, объективті шындықтың құбылыстары мен ойлылығы туралы кез-келген
ақпараттың арнайы материалында кез-келген әдіспен бекітілетін құрал ретінде
анықталады.
Құжаттар түрліше жіктеледі. Елеулілерінің бірі құжаттар бірінші және
екінші бөліну болып табылады. Біріншіге автордан туындайтын бастапқы
ақпарат мазмұндалатын құжаттар жатады. Екіншіге-бір немесе бірнеше бріншіні
өңдеу нәтижесі болып табылады. Әдетте мұндай өңдеуді талдау-синтетикалық
деп атайды. Екінші құжаттық айрықша түрі ретінде индекстеудің нәтижесі –
арнайы ақпараттық-іздестіру тіліндегі негізгі мазмұнның жазбалары болып
табылатын – құжаттық іздестіру бейнесі (ҚІБ) түрлі формаларға ие.
Автоматттандырылған құжатты АІЖ-де бұл ең алдымен машина оқитын
формадағы табиғи тілдегі мәтіндік ақпарат. Іздестіру тұрғысынан құжаттардың
ішкі құрылымы елеулі маңызға ие; оларды өрісға бөлу және метажазу
элементтерінің барлығы. Құрылым нақты АІЖ үшін арнайы жасалуы мүмкін немесе
нақты стандарттарымен анықталады. Құрылымдану тілі, құжаттар жазуы,
құжаттардың форматтары мен кодтары да маңызды.
АІЖ- де әдетте екі массиві – бірінші және екінші контурлар деп
аталатын типтері болады. Бірінші контур деп компьютерде сақталған (сыртқы
таратушыда) іздестіру массивтері (құжаттардың іздестіру бейнелері)
ұғынылады, екіншісі – көбіне компьютерден тыс (қағазда немесе микро
таратушыда) немесе басқа компьютерлерде (мысалы, интернет желісінде)
сақталатын бірінші массиві.
Тиімді және тез іздестіруді қамтамасыздандыру үшін массивтерді физикалық
ұйымдастыру мәселесі үлкен рөл ойнайды. Әсіресе бұл толық мәтіндік
құжаттарды өңдеу мәселесі өткір болып тұр. АІЖ-ін ақпараттық қамтамасыз
етудің екінші бөлігі – бұл сұраныстар. Сұраныс табиғи тілде
қалыптастырылған ақпараттық қажеттілікті көрсетеді. Ақпарттық сұранысты
ақпарттық тілге аударудың нәтижесін сұраныстың іздестіру бейнесі (СІБ) деп
атайды.
Ақпарттық қажеттілікті, және сұраныстарды индекстеуді табу бір мәндік
шешімге ие емес күрделі семантикалық процедураларды көрсетеді. Сұраныстың
іздестіру бейнесі терминімен қатар іздестіру нәтижесі ұғымы
пайдаланылады. Мұның аясында сұраныстар тілі ұғынылады, ол өзіне өзіндік
АІТ сияқты іздестіруді басқару құралдарын да ендіреді, сұраныс тілінің
синтаксисі мен семантикасы құрылыммен және құжаттарды толықтырумен және
жүйенің жалпы міндеттерімен анықталады. Барабар іздестіру нәтижесін (ІН)
құрау үшін пайдаланушы сұраныс тілін және ақпарттық-іздестіру тілін (АІТ)
білуі тиіс, яғни құжаттардың іздестіру жүйесіндегі мазмұнындағы ұғыну,
мәнін ашу деңгейін көрсетеді.
Ақпарттық қамтамасыз етудің үшінші бөлігі беру деп аталатын
іздестірудің нәтижесі. Беру екі түрде қолданылады: құжаттардың қысқаша
жазбалары мен құжаттардың өзі жүйе қандай түрде құжаттарды түсіндіретінін
біле отырып, жүйе іздей білетіні тек қана ІН дұрыс толтыру үшін емес,
сонымен бірге берілетін нәтижелер жүйесі дұрыс мәнін ашуды қажет етеді. Кез-
келген жағдайда толтырылған ІН бойынша АІЖ орындайтын іздестіру берілген
бағдарлама бойынша мәліметтерді таза формальды компьютерлік өңдеу болып
табылады. Берілген сұраныс жүйесінде мәндік мағынасы қандай болмасын, одан
алынған жауапты пайдаланушы алады.
Ақпараттық-іздестіру тілі
Ақпараттық-іздестіру жүйесінің аса маңызды компоненті ақпараттық-
іздестіру тілі болып табылады. Адам құжаттар жиынтығынан қажетін алу үшін,
оның мазмұнын оқуы немесе қарауы тиіс. Бұл процедурюны жеделддандыру мен
оңайлату үшін құжаттар мазмұны қысқартылған жазбасының түрлі формалары –
аннотациясы, рефераттар, каталогтар пайда болды. Алайда барлық бұл
жағдайларда құжаттарды олардың қысқартылған жазбалары бойынша іріктеуде
табиғи тіл пайдаланылады. Тілді түсіну актісі сигнитивті мәнге арқа
сүйейтіні белгілі, ол айқын білдірілген мәтінде (сөзде) тілдік белгілермен
күрделі қатынаста болады. Тілдік белгілердің мұндай кемшіліктері
омонимия, синонимия көп мағналы сияқты жақсы белгілі, көптеген сөздердің
дәл мағнасын тек контексте ұғыну мүмкін. Бұл ұғымдық ақпаратты белгілеу мен
бірдейлендіру үшін табиғи пайдалануға кедергі келтіреді. Бірақ бұл
асимметризмжәне алогизм тілдік белгілермен аяқталмайды. Тілдегі бір
мағналылық және көп мағналылық тек лексикаға емес, грамматикаға да жатады.
Бір және сол грамматикалық қатынастар түрліше білдіріле алады, сөйтіп бір
және сол формалар түрлі грамматикалық мағнаға ие бола алады. Одан
басұғымның мәндік қатынасын түсіну тұрғысынан елеулі, мысалы тек-түр
қатынасы ешқандай ттабиғи тілдің лексикалық және грамматикалық жүйесінде
айқын бейнеленбейді.
Сондықтан келесі іздестіру мақсатында құжаттық ақпаратты сақтау үшін
тағайдалған формальды жүйелер арнай ақпараттық тілдер жасауды талап етті.
Табиғидан үздік және жіктеу атауын алған мұндай алғашқы тілдер кітапхана
үшін құрылуы ықтимал. Компьютерді ақпараттық іздестіруге ендіру ақпараттық
тілдерді одан әрі дамыту мен формалдандыруға қалыптастырды. Ақпараттық-
іздестіру тілдері белгілік жүйесін өз әліппесімен, лексикасымен,
грамматикасымен және пайдалану ережесімен көрсетеді. Барлық жасанды тілдер
қандай да болмасын табиғи тілдер негізінде жасалды және жасалатынын
байқаймыз.
Ақпараттық-іздестіру тілдеріне негізгі талаптар мынадай:
• айтылу жоспары мен мазмұн жоспарының арасындағы бір мағыналылық (әрбір
лексикалық бірлік бір ұғымға сай келеді, және керсінше);
• әрбір ұғым бірыңғай атауға ие (АІЖ-гі әрбір жазба тек бір мағынаға ие);
• жеткілікті семантикалық күш (құжаттар мен сұраныстардың мазмұнындағы
барлық мәнді толығымен және дәл белгілеуге қабілеттілігі);
• ашықтығы (тілді түрлендіру және толықтыру мүмкіндігі).
Мағыналық сәйкестіктің өлшемі
Құжаттар мен сұраныстарда салыстыруда сұранысқа қатынасы бойынша
құжаттық релеванттығын анықтау және сол сұранысқа құжатты беру немесе
бермеу туралы шешім қабылдау талап етіледі.
Ереже, оның негізінде құжат пен сұраныстың релеванттығы дәрежесі, яғни
ҚІБ пен СІБ-не сәйкес формальды анықталып, мағыналық сай келудің өлшемі
(МСӨ), немесе беру өлшемі (БӨ) деп аталады. Құжатты жазу, релеванттылық деп
танылған сұраныс (немесе өзі), файлға іздестіру нәтижелері орналастырылады
немесе беруге деп айтылғанындай орналастырылады. Нақ сондықтан беру
өлшемі термині пайда болды, бәлкім, формальды релеванттылық құбылысына
мейлінше сай ретінде тіпті артығырақ көрінетін болады.
Барлық қолданылатын БӨ екі үлкен топқа бөлуге болады: сандық және
қисындық. Біріншісі сандық параметрлермен іс жүргізеді, және олардың
негізінде әрбір құжат-сұраныс жұбы құжаттар мен сұраныстардың мағыналық
жақындығы (ұқсастығының) сандық мағынасы есептеледі. Бұл ұқсастық
коэффицентін кеміту тәртібімен құжат жеткізіп беруді маңызына қарай істеуге
мүмкіндік береді, сондай-ақ берілген бастау мағынасына байланысты
құжаттардың әлдебір санын береді.
Ұқсастықтың математикалық моделі мен коэффицентін есептеу өрнегі
әртүрлі болуы мүмкін. Бірінші іздестіру жүйесінде БӨ ҚБ (ҚІБ) пен СБ (СІБ)
көптеген терминдерінің кесіп өту, қыйылысудың теориялық–жыйындар
операцияларына негізделеді. Мұндай кесіп өтудің дәрежесі пайызбен
анықталады. Бұл жағдайда R беру өлшемі мағынасының шамасы мына формула
бойынша анықталады :
R = (M N) * 100 %.
Мұнда М – ҚБ және СБ терминдерін іздестіруде сай келетіндердің
саны, N – С1Б терминдерінің жалпы саны .
1. Беру өлшемі бұл жағдайда бастапқы мағына ретінде, пайызбен
білдіріліп беріледі, оның релеванттылық деңгейі жоғары тұрады.
Шеткі жағдай 100 ... жалғасы
ДИПЛОМДЫҚ ЖҰМЫС
050111– Информатика мамандығы бойынша
ТҮРКІСТАН 2010
Ф-ОБ-001033
Қазақстан Республикасының білім және ғылым министрлігі
Қ.А.Ясауи атындағы халықаралық қазақ-түрік университеті
Қорғауға жіберілді
ДИПЛОМДЫҚ ЖҰМЫС
тақырыбы: ҒЫЛЫМИ ЗЕРТТЕУДЕГІ АҚПАРАТТЫҚ-ІЗДЕСТІРУ
ТЕОРИЯСЫ курсын ОҚЫТУ ӘДІСТЕМЕСІ
050111– Информатика мамандығы бойынша
Орындаған: студенті
Ғылыми жетекші: техн.ғ.к., доцент
ТҮРКІСТАН 2010
М А З М Ұ Н Ы
КІРІСПЕ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . ... 3
1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясының негіздері ... .. 5
1.1. Ғылыми зерттеудегі ақпараттық-іздестіру үдерісінің негіздері
... ... .. 6
1.2. Интернет желісіндегі ақпараттық-іздестіру жүйелері
... ... ... ... ... 23
1.3. Метаіздестіру жүйелері мен іздестіру машиналары
... ... ... ... ... ... ... 33
1-тарау бойынша қорытынды
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 30
2. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... ... ... .. 44
2.1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсының
оқу
бағдарламасы ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... .. 44
2.2. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсы
бойынша зертханалық жұмыстар
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 51
2.3. Ғылыми зерттеудегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... .. 64
2-тарау бойынша қорытынды
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 65
ҚОРЫТЫНДЫ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 66
ПАЙДАЛАНЫЛҒАН ӘДЕБИЕТТЕР ТІЗІМІ ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 67
ҚОСЫМШАЛАР
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .
... ... ... ... ... ... ... ... ... ... ... 68
1. Курс бойынша тест тапсырмалары
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 68
2. Ғылыми зерттеулердегі ақпараттық-іздестіру теориясы курсын
оқыту әдістемесі бойынша оқу құралының электрондық нұсқасы
... ... ... .67
К І Р І С П Е
Ақпараттық-іздеcтіру бойынша зерттеулер – Д.Лахути, В.Решетников,
И.Попов, А.Черный, Э.Гасанов, Ю.Шрейдер, И.Некрестьянов, И.Кураленок,
В.Добрынин, А.Дубинский, А.Ермаков, М.Когаловский, А.Сокирко, G.Salton,
K.Sparck-Jones, S.E.Robertson, G.K.Zipf, A.Singhal, M.Mitra, S.Lowrence,
P.Foltz, E.Fox. I.Cho, R.Baera-Yates, K.Tajima, C.Van Rijsbergen,
L.Gravano, J.Kleinberg және т.б. ғалымдардың жинақталған теориялық және
әдістемелік қағидаларына негізделіп, дипломдық жұмыста жасалынған
тұжырымдар мен практикалық ұсыныстардың Ғылыми зерттеудегі ақпараттық-
іздестіру теориясы курсын оқыту әдістемесін жетілдіру мәселелерінде
бүгінгі заман талаптарына сай қолданылуы тақырыптың өзектілігін айғақтайды.
Ақпараттық және телекоммуникациялық технологиялардың ендірілуіне
байланысты Бірыңғай ақпараттық білім беру ортасының даму
бағдарламасындағы білім беруді ақпараттандырудың келесі негізгі бағыттары:
электрондық білім беру ресурстары, кадрларды ақпараттық қоғамға дайындау,
білім беруді компьютерлендіру және коммуникациялық қамтамасыз ету,
регионалды ақпараттандыру бағдарламаларына қолдау көрсету, білім беруде
ақпараттық басқару жүйелерін дамыту айқындалған.
Электрондық кітапханаларды жасау қажеттілігі – Интернеттің шығуы және
оның белсенді қолданысқа енуі үдерісіндегі ақпараттық іздестіру
жұмыстарының түрленуімен түсіндіріледі. Ақпараттық іздестіру аумағы бойынша
зерттеулердің актуалдылығы сонымен қатар, Интернет желісінде ақпарттарды
іздестіру, сұранысқа жауап беруші құжаттардың қуаттылығы, сәйкес емес
құжаттардың жиындарынан, өкінішке орай өте мардымсыз болады. Бұл ақпараттық-
іздестіру әдістерінің сапасын арттыруға туындаған қажеттіліктің
ерекшеліктерін зерттеп, оларды ескеру керектігін айқындайды.
Курстың мақсаты, студенттерге ұсынылған ақпараттық-іздестіру үдерісі
курсының теориялық негіздерін , бірінші кезекте құжаттық және тағы басқа
түрлі ақпараттық-іздестіру жүйелерінің, соның ішінде интернет желісіндегі
ақпараттық-іздестіру жүйелерін пайдалану дағдыларын қалыптастырудан тұрады.
Дипломдық жұмыс кіріспеден, екі тараудан, қорытындыдан, пайдаланған
әдебиеттер тізімінен және қосымшадан тұрады.
Бірінші тарауда ақпараттық-іздестіру үдерісінің теориялық негіздері,
құжаттық, фактографиялық, интеллектуалдық типтері мен қамтамасыздандыру
жүйешелері және ғаламтор желісіндегі ақпараттық-іздестіру жүйелері және
олардың сұраныс тілдерінің ерекшеліктері сипатталған.
Екінші тарауда курстың оқу бағдарламасы, орындалатын зертханалық
жұмыстардың тізімдері, олардың сипаттамалары мен орындау нұскаулығы және
ҒЗ ақпараттық-іздестіру теориясы курсын оқыту әдістемесі – есептеу
техникалары және коммуникациялық құралдарының жәрдемімен ақпараттық
ресурстарды жасау, сақтау, өңдеу және ұзату әдістерін теориялық жағынан
жүйелеп зерттейтін ғылымның негізгі бағыттарының бірі ретінде ұсынылады.
1. Ғылыми зерттеудегі ақпараттық-іздестіру теориясының негіздері
1. Ғылыми зерттеудегі ақпараттық-іздестіру үдерісінің негіздері
Ақпараттық үдерістер және жүйелер
Ақпарат деген сөздің өзі өзінің ішкі формасы бойынша (латын тілінен
аударғанда informaftion – хабар алу, хабарлау) қатынас, коммуникация
дегенді білдіреді. Материяның кез-келген формалары: өсімдіктер, жәндіктер,
жануарлар, адамдар ақпаратпен алмасады. Бізді ақпараттың және ақпараттық
үдерістердің адамзат қоғамында алатын орны туралы түрлері қызықтырады.
Ақпарат түрлі әдістермен алынады: тәжірибе нәтижесінде, қисындық түйсінге
ой жүгірте отырып, бақылаулардың немесе өлшемдердің нәтижелерін белгілеу
жолымен және т.б. Ақпарат пен мәліметтерді тіркелген дабылдар айырады. Бұл
жағдайда былай айтылады: ақрарат дегеніміз – бұл мәліметтердің көмегімен
оларды барабар әдіспен өңделу жемісі[1]. Ақпарат кез-келген нысан сияқты,
қасиеттерге ие. Информатика тұрғысынан аса маңызды келесі қасиеттер болып
табылады: обьективтік сенімділік, барабарлық, толықтық, қол жетімділік және
ақпараттың түйінділігі. Ақпарат ақиқат немесе жалған, негізделген немесе
ықтималды болуы мүмкін. Ақпаратты қарастырудың түрлі аспектілері бар:
прагматикалық, семантикалық, синтаксистік[2]. Ақпарат адаммен қоғамның
өмірлік қызметінің барлық саласына өтеді. Қазіргі кезде ақпарат адам үшін
энергетикалық, шикізаттық, немесе қаржылық ресурстардан мәні кем соқпайтын
айрықша ресурс деген көзқарас қалыптасты. Ақпараттық ресурстардың өсе
түсетін мәні информатика атауын алған жаңа ғылымның интенсивті дамуын
анықтайды. Оны есептеу техникалары құралдарымен мәліметтерді жасау, сақтау,
өңдеу және беру әдістерін жүйелейтін ғылым ретінде анықтауға болады, сондай-
ақ бұл құралдардың қызмет дандыру принциптерін де анықтайды. Информатикаға
қол жеткізудің пайдаланушылық деңгейінде ақпараттық жүйені жасау және
пайдалану байқалады әлеуметтік коммуникациялар жүйесі мәні бойынша әрдайым
ақпарат алмасу жүйесі болып табылады. Бұл жүйелер функциональды және
ұйымдастырушы компоненттерінен тұрады [3]. Біріншісінің аясында тікелей
ақпараттық үдерістер, яғни ақпараттық хабарларды жасау, сақтау, тарату және
пайдалану ұғынылады. Екіншіге ақпаратты жасаушылар, ақпаратты тұтынушылар
ақпараттық арналар мен ақпараттық жүйелер жатады.
Ақпараттық үдерістер мен хабарларды, функционалдық және ақпараттық
байланыстарды тұтынушыларға жеткізу мақсатында әлеуметтік коммуникациялар
жүйесінде жүзеге асырылатын жүйелі іс-әрекеттердің жиынтығы ретінде
анықтаймыз[4,5]. Сондай-ақ, ақпараттық жүйені ақпаратты жандандырудың және
ақпараттық үдерістерді қолдайтын ақпараттық өзара іс-әрекетті ұйымдастыру
компоненттері ретінде анықтаймыз. Мәліметтердің жиынтығын көрсете
ақпараттың алмасу, ақпараттық ағындардың бүкіл жүйесін бірыңғай
байланыстыра отырып, ақпараттық үдерістерді толықтырады. Әлдебір адамдар
немесе олардың топтары бір мезгілде ақпаратты тұтынушы және жасаушы,
жеткізіп беруші ретінде бола алады. Жалпы жағдайда ақпаратты аралық
тұтынушы және жеткізіп беруші ақпараттық жүйе бола алады.
Автоматтандырылған ақпараттық жүйені (ААЖ) ішкі техникалық,
бағдарламалық, алгоритмдік және тілдік құралдардың, сондай-ақ белгілі бір
ақпараттық үдерістерді тұрақты орындау үшін жасалатын, арнайы
ұйымдастырылатын ақпараттар жиыны ретінде анықтауға болады[6].
Тікелей ақпараттық жүйеде жүзеге асырылатын ақпараттарды қайта құру
үдерісін негізгі бес процедураға: енгізу, өңдеу, сақтау, іздестіру,
шығаруға келтіруге болады. Алғашқы екі процедура ақпараттың дерек
көздерімен және оларды алушылармен жүйелі байланысты қамтамасыз етіп,
ақпаратты алушыларменде жүзеге асырылады.
Ақпараттық жүйені екі топқа бөлуге болады. Арнайы тағайындалған
автоматтандырылған жүйе шеңберінде ақпараттық қамтамасыздандыру жүйесі
және дербес мақсаттық ақпараттық тағайындау және қолдану саласында бар
жүйелер. Біріншінің мысалы болып басқару жүйелері – автоматтандырылған
басқару жүйелері (АБЖ), мекемелердің автоматтандырылған басқару жүйелері
(МАБЖ), технологиялық үдерістердің автоматтандырылған басқару жүйелері
(ТҮАБЖ); зерттеу жүйелері – ғылыми зерттеулердің автоматтандырылған
жүйелері (ҒЗ АЖ), автоматтандырылған жобалау жүйелері (АЖЖ); шешім қабылдау
жүйелері және т.б. Дербес тағайындалған ақпараттық жүйе –
автоматтандырылған ақпараттық-іздестіру жүйесі болып табылады. Ақпараттық-
іздестіру жүйесі (АІЖ) реттелген құжаттар (құжаттар массивтері) жиынтығы
және ақпаратты сақтау және іздестіру үшін арналған ақпараттық технология –
мәтіндер (құжаттар) немесе мәліметтер (фактілер). АІЖ кез-келген белгілі
бір түрде ұйымдастырылған ақпараттарды ретпен іздестіру және сақтау. Оның
үстіне ақпараттық-іздестіру жүйесі автоматтандырылмаған болуы да мұмкін.
Бастысы – бұл мақсатты функция: ақпаратты сақтау мен іздестіру.
Сақтау нысанасы және сұраныс типіне байланысты ақпараттық-іздестіру екі
түрге бөлінеді: құжаттық және фактографиялық және тиісінше АІЖ-ның екі типі
құжаттық және фактографиялық түрі бар. Сондай-ақ ақпараттық-анықтамалық АІЖ
деп те аталады.
Құжаттық деп АІЖ аталады, егер мұнда құжаттар массивіне тақырыптық
сұраныс бойынша іздестіру іске асырылып, пайдаланушыға бұл құжаттардың
көпшілігі немесе олардың көшірмелері жеткізілсе. Құжат ұғымы жүйеден жүйеге
өзгеруі мүмкін. Жалпы жағдайда бұл әлдебір материялдық иеленушіде (қағаз,
фото, кинопленка, магниттік жад т.б) белгіленген (әдетте біршама белгі
жүйесі арқылы) әлдебір ақпараттық нысан және әлеуметтік коммуникациялар
жүйесінде кеңістікпен және уақытпен беру үшін тағайындалған.
Фактографиялық АІЖ тікелей нақты мәліметтерді (ғылыми техникалық
нысандардың эканомикалық сипаттамасымен, қасиеті, үдерістер, құбылыстар
мекен-жай, атау, сандық мәліметтер, т.б) сақтауды іздестіру мен жеткізіп
беруді іске асырады. Құжаттық және фактографиялық ең алдымен материалдарды
алдын ала интеллектуальды өңдеу дәрежесімен ерекшеленеді. Құжаттық жүйеде
сақтау мен беру нысандар жүйесі – тұтастай құжаттар (мәтіндер).
Фактографиялық іздестіруде сақтау мен беру нысандары – бұл белгібір нысан
немесе нысандар класы жөнінде мәләмет (фактілер) ұсынылатын арнайы формасы.
Бұл мәліметтер немесе енуде тікелей тіркеледі, немесе құжаттардан
(мәтіндерден) жазып алынады.
Мысалы, жарықтың жылдамдығы қандай-? деген сұраққа: құжаттық АІЖ-де
мақалалар мен кітаптардың тізімдері және мәтіндері бірілетін болады.
Оларда жарықтың жылдамдығы туралы айтылып, мүмкін, қойылған сұраққа жауап
болады. Ал фактографиялық жүйеде – оның қандай екендігі туралы әлдебір
формада хабар беріледі (секундына үш жүз мың километр).
Құжаттық және фактографиялық іздестірудің арасындағы басты мәнді
айырмашылық – құжаттардың семантикасына баруымен түзіледі және тиісінше
одан әрі іздестіру қажеттілігі үшін құжаттарды алдын ала өңдеу сипаты.
Құжаттық жүйеде – құжатта не туралы екендігі ал фактографиялықта жүйеде –
құжатта нақты не хабарланатыны талданады және жазылады. Тиісінше,
сұраныстың екі типін айыру керек: құжаттық (тақырыптық) – жарықтың
жылдамдығы туралы құжаттарды табу керек және фактографиялық – жарықтың
жылдамдығы қандайлығын табу.
Құжаттық жүйеде құжаттар тұтастай олардың тақырыптық, пәндік мазмұны
түрғысынан мәні жазылады. Бұл жағдайда құжат арналған негізгі тақырыптар
мен нысандарды тауып, атауы маңызды фактографиялық жүйеде нысандар
жазылады, олардың белгілері мен бұл белгілердің мағынасы белгіленеді.
Осы жерден жүйедегі жазу тілі мен жазуды сақтау әдістеріндегі айырмашылық
туады. Тиісінше іздестірудің әрбір түрі үшін өзінің іздестіру құралдары
қолданылады.
Фактографиялық жүйе құжаттар массивінде қатаң реттелген құрылғымен
жинақтау мен іздестіруді көздейді. Мұндай құрылым ақпараттық жүйеге енгенде
құжаттарды алдын ала интелектуальді өңдеу немесе мұндай құжаттардың дайын
күйінде нақты адам қызметінің саласында бар болуы, мысалы, есептік форма,
бланкілер, анықтамалықтар, кестелер т.б. Фактографиялық АІЖ ақпарат пен
іздестіруді жинақтауды тек нысанның бір типі бойынша және тек сұраныстың
бір типі бойынша қамтамасыз етеді. Мазмұны мен құрылымы бойынша сан алуан,
бірақ бұл саналуандылық әрдайым түпкі мәліметтерді сақтау мен іздестіруді
қамтамасыз ететін мейлінше дамыған фактографиялық жүйе қолданылады.
Сонымен бір мезгілде құжаттық және фактографиялық жүйелер арасында
елеулі айырмашылық жоқ. Көбіне нақты АІЖ аралас жүйелер үлгісін көрсетеді.
Мұнда фактографиялық ақпарат құжаттық іздестірудің қосымша құралы рентінде
және керсінше пайдаланылады. Құжаттық жүйеде мәтіндер (құжаттар)
фрагменттерге немесе өрістерге бөлініп құрылымдануы мүмкін, құжаттық
ақпаратты өңдеу мен беру жекеленген өрістер деңгейінде жүргізіле алады.
Құжаттық фактографиялық іздестірудің фактографиялық элементтермен сан
түрлілігі деб құжаттарды библиография элементтері бойынша жүзеге асыратын
библиографиялық іздестіруді санауға болады (автор, жылы, баспа орны, баспа
түрі, баспа, т.б). Библиографиялық сұраныс толығымен фактографиялық сипат
алады, мысалы, Атамұра баспасы 2004 жылы Мәдени мұра сериясымен
шығарған кітаптар. Мұндай сұраныс берілетін нысандар, мәлімет сияқты
бірыңғай сипатталатын белгілеуге жататын кітаптар (библиографиялық жазу,
сақтау шифрлары) мәліметтері сияқты кітаптардың өзі де бола алады. Сонда
бірінші жағдайда библиографиялық жүйе туралы, екіншіден кітапханалық
құжаттығы туралы айтады. Іс жүзінде нақты кітапханалық жүйе әрдайым
құжаттық сияқты фактографиялық түрлі типтегі бірнеше АІЖ-ның бірігуін
көрсетеді.
Тағы да жүйенің ақпараттық қисындық деп аталатын үшінші типіне де
бөлінеді. Бұл жүйелер сұраныстарға да жауап беріп, олардың ақпараттық
базада айқын түрінде жауабы жоқ. Жауап алуға әзірдің өзінде қолда бар
құжаттық немесе фактографиялық алгоритмдік туындайтын білім мен ақпараттың
экстралингвистикалық базасына жауап алуға көмектеседі. Бұл жаңа ақпарат
немесе сұранысқа жауап ретінде беріледі немесе іздестіру үшін қосымша
пайдаланылады. Бұл типтің теориялық жүйесі класс сияқты бұрыннан зерттеліп,
өңделеді. Практикада олар салыстырмалы түрде сирек және олардың кейбірі
АІЖ-ның дәстүрлі құжаттық және фактографиялық дамуын көрсетеді. Тұтастай
бұл жүйелер мүлдем әртүрлі. Олардың арасында интелектуальды-диалогтық АІЖ-
н, эксперттік жүйені, есептік-қисындық шешімдер қабылдау жүйесі (қолдануы),
білім базасы, жасанды интелект жүйесін атауға болады. Одан басқа мұндай
парасатты жүйелер автоматтандырылған сан алуан жүйелер құрамында ақпараттық
жүйешелер ретінде қолданылады және компьютермен табиғи тілде
(қатынас)өңделеді.
Ақпараттық-іздестіру жүйесінің даму кезеңдері
Ақпараттық-іздестіру жүйелері (АІЖ) нақты кез-келген белгіленген түрде
ұйымдастырылған ақпараттар қоймасы саналуы мүмкін. Мұндай жүйелердің
үлгілері ретінде кітапханалық каталотардағы архивтерді, картотека,
сөздіктер, анықтамалықтар және т.б. атауға болады. Ақпараттық-іздестіру
жүйесі – бұл кітаптардағы және тұтастай кітапханалардағы көрсеткіш болып,
ақпараттық іздестірудің мақсатты функцияларын орындайды және бұл үшін
белгілі бір түрде орналасуы және ұйымдастырылуы тиіс.
Ақпараттық-іздестіру жүйесі, басқа ақпараттық жүйелер сияқты
автоматтандырылмаған да бола алады. Бірінші арнайы ақпараттық-іздестіру
құрылысы мен жүйесі – құжаттардың іздестіру үлгілерін механикалық салыстыру
жолымен қажетті құжаттарды іріктеуді қамтамасыз ететін техникалық құралдар
болды. Бұл үшін перфокарталар, суперпозициялық карталар, жиегі
перфорацияланған перфокарталар, т.б. қолданылды. Бірақ, іздестіру жүйесін
іске асырудың негізгі құралы есептеу техникасы болып табылады.
Автоматтандырылған АІЖ-нің даму тарихы жарты ғасырмен есептеледі.Оны түрлі
көзқараспен, түрлі негіздермен зерттеуге болады. Бірақ, ең алдымен бұл даму
лингвистикалық қамтамасыз етудің дамуымен анықталып келді және бұдан кейін
анықталады да. Бұл жолда бірнеше негізгі кезеңді бөлуге болады.
АІЖ дамуының бірінші кезеңіне шартты түрде 1955-1965жж. жатқызуға
болады. Бұл кезде әсіресе ақпараттық жарылыстың проблемасы туралы белсенді
айтылды. Бұл проблема есептеу техникалары құралдарының дамуымен бірге
ақпаратты өңдеу, сақтау және іздестірудің жаңа әдістеріне
қызығушылыққа түрткі болды. Алғашқы автоматтандырылған АІЖ 60-ыншы
жылдардың басында-ақ пайда болды. Ақпараттық-іздестіру саласына
компьтерлерді ендіру үлкен перспективаларға жол ашты. Алайда бұл бастапқы
кезең буырхану және қосу ұзақ болған жоқ, эйфория сауығуға алмасты.
Толығымен автоматтандырылған интелектуальды іздестіру жүйесі жедел алу
мүмкін болмай шықты. Шектеулі, бірақ пайдалы іздестіру жүйесін жасауға
практикалық жұмыстар басталды. Сонда ғана құжаттық іздестіру өз пәні мен өз
әдістері бар жекелеген, айрықша міндеттерді көрсететіне сезілді.
Екінші кезең шарттылықтың белгілі үлесімен ХХ ғ. 60 ж. ортасы мен 70 ж.
ортасының арасына орналастыруға болады. Бұл жылдары компьютерлерді
библиотека жұмысына да ендіру басталды. Бұл ендіру қарапайым дағдылы
операцияларды автоматтандырудан басталды, алайда қауымдастықтың
кітапханалық қазынасында MEDLARS жүйесі және MARC форматы сияқты ірі
өзіндік жобалар пайда борлды. Бұл кезең үшін ақпараттық-іздестіру тілі
(AIT) және индекстік әдіске жоғары қызығушылық тән. Индекстеу сонымен бірге
қолмен жүзеге асырылды. Сол жылдардың типтік АІЖ-бұл адам –машиналық
жүйе мұнда құжаттардың мазмұнын талдау мен индекстеу қолмен
орыдалады, ал іздестіру машинамен жүргізіледі. Бұл іздестірулер
құжаттардың іздестіру бейнелерін және дескрипторлық сөздіктер
немесе тезаурустардың негізінде жасалған сұраныстың іздестіру
бейнелерін автоматты салыстырудан тұрды. Бұл АІЖ-лер әдетте, ақпаратты
іріктеу тарату тәртібін пайдаланды, және кітапханаларға байланыссыз
автономды жүйе ретінде қызмет етеді. Әсіресе бұл кеңестер одағы үшін
тән. Мұнда сол жылдары мемлекеттік ғылыми-техникалық ақпараттардың
автоматтандырылған жүйесі (ГАСНТИ) құралады.
Тұтастай бұл кезеңдегі жұмыс үшін АІЖ және АІТ дамуына АІТ-ті табиғи
тілмен салыстыру арқылы табиғи тін табу, нақты тілдер өңдеуге, индекстеу
әдістемесін өңдеу мен пайдалануға көп көңіл бөлінді. Мұнда Екінші
Крэнфилдтік эксперимент үлкен мәнге ие болды. Оның мақсаты
іздестірудің түрлі құралдары мен стратегиясының тиімділігін салыстырмалы
бағалау болды. Көптеген іздестіру құралдары парадигматикалық және
синтагматикалық қатынастарды белгілеу, синтаксистік байланыстарды тіркеу
және т.б жақсаруына әкелмейді, не негізгі сипаттамалардың (толықтық,
дәлдік) бірін елеусіз жақсарта отырып, екішісін байқаларлықтай нашарлатады.
Семантикалық және синтаксистік қуатты тілдерді қолданудың тағы бір себебі –
бұл қолмен интелектуальдық индекстеуден – автоматтандыруға өту.
Құжаттық АІЖ дамуының үшінші кезеңі шартты түрде 1975-1995 жж. жатқызуға
болады. Бұл жылдары, ғылыми пікірсайыстан соң және сыртқы технологиялық
факторлардың ықпалымен тезаурус емес деп аталатын жүйе немесе еркін мәтін
бойынша іздестіру жүйесі бұқаралық таралу алды (free-text searching
systems). Олардың ерекшелігі – бір жағынан, лексикалық бақылаудан бас
тарту және соның өзімен парадигматикалық тіркеуден бас тарту, ал екішіден –
контексті және синтагматикалық байланыстарды кеңінен пайдалану болып
табылады.
Сыртқы технологиялық факторлар машина оқитын мәліметтер базасы (МБ)
мәтіндік өрісті қоса отырып, құжаттардың қысқаша библиографиялық жазуларын
мазмұндайды – табиғи тілде көрінетін – тақырып, аннотация, реферат, және
керісінше бірқалыптандырылған лексикамен құжаттардың іздестіру бейнелерін
ұстанады. МБ әдетте бір орында – мамандандырылған мәліметтер базасын
ұйымдастырушы – генераторда құрылды. Бірақ басқаларында пайдаланылды,
өйткені құжаттарды бастапқы семантикалық өңдеу мен сұраныстарды өңдеу
үдерістері үзілген болып шықты. Бұл жағдайда ең оңтайлы болып жоғарыда
аталған жүйелер өзін көрсетті. Автоматты индекстеу саласында жақсы
нәтижелерге қол жеткізілді. Жүйелер пайда болды, мұнда автоматты индекстеу
енді өнеркәптік тәртіпте жүзеге асырылды (мысалы, Скоби АІЖ-де) [7].
Бұл кезеңнің зерттелуінің басқа бағыты – іздестіру моделі (мәніне сәйкес
өлшемді таңдау) және жүйені бағалау әдістері. Ықтималдық-статистикалық
моделге арналған зерттеулердің үлкен санына қарамастан, практикада
негізінен АІЖ-ні булевтік операторлар пайдалана бастады Булевтік жүйенің
басымдығын оның қарапайымдылығымен түсіндіруге болады. Булевтік
іздестірудің мөлдірлігі іздестірудің диалогтық құралдардың дамуымен сәйкес
келеді. Іздестірудің аралық нәтижелерін алу мүмкіндігі – іздестірулік кері
байланыс бойынша ұйғарымды түзеу мүмкіндігін қолданылған жүйенің көмегімен
іздестіру нәтижелерін қанағаттандыруға жеткілікті болып шықты.
Осылайша, 70-ж ортасында ең көп таралған және өнеркәсіптерде пайдалану
тәртібімен жұмыс істейтін жүйелер класының басымдығы қалыптасты және ұзақ
жылдар тұрды.
Бұл жүйелер класы келесі ерекшеліктерімен ажыратылады:
• АТ түйінді сөздер негізінде бұрынғы үйлестіруші типі.
• Булевтік қисын негізінде мәндік сәйкес қисындық өлшемі.
• Синтагматиканы тіркеу үшін арнайы контекстік операторлар.
• Еркін мәтін бойынша іздестіру (әдетте, ұсынылған рефераттар).
• Іздестірудің диалогтық тәртібі.
• Іздестірудің толықтығы мен дәлдігінің тиімділігін бағалау.
• Мәтіндердің кері байланысы негізінде іздестірудің басқару көрсеткіштері.
• ИРИ тәртібіндедегі іздестіру жүйесінің кең таралуы.
Бұл кезең үшін АІЖ өндіріс құрамына айналуы тән: мәліметтер құжаттық
базасы және сұраныс бойынша іздестіру машинамен оқуды жинақтауды жүзеге
асырады, қуатты коммерциялық ақпараттық қызмет пайда болады. АІЖ-ні
бағдарламалық қамтамасыздандыру нақты пайдаланушылар мен ұйымдар шарттарына
тез биімделетін салыстырмалы, қолданбалы бағдарламалар пакеттер түрінде
тарала бастайды. Тіл құралдарын бір ізге түсіру құжаттық массивтерді
алмастырудың бірыңғай қалыптарын жасауды білдіреді. Кеңестар одағында ГКФ
коммуникативтік форматы жасалды (1978-1979жж), одан соң МЕКОФ (1984-1985жж)
жасалды, бірыңғай бұйрықты тіл жасау мақсатында сұраныс тілдерін бір ізге
түсіруге әрекет жасалды. Түптің түбінде мұндай тіл жасалды да, бірақ жеке
тіл ретінде емес Z39.50 іздестіру хаттамасы құрамында жасалғанын айтуға
болады.
Құжаттық АІЖ дамытудың төртінші кезеңі 1990 жылдардың ортасында
басталды. Ақпараттық салада түбегейлі өзгерістер интернет желісінің
дамуымен байланысты өтті және электронды түрде құжаттық ақпарат көлемінің
шұғыл көшкін түрінде өсті. Бұл кезең үшін мыналар тән: базада жаһандық АІЖ
пайда болуы; электрондық құжаттарды ұсынудың арнайы тілдері; ақпараттық
массивтердің түрлік, тақырыптық, тілдік сан алуандылығы; толық мәтіндік
іздестіруге бейімделуі; өткен кезеңнің лингвистикалық қамтамасын
мұраландыру.
Қазіргі АІЖ-нің лингвистикалық компоненті техникалық және
бағдарламалықтан артта қалуда. АІЖ-ін өңдеу көбірек компьютерлік техника
бойынша бағдарламашылар мен мамандардың ісіне айналуда. Лингвистикалық
қамтамасыздандыруды жасау семантиканың, қолданбалы лингвистиканың және
ақпараттық-іздестіру теориясының көптеген проблемаларын зерттеу мен шешуді
талап ететін күрделі және кешенді проблема болып табылады. Құжаттық
іздестірудің бағдарламалық және техникалық қамтамасыздандыру саласындағы
жетістіктері түбегейлі түрде қазіргі ақпараттық жүйелердің өзгерген
бейнесімен әсер қалдыратындай көрінеді. Алайда, бұл жетістік іздестірудің
сапалы жағын бейнелейтін функциональды тиімділіктің көрсеткіштеріне сәйкес
емес. Қазіргі кездегі құжаттық ағынның қуаттылығы ерекшеліктері мынадай,
бұл ақпараттық жүйенің тиімді қызметін автоматтандыру ескі лингвистикалық
базада мүмкін емес және жаңа тілдік құралдар жасауға бағытталған
зерттеулерді талап етеді. ХХ-ғасырдың соңында электрондық құжат айналымына
толық құқығымен табиғи тіл енді. Бұл сондай-ақ ақпараттық жүйе саласында
бірінші кезекте оларды интелектуальдандыру бағытында жаңа теориялық және
практикалық өңдеуді талап етеді[8].
Құжаттық іздестіру негіздері
Релеванттылық және пертиненттік. Құжаттық типтегі ақпараттық-іздестіру
жүйесі реттелген құжаттар жиынтығын, сондай-ақ құжатты ақпарат сұранысы
бойынша сақтау, іздестіру және беру үшін белгіленген құралдар мен әдістер
жиынтығын көрсетеді. Құжаттық іздестірудің сан алуандығы заттық немесе
тақырыптық іздестіру болып табылады. Құжаттық АІЖ тақырыбы пәні бойынша
сұранысқа сай келетін құжаттар береді. Құжат, оның орталық пәні немесе
тақырыбы тұтастай ақпараттық сұраныстың ойлы мазмұнына сай келуі
релеванттылық деп аталады, ал екі және одан да көп мәтіндердің ой-пікір
жақындығы қасиеті (бұл жағдайда – құжаттық және ақпараттық сұраныс
арасында) – релеванттылық деп аталады. (ағылшынша relevant – тиісті, сәйкес
келуші).
Ақпараттық іздестіруде бұл құжатар мен сұраныстар топтары және АІЖ-нің
негізгі тағайындалуы құжаттар мен сұраныстардың мазмұнын салыстырудан және
олардың сәйкестігі немесе сәйкес еместігін туралы шешім қабылдаудан тұрады.
Бірақ АІЖ-нің бұл үшін құжаттар мен сұраныстардың мазмұнының формальді
түсінігі қалыптастырылады. Олар құжатты іздестіру үлгісі (ҚIҮ) мен сұраныс
іздестіру үлгісі (СIҮ) атауын алады және бір-бірімен салыстырылады. Сонда
релеванттылық бұл екі іздестіру бейнелерінің арасындағы қатынас деп
қорытынды жасауға болады. Екінші жағынан жоғарыда келтірілген
релеванттылықты анықтау әлдебір екінші машиналық бейнелер емес құжаттар мен
сұраныстардың өзін олардың пайдаланушы белгілі және қол жеткізерлік
түрінде сәйкестігі туралы айтылады. Бұл ұғым обьективті ме, немесе
субьективті ме деген пікірсайыс пайда болады. Сондықтан релеванттылықтың
екі түрі: мәндік және формалыдік туралы айта бастады. Ақпараттық сұраныстың
құжаттық мазмұнына сәйкестігін мәндік релеванттылық деп атайды, ал бұл
құжаттық іздестіру бейнесі берілген ақпараттық сұраныстың білдіретін
іздестіру нұсқауына сай келуі – формальды релеванттылықты құжаттық
релеванттылықтық деп аталады. Сондайақ формальды релеванттылықты құжаттық
релеванттығы, мәндік релеванттылықты-ақпараттың релеванттығы (құжат
мазмұнындағы ақпарат түрін алады) [9].
Ақпараттық қажеттілік ақпараттық іздестірудің негізгі ұғымдарының бірі
болып, іздестіруге сұраныс, адамдардың ақпаратты қажет етуінен туындайды.
Ол әлдебір міндеттер мен проблемаларды шешу үшін қажет (өзінің жеке
қызығушылығын қанағаттандыруды қоса отырып). Ақиқатында да, түрлі дәрежеде
барлық адамдарға тән, өзінің ақпараттық тұтынушылығын түпкілікті бірден
бара-бар білдіре алмауы мүмкін. Сондықтан, нақты АІЖ негізінен тек
құжаттарды іздестіруді қамтамасыз ете алады.
Ақпараттық сұраныс мұнда білдірілген ақпараттық қажеттіліктен едәуір
ерекшеленеді. Көптеген жағдайларда пайдаланушылар өзінің тұтынушылығын дәл
бейнелеуге қабілетсіз болып шығады. Мысалы паралельдік алгоритмдер сияқты
сұраныс жеткілікті түрде дәл емес болып шығады. Біріншіден, пайдаланушыға
паралельдік алгоритмдер немесе олар туралы ақпарат үлгілері ме, нақты не
қажет екені түсініксіз. Екіншіден, авторға барлық қолда бар ақпарат қажет
пе немесе тек бірнеше үлгілері қажет қажет пе және соңында қай сала –
теориялық немесе практикалық – пайдаланушыны қызықтырады. Осылайша,
пайдаланушы релеванттылық туралы пікірді шығара отырып меншікті ақпараттық
тұтынушылығы негізінде оны анықтайтын болады. Ол өте жиірек оның санасында
болады, сол кезде АІЖ сияқты релеванттылық туралы пікірді пайдаланушы
қалыптастырған сұрақ мәтіні негізінде шығарылады. Осылайша, релевантты
болу, шын мәнінде сол немесе басқа адамның тұтынушылығына сай келеді
дегендей білдірмейді. Кез-келген жүй берген құжатты екі аспектіде: сұраныс
берген пайдаланушының субьективті көзқарасы тұрғысынан (прагматикалық
әдіс) және оның табиғи тілде қалыптасқанындай сұраныс мәніне сай көзқарасы
тұрғысынан (семантикалық әдіс) қарастыруға болады. Семантика терминінде
релеванттылықтың семантикалық қатынасы сияқты пертиненттікті прагматикалық
қатынас сияқты анықтауға болады[10,11]. Алайда пертиненттік пен
релеванттылықты шектеу барлық проблемаларды шешпейді. Іс жүзінде жағдай
күрделірек, жалпы жағдайда ақпараттық іздестіруде бірінші топтың
нысандарында құжаттарда келесі мәндерді бөліп ұсынуға болады:
• құжат (физикалық мән, оны пайдаланушы АІЖ-нен ақпарат іздестіру
нәтижесінде алады);
• ақпарат (пайдаланушы құжатты оқи отырып біледі);
• құжаттық іздестіру бейнесі (құжаттың формальды көрінісі, ол іздестіруде
пайдаланылады және түрлі форма қабылдауы мүмкін тақырыптан түйінді сөздер
тізімінен, авторлар атынан, библиографиялық мәліметтерден,
аннотациялардан, үзінділерден және т.б тұруы мүмкін);
Екінші топ нысандарындағы сұраныста, келесі мәндерді бөліп көрсетуге
болады:
• проблема (пайдаланушы әлденемен қақтығысатын және өзінің рұқсат етілуі
үшін ақпарат талап етуін);
• ақпараттық қажеттілік (пайдаланушының санасында проблеманың көрінісі,
оның үстіне пайдаланушы проблеманы көз алдына дұрыс елестетпеуі мүмкін);
• ақпараттық сұраныс (табиғи тілде пайдаланушының ақпараттық
тұтынушылығының көрінісі);
• іздестіру нұсқаулығы (сұраныстың іздестіру бейнесі (СІБ) түріндегі
ақпараттық сұраныстың көрінісі және сұраныс тіліндегі іздестіруге
тапсырма).
Сонда, релеванттылықты құжаттық іздестіру бейнесінің іздестіру нұсқауына
(формальды релеванттылық) немесе құжаттық ақпараттық сұранысқа (мәндік
релеванттылық) немесе ақпарат пайдаланушы алған ақпараттық тұтынушулық
(пертиненттік) қатынасы сияқты қарастыруға болады. Релеванттылық әрбір түрі
туралы пікір қандай деңгейде қалған мәніне ықпал жасайды, деген сұраныс
туады.
Одан басқа, екінші топтағы жоғарыда аталған әрбір мәнге келесі үш
компонентті қосуға болады:
• тақырып (пайдаланушыны қызықтыратын пәндік салаға жататын нәрсе);
• міндет (табылған құжатта бойынша пайдаланушының қызметіне жататын нәрсе)
• контекст (тақырып пен міндетке жататын нәрсе, бірақ оның үстіне,
іздестіру мен іздестіру нәтижелерін бағалауға ықпал етеді).
Әдеттегідей, ақпараттық-іздестіру тақырыптық компонентке
шоғырландырылған, алайда тақырыптық сәйкестік жеткіліксіз болып ұсынылуы
мүмкін: Мысалы, пайдаланушыға міндетті орындау үшін пайдалануға болмайтын,
немесе оған белгілі сол ақпарат қажет емес. Немесе, бір жағдайда ол үшін
жалғыз құжат жеткілікті болады, басқа пайдаланушы өзінің сұраныс пәні
бойынша барынша көп әдебиетті алуға ұмтылады.
Сонда, басқа сөзбен айтылғанда, құжаттық іздестіру бейнесі (құжат,
ақпарат) бір немесе одан көп компонентке қатысты іздестіру нұсқауына
(пайдаланушылық сұраныс, ақпараттық қажеттілік, проблема) релевантты болуы
мүмкін: тақырыпқа жататын, міндеттер мен тақырыпқа жататынын релеванттылық
туралы, немесе барлық үш компонентке жататын релеванттылық туралы айтуға
болады.
Одан басқа уақыт факторы ескерілуі тиіс. Ақпараттық сұранысты
қалыптастыруда адам әрдауым өзіне қандай ақпарат шын мәнінде керек екенін
сезіне бермейді. Сондықтан оған берілген ақпараттық сұранысқа жауапты АІЖ
беретін құжаттардың мазмұны, бұл адамның өзінің ақпараттық тұтынушылығы
туралы түсінігін өзгерте алады немесе бұл қажеттілікті өрнектер
формасымен оның өзгертуіне мәжбүр етеді және оның өзімен релеванттылық
туралы пікірді өзгертеді. Релеванттылық- динамикалық құбылыс: бір және сол
сарапшы үшін құжат уақыттың белгілі бір сәтінде релевантты бола алады және
кейіннен релевантты емес, және керсінше. Құжаттардың арасында тәуелділік
бар: бірінші көрінген құжат келесісінің релеванттылығына ықпал дандыруі
мүмкін.
Демек, релеванттылықтың әрбір түрі төрт өлшемді кеңістіктегі нүкте
сияқты келесі мәндерімен қарастырылады.
• іздестіру бейнесі, құжат, ақпарат;
• іздестіру нұсқауы, пайдаланушылық сұраныс, ақпараттық қажеттілік,
проблема;
• пайдаланушы, тақырып, мәселе, контекст және олардың бар мүмкіндікті
комбинациясы;
• түрлі уақыттық интервалдар – проблеманың пайда болуынан оның шешілуіне
дейін.
Релеванттылықты анықтау әдістері. Релеванттылықтың түрлі түрлерін
анықтаудың әдістері туралы мәселе ашық күйінде қалуда. Пертинентікке
қатынастылығы айқын: оны ақпарат тұтынушы бағалауы тиіс, немесе сол басқа
құжат қаншалықты оның ақпараттық тұтынушылығына сай келеді. Мұнда
тұтынушының бағасы оның алдында тұрған практикалық сипатына, оның ғылыми
квалификациясының деңгейі мен басқа факторларына тәуелді.
Релеванттылық туралы бұл пікірді бес өлшем бойынша жіктеуге болады:
• құжаттық мәні, оның негізінде пікір шығады (іздестіру бейнесі, құжат
немесе ақпарат);
• сұраныстық мәні, оны сарапшы пікір шығару үшін пайдаланады (іздестіру
нұсқауы, пайдаланушылық сұраныс, ақпараттық қажеттілік немесе проблема);
• пікір шығарылатын компонент (тақырып, міндет, контекст);
• релеванттылық туралы пікір шығатын уақыт сәті;
• сарапшы типі (пайдаланушы және маман).
Релеванттылық – субъективті ұғым: түрлі сарапшылар релеванттылық туралы
түрлі пікір шығарады. Релеванттылықты бағалау үшін, бағалауда жетерлі
бірыңғайлықты қамтамасыз ететін формальды ережелер бойынша жүзеге асырылуы
қажет.
Релеванттылық туралы пікір өрнектерінің баламасы бар:
• Дихотомия (ия\жоқ);
• Шкалалар, мұнда релеванттылық туралы пікірлер үшін бірнеше мағына
болады;
• Релеванттылық шамасының сандық мағынасы.
Берілген проблематика бойынша жарияланымдардың едәуір саны бар.
Релеванттылық бойынша қазіргі жарияланымдар үшін жүйеге бейімделген
зерттеулерден түрлі іздестіру құралдары релеванттығына ықпалын табатын
жүйесіне бейімделген өту тән.
Ақпараттық-іздестіру жүйесінің құрамы
Ақпарттық-іздестіру жүйесі өзімен бірге сұраныс бойынша ақпартты сақтау,
іздестіру және беру үшін белгіленген құралдардың жиынтығы:
• ақпарттық массивтер (құжаттар, сұраныстар, метамәліметтер);
• ақпарттық-іздестіру тілі (АІТ), оны пайдалану және мәндік сәйкес келу
өлшемдерін, сондай-ақ басқа да бірқатар басқа лингвистикалық құралдарының
ережелерін қосатын қисындық-лингвистикалық аппарат;
• жүйенің функциясын (бағдарламалар, компьютерлер) іске асыруды қамтамасыз
ететін есептеу құралдары,
• оны пайдалануды (персонал, нұсқаулық-әдістемелік материалдар, т.б.)
қамтамасыз ететін құралдар.
АІЖ бұл құрамда нақты (жұмысшы) АІЖ деб[12], абстрактілі АІЖ-ден ерекше,
тек қана бірінші және екінші бөлігін қосатын айырмашылығын атайды. АІЖ
абстрактіден қисындық-лингвистикалық моделі туралы қалай айтуға болады, ол
бірінші кезекте іздестіру жүйесі мен сапасының типін анықтайды. Д.Г.Лахути
ақпараттық-іздестіру жүйесі (абстрактілі АІЖ) және ақпараттық-іздестіру
қызмет (нақты АІЖ) деп атайды[13].
АІЖ-нің құрамдас бөлігі жүйеше деп аталады. Жүйешеге бөлу өңдеу
мақсаттары сияқты, жүйенің қызмет дандыру технологиясын жазу үшін қажет
және пайдалы. Ол түрлі негізге ие болуы мүмкін. Әдетте АІЖ жүйешеге бөлудің
екі типін қарастырамыз: функциональдық принципі бойынша (функциональды
жүйешелер) және құралдар типі бойынша (қамтамасыздандырушы жүйешелері).
Қамтамасыздандырушы жүйешелер. АІЖ функциясын іске асыратын түрлі
құралдар қамтамасыз ететін жүйеше, немесе қамтамасыздандыру атауын алды.
Жинақталған түрде, бұлар жоғарыда аталған төрт бөлікті және нақты АІЖ-ін
құрайды. Көбіне бөлшек бөлуде мынадай жүйешелер бөлінеді: лингвистикалық
қамтамасыздандыру, ақпараттық қамтамасыздандыру, техникалық
қамтамасыздандыру, бағдарламалық қамтамасыздандыру, технологиялық
қамтамасыздандыру, кадрлық қамтамасыздандыру, т.б.
Ақпараттық қамтамасыздандыру – бұл ақпараттық массивтер (құжаттар,
сұраныс, метамәліметтер), сондай-ақ олардың жазылу, құрылу және жіктелу
құралдары мен әдістері.
Лингвистикалық қамтамасыздандыру – бұл қисындық-семантикалық аппарат, ол
ақпараттың іздестіру тілінен, қолдану ережесінен (индекстеу әдістемесі)
беру өлшемі және басқа тілдік құралдардан тұрады.
Бағдарламалық қамтамасыздандыру – бұл компорьютердің көмегімен
орындалатын АІЖ-нің барлық функциясын іске асыратын алгоритмдер мен
бағдарламалық құралдыр.
Техникалық қамтамасыздандыру – бұл ақпаратты сақтауды, іздестіру мен
жеткізіп беруді қамтамасыз ететін техникалық құралдар (компьютерлер,
телекоммуникация құралдары).
Технологиялық қамтамасыздандыру – бұл АІЖ-нің ақпаратын олардың жазылу,
ақпараттық-технологиялық схемасы және нұсқау-әдістемелік материалдарды қоса
өңдейтін автоматтандырылған және автоматтандырылмаған үдерістер мен
процедуралар орындалуының жиынтығы мен тәртібі.
Кадрлық (немсе штаттық) қамтамасыздандыру – бұл жүйемен өзара әрекет
жасайтын және оның пайдаланылуын қамтамасыз ететін адамдар (қызмет
көрсетушілер).
АІЖ-нің дамуының бастапқы кезеңінде ақпараттық-лингвистикалық
қамтамасыздандыру түрі жекелей қарастырыла бастады. Олардың арасындағы
шекарасы мейлінше жылжымалы. Жекелей алғанда көрініс пен ақпаратты жазу
тілін лингвистикалық сияқты, ақпараттық қамтамасыздандыруды де жатқызуға
болады.
Функциональды жүйешелер. АІЖ-гі әрбір жүйеше технологиялық үдерісте
белгілі бір функцияны: құжаттарды іске қосу, құжаттарды индекстеу,
сұранысты енгізу мен түрлендіру, сұраныстарды индекстеу, іздестіру, сөздік
жүргізу, статистика жүргізу, іздестірудің нәтижелерін өңдеу, құжаттар беру,
т.б. орындалады. Мұндай бөлік функциональды жүйеше деп аталады. Бұл жүйеше
АІЖ-нің моделінің құрылымын құрайды (және де үдерістік, операциялық деп те
аталады).
Сол кезде әрбір үлгі жекелей бағдарлама түріндегі интегральдық ұсақ
функциональды элементтерден тұратын өзінің құралдарымен жүйеше ретінде
құрылады. Мысалы, операциялық модуль Құжаттарды машинадан алдын өңдеу
және сұранысты қалыптастыру және іздестіру нұсқауын толтыру модульдерінен
тұрады.
Құжаттарды машинадан алдын өңдеу моделі, ол өз кезегінде мейлінше ұсақ
құрамдас элементтерге бөлуі мүмкін (операциялар): құжатты бірыңғайлау;
құжаттық қалыптық белгісі; метажазуды толтыру; индекстеу.
Сұранысты қалыптастыру және іздестіру нұсқауын толтыру моделі мынадай
элементтерден тұруы мүмкін: сұраныстың мәтінін анықтау; ақпараттық
қажеттілік; мәтін аясына бөлу; сұранысты индекстеу; мәндік кеңею;
іздестіруді шектеу тапсырмалары; нақты жүйенің сұраныс тілінде іздестіру
нұсқауын жазу.
Басқа жүйелерде, басқа жағдайларда бұл элементтердің бөліктері басқа
модульдерде (мысалы индекстеу, ендіру, сұраныстар тілінде іздестіру
нұсқауын жазу модульдерінде іздестіру модульінде, т.б. орындалуы мүмкін)
іске асырылуы мүмкін.
Құжаттық ақпараттық-іздестіру жүйесінің математикалық моделі
АІЖ жүйешелерінің композициялану әдістерін қарастыра отырып, енді жүйе
ұғымының өзін анықтаймыз. Жүйе мыналарға ие элементтер жиынтығы ретінде
анықталады:
• екі кез-келген жиынтық элементтерін элементтен элементке жалғастырып, ол
бойынша оларға өту құралына мүмкіндік береді;
• жиынтықтың жекелеген элементтерінің қасиеттерінен үздік қасиет (белгілеу,
функция) [14].
Ақпараттық-іздестіру жүйесі мұндай анықтамаға тұтастай жауап береді.
Кортеж анықтатамасын қолдана отырып, жүйені төмендегідей жазбалар
түрінде көруге болады:
У:{ { М }, { Х }, Ғ },
мұнда У – жүйе; {М } – элементтер жиынтығы; {Х} – байланыстар жиынтығы;
Ғ – жүйенің (жаңа қасиеті) функциясы.
Бұл жүйе жазуының ең қарапайымы. Жазудың күрделі жүйелердің түрлі
қасиеттеріне сәйкес сән-салтанатты жүйелілігінің 10-нан аса мүшесін
қамтитын қалыбы бар[15].
Жүйелер элементтері ретінде бірқатар маңызға ие нысандар (материалдық,
ақпараттық) әрекет етеді, бірақ олардың ішкі құрылысы бұл жағдайда
қарастырылмайды.
Жүйенің элементтері арасындағы байланыстар бір элемент екіншісіне әсер
дандыруін атайды. Ақпарттық жүйеде бәрінен көп бұл байланыстар мәлімет
берумен қорытындыланады.
Элементтердің белгілі бір тобы жүйенің жүйешедеп аталатын бөлігін
құрайды. Әрбір жүйешеөзімен бірге өзара мықты байланысы бар элементтер
тобын және әлсіз басқа топтардың элементтері (жүйеше) көрсетеді. Жүйешелер
жиынтығы олардың арасындағы байланыстарды ұсынумен жүйенің құрылымы деп
аталады.
Автоматтандырылған ақпараттық-іздестіру жүйелерінің формальды түрін
келесі көріністе жазуға болады.
У={{Мт},{Мч},{Мя},{Мн},{Мг},{Мх},{М і},{Х},Ғ}.
Мұнда Мт – техникалық құралдар (компьютерлер), Мч –адамның әрекеті мен
шешімі, Мя – тіл құралы, Мп – бағдарламалық қамтамасыздандыру, Мх –
технологиялық қамтамасыздандыру, Мі – жүйенің қалған құралдары, Х – жүйе
элементтері арасындағы байланыстар жиынтығы, Ғ – жүйе функциясы.
Жүйенің декомпозициясы мен сән-салтанатын анықтауды, жүйешені жекелеген
құралдарға бөле отырып, ал жаһандық мақсатты жергілікті ете отырып, одан
әрі күрделендіруге болады. АІЖ, барлық жасанды жүйе сияқты мақсатқа сай
жүйе типіне жатады. Кез-келген мақсатқа сай жүйені жобалау жүйенің алдында
тұрған жаһандық мақсатты, жүйешенің (модулдердің ) алдында тұрған
жергілікті мақсатты болумен және модулдің шығу сипаттамасының талаптары
сияқты әрекет етіп көрінеді. Сірә, мұндай әдісте жергілікті мақсаттарды
келісу және бөліктерді мақсатқа бағытталған жүйеге біріктіру айрықша
маңызды. Келісу әдетте күрделі, нашар қалыптасатын процедура екенін
байқаймыз.
Автоматтандырылған АІЖ түрлі типтер элементтерінен тұратын және олардың
арасындағы түрлі байланыстарға ие күрделі жүйе деп аталатын класқа жатады.
Құжаттар мен сұраныстар
Құжат сөзі латынның documentum – куәлік сөзінен шыққан. Құжаттық
ұғымы уақыт өткен сайын өзгереді, құжаттық жаңа формалары тұрақты пайда
болады. Сондай-ақ ескі формалар өзгерістерге төзеді. Қазақстандің
мемлекеттік стандартына сәйкес құжат адам қызметінің фактілері,
оқиғалары, объективті шындықтың құбылыстары мен ойлылығы туралы кез-келген
ақпараттың арнайы материалында кез-келген әдіспен бекітілетін құрал ретінде
анықталады.
Құжаттар түрліше жіктеледі. Елеулілерінің бірі құжаттар бірінші және
екінші бөліну болып табылады. Біріншіге автордан туындайтын бастапқы
ақпарат мазмұндалатын құжаттар жатады. Екіншіге-бір немесе бірнеше бріншіні
өңдеу нәтижесі болып табылады. Әдетте мұндай өңдеуді талдау-синтетикалық
деп атайды. Екінші құжаттық айрықша түрі ретінде индекстеудің нәтижесі –
арнайы ақпараттық-іздестіру тіліндегі негізгі мазмұнның жазбалары болып
табылатын – құжаттық іздестіру бейнесі (ҚІБ) түрлі формаларға ие.
Автоматттандырылған құжатты АІЖ-де бұл ең алдымен машина оқитын
формадағы табиғи тілдегі мәтіндік ақпарат. Іздестіру тұрғысынан құжаттардың
ішкі құрылымы елеулі маңызға ие; оларды өрісға бөлу және метажазу
элементтерінің барлығы. Құрылым нақты АІЖ үшін арнайы жасалуы мүмкін немесе
нақты стандарттарымен анықталады. Құрылымдану тілі, құжаттар жазуы,
құжаттардың форматтары мен кодтары да маңызды.
АІЖ- де әдетте екі массиві – бірінші және екінші контурлар деп
аталатын типтері болады. Бірінші контур деп компьютерде сақталған (сыртқы
таратушыда) іздестіру массивтері (құжаттардың іздестіру бейнелері)
ұғынылады, екіншісі – көбіне компьютерден тыс (қағазда немесе микро
таратушыда) немесе басқа компьютерлерде (мысалы, интернет желісінде)
сақталатын бірінші массиві.
Тиімді және тез іздестіруді қамтамасыздандыру үшін массивтерді физикалық
ұйымдастыру мәселесі үлкен рөл ойнайды. Әсіресе бұл толық мәтіндік
құжаттарды өңдеу мәселесі өткір болып тұр. АІЖ-ін ақпараттық қамтамасыз
етудің екінші бөлігі – бұл сұраныстар. Сұраныс табиғи тілде
қалыптастырылған ақпараттық қажеттілікті көрсетеді. Ақпарттық сұранысты
ақпарттық тілге аударудың нәтижесін сұраныстың іздестіру бейнесі (СІБ) деп
атайды.
Ақпарттық қажеттілікті, және сұраныстарды индекстеуді табу бір мәндік
шешімге ие емес күрделі семантикалық процедураларды көрсетеді. Сұраныстың
іздестіру бейнесі терминімен қатар іздестіру нәтижесі ұғымы
пайдаланылады. Мұның аясында сұраныстар тілі ұғынылады, ол өзіне өзіндік
АІТ сияқты іздестіруді басқару құралдарын да ендіреді, сұраныс тілінің
синтаксисі мен семантикасы құрылыммен және құжаттарды толықтырумен және
жүйенің жалпы міндеттерімен анықталады. Барабар іздестіру нәтижесін (ІН)
құрау үшін пайдаланушы сұраныс тілін және ақпарттық-іздестіру тілін (АІТ)
білуі тиіс, яғни құжаттардың іздестіру жүйесіндегі мазмұнындағы ұғыну,
мәнін ашу деңгейін көрсетеді.
Ақпарттық қамтамасыз етудің үшінші бөлігі беру деп аталатын
іздестірудің нәтижесі. Беру екі түрде қолданылады: құжаттардың қысқаша
жазбалары мен құжаттардың өзі жүйе қандай түрде құжаттарды түсіндіретінін
біле отырып, жүйе іздей білетіні тек қана ІН дұрыс толтыру үшін емес,
сонымен бірге берілетін нәтижелер жүйесі дұрыс мәнін ашуды қажет етеді. Кез-
келген жағдайда толтырылған ІН бойынша АІЖ орындайтын іздестіру берілген
бағдарлама бойынша мәліметтерді таза формальды компьютерлік өңдеу болып
табылады. Берілген сұраныс жүйесінде мәндік мағынасы қандай болмасын, одан
алынған жауапты пайдаланушы алады.
Ақпараттық-іздестіру тілі
Ақпараттық-іздестіру жүйесінің аса маңызды компоненті ақпараттық-
іздестіру тілі болып табылады. Адам құжаттар жиынтығынан қажетін алу үшін,
оның мазмұнын оқуы немесе қарауы тиіс. Бұл процедурюны жеделддандыру мен
оңайлату үшін құжаттар мазмұны қысқартылған жазбасының түрлі формалары –
аннотациясы, рефераттар, каталогтар пайда болды. Алайда барлық бұл
жағдайларда құжаттарды олардың қысқартылған жазбалары бойынша іріктеуде
табиғи тіл пайдаланылады. Тілді түсіну актісі сигнитивті мәнге арқа
сүйейтіні белгілі, ол айқын білдірілген мәтінде (сөзде) тілдік белгілермен
күрделі қатынаста болады. Тілдік белгілердің мұндай кемшіліктері
омонимия, синонимия көп мағналы сияқты жақсы белгілі, көптеген сөздердің
дәл мағнасын тек контексте ұғыну мүмкін. Бұл ұғымдық ақпаратты белгілеу мен
бірдейлендіру үшін табиғи пайдалануға кедергі келтіреді. Бірақ бұл
асимметризмжәне алогизм тілдік белгілермен аяқталмайды. Тілдегі бір
мағналылық және көп мағналылық тек лексикаға емес, грамматикаға да жатады.
Бір және сол грамматикалық қатынастар түрліше білдіріле алады, сөйтіп бір
және сол формалар түрлі грамматикалық мағнаға ие бола алады. Одан
басұғымның мәндік қатынасын түсіну тұрғысынан елеулі, мысалы тек-түр
қатынасы ешқандай ттабиғи тілдің лексикалық және грамматикалық жүйесінде
айқын бейнеленбейді.
Сондықтан келесі іздестіру мақсатында құжаттық ақпаратты сақтау үшін
тағайдалған формальды жүйелер арнай ақпараттық тілдер жасауды талап етті.
Табиғидан үздік және жіктеу атауын алған мұндай алғашқы тілдер кітапхана
үшін құрылуы ықтимал. Компьютерді ақпараттық іздестіруге ендіру ақпараттық
тілдерді одан әрі дамыту мен формалдандыруға қалыптастырды. Ақпараттық-
іздестіру тілдері белгілік жүйесін өз әліппесімен, лексикасымен,
грамматикасымен және пайдалану ережесімен көрсетеді. Барлық жасанды тілдер
қандай да болмасын табиғи тілдер негізінде жасалды және жасалатынын
байқаймыз.
Ақпараттық-іздестіру тілдеріне негізгі талаптар мынадай:
• айтылу жоспары мен мазмұн жоспарының арасындағы бір мағыналылық (әрбір
лексикалық бірлік бір ұғымға сай келеді, және керсінше);
• әрбір ұғым бірыңғай атауға ие (АІЖ-гі әрбір жазба тек бір мағынаға ие);
• жеткілікті семантикалық күш (құжаттар мен сұраныстардың мазмұнындағы
барлық мәнді толығымен және дәл белгілеуге қабілеттілігі);
• ашықтығы (тілді түрлендіру және толықтыру мүмкіндігі).
Мағыналық сәйкестіктің өлшемі
Құжаттар мен сұраныстарда салыстыруда сұранысқа қатынасы бойынша
құжаттық релеванттығын анықтау және сол сұранысқа құжатты беру немесе
бермеу туралы шешім қабылдау талап етіледі.
Ереже, оның негізінде құжат пен сұраныстың релеванттығы дәрежесі, яғни
ҚІБ пен СІБ-не сәйкес формальды анықталып, мағыналық сай келудің өлшемі
(МСӨ), немесе беру өлшемі (БӨ) деп аталады. Құжатты жазу, релеванттылық деп
танылған сұраныс (немесе өзі), файлға іздестіру нәтижелері орналастырылады
немесе беруге деп айтылғанындай орналастырылады. Нақ сондықтан беру
өлшемі термині пайда болды, бәлкім, формальды релеванттылық құбылысына
мейлінше сай ретінде тіпті артығырақ көрінетін болады.
Барлық қолданылатын БӨ екі үлкен топқа бөлуге болады: сандық және
қисындық. Біріншісі сандық параметрлермен іс жүргізеді, және олардың
негізінде әрбір құжат-сұраныс жұбы құжаттар мен сұраныстардың мағыналық
жақындығы (ұқсастығының) сандық мағынасы есептеледі. Бұл ұқсастық
коэффицентін кеміту тәртібімен құжат жеткізіп беруді маңызына қарай істеуге
мүмкіндік береді, сондай-ақ берілген бастау мағынасына байланысты
құжаттардың әлдебір санын береді.
Ұқсастықтың математикалық моделі мен коэффицентін есептеу өрнегі
әртүрлі болуы мүмкін. Бірінші іздестіру жүйесінде БӨ ҚБ (ҚІБ) пен СБ (СІБ)
көптеген терминдерінің кесіп өту, қыйылысудың теориялық–жыйындар
операцияларына негізделеді. Мұндай кесіп өтудің дәрежесі пайызбен
анықталады. Бұл жағдайда R беру өлшемі мағынасының шамасы мына формула
бойынша анықталады :
R = (M N) * 100 %.
Мұнда М – ҚБ және СБ терминдерін іздестіруде сай келетіндердің
саны, N – С1Б терминдерінің жалпы саны .
1. Беру өлшемі бұл жағдайда бастапқы мағына ретінде, пайызбен
білдіріліп беріледі, оның релеванттылық деңгейі жоғары тұрады.
Шеткі жағдай 100 ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz