Мұрағаттық құжаттарды цифрлық форматқа айналдыру технологиялары, отандық және шетелдік тәжірибе
1.2. Мұрағаттық құжаттарды цифрлық форматқа айналдыру технологиялары, отандық және шетелдік тәжірибе
Соңғы он жылдықтарда заманауи ақпараттық технологияларды қоғамның көптеген салаларында енгізуге ерекше мән берілді. Мұрағаттауда шет қалған жоқ. Қазір таңда ақпарат құралдарында құжаттарды цифрландыру арқылы алынған ақпараттық ресурстар саны көбейіп келеді. Дәстүрлі дереккөздерді цифрландыру және түпнұсқаларын біртіндеп жою жобаларын жүзеге асыру біртіндеп кеңтаралған тәжірибеге айналуда.
Мұрағат қызметкерлерінің басты бағыттарының бірі мұрағат қорының электронды көшірмелерін жасау үшін құжаттарды цифрландыру болып табыладыі. Цифрландыру дегеніміз арнайы техникалық құралдар көмегімен құжаттарды дәстүрлі (қағаз) түрден электронды (цифрлық) түрге аудару.
Мұрағаттауда қазіргі заманғы компьютерлік технологияларды қолдану мәселелері жаңа нәрсе емес.Бұл мәселе тіпті 1980 жылдардың басында зерттеушілердің еңбектерінде көтерілді.Бірқатар мақалалар мен жұмыстар архивтердегі құжаттарды цифрландыру, құжаттардың электрондық көшірмелерін қолдану, мұрағаттың электрондық базасына қолжетімділік мәселелерін қарастырды. Мұрағат қорын цифрландыру мәселесіне аса назараударылады әсіресе шет елдерде электрондық көшірмелерді жасау және пайдалану технологиясының мәселелері қарастырылады. Сонау 1980 жылдары шет елдерде қажетті нормативтік құжаттар дайындау басталды.Осы бағыттағы алғашқы құжаттардың бірі АҚШ-тың ANSI AIIM MS44 стандарты болды Сканерленген кескіндердің сапасын бақылауға арналған нұсқаулық . Бұл жерде негізгі терминдер, негізгі параметрлері және сканерлеу сапасын бағалау критерийлері, оларды практикалық түрде қолдану тәсілдері берілген.
Қазақстанда құжаттардың электрондық архивін құру қызметі құжаттардың көлемін ұлғайту көмектеседі.
Мұрағат көлемінің артуына байланысты құжаттарды іздеу уақыты артып келеді және соның салдарынан жұмыстар тоқтап қалады. Бұл мәселенің тиімді шешімі - құжаттарды сканерлеу, электронды мұрағатты ұйымдастыру және құру. Электронды архивтер қазіргі заманғы ұйымдардың тиімді жұмыс істеуі үшін қажетті бір шартына айналды.
Электрондық архивтің басты міндеті - барлық мүдделі тұлғаларға қажетті құжаттарға жедел қол жетімділікті қамтамасыз ету. Дәстүрлі мұрағаттағы физикалық белсенділікті төмендету..
Электрондық архивті қолданудың қандай артықшылықтары:
* Экономикалық орнықтылығы:: құжаттарды сақтауға кететін шығындар құны 80 есеге дейін төмендейді!
* Қауіпсіздікті және конфиденциальдық құқықтарды сақтау: электронды құжаттарды сақтау орны заңсыз әрекеттерден сенімді қорғалады.
* Құжаттармен жұмыс істеу тиімді: электронды мұрағатты қолдану жылдамдығы ең талапшыл қолданушыныда қанағаттандырады..
* Сенімді әрі тұрақты:тозу және құжаттардың жоғалу қаупі минималды күйде болады.
* Көптеген қолданушыр режимі: бірнеше қолданушылар бір уақытта бір құжаттармен жұмыс істей алады, бұл кәдімгі дәстүрлі мұрағатты пайдалану кезінде қол жетімсіз.
* Қашықтан қол жетімді: архивті ресми және заңды мақсаттарда қолдану үшін қашықтықтан қол жеткізуге болады.
* Аналитикалық жұмыс: құжаттарды жылдам, ыңғайлы және дәл есепке алу кез келген қажетті жинақтарды құрастыруға және талдауға мүмкіндік береді.
Қазіргі уақытта біздің елімізде қағаз архивтерін цифрландыруға Мемлекеттік бағдарламалар белсенді қолдау көрсетеді, мысалы:
* Елбасының Қазақстан халқына жолдауы Үшінші жаңғыру: жаһандық бәсекеге қабілеттілік;
* Цифрлық Қазақстан бағдарламасы;
* Архив-2025 бағдарламасы.
Мұрағат қорының сақталуын қамтамасыз ету мәселелері кез келген мұрағаттың әрқашан басында тұрған. Егер бұрын мұрағаттық құжаттар микрофильмдерге, фотосуреттер мен фотокөшірмелерге көшірілсе,қазір жаңа ғасырдың талабы бойынша біз өз жұмысымызға заманауи жұмыс әдістерін енгізіліп жатыр.
Негізгі технологиялық кезеңдер:
1. Құжаттарды дайындау және сараптау, өңдеудің әр түрлі деңгейлері үшін массивтердің көлемін анықтау; әртүрлі типтегі құжаттарды өңдеу технологиясын жасау.
Бұл кезеңде мыналар жүзеге асырылады: құжаттарды сұрыптау, мұрағаттық өңдеу, қажет болған жағдайда қапсырмаларды оларды кейін қалпына келтіре отырып алып тастау, оларды қалпына келтіре отырып құжаттарды шашыратып жинау; стандартқа сай емес көлемдегі парақтарды және зақымдалған парақтарды кейіннен қолмен планшетті сканерлер арқылы сканерлеу үшін немесе бір форматқа келтіру бөліп алу.
Құжаттар архивін цифрландыру - бұл Қазақстандағы құжаттардың электрондық архивін құру және толтыру қызметі. Мұндай есептеуді тек мұрағат ісі, техникалық, қаржылық немесе басқа құжаттама болсын, құжаттарыңызды цифрландыру технологияларын білетін адам ғана жасай алатыны анық. Сондықтан кез-келген цифрландыру жобасы олардың жағдайын бағалайтын, қажетті жұмыстар мен жабдықтардың тізімін қалыптастыратын сарапшының құжаттарды тексеруден басталады.
2. Ағынды сканерлеу және мұрағатталған құжаттарды қалпына келтіру.
Бұл кезеңде суреттің максималды айқындылығын, ескі мұрағатталған құжаттар үшін фондық сүзгілеуді, құжаттарды қарапайым бірмәнді сәйкестендіру үшін бірегей мұрағат нөмірлерін басып шығару үшін сканерлеу параметрлері таңдалады.
Бұл кезеңнің тиімділігі көбіне қолданылатын жабдықтың сапасымен анықталады.Заманауи желілік сканерлер құжаттарды автоматты түрде беру жүйесімен жабдықталған, бұл қол еңбегін азайтуға және бір сканерге минутына 200 суретке дейін цифрландыру жылдамдығына қол жеткізуге мүмкіндік береді.
Сканер дегеніміз - компьютерге сурет кескіндерін, мәтін түрінде берілген сызбаларды, слайдтарды, немесе басқа графикалық ақпараттарды енгізуге мүмкіндік беретін құрылғы. Жарық көздері, айналар мен линзалар сканердің құрылымдық элементтері болып табылады және сканерленген кескіннің сапасына тікелей әсер етеді. Сканердің оптикалық жүйесі кареткаға мықтап бекітілуі керек, ал оның жеке бөліктері олардың өзара орналасуын өзгертпеуі керек. Мысалы, егер ауытқу айналары линзалармен қатаң байланыспай сканерлеу кезінде олардың бағытымен бірге қозғалса, онда оптикалық жүйенің фокустық қашықтығы өзгеріп, соның кесірінен кескіннің бұрмалануына әкелуі мүмкін.
Сканер қолданылған жарық көзі біркелкі спектрлік сипаттамаға ие болған жағдайда ғана түпнұсқадағы барлық түстерді тани алады. Сондықтан идеалды көз спектрдің барлық түстерінің жиынтығынан - күлгіннен қызылға дейін пайда болатын ақ жарық шығаруы керек.
Жасыл жарық диоды жарық көзі ретінде пайдаланылған кезде спектрдің орта бөлігі жартылай талапқа сай келмейді, сондықтан түпнұсқаның барлық түстері тиісті деңгейде анықталмайды. Мұндай анықталмайтын түстер сканер сипаттамасында көрсетілуі керек. Өкінішке орай, сканер өндірушілердің көбісі осы маңызды ақпаратты арнайы техникалық құжаттамада көрсете бермейді.
Қарапайым көзге жарық көзінің сәулелену сапасын дұрыс бағалау қиын, өйткені ақ болып көрінетін жарық спектрлік таралуы біркелкі болмауы мүмкін. Мысалы, ақ флуоресцентті жарық түс сары түсті дәл шығармайды.
Әрқайсысы өзінің спектрлік сипаттамаларымен ерекшеленетін көптеген жарық көздері бар. Сканерлерде галогендік шамның артықшылығы - оның біркелкі спектрлік реакциясы және сәулеленудің жоғары қарқындылығында. Кемшілігі - көп жылу пайда болады, сондықтан оны салқындату үшін желдеткіш қажет болады.
Планшеттік сканерлерде вольфрам галогендік лампалары немесе төмен жылу флуоресцентті суық катодты көздері қолданылады. Бұл сканерлеу механизмін түпнұсқаға жақын орналастыруға және оның ұзақ уақыт қызмет көрсетуіне мүмкіндік береді, сол арқылы түсірілген кескіннің сапасын жақсартады.
Сканерлеуді кейде сандық кодтау деп те атайды, өйткені ол аналогтық жарық сигналын компьютер түсінетін цифрлық түрге айналдырады. Сканерлеу терминін цифрлық кескін алу деп түсіну керек - визуалды ақпаратты сандыққа түрлендіру процесі. Сондықтан компьютерге енгізу үшін түпнұсқаларды дайындау көбінесе цифрландыру деп аталады. Сонымен бірге кескін пиксель деп аталатын элементар бөлшектерге бөлінеді, олардың әрқайсысы өз жарық параметрі мен түс реңктерінің белгілі бір кодына сәйкес келеді.
Сканерлер суреттерді түсірудің әртүрлі әдістерін жүзеге асырады. Егер сенсор қабылдаған жарық мөлшері алдын ала орнатылған шектен аспаса, түпнұсқаның түсірілген элементі қара ретінде қабылданады. Әйтпесе, оған ақ түске немесе сұр реңкке сәйкес код мәні беріледі.
Кейбір сканерлер сезімталдық шегін реттеуге мүмкіндік береді. Бұл сканерленген түпнұсқалардың суреттерін жарық параметрлерінің кең ауқымын алуға мүмкіндік береді - сондықтан қағаз құрылымы кескін элементтері ретінде қабылдана бастайды. Жарық параметрлерін өзгертуге арналға бағдарламалар көмегімен сұр түс деңгейін өзгертуге мүмкіндік береді.
Түрлі-түсті сканерлерінің жұмыс істеу принципі жоғарыда сипатталғанға ұқсас, тек бұл жағдайда сезімталдық шегі түстерді қалыптастыру жүйесінің негізгі түстерінің әрқайсысы үшін анықталады.
Сурет көзінің әрбір элементі туралы ақпаратты дәйекті түрде оқып, сенсор бүкіл кескін түсірілгенге дейін оның бойымен қозғалады. Бұл өте тез орындалады - сканерлеу процедурасы әдетте бірнеше секундты ғана алады.
Бейнелеу әдісі
Сканерлеу кезінде түпнұсқа жарық көзі арқылы жарықтандырылады. Шағылған жарық сенсорға сызық түрінде немесе жарыққа сезімтал элементтердің матрицасы түрінде арнайы оптикалық жүйені қолдана отырып жіберіледі, олар алынған жарықтың қарқындылығын сәйкес кернеу мәніне айналдырады. Аналогтық сигнал сандық форматқа ауысады және бұл формада кескін туралы ақпаратты компьютерге енгізуге болады.
Жарыққа сезімтал датчиктер
Қазіргі заманғы кескінді цифрландыру құрылғыларында мәліметтерді оқу технологиясы негізінен екі түрлі жарыққа сезімтал датчиктерді қолдануға негізделген: фототүсіргіш түтіктер немесе зарядпен байланысқан құрылғылар. Барлық енгізу құрылғыларында қолданылатын аналогты-сандық түрлендіргіштер немесе компараторлар оқылған ақпаратты компьютер оқитын сандық мәліметтерге айналдырады.
Зарядпен байланысқан құрылғылар ЗБҚ сенсорлары - бұл интенсивтілікке пропорционалды электр зарядын шығаратын, жарыққа сезімтал көптеген кішкентай элементтерден тұратын қатты күйдегі электрондық компонент. ЗБҚ жұмысы кәдімгі жартылай өткізгіш диодтың pn-өткізгішінің жарықтану дәрежесіне тәуелділігіне негізделген.
Сканерлеу кезінде сіз қайта өңдеуді минимальды нәтижеге жетуіңіз керек. Түпнұсқаны алдын-ала тексеру өте маңызды, өйткені оның сипаттамалары сканерлеу режимін таңдауды және кескінді кейіннен өңдеу режимдерін анықтайды.
Түпнұсқа кескін әдетте бірнеше сипаттамаларға сәйкес жіктеледі: тон, түс және тасымалдағыш түрі. Түпнұсқаның тональды сипаттамасы ең алдымен бағдарламалық жасақтама құралдарымен кескінді өңдеу әдістерін анықтау үшін маңызды, ал сканер типін таңдауға негізінен кескіннің түс сипаттамасы мен графикалық ақпарат тасымалдаушы типі әсер етеді.
Түстер құрамы бойынша түпнұсқалы құжаттар мен сканерлер ақ-қара, сұр реңді және түрлі-түсті болып бөлінеді.
Ақ-қара сканерлер
Ақ-қара сканерлер ақ немесе қара түстерді шығару режимінде жұмыс істейді. Сканерленген кескін ақ жарықпен жарықтандырылады.
Бұл үшін әдетте флуоресцентті лампа қолданылады. Редукциялаушы линза арқылы шағылысқан жарық ЗБҚ сенсорының жарықтандырғыш жартылай өткізгіш элементтеріне енеді.
Сканерленген кескіннің әр сызығы жарыққа, сезімтал элементтің шығуындағы кернеу мәндеріне байланысты сәйкес келеді. Бұл кернеу мәндері компаратор көмегімен сандық түрге ауысады. Компаратор ЗБҚ-дан кернеуді немесе токты эталондық мәнмен салыстырады және шығыуында 0 (ақ) немесе 1 (қара) сигнал шығарады.
Бұл сканерлерде сезімталдық шегі параметрі бар, ол әр түрлі түпнұсқаларды сканерлеуге мүмкіндік береді, тым ашықтан қараңғыға дейін.
Сұр реңкті сканерлер
Сұр реңктегі кескіндердің сандық көрінісі үшін жарық параметрлерінің градациясы ұғымы енгізілген. Сұр реңктегі сканерлер компьютерге әр сканерленген кескін нүктесінің жарықт параметрінің мәнін жібереді. Сканерленген кескінді жарықтандыру үшін әдетте ақ флуоресцентті лампа қолданылады. Жарық параметрлерінің 16, 64 және 256 градациясын ажырата алатын сканер модельдері бар.
Сұр реңді сканердің функционалдық диаграммасы іс жүзінде оның ақ-қара аналогынан ерекшеленбейді, тек аналогтық-цифрлық түрлендіргішті қолдану қажеттілігін қоспағанда, бит тереңдігі қолдау көрсетілетін сұр деңгейлер санына байланысты Мысалы, 256 сұр деңгейлерін қолдайтын сканер 8-разрядты ADC-мен жабдықталуы керек.
Түрлі-түсті сканерлер
Түрлі-түсті сканер негізгі түстерді (қызыл, жасыл және көк) ажырата білуі керек. Ол үшін түрлі технологиялар қолданылады. Мысалы, бір жарық көзі бар түрлі-түсті сканерде түпнұсқаны жарық көзі мен түпнұсқа арасында кезек-кезек орналастырылған әр түрлі сүзгілерді (қызыл, жасыл, көк) дәйекті түрде қолдану арқылы үш рет өту арқылы сканерлеуге болады. Сканерленген кескін ақ жарықпен тікелей емес, айналмалы RGB сүзгісі арқылы жарықтандырылады.Негізгі түстердің әрқайсысы үшін операциялар реттілігі іс жүзінде сұр реңкті сканерлеу кезіндегі әрекеттердің кезегінен ерекшеленбейді. Сипатталған әдістің маңызды кемшіліктері сканерлеу уақытының үш есе артуы және түрлі-түсті қабаттарды дұрыс араластыру қажеттілігі болып табылады,әйтпесе кескін бұлыңғыр болуы мүмкін.
Басқа сканерлер үш жарық көзін қолдана алады: қызыл, жасыл, көк; сканерлеу бір рет орындалады және жарық көздері өз кезек-кезек өзара әрекеттеседі, қысқа уақыт ішінде түпнұсқаны жарықтандырады. Бұл әдіс түстердің сәйкессіздігін болдырмайды, бірақ тағы бір қиындық пайда болады - тұрақты сипаттамалары бар жарық көздерін таңдау.
Кейбір түсті сканерлерде бір жарық көзі қолданылады, бірақ түстердің түпнұсқалары бір жолда сканерленеді. Мысалы, Seiko Instruments фирмасының SpectraPoint түрлі-түсті планшетті сканерінде ЗБҚ элементтерінің орнына үш жолға орналастырылған фототранзисторлар қолданылады және фототранзисторлардың әр сызығы редукция қолданбай тек өз түсімен жарықтандырылатын етіп үш түсті сүзгі орналастырылған.
3.Құжатты енгізу, тану және индекстеу
Бәлкім бұл көп уақытты қажет ететін кезеңдердің бірі болар.Бұл кезеңде мыналар жүзеге асырылады: құжат кескіндерін өңдеу және мәтінді тану; құжаттардың деректер базасын құру, индекстеу және электронды тасымалдағыштарға жазу; танылған ақпараттың дұрыстығын тексеру; мәтінді тану жүйелерін қолдана отырып мәтіндік құжаттарды енгізу, кестелерді енгізу, суреттер мен сызбаларға ескертулер енгізу, ақпаратты енгізудің дұрыстығын көзбен тексеру; мәтінді тану жүйелерін қолдана отырып формаларды толтыру немесе қағаз құжаттардың электрондық мұрағатына деректерді қолмен енгізу.
OCR бағдарламалық жасақтамасының компоненттері тану сатысында қолданылады. Алынған жазбалардың сапасы машиналық оқуға арналған сауалнаманың дайындық деңгейіне және бағдарламалық жасақтаманың алдын-ала конфигурациясының мұқият болуына байланысты.
Оптикалық таңбаларды тану (OCR) - қолмен жазылған, машинкаға басылған немесе басылған мәтін кескіндерін мәтіндік мәліметтерге механикалық немесе электрондық аудару - компьютердегі таңбаларды бейнелеу үшін қолданылатын кодтар тізбегі.Тану кітаптар мен құжаттарды электронды түрге ауыстыру, шаруашылық есеп жүйелерін автоматтандыру немесе мәтінді веб-бетте жариялау үшін кеңінен қолданылады. Оптикалық таңбаларды тану (OCR) сізге мәтінді өңдеуге, сөзді немесе сөз тіркесін іздеуге, оны ықшам түрде сақтауға, материалды көрсетуге немесе сапаны жоғалтпастан басып шығаруға, ақпаратты талдауға, сөйлемге электронды аударманы қолдануға, пішімдеуге немесе мәтінді түрлендіруге мүмкіндік береді.Оптикалық таңбаларды тану (OCR) - бұл үлгіні тану, жасанды интеллект және компьютерлік көру саласындағы зерттеу мәселелерінің бірі.
OCR жүйелері белгілі бір қаріппен жұмыс істеу үшін калибрлеуді қажет етеді; алдыңғы нұсқаларында бағдарламалау үшін әр таңбаның кескіні қажет болды, бағдарлама бір уақытта тек бір қаріппен жұмыс істей алатын. Қазіргі уақытта ең кең таралғаны қаріптердің көпшілігін жоғары дәлдікпен танитын ақылды деп аталатын интелектуальды жүйелер. Кейбір OCR жүйелері суреттер, бағандар және басқа мәтіндік емес компоненттерді қоса, мәтіннің бастапқы пішімін қалпына келтіруге қабілетті.
4.Индекс ақпаратын мәліметтер базасына сақтау және түсіру, электрондық кескіндер массивін құру және электронды құжаттарды электрондық тасымалдағыштарға жүктеу,ақпараттық жүйеге интеграциялау
Соңғы кезеңде мыналар орындалады: суреттерді TIFF, JPEG, PDF, BMP форматтарында сақтау, кескіндердің көлемін ықшамдау, электронды түрде де құрылымы дәстүрлі құжаттар толық сәйкес келуі, мұрағаттық базаны қажетті форматқа жазу , CD DVD дискілеріне деректер жазу.
Цифрландырылған мәліметтер әрі қарай талдау үшін қажетті форматқа жүктеледі.
Шетелдік тәжірибе. Мұрағат құжаттарын цифрландыру бойынша жобаларды іске асырудың әлемдік тәжірибесінде жобаларды кешенді ұйымдастырудың бірыңғай халықаралық стандарттарын әзірлеу мен қолдануды көздейтін дәлелденген әдіс бар.Сонымен, сканерлеу саласындағы біртұтас ұлттық тәсілдердің мысалы ретінде қоғамдық талқылау үшін жария доменде орналастырылған ұлттық өзара әрекеттестік тұжырымдамасының стандарттары (Юбола алады. Ұқсас стандарттар - цифрландыру бағдарламалары мен жобаларын басқаратын NSW болашақ дәлелдеуі - Австралияда 2008 жылдан бастап қолданысқа енгізілген. Олардың авторы және жасаушысы - NSW State Records Office, Австралия, NSW State Records], ол 2012 жылы Нұсқаулықты қазіргі заман талабына сай өзгерту мақсатында қоғамдық талқылау өткізді. Нұсқаулықтың жаңа редакциясында дербес бөлім пайда болды - Цифрландыру жобаларын басқару.
Нұсқаулықтың осы бөлімінің мазмұнына тоқталған жөн. ол архивтік құжаттарды цифрландыруға арналған жобаларды интеграцияланған ұйымдастыру мен басқару идеяларын шоғырланған түрде жеткізеді, яғни. өзара үйлесімділік тұжырымдамасына кіретін барлық нәрсе. Атап айтқанда, онда: Жобаның мақсаттары мен көлемін нақты анықтап, құжаттарды мұқият таңдау маңызды. Жоспарлау, жобаларды басқару әдістемесі және дұрыс процедуралар цифрландыру үдерісін басшылыққа алуы керек, ал қызметкерлер өз міндеттерін орындау және өзгерістерді қабылдау үшін тиісті дайындықтан өтуі керек. Цифрландыруды өздігінен жүзеге асыру керек пе немесе оны аутсорсингке беру керек пе, қажетті жабдықтар туралы және берілген тапсырмаларды шешуге графикалық кескіндердің жарамдылығын қамтамасыз ететін техникалық стандарттар мен метадеректерді таңдау критерийлері туралы шешім қабылдау керек, сонымен қатар құжаттардың негізгі сипаттамаларын сақтай отырып ... Цифрландыру сапасын бақылауды қамтамасыз ететін шаралар анықталып, жүзеге асырылуы керек .
Нұсқаулықта келтірілген мәселелер осы Нұсқаулықты құру мақсаттарымен толық сәйкес келеді, бұл құжаттарды электронды форматқа аудару процестерін реттейтін нормативтік-әдістемелік құжаттама жасау проблемалары әр түрлі елдер үшін де, әр түрлі қор иелері үшін де тән деген ойды растайды.
Осы Нұсқаулыққа және Жаңа Зеландияның S6 цифрландыру стандартына сүйене отырып, екі жыл бұрын, 2010 жылдың күзінде, Халықаралық стандарттау ұйымы ISO TR 13028-2010 Техникалық есебін Ақпарат және құжаттама - ұйымдастыру бойынша нұсқаулық. жазбаларды цифрландыру . Есепте қағаздың түпнұсқасы немесе басқа электрондық емес бастапқы құжаттар оған цифрландыру немесе басқа тәсілмен аударылғаннан кейін таза электрондық түрде құжаттарды құру және жүргізу бойынша ұсыныстар бар. Есепте цифрландыру үдерісінің құжаттардың сенімділігі мен нақтылығына қойылатын талаптарға сәйкес келуін қамтамасыз ететін дәлелденген тәжірибені көрсететін ұсыныстар бар. Сонымен қатар келесі мәселелер бойынша нұсқаулық бар:
-Дәлел ретінде пайдалану мүмкіндігіне және олардың болжамды мәніне әсер ететін цифрландырылған құжаттардың сенімділігі;
-Цифрландырылған құжаттардың қажеттілігі болған кезде олардың болуы;
-Ұзақ мерзімді сақтауға жарамды цифрланған құжаттарды құруды жеңілдететін стратегиялар;
-Электрондық емес бастапқы құжаттарды цифрландырудан кейін басқару.
Техникалық есеп барлық цифрландырушы ұйымдардың қолдануына арналған және ISO 15489-1: 2001 Ақпарат және құжаттама - Құжат айналымы - 1 бөлім: Жалпы ережелеріне және ISO TR 15801: 2009 Техникалық есеп құжатына сәйкес әзірленген. менеджмент - Ақпарат электронды түрде сақталады - Сенімділік пен сенімділік бойынша ұсыныстар.
Шетелде цифрландырудың қазіргі проблемаларын еңсеру бойынша әртүрлі ұйымдардың күш-жігерін үйлестіруді Халықаралық архивтер кеңесі жүзеге асырады, ол 2008 - 2018 жылдарға арналған стратегиялық курс бағдарламалық құжатында оның қызметінің негізгі бағыттарын көрсетті. Олардың ішінде маңызды орны: Тарихи құнды архивтік құжаттардың электрондық құжаттарын және сандық көшірмелерін сақтау проблемаларын шешу, сондай-ақ жаңа технологияларды пайдалану мұрағатқа қол жетімділікті жақсарту.
Мұрағаттық және кітапханалық қорларды цифрландыру жөніндегі шетелдік жобаларды қарастыру кезінде Evropeana цифрлық кітапханасының еуропалық интеграциялық жобасын атап өткен жөн ,оның мақсаты кітаптар мен архивтік құжаттардың сканерленген беттеріне қол жетімділікті қамтамасыз ету болып табылады. еуропалық мәдениеттің әр түрлі аспектілері. Жоба ресми түрде 2008 жылдың 20 қарашасында басталды. Жоба басталған кезде 2 миллион түрлі мұрағат көздері мен еуропалық мәдени мұра нысандары цифрландырылды. 2010 жылдың аяғында әзірлеушілердің кепілдіктері бойынша бұл көрсеткіш 6-10 миллионға, 2015 жылға қарай 15 миллионға жетті.
Бұл жобаның жетекшілері мен әзірлеушілері өздерін цифрландырылған коллекциялардың еуропалық интеграторлары ретінде санайды және сандық кітапхананың басты міндетін цифрлық мұраға қол жетімділікті ұйымдастыруда көреді. Бұл ретте архивтік, мұражайлық және кітапханалық қорлардағы заттар болып табылатын осындай күрделі объектілердің электрондық көшірмелерін жасаудың әдістері, технологиялары мен жабдықтарын таңдау мәселелері архивтер, кітапханалар мен мұражайлардың қызметкерлеріне қалдырылады. Бұл позиция өзінің жарқын көрінісін 2010 жылдың қазан айында Europeana Open Culture 2010 жобасы аясында өткізілген конференцияда жасалған баяндамаларында тапты.
2011 жылдың басында Еуропалық Комиссияның Comite des Sages Цифрландыру бойынша ЕС ұсынымдарын жариялады және еуропалық мәдени мұра бойынша цифрланған ақпараттық ресурстарға on-line қол жеткізуді ұйымдастырды. Бұл құжат цифрлық мазмұнға қол жетімділіктің ұйымдастырушылық және құқықтық аспектілерін қарастырды.
ATHENA жобасының Стандарттарды зерттеу және ұсыныстар дайындау жұмыс тобының есебі]: Цифрландыру: еуропалық мұражайлар, мұрағаттар, кітапханалар стандарттарының ландшафты, ақпараттық ресурстарды талдауға негізделген. цифрландыру жобалары үшін нормативтік-әдістемелік базаны дамыту проблемаларына байланысты қызығушылық.Афена жобасының серіктестері Europeana еуропалық цифрлық кітапханасына ұсынады.
Интернетте ұсынылған тағы бір танымал жоба - бұл АҚШ Конгресі Кітапханасының жұмыс тобы әзірлеген жеті тілді (араб, қытай, ағылшын, француз, португал, орыс және испан) Әлемдік сандық кітапхана жобасы елдердің көптеген серіктес институттарының көмегімен, БҰҰ-ның білім, ғылым және мәдениет жөніндегі ұйымының (ЮНЕСКО) қолдауымен және бірқатар компаниялар мен жеке қорлардың қаржылық қолдауымен. WDL 2009 жылдың сәуірінде іске қосылған кезде оның мазмұны 26 мекеме мен 19 ел ұсынған ақпараттардан тұрды. WDL АҚШ Конгрессінің кітапханасы, тарихи-мәдени мұраның әр түрлі нысандарын цифрландыру жобаларында танымал көшбасшы болғанына қарамастан], оның мазмұнын қалыптастыру тәсілдері іс жүзінде бірдей Europaana жобасы.
Тарихи ескерткіштерді электронды ортада ұсыну мәселесі бойынша көптеген елдер мен мекемелердің күш-жігерін біріктіретін және үйлестіретін жаһандық жоба - бұл ЮНЕСКО-ның Әлемнің жады бағдарламасы ]. Бұл бағдарламаның бір бағыты - бұл мұрағаттық, мұражайлық және кітапханалық қорлардың электронды көшірмелерін жасауға бағытталған жаңа сандық Цифрлық дәуірдегі әлем жады: цифрландыру және сақтау жобасы. әлемдік тарихнамадағы сандық тарих деп аталатын тенденция. Бұл бағыт жалпы пайдаланушыға нақты тарихи дәуірді, оқиғаны, жеке тұлғаны сипаттайтын аса маңызды тарихи құжаттар мен артефактілердің электрондық бейнелерін онлайн режимінде көруге мүмкіндік береді.
Еуропадағы және Америкадағы түрлі қоғамдық, ғылыми және білім беру ұйымдарының архивтік, кітапхана құжаттары мен мұражай экспонаттарын сипаттайтын мәліметтер базасын, сондай-ақ олардың электронды бейнелерін сипаттайтын тақырыптық тарихи порталдарды құру жөніндегі жобалары осы тенденцияның айқын көрінісі болды. тарихи дерек көздері.
Шетелдік ірі мұрағаттық ұйымдарда жүзеге асырылған және дамыған нормативтік-әдістемелік базасы бар цифрландыру жобаларының ішінде АҚШ-тың Ұлттық мұрағаттар және жазбалар басқармасы Перспективалық жоспарға сәйкес жүзеге асырған жобаларды атап өткен жөн. мұрағат материалдарын цифрландыру. ... жалғасы
Соңғы он жылдықтарда заманауи ақпараттық технологияларды қоғамның көптеген салаларында енгізуге ерекше мән берілді. Мұрағаттауда шет қалған жоқ. Қазір таңда ақпарат құралдарында құжаттарды цифрландыру арқылы алынған ақпараттық ресурстар саны көбейіп келеді. Дәстүрлі дереккөздерді цифрландыру және түпнұсқаларын біртіндеп жою жобаларын жүзеге асыру біртіндеп кеңтаралған тәжірибеге айналуда.
Мұрағат қызметкерлерінің басты бағыттарының бірі мұрағат қорының электронды көшірмелерін жасау үшін құжаттарды цифрландыру болып табыладыі. Цифрландыру дегеніміз арнайы техникалық құралдар көмегімен құжаттарды дәстүрлі (қағаз) түрден электронды (цифрлық) түрге аудару.
Мұрағаттауда қазіргі заманғы компьютерлік технологияларды қолдану мәселелері жаңа нәрсе емес.Бұл мәселе тіпті 1980 жылдардың басында зерттеушілердің еңбектерінде көтерілді.Бірқатар мақалалар мен жұмыстар архивтердегі құжаттарды цифрландыру, құжаттардың электрондық көшірмелерін қолдану, мұрағаттың электрондық базасына қолжетімділік мәселелерін қарастырды. Мұрағат қорын цифрландыру мәселесіне аса назараударылады әсіресе шет елдерде электрондық көшірмелерді жасау және пайдалану технологиясының мәселелері қарастырылады. Сонау 1980 жылдары шет елдерде қажетті нормативтік құжаттар дайындау басталды.Осы бағыттағы алғашқы құжаттардың бірі АҚШ-тың ANSI AIIM MS44 стандарты болды Сканерленген кескіндердің сапасын бақылауға арналған нұсқаулық . Бұл жерде негізгі терминдер, негізгі параметрлері және сканерлеу сапасын бағалау критерийлері, оларды практикалық түрде қолдану тәсілдері берілген.
Қазақстанда құжаттардың электрондық архивін құру қызметі құжаттардың көлемін ұлғайту көмектеседі.
Мұрағат көлемінің артуына байланысты құжаттарды іздеу уақыты артып келеді және соның салдарынан жұмыстар тоқтап қалады. Бұл мәселенің тиімді шешімі - құжаттарды сканерлеу, электронды мұрағатты ұйымдастыру және құру. Электронды архивтер қазіргі заманғы ұйымдардың тиімді жұмыс істеуі үшін қажетті бір шартына айналды.
Электрондық архивтің басты міндеті - барлық мүдделі тұлғаларға қажетті құжаттарға жедел қол жетімділікті қамтамасыз ету. Дәстүрлі мұрағаттағы физикалық белсенділікті төмендету..
Электрондық архивті қолданудың қандай артықшылықтары:
* Экономикалық орнықтылығы:: құжаттарды сақтауға кететін шығындар құны 80 есеге дейін төмендейді!
* Қауіпсіздікті және конфиденциальдық құқықтарды сақтау: электронды құжаттарды сақтау орны заңсыз әрекеттерден сенімді қорғалады.
* Құжаттармен жұмыс істеу тиімді: электронды мұрағатты қолдану жылдамдығы ең талапшыл қолданушыныда қанағаттандырады..
* Сенімді әрі тұрақты:тозу және құжаттардың жоғалу қаупі минималды күйде болады.
* Көптеген қолданушыр режимі: бірнеше қолданушылар бір уақытта бір құжаттармен жұмыс істей алады, бұл кәдімгі дәстүрлі мұрағатты пайдалану кезінде қол жетімсіз.
* Қашықтан қол жетімді: архивті ресми және заңды мақсаттарда қолдану үшін қашықтықтан қол жеткізуге болады.
* Аналитикалық жұмыс: құжаттарды жылдам, ыңғайлы және дәл есепке алу кез келген қажетті жинақтарды құрастыруға және талдауға мүмкіндік береді.
Қазіргі уақытта біздің елімізде қағаз архивтерін цифрландыруға Мемлекеттік бағдарламалар белсенді қолдау көрсетеді, мысалы:
* Елбасының Қазақстан халқына жолдауы Үшінші жаңғыру: жаһандық бәсекеге қабілеттілік;
* Цифрлық Қазақстан бағдарламасы;
* Архив-2025 бағдарламасы.
Мұрағат қорының сақталуын қамтамасыз ету мәселелері кез келген мұрағаттың әрқашан басында тұрған. Егер бұрын мұрағаттық құжаттар микрофильмдерге, фотосуреттер мен фотокөшірмелерге көшірілсе,қазір жаңа ғасырдың талабы бойынша біз өз жұмысымызға заманауи жұмыс әдістерін енгізіліп жатыр.
Негізгі технологиялық кезеңдер:
1. Құжаттарды дайындау және сараптау, өңдеудің әр түрлі деңгейлері үшін массивтердің көлемін анықтау; әртүрлі типтегі құжаттарды өңдеу технологиясын жасау.
Бұл кезеңде мыналар жүзеге асырылады: құжаттарды сұрыптау, мұрағаттық өңдеу, қажет болған жағдайда қапсырмаларды оларды кейін қалпына келтіре отырып алып тастау, оларды қалпына келтіре отырып құжаттарды шашыратып жинау; стандартқа сай емес көлемдегі парақтарды және зақымдалған парақтарды кейіннен қолмен планшетті сканерлер арқылы сканерлеу үшін немесе бір форматқа келтіру бөліп алу.
Құжаттар архивін цифрландыру - бұл Қазақстандағы құжаттардың электрондық архивін құру және толтыру қызметі. Мұндай есептеуді тек мұрағат ісі, техникалық, қаржылық немесе басқа құжаттама болсын, құжаттарыңызды цифрландыру технологияларын білетін адам ғана жасай алатыны анық. Сондықтан кез-келген цифрландыру жобасы олардың жағдайын бағалайтын, қажетті жұмыстар мен жабдықтардың тізімін қалыптастыратын сарапшының құжаттарды тексеруден басталады.
2. Ағынды сканерлеу және мұрағатталған құжаттарды қалпына келтіру.
Бұл кезеңде суреттің максималды айқындылығын, ескі мұрағатталған құжаттар үшін фондық сүзгілеуді, құжаттарды қарапайым бірмәнді сәйкестендіру үшін бірегей мұрағат нөмірлерін басып шығару үшін сканерлеу параметрлері таңдалады.
Бұл кезеңнің тиімділігі көбіне қолданылатын жабдықтың сапасымен анықталады.Заманауи желілік сканерлер құжаттарды автоматты түрде беру жүйесімен жабдықталған, бұл қол еңбегін азайтуға және бір сканерге минутына 200 суретке дейін цифрландыру жылдамдығына қол жеткізуге мүмкіндік береді.
Сканер дегеніміз - компьютерге сурет кескіндерін, мәтін түрінде берілген сызбаларды, слайдтарды, немесе басқа графикалық ақпараттарды енгізуге мүмкіндік беретін құрылғы. Жарық көздері, айналар мен линзалар сканердің құрылымдық элементтері болып табылады және сканерленген кескіннің сапасына тікелей әсер етеді. Сканердің оптикалық жүйесі кареткаға мықтап бекітілуі керек, ал оның жеке бөліктері олардың өзара орналасуын өзгертпеуі керек. Мысалы, егер ауытқу айналары линзалармен қатаң байланыспай сканерлеу кезінде олардың бағытымен бірге қозғалса, онда оптикалық жүйенің фокустық қашықтығы өзгеріп, соның кесірінен кескіннің бұрмалануына әкелуі мүмкін.
Сканер қолданылған жарық көзі біркелкі спектрлік сипаттамаға ие болған жағдайда ғана түпнұсқадағы барлық түстерді тани алады. Сондықтан идеалды көз спектрдің барлық түстерінің жиынтығынан - күлгіннен қызылға дейін пайда болатын ақ жарық шығаруы керек.
Жасыл жарық диоды жарық көзі ретінде пайдаланылған кезде спектрдің орта бөлігі жартылай талапқа сай келмейді, сондықтан түпнұсқаның барлық түстері тиісті деңгейде анықталмайды. Мұндай анықталмайтын түстер сканер сипаттамасында көрсетілуі керек. Өкінішке орай, сканер өндірушілердің көбісі осы маңызды ақпаратты арнайы техникалық құжаттамада көрсете бермейді.
Қарапайым көзге жарық көзінің сәулелену сапасын дұрыс бағалау қиын, өйткені ақ болып көрінетін жарық спектрлік таралуы біркелкі болмауы мүмкін. Мысалы, ақ флуоресцентті жарық түс сары түсті дәл шығармайды.
Әрқайсысы өзінің спектрлік сипаттамаларымен ерекшеленетін көптеген жарық көздері бар. Сканерлерде галогендік шамның артықшылығы - оның біркелкі спектрлік реакциясы және сәулеленудің жоғары қарқындылығында. Кемшілігі - көп жылу пайда болады, сондықтан оны салқындату үшін желдеткіш қажет болады.
Планшеттік сканерлерде вольфрам галогендік лампалары немесе төмен жылу флуоресцентті суық катодты көздері қолданылады. Бұл сканерлеу механизмін түпнұсқаға жақын орналастыруға және оның ұзақ уақыт қызмет көрсетуіне мүмкіндік береді, сол арқылы түсірілген кескіннің сапасын жақсартады.
Сканерлеуді кейде сандық кодтау деп те атайды, өйткені ол аналогтық жарық сигналын компьютер түсінетін цифрлық түрге айналдырады. Сканерлеу терминін цифрлық кескін алу деп түсіну керек - визуалды ақпаратты сандыққа түрлендіру процесі. Сондықтан компьютерге енгізу үшін түпнұсқаларды дайындау көбінесе цифрландыру деп аталады. Сонымен бірге кескін пиксель деп аталатын элементар бөлшектерге бөлінеді, олардың әрқайсысы өз жарық параметрі мен түс реңктерінің белгілі бір кодына сәйкес келеді.
Сканерлер суреттерді түсірудің әртүрлі әдістерін жүзеге асырады. Егер сенсор қабылдаған жарық мөлшері алдын ала орнатылған шектен аспаса, түпнұсқаның түсірілген элементі қара ретінде қабылданады. Әйтпесе, оған ақ түске немесе сұр реңкке сәйкес код мәні беріледі.
Кейбір сканерлер сезімталдық шегін реттеуге мүмкіндік береді. Бұл сканерленген түпнұсқалардың суреттерін жарық параметрлерінің кең ауқымын алуға мүмкіндік береді - сондықтан қағаз құрылымы кескін элементтері ретінде қабылдана бастайды. Жарық параметрлерін өзгертуге арналға бағдарламалар көмегімен сұр түс деңгейін өзгертуге мүмкіндік береді.
Түрлі-түсті сканерлерінің жұмыс істеу принципі жоғарыда сипатталғанға ұқсас, тек бұл жағдайда сезімталдық шегі түстерді қалыптастыру жүйесінің негізгі түстерінің әрқайсысы үшін анықталады.
Сурет көзінің әрбір элементі туралы ақпаратты дәйекті түрде оқып, сенсор бүкіл кескін түсірілгенге дейін оның бойымен қозғалады. Бұл өте тез орындалады - сканерлеу процедурасы әдетте бірнеше секундты ғана алады.
Бейнелеу әдісі
Сканерлеу кезінде түпнұсқа жарық көзі арқылы жарықтандырылады. Шағылған жарық сенсорға сызық түрінде немесе жарыққа сезімтал элементтердің матрицасы түрінде арнайы оптикалық жүйені қолдана отырып жіберіледі, олар алынған жарықтың қарқындылығын сәйкес кернеу мәніне айналдырады. Аналогтық сигнал сандық форматқа ауысады және бұл формада кескін туралы ақпаратты компьютерге енгізуге болады.
Жарыққа сезімтал датчиктер
Қазіргі заманғы кескінді цифрландыру құрылғыларында мәліметтерді оқу технологиясы негізінен екі түрлі жарыққа сезімтал датчиктерді қолдануға негізделген: фототүсіргіш түтіктер немесе зарядпен байланысқан құрылғылар. Барлық енгізу құрылғыларында қолданылатын аналогты-сандық түрлендіргіштер немесе компараторлар оқылған ақпаратты компьютер оқитын сандық мәліметтерге айналдырады.
Зарядпен байланысқан құрылғылар ЗБҚ сенсорлары - бұл интенсивтілікке пропорционалды электр зарядын шығаратын, жарыққа сезімтал көптеген кішкентай элементтерден тұратын қатты күйдегі электрондық компонент. ЗБҚ жұмысы кәдімгі жартылай өткізгіш диодтың pn-өткізгішінің жарықтану дәрежесіне тәуелділігіне негізделген.
Сканерлеу кезінде сіз қайта өңдеуді минимальды нәтижеге жетуіңіз керек. Түпнұсқаны алдын-ала тексеру өте маңызды, өйткені оның сипаттамалары сканерлеу режимін таңдауды және кескінді кейіннен өңдеу режимдерін анықтайды.
Түпнұсқа кескін әдетте бірнеше сипаттамаларға сәйкес жіктеледі: тон, түс және тасымалдағыш түрі. Түпнұсқаның тональды сипаттамасы ең алдымен бағдарламалық жасақтама құралдарымен кескінді өңдеу әдістерін анықтау үшін маңызды, ал сканер типін таңдауға негізінен кескіннің түс сипаттамасы мен графикалық ақпарат тасымалдаушы типі әсер етеді.
Түстер құрамы бойынша түпнұсқалы құжаттар мен сканерлер ақ-қара, сұр реңді және түрлі-түсті болып бөлінеді.
Ақ-қара сканерлер
Ақ-қара сканерлер ақ немесе қара түстерді шығару режимінде жұмыс істейді. Сканерленген кескін ақ жарықпен жарықтандырылады.
Бұл үшін әдетте флуоресцентті лампа қолданылады. Редукциялаушы линза арқылы шағылысқан жарық ЗБҚ сенсорының жарықтандырғыш жартылай өткізгіш элементтеріне енеді.
Сканерленген кескіннің әр сызығы жарыққа, сезімтал элементтің шығуындағы кернеу мәндеріне байланысты сәйкес келеді. Бұл кернеу мәндері компаратор көмегімен сандық түрге ауысады. Компаратор ЗБҚ-дан кернеуді немесе токты эталондық мәнмен салыстырады және шығыуында 0 (ақ) немесе 1 (қара) сигнал шығарады.
Бұл сканерлерде сезімталдық шегі параметрі бар, ол әр түрлі түпнұсқаларды сканерлеуге мүмкіндік береді, тым ашықтан қараңғыға дейін.
Сұр реңкті сканерлер
Сұр реңктегі кескіндердің сандық көрінісі үшін жарық параметрлерінің градациясы ұғымы енгізілген. Сұр реңктегі сканерлер компьютерге әр сканерленген кескін нүктесінің жарықт параметрінің мәнін жібереді. Сканерленген кескінді жарықтандыру үшін әдетте ақ флуоресцентті лампа қолданылады. Жарық параметрлерінің 16, 64 және 256 градациясын ажырата алатын сканер модельдері бар.
Сұр реңді сканердің функционалдық диаграммасы іс жүзінде оның ақ-қара аналогынан ерекшеленбейді, тек аналогтық-цифрлық түрлендіргішті қолдану қажеттілігін қоспағанда, бит тереңдігі қолдау көрсетілетін сұр деңгейлер санына байланысты Мысалы, 256 сұр деңгейлерін қолдайтын сканер 8-разрядты ADC-мен жабдықталуы керек.
Түрлі-түсті сканерлер
Түрлі-түсті сканер негізгі түстерді (қызыл, жасыл және көк) ажырата білуі керек. Ол үшін түрлі технологиялар қолданылады. Мысалы, бір жарық көзі бар түрлі-түсті сканерде түпнұсқаны жарық көзі мен түпнұсқа арасында кезек-кезек орналастырылған әр түрлі сүзгілерді (қызыл, жасыл, көк) дәйекті түрде қолдану арқылы үш рет өту арқылы сканерлеуге болады. Сканерленген кескін ақ жарықпен тікелей емес, айналмалы RGB сүзгісі арқылы жарықтандырылады.Негізгі түстердің әрқайсысы үшін операциялар реттілігі іс жүзінде сұр реңкті сканерлеу кезіндегі әрекеттердің кезегінен ерекшеленбейді. Сипатталған әдістің маңызды кемшіліктері сканерлеу уақытының үш есе артуы және түрлі-түсті қабаттарды дұрыс араластыру қажеттілігі болып табылады,әйтпесе кескін бұлыңғыр болуы мүмкін.
Басқа сканерлер үш жарық көзін қолдана алады: қызыл, жасыл, көк; сканерлеу бір рет орындалады және жарық көздері өз кезек-кезек өзара әрекеттеседі, қысқа уақыт ішінде түпнұсқаны жарықтандырады. Бұл әдіс түстердің сәйкессіздігін болдырмайды, бірақ тағы бір қиындық пайда болады - тұрақты сипаттамалары бар жарық көздерін таңдау.
Кейбір түсті сканерлерде бір жарық көзі қолданылады, бірақ түстердің түпнұсқалары бір жолда сканерленеді. Мысалы, Seiko Instruments фирмасының SpectraPoint түрлі-түсті планшетті сканерінде ЗБҚ элементтерінің орнына үш жолға орналастырылған фототранзисторлар қолданылады және фототранзисторлардың әр сызығы редукция қолданбай тек өз түсімен жарықтандырылатын етіп үш түсті сүзгі орналастырылған.
3.Құжатты енгізу, тану және индекстеу
Бәлкім бұл көп уақытты қажет ететін кезеңдердің бірі болар.Бұл кезеңде мыналар жүзеге асырылады: құжат кескіндерін өңдеу және мәтінді тану; құжаттардың деректер базасын құру, индекстеу және электронды тасымалдағыштарға жазу; танылған ақпараттың дұрыстығын тексеру; мәтінді тану жүйелерін қолдана отырып мәтіндік құжаттарды енгізу, кестелерді енгізу, суреттер мен сызбаларға ескертулер енгізу, ақпаратты енгізудің дұрыстығын көзбен тексеру; мәтінді тану жүйелерін қолдана отырып формаларды толтыру немесе қағаз құжаттардың электрондық мұрағатына деректерді қолмен енгізу.
OCR бағдарламалық жасақтамасының компоненттері тану сатысында қолданылады. Алынған жазбалардың сапасы машиналық оқуға арналған сауалнаманың дайындық деңгейіне және бағдарламалық жасақтаманың алдын-ала конфигурациясының мұқият болуына байланысты.
Оптикалық таңбаларды тану (OCR) - қолмен жазылған, машинкаға басылған немесе басылған мәтін кескіндерін мәтіндік мәліметтерге механикалық немесе электрондық аудару - компьютердегі таңбаларды бейнелеу үшін қолданылатын кодтар тізбегі.Тану кітаптар мен құжаттарды электронды түрге ауыстыру, шаруашылық есеп жүйелерін автоматтандыру немесе мәтінді веб-бетте жариялау үшін кеңінен қолданылады. Оптикалық таңбаларды тану (OCR) сізге мәтінді өңдеуге, сөзді немесе сөз тіркесін іздеуге, оны ықшам түрде сақтауға, материалды көрсетуге немесе сапаны жоғалтпастан басып шығаруға, ақпаратты талдауға, сөйлемге электронды аударманы қолдануға, пішімдеуге немесе мәтінді түрлендіруге мүмкіндік береді.Оптикалық таңбаларды тану (OCR) - бұл үлгіні тану, жасанды интеллект және компьютерлік көру саласындағы зерттеу мәселелерінің бірі.
OCR жүйелері белгілі бір қаріппен жұмыс істеу үшін калибрлеуді қажет етеді; алдыңғы нұсқаларында бағдарламалау үшін әр таңбаның кескіні қажет болды, бағдарлама бір уақытта тек бір қаріппен жұмыс істей алатын. Қазіргі уақытта ең кең таралғаны қаріптердің көпшілігін жоғары дәлдікпен танитын ақылды деп аталатын интелектуальды жүйелер. Кейбір OCR жүйелері суреттер, бағандар және басқа мәтіндік емес компоненттерді қоса, мәтіннің бастапқы пішімін қалпына келтіруге қабілетті.
4.Индекс ақпаратын мәліметтер базасына сақтау және түсіру, электрондық кескіндер массивін құру және электронды құжаттарды электрондық тасымалдағыштарға жүктеу,ақпараттық жүйеге интеграциялау
Соңғы кезеңде мыналар орындалады: суреттерді TIFF, JPEG, PDF, BMP форматтарында сақтау, кескіндердің көлемін ықшамдау, электронды түрде де құрылымы дәстүрлі құжаттар толық сәйкес келуі, мұрағаттық базаны қажетті форматқа жазу , CD DVD дискілеріне деректер жазу.
Цифрландырылған мәліметтер әрі қарай талдау үшін қажетті форматқа жүктеледі.
Шетелдік тәжірибе. Мұрағат құжаттарын цифрландыру бойынша жобаларды іске асырудың әлемдік тәжірибесінде жобаларды кешенді ұйымдастырудың бірыңғай халықаралық стандарттарын әзірлеу мен қолдануды көздейтін дәлелденген әдіс бар.Сонымен, сканерлеу саласындағы біртұтас ұлттық тәсілдердің мысалы ретінде қоғамдық талқылау үшін жария доменде орналастырылған ұлттық өзара әрекеттестік тұжырымдамасының стандарттары (Юбола алады. Ұқсас стандарттар - цифрландыру бағдарламалары мен жобаларын басқаратын NSW болашақ дәлелдеуі - Австралияда 2008 жылдан бастап қолданысқа енгізілген. Олардың авторы және жасаушысы - NSW State Records Office, Австралия, NSW State Records], ол 2012 жылы Нұсқаулықты қазіргі заман талабына сай өзгерту мақсатында қоғамдық талқылау өткізді. Нұсқаулықтың жаңа редакциясында дербес бөлім пайда болды - Цифрландыру жобаларын басқару.
Нұсқаулықтың осы бөлімінің мазмұнына тоқталған жөн. ол архивтік құжаттарды цифрландыруға арналған жобаларды интеграцияланған ұйымдастыру мен басқару идеяларын шоғырланған түрде жеткізеді, яғни. өзара үйлесімділік тұжырымдамасына кіретін барлық нәрсе. Атап айтқанда, онда: Жобаның мақсаттары мен көлемін нақты анықтап, құжаттарды мұқият таңдау маңызды. Жоспарлау, жобаларды басқару әдістемесі және дұрыс процедуралар цифрландыру үдерісін басшылыққа алуы керек, ал қызметкерлер өз міндеттерін орындау және өзгерістерді қабылдау үшін тиісті дайындықтан өтуі керек. Цифрландыруды өздігінен жүзеге асыру керек пе немесе оны аутсорсингке беру керек пе, қажетті жабдықтар туралы және берілген тапсырмаларды шешуге графикалық кескіндердің жарамдылығын қамтамасыз ететін техникалық стандарттар мен метадеректерді таңдау критерийлері туралы шешім қабылдау керек, сонымен қатар құжаттардың негізгі сипаттамаларын сақтай отырып ... Цифрландыру сапасын бақылауды қамтамасыз ететін шаралар анықталып, жүзеге асырылуы керек .
Нұсқаулықта келтірілген мәселелер осы Нұсқаулықты құру мақсаттарымен толық сәйкес келеді, бұл құжаттарды электронды форматқа аудару процестерін реттейтін нормативтік-әдістемелік құжаттама жасау проблемалары әр түрлі елдер үшін де, әр түрлі қор иелері үшін де тән деген ойды растайды.
Осы Нұсқаулыққа және Жаңа Зеландияның S6 цифрландыру стандартына сүйене отырып, екі жыл бұрын, 2010 жылдың күзінде, Халықаралық стандарттау ұйымы ISO TR 13028-2010 Техникалық есебін Ақпарат және құжаттама - ұйымдастыру бойынша нұсқаулық. жазбаларды цифрландыру . Есепте қағаздың түпнұсқасы немесе басқа электрондық емес бастапқы құжаттар оған цифрландыру немесе басқа тәсілмен аударылғаннан кейін таза электрондық түрде құжаттарды құру және жүргізу бойынша ұсыныстар бар. Есепте цифрландыру үдерісінің құжаттардың сенімділігі мен нақтылығына қойылатын талаптарға сәйкес келуін қамтамасыз ететін дәлелденген тәжірибені көрсететін ұсыныстар бар. Сонымен қатар келесі мәселелер бойынша нұсқаулық бар:
-Дәлел ретінде пайдалану мүмкіндігіне және олардың болжамды мәніне әсер ететін цифрландырылған құжаттардың сенімділігі;
-Цифрландырылған құжаттардың қажеттілігі болған кезде олардың болуы;
-Ұзақ мерзімді сақтауға жарамды цифрланған құжаттарды құруды жеңілдететін стратегиялар;
-Электрондық емес бастапқы құжаттарды цифрландырудан кейін басқару.
Техникалық есеп барлық цифрландырушы ұйымдардың қолдануына арналған және ISO 15489-1: 2001 Ақпарат және құжаттама - Құжат айналымы - 1 бөлім: Жалпы ережелеріне және ISO TR 15801: 2009 Техникалық есеп құжатына сәйкес әзірленген. менеджмент - Ақпарат электронды түрде сақталады - Сенімділік пен сенімділік бойынша ұсыныстар.
Шетелде цифрландырудың қазіргі проблемаларын еңсеру бойынша әртүрлі ұйымдардың күш-жігерін үйлестіруді Халықаралық архивтер кеңесі жүзеге асырады, ол 2008 - 2018 жылдарға арналған стратегиялық курс бағдарламалық құжатында оның қызметінің негізгі бағыттарын көрсетті. Олардың ішінде маңызды орны: Тарихи құнды архивтік құжаттардың электрондық құжаттарын және сандық көшірмелерін сақтау проблемаларын шешу, сондай-ақ жаңа технологияларды пайдалану мұрағатқа қол жетімділікті жақсарту.
Мұрағаттық және кітапханалық қорларды цифрландыру жөніндегі шетелдік жобаларды қарастыру кезінде Evropeana цифрлық кітапханасының еуропалық интеграциялық жобасын атап өткен жөн ,оның мақсаты кітаптар мен архивтік құжаттардың сканерленген беттеріне қол жетімділікті қамтамасыз ету болып табылады. еуропалық мәдениеттің әр түрлі аспектілері. Жоба ресми түрде 2008 жылдың 20 қарашасында басталды. Жоба басталған кезде 2 миллион түрлі мұрағат көздері мен еуропалық мәдени мұра нысандары цифрландырылды. 2010 жылдың аяғында әзірлеушілердің кепілдіктері бойынша бұл көрсеткіш 6-10 миллионға, 2015 жылға қарай 15 миллионға жетті.
Бұл жобаның жетекшілері мен әзірлеушілері өздерін цифрландырылған коллекциялардың еуропалық интеграторлары ретінде санайды және сандық кітапхананың басты міндетін цифрлық мұраға қол жетімділікті ұйымдастыруда көреді. Бұл ретте архивтік, мұражайлық және кітапханалық қорлардағы заттар болып табылатын осындай күрделі объектілердің электрондық көшірмелерін жасаудың әдістері, технологиялары мен жабдықтарын таңдау мәселелері архивтер, кітапханалар мен мұражайлардың қызметкерлеріне қалдырылады. Бұл позиция өзінің жарқын көрінісін 2010 жылдың қазан айында Europeana Open Culture 2010 жобасы аясында өткізілген конференцияда жасалған баяндамаларында тапты.
2011 жылдың басында Еуропалық Комиссияның Comite des Sages Цифрландыру бойынша ЕС ұсынымдарын жариялады және еуропалық мәдени мұра бойынша цифрланған ақпараттық ресурстарға on-line қол жеткізуді ұйымдастырды. Бұл құжат цифрлық мазмұнға қол жетімділіктің ұйымдастырушылық және құқықтық аспектілерін қарастырды.
ATHENA жобасының Стандарттарды зерттеу және ұсыныстар дайындау жұмыс тобының есебі]: Цифрландыру: еуропалық мұражайлар, мұрағаттар, кітапханалар стандарттарының ландшафты, ақпараттық ресурстарды талдауға негізделген. цифрландыру жобалары үшін нормативтік-әдістемелік базаны дамыту проблемаларына байланысты қызығушылық.Афена жобасының серіктестері Europeana еуропалық цифрлық кітапханасына ұсынады.
Интернетте ұсынылған тағы бір танымал жоба - бұл АҚШ Конгресі Кітапханасының жұмыс тобы әзірлеген жеті тілді (араб, қытай, ағылшын, француз, португал, орыс және испан) Әлемдік сандық кітапхана жобасы елдердің көптеген серіктес институттарының көмегімен, БҰҰ-ның білім, ғылым және мәдениет жөніндегі ұйымының (ЮНЕСКО) қолдауымен және бірқатар компаниялар мен жеке қорлардың қаржылық қолдауымен. WDL 2009 жылдың сәуірінде іске қосылған кезде оның мазмұны 26 мекеме мен 19 ел ұсынған ақпараттардан тұрды. WDL АҚШ Конгрессінің кітапханасы, тарихи-мәдени мұраның әр түрлі нысандарын цифрландыру жобаларында танымал көшбасшы болғанына қарамастан], оның мазмұнын қалыптастыру тәсілдері іс жүзінде бірдей Europaana жобасы.
Тарихи ескерткіштерді электронды ортада ұсыну мәселесі бойынша көптеген елдер мен мекемелердің күш-жігерін біріктіретін және үйлестіретін жаһандық жоба - бұл ЮНЕСКО-ның Әлемнің жады бағдарламасы ]. Бұл бағдарламаның бір бағыты - бұл мұрағаттық, мұражайлық және кітапханалық қорлардың электронды көшірмелерін жасауға бағытталған жаңа сандық Цифрлық дәуірдегі әлем жады: цифрландыру және сақтау жобасы. әлемдік тарихнамадағы сандық тарих деп аталатын тенденция. Бұл бағыт жалпы пайдаланушыға нақты тарихи дәуірді, оқиғаны, жеке тұлғаны сипаттайтын аса маңызды тарихи құжаттар мен артефактілердің электрондық бейнелерін онлайн режимінде көруге мүмкіндік береді.
Еуропадағы және Америкадағы түрлі қоғамдық, ғылыми және білім беру ұйымдарының архивтік, кітапхана құжаттары мен мұражай экспонаттарын сипаттайтын мәліметтер базасын, сондай-ақ олардың электронды бейнелерін сипаттайтын тақырыптық тарихи порталдарды құру жөніндегі жобалары осы тенденцияның айқын көрінісі болды. тарихи дерек көздері.
Шетелдік ірі мұрағаттық ұйымдарда жүзеге асырылған және дамыған нормативтік-әдістемелік базасы бар цифрландыру жобаларының ішінде АҚШ-тың Ұлттық мұрағаттар және жазбалар басқармасы Перспективалық жоспарға сәйкес жүзеге асырған жобаларды атап өткен жөн. мұрағат материалдарын цифрландыру. ... жалғасы
Ұқсас жұмыстар
Пәндер
- Іс жүргізу
- Автоматтандыру, Техника
- Алғашқы әскери дайындық
- Астрономия
- Ауыл шаруашылығы
- Банк ісі
- Бизнесті бағалау
- Биология
- Бухгалтерлік іс
- Валеология
- Ветеринария
- География
- Геология, Геофизика, Геодезия
- Дін
- Ет, сүт, шарап өнімдері
- Жалпы тарих
- Жер кадастрі, Жылжымайтын мүлік
- Журналистика
- Информатика
- Кеден ісі
- Маркетинг
- Математика, Геометрия
- Медицина
- Мемлекеттік басқару
- Менеджмент
- Мұнай, Газ
- Мұрағат ісі
- Мәдениеттану
- ОБЖ (Основы безопасности жизнедеятельности)
- Педагогика
- Полиграфия
- Психология
- Салық
- Саясаттану
- Сақтандыру
- Сертификаттау, стандарттау
- Социология, Демография
- Спорт
- Статистика
- Тілтану, Филология
- Тарихи тұлғалар
- Тау-кен ісі
- Транспорт
- Туризм
- Физика
- Философия
- Халықаралық қатынастар
- Химия
- Экология, Қоршаған ортаны қорғау
- Экономика
- Экономикалық география
- Электротехника
- Қазақстан тарихы
- Қаржы
- Құрылыс
- Құқық, Криминалистика
- Әдебиет
- Өнер, музыка
- Өнеркәсіп, Өндіріс
Қазақ тілінде жазылған рефераттар, курстық жұмыстар, дипломдық жұмыстар бойынша біздің қор #1 болып табылады.
Ақпарат
Қосымша
Email: info@stud.kz