Шығынмен ақпаратты қысу жайлы мәлімет



1. Шығынмен ақпаратты қысу
2. Деректер қысу
3. Ақпаратты өңдеу және беру
Шығынмен ақпаратты қысу - түпнұсқа ерекшеленеді, бірақ айырмашылық дәрежесі оны одан әрі пайдалану тұрғысынан маңызды емес ашылатын деректерді пайдаланып деректер қысу әдісі (қысу). Қысу бұл түрі жиі аудио және бейне, қимылсыз бейнені, интернетте, әсіресе ағыны деректер, сондай-ақ сандық телефония қысу үшін пайдаланылады. Балама шығынсыз. Деректер қысу
Біз 1 (бір) мегабайт файл өлшемін бар делік. Біз одан аз файлды алу қажет. Күрделі ештеңе - мысалы, WinZip мұрағат іске, және нәтиже алуға, мысалы, 600 килобайт бір файл өлшемі. Қайда басқа 424 килобайтын кетті? Бұл сұраққа жауап өте қиын, бірақ біз оны табуға тырысады. Бірінші, әдеттегідей, бастайық.
Деректер қысу әдістері сараптамасы, біз қарапайым әмбебап алгоритм басталады, содан кейін ғана олар графика, дыбыс пен бейнені қысу көп мамандандырылған әдістеріне өту.
Деректер қысу кодтау үшін тәсілдерінің бірі болып табылады. Коды қысу (тиімді кодтары), шу төзімді кодтары мен криптографиялық кодтары - Жалпы кодтары үш топқа бөлінеді. Ақпаратты қысу үшін кодтары, өз кезегінде, шығынсыз және жоғалтумен кодтары кодтары бөлінеді. Lossless кодтау кодтан кейін деректердің мүлдем дәл қалпына білдіреді және кез келген ақпаратты қысу үшін қолданылуы мүмкін. Жоғалтумен кодтау әдетте жоғалтпайтын кодтау қарағанда әлдеқайда жоғары қысу коэффициенті бар, бірақ бастапқы кейбір ауытқу деректерді декодталған мүмкіндік береді.
Жоғалатын сығу негізінен, өйткені файлдар үлкен мөлшерін, графика (JPEG) үшін пайдаланылатын аудио (MP3), бейне (MPEG), бастапқы көрінбейтін немесе болмашы, және қысу дәрежесін, яғни, онда шағын ауытқулар өте маңызды болып табылады. Мәтіндер, екіліктер, жоғары сапалы дыбыс және графика үшін, және т.б. - Lossless қысу қалған барлық жағдайларда қолданылады және т.б.
Негізгі ұғымдар
Термин «ақпарат» көптеген анықтамалары бар - ең көп таралған философиялық бастап (ақпарат нақты әлемнің көрінісі болып табылады), өте тар үшін (ақпаратты сақтау, беру және конверсия жататын барлық ақпарат қол жетімді). Егер сіз осы анықтамалардың мәні туралы ойлануға Алайда, егер, біз тез бірінші толығымен емес функционалдық екенін түсінеді, ал екінші рекурсивті негізінен болып табылады - «. Ақпарат» біз сөз «ақпарат» анықтауға тырысамыз болса, онда біз сөзсіз қайтып келеді ұғымынан себебі Сондықтан, ақпаратты өңдеу қарауына бір жерде алдыңғы екі арасындағы жатыр қорыту дәрежесі анықталады.
1. Саломаа А. Криптография с открытым ключом: Пер. с англ. – М.: Мир, 1995. – 318 с.
2. Баричев С.Г., Гончаров В.В., Серов Р.Е. Основы современной криптографии. – М.: Горячая линия - Телеком, 2001.
3. Хоффман Л. Современные защиты информации. Пер. С англ.-М.: Сов. Радио, 1980
4. Ященко В.В. Введение в криптографию. – Питер, 2001
5. Мельников .В. Защита информации в компьютерных системах. М.:Электроинформ,1997
6. Брюс Шнайдер Прикладная криптография.

ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ
СЕМЕЙ ҚАЛАСЫНЫҢ ШӘКӘРІМ АТЫНДАҒЫ МЕМЛЕКЕТТІК УНИВЕРСИТЕТІ

СӨЖ
Тақырыбы: Шығынмен ақпаратты қысу

Орындаған:Жумагалиев Р
Тобы: АУ-401с
Қабылдаған: Қожахметова Д.О.

СЕМЕЙ 2015
Жоспар
1. Шығынмен ақпаратты қысу
2. Деректер қысу
3. Ақпаратты өңдеу және беру
Шығынмен ақпаратты қысу - түпнұсқа ерекшеленеді, бірақ айырмашылық дәрежесі оны одан әрі пайдалану тұрғысынан маңызды емес ашылатын деректерді пайдаланып деректер қысу әдісі (қысу). Қысу бұл түрі жиі аудио және бейне, қимылсыз бейнені, интернетте, әсіресе ағыны деректер, сондай-ақ сандық телефония қысу үшін пайдаланылады. Балама шығынсыз. Деректер қысу
Біз 1 (бір) мегабайт файл өлшемін бар делік. Біз одан аз файлды алу қажет. Күрделі ештеңе - мысалы, WinZip мұрағат іске, және нәтиже алуға, мысалы, 600 килобайт бір файл өлшемі. Қайда басқа 424 килобайтын кетті? Бұл сұраққа жауап өте қиын, бірақ біз оны табуға тырысады. Бірінші, әдеттегідей, бастайық.
Деректер қысу әдістері сараптамасы, біз қарапайым әмбебап алгоритм басталады, содан кейін ғана олар графика, дыбыс пен бейнені қысу көп мамандандырылған әдістеріне өту.
Деректер қысу кодтау үшін тәсілдерінің бірі болып табылады. Коды қысу (тиімді кодтары), шу төзімді кодтары мен криптографиялық кодтары - Жалпы кодтары үш топқа бөлінеді. Ақпаратты қысу үшін кодтары, өз кезегінде, шығынсыз және жоғалтумен кодтары кодтары бөлінеді. Lossless кодтау кодтан кейін деректердің мүлдем дәл қалпына білдіреді және кез келген ақпаратты қысу үшін қолданылуы мүмкін. Жоғалтумен кодтау әдетте жоғалтпайтын кодтау қарағанда әлдеқайда жоғары қысу коэффициенті бар, бірақ бастапқы кейбір ауытқу деректерді декодталған мүмкіндік береді.
Жоғалатын сығу негізінен, өйткені файлдар үлкен мөлшерін, графика (JPEG) үшін пайдаланылатын аудио (MP3), бейне (MPEG), бастапқы көрінбейтін немесе болмашы, және қысу дәрежесін, яғни, онда шағын ауытқулар өте маңызды болып табылады. Мәтіндер, екіліктер, жоғары сапалы дыбыс және графика үшін, және т.б. - Lossless қысу қалған барлық жағдайларда қолданылады және т.б.
Негізгі ұғымдар
Термин ақпарат көптеген анықтамалары бар - ең көп таралған философиялық бастап (ақпарат нақты әлемнің көрінісі болып табылады), өте тар үшін (ақпаратты сақтау, беру және конверсия жататын барлық ақпарат қол жетімді). Егер сіз осы анықтамалардың мәні туралы ойлануға Алайда, егер, біз тез бірінші толығымен емес функционалдық екенін түсінеді, ал екінші рекурсивті негізінен болып табылады - . Ақпарат біз сөз ақпарат анықтауға тырысамыз болса, онда біз сөзсіз қайтып келеді ұғымынан себебі Сондықтан, ақпаратты өңдеу қарауына бір жерде алдыңғы екі арасындағы жатыр қорыту дәрежесі анықталады. Сондықтан, ақпарат бойынша біз бұл белгілі бір объектінің немесе құбылыстың қатысты біздің надандық дәрежесін төмендетеді білдіреді.
Ақпаратты өңдеу және беру теориялық аспектілері, сондай-ақ информатика деп аталады деп аталатын ақпараттық теориясы, айналысады. (Алайда, мектеп бағдарламасына сол сөз ақпарат теориясы, мүлдем жоқ ақпаратқа істеу ештеңе жоқ оғаш нысан деп аталады.)

Ақпарат алу үшін, сондай-ақ барлық басқа қолданыстағы нақты мән кейбір бірлік өз көлемін білдіру, яғни, өлшенуі мүмкін. Ақпарат теориясында, ақпарат соманы өлшеуге үш сапалы түрлі тәсілдері бар: көзқарас құрылымы ақпараттың көлемі алапта элементтерін қарапайым есептеу қосымша, назарға олардың пайда ықтималдығын қабылдайды, бұл ақпарат көзқарас статистика алапта элементтердің саны негізінде анықталады, онда мен оның пайдалылығы мен орындылығы дәрежесін ақпарат санын анықтайды семантикалық тәсіл. Осылайша, барлық үш көзқарас сіз математикалық барлық үш жағдайларда мүлдем басқа жауап алуға, ең таңқаларлық, кез келген алапта қамтылған ақпаратты сомасын есептеп, және мүмкін ол арқылы әдістерін ұсынады. Сонымен қатар, біз бит бүтін сан файлындағы ақпарат көлемін өлшеу статистикалық әдісі алуға болады, және қашан семантикалық - тіпті теріс олардың саны!
Қарастырайық ақпарат көлемін өлшеу үшін тәсілдерді жоғарыда бір-бірінен ерекшеленеді.
Құрылымдық тәсіл, біз жай ғана файл 1 KB, сондай-ақ ақпаратты дәл 1 KB бар алып деп есептейміз. Өте қисынды Agree!
Қашан семантикалық тәсіл, ол объектіге өндіреді әсер бағалады ақпарат көлемі. Бізге кейбір ақпарат белгілі бір мақсатқа қол жеткізу үшін бізге көмектесуге тиіс делік. Бұл ақпаратты алу осы мақсатқа жету ықтималдығы p1 болсын, және осы ақпаратты беруге - P2. Содан кейін осы ақпаратты сомасы тең: I = Р2 p1 бит кіріңіз.
Әлбетте, құрылымдық тәсіл деректер қысу бізге көмектесе алмайды. Мүмкін сияқты семантикалық, бірақ белгісіздік көп - оның соңғы тұтынушыға ақпарат әсерін бағалау қалай - Мү.рағаттықтар, жалпы, мұндай нәзік мәселелер туралы білеміз, өйткені. Сондықтан, біз тек ақпарат сомасын өлшеу үшін статистикалық тәсіл көмектесе алады.
Осылайша, кез келген ақпарат көзінің шығарды байт тізбегі ретінде дискретті түрінде келеді. Осы байт кейбір толығымен кездейсоқ жасалған болса, кез келген нақты құнының пайда ықтималдығы (мысалы, 6Eh) дәл 1256 еді. Алайда, ең нақты деректер көздеріне түрлі құндылықтарды туындау ықтималдығы, сондай-ақ әр түрлі болады. Біз редакторында мәтінді жазғанда шын мәнінде, біз хат а хатында артық ортақ болып табылады деп есептейміз барлық негіз бар і. Белгілі бір символдар пайда ықтималдығы туралы ақпаратты негізінде мәтін бойымыздағы есептеуге болады. 1948 жылы Клод Шеннон құрылған ақпаратты статистикалық теориясы, энтропия символы бір ақпарат сома ретінде анықталады. Энтропияны нәтиже есептеу үшін формула емес, - соңғы елу жылда, ол осы шығып, еш қиындықсыз оны әкелді кім екенін, бірнеше рет жарияланды.
Алайда, ақпарат энтропияның тән кейбір үлгілері, біз сипаттайды.
Одан әрі талқылау үшін оның шығу туралы бір-пайда рәміздер көзі ретінде біздің бастапқы мәтін файлды енгізу ыңғайлы болады. Біз келесі таңба қандай болады алдын ала білмеймін, бірақ біз ықтималдығы Р1 және т.б. хат А ықтималдығы P2 -bukva бірге б, пайда білеміз,

Қарапайым жағдайда, біз, яғни, бір-біріне мәтіні тәуелсіз барлық таңбаларды мойнына алады Келесі сипаттағы туындау ықтималдығы алдыңғы символы тәуелсіз болып табылады. Әрине, мағыналы мәтін олай емес, бірақ қазір біз өте оңайлатылған жағдайды қарастыру. Бұл жағдайда делінген таңбасы оның пайда болу ықтималдығы аз, қосымша ақпарат асырады.
Бізге оның әліпби тек 16 әріптер тұратын мәтінді делік: A, B, C, D, E, F, G, H, I, K, L, M, N, O, P және Р. осы таңбалардың Әрбір болуы мүмкін Енді 0000 жылдан бастап 1111 дейін, тек 4 бит бар кодталған, төмендегідей осы таңбалардың туындау ықтималдығы бөлінген деп елестетіп көріңізші:
A B C D E F G H I J K L M N O P Q R
0,2 0,15 0,15 0,1 0,08 0,08 0,06 0,04 0,03 0.022 0.018 0.016 0.014 0.014 0.013 0.013
Осы Ықтималдықты сомасы табиғи бірі болып табылады. Әр топтың рәміздер аралас ықтималдығы шамамен 0,5 (1-сур.) Болды, сондықтан екі топқа осы рәміздер бөліңіз. Біздің мысалда бұл таңбалардың А және D-F тобы болады. бинарлық ағаш (B-ағаш) - суретте топтар шыңдары немесе түйіндері (тораптар) деп аталатын таңбалардың тобы, және осы бірлік өте құрылымын ұсынады. Саны 1 - әрбір түйінде бір торабы 0 санын, және басқа да тағайындау кодын тағайындаңыз.
Тағы да, олардың жалпы ықтималдығы бір-біріне жақын болды етіп екі топқа бірінші тобын (A-B) бөліңіз. Саны 1 - саны 0 бірінші ішкі коды, және екінші коды қосу.
Біз сондай-ақ ұзақ біздің ағашының әрбір шыңында бір таңба қалады-ақ осы операцияны қайталаңыз. Біздің әліпбиін толық ағашы 31 узел болады.
Таңба кодтары (оң ағаш түбірін қайырады) тең ұзындығы кодтары бар. Мысалы, А әрпі, біздің ойдан мәтін ықтималдығы р = 0,2 үшін қол жетімді барлық екі бит арқылы кодталған және әріп P (көрсетілген емес), р ықтималдығы бар = 0,013, сондай-ақ көптеген алты биттік кодталған комбинациясы.
Сондықтан принципі айқын - ортақ кейіпкерлері сирек аз бит кодталған - ұлы. Нәтижесінде, символы бит орташа статистикалық саны тең
мұндағы Ni - і-ші ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Ақпараттарды шығынмен қысудың жаңашыл тәсілдерін үйрену
Шығынмен ақпаратты қысу
Кодтау және кодтаудың түрлері
Архиватор жайлы түсінік
Электрондық сауда – саттық жүргізуді ұйымдастыру технологиясы
Үздіксіз суық жаймалау станы және болат жолақтарын шынықтыру
Файлдарды архивтеу. архиватор бағдарламалар
Құрылымды мәліметтердің көрінісі
Photoshop қолданбалы бағдарламасына электронды оқулық құру
Файл. Файлдар мен қалталар түсінігі
Пәндер