Шығынмен ақпаратты қысу жайлы мәлімет


ҚАЗАҚСТАН РЕСПУБЛИКАСЫНЫҢ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ

СЕМЕЙ ҚАЛАСЫНЫҢ ШӘКӘРІМ АТЫНДАҒЫ МЕМЛЕКЕТТІК УНИВЕРСИТЕТІ

СӨЖ

Тақырыбы : Шығынмен ақпаратты қысу

Орындаған:Жумагалиев Р

Тобы: АУ-401с

Қабылдаған: Қожахметова Д. О.

СЕМЕЙ 2015

Жоспар
  1. Шығынмен ақпаратты қысу
  2. Деректер қысу
  3. Ақпаратты өңдеу және беру
Шығынмен ақпаратты қысу - түпнұсқа ерекшеленеді, бірақ айырмашылық дәрежесі оны одан әрі пайдалану тұрғысынан маңызды емес ашылатын деректерді пайдаланып деректер қысу әдісі (қысу) . Қысу бұл түрі жиі аудио және бейне, қимылсыз бейнені, интернетте, әсіресе ағыны деректер, сондай-ақ сандық телефония қысу үшін пайдаланылады. Балама шығынсыз. Деректер қысу Біз 1 (бір) мегабайт файл өлшемін бар делік. Біз одан аз файлды алу қажет. Күрделі ештеңе - мысалы, WinZip мұрағат іске, және нәтиже алуға, мысалы, 600 килобайт бір файл өлшемі. Қайда басқа 424 килобайтын кетті? Бұл сұраққа жауап өте қиын, бірақ біз оны табуға тырысады. Бірінші, әдеттегідей, бастайық. Деректер қысу әдістері сараптамасы, біз қарапайым әмбебап алгоритм басталады, содан кейін ғана олар графика, дыбыс пен бейнені қысу көп мамандандырылған әдістеріне өту. Деректер қысу кодтау үшін тәсілдерінің бірі болып табылады. Коды қысу (тиімді кодтары), шу төзімді кодтары мен криптографиялық кодтары - Жалпы кодтары үш топқа бөлінеді. Ақпаратты қысу үшін кодтары, өз кезегінде, шығынсыз және жоғалтумен кодтары кодтары бөлінеді. Lossless кодтау кодтан кейін деректердің мүлдем дәл қалпына білдіреді және кез келген ақпаратты қысу үшін қолданылуы мүмкін. Жоғалтумен кодтау әдетте жоғалтпайтын кодтау қарағанда әлдеқайда жоғары қысу коэффициенті бар, бірақ бастапқы кейбір ауытқу деректерді декодталған мүмкіндік береді. Жоғалатын сығу негізінен, өйткені файлдар үлкен мөлшерін, графика (JPEG) үшін пайдаланылатын аудио (MP3), бейне (MPEG), бастапқы көрінбейтін немесе болмашы, және қысу дәрежесін, яғни, онда шағын ауытқулар өте маңызды болып табылады. Мәтіндер, екіліктер, жоғары сапалы дыбыс және графика үшін, және т. б. - Lossless қысу қалған барлық жағдайларда қолданылады және т. б. Негізгі ұғымдар Термин «ақпарат» көптеген анықтамалары бар - ең көп таралған философиялық бастап (ақпарат нақты әлемнің көрінісі болып табылады), өте тар үшін (ақпаратты сақтау, беру және конверсия жататын барлық ақпарат қол жетімді) . Егер сіз осы анықтамалардың мәні туралы ойлануға Алайда, егер, біз тез бірінші толығымен емес функционалдық екенін түсінеді, ал екінші рекурсивті негізінен болып табылады - «. Ақпарат» біз сөз «ақпарат» анықтауға тырысамыз болса, онда біз сөзсіз қайтып келеді ұғымынан себебі Сондықтан, ақпаратты өңдеу қарауына бір жерде алдыңғы екі арасындағы жатыр қорыту дәрежесі анықталады. Сондықтан, ақпарат бойынша біз бұл белгілі бір объектінің немесе құбылыстың қатысты біздің надандық дәрежесін төмендетеді білдіреді. Ақпаратты өңдеу және беру теориялық аспектілері, сондай-ақ информатика деп аталады деп аталатын ақпараттық теориясы, айналысады. (Алайда, мектеп бағдарламасына сол сөз ақпарат теориясы, мүлдем жоқ ақпаратқа істеу ештеңе жоқ оғаш нысан деп аталады. ) Ақпарат алу үшін, сондай-ақ барлық басқа қолданыстағы нақты мән кейбір бірлік өз көлемін білдіру, яғни, өлшенуі мүмкін. Ақпарат теориясында, ақпарат соманы өлшеуге үш сапалы түрлі тәсілдері бар: көзқарас құрылымы ақпараттың көлемі алапта элементтерін қарапайым есептеу қосымша, назарға олардың пайда ықтималдығын қабылдайды, бұл ақпарат көзқарас статистика алапта элементтердің саны негізінде анықталады, онда мен оның пайдалылығы мен орындылығы дәрежесін ақпарат санын анықтайды семантикалық тәсіл. Осылайша, барлық үш көзқарас сіз математикалық барлық үш жағдайларда мүлдем басқа жауап алуға, ең таңқаларлық, кез келген алапта қамтылған ақпаратты сомасын есептеп, және мүмкін ол арқылы әдістерін ұсынады. Сонымен қатар, біз бит бүтін сан файлындағы ақпарат көлемін өлшеу статистикалық әдісі алуға болады, және қашан семантикалық - тіпті теріс олардың саны! Қарастырайық ақпарат көлемін өлшеу үшін тәсілдерді жоғарыда бір-бірінен ерекшеленеді. Құрылымдық тәсіл, біз жай ғана файл 1 KB, сондай-ақ ақпаратты дәл 1 KB бар алып деп есептейміз. Өте қисынды Agree! Қашан семантикалық тәсіл, ол объектіге өндіреді әсер бағалады ақпарат көлемі. Бізге кейбір ақпарат белгілі бір мақсатқа қол жеткізу үшін бізге көмектесуге тиіс делік. Бұл ақпаратты алу осы мақсатқа жету ықтималдығы p1 болсын, және осы ақпаратты беруге - P2. Содан кейін осы ақпаратты сомасы тең: I = Р2 / p1 бит кіріңіз. Әлбетте, құрылымдық тәсіл деректер қысу бізге көмектесе алмайды. Мүмкін сияқты семантикалық, бірақ белгісіздік көп - оның соңғы тұтынушыға ақпарат әсерін бағалау қалай - Мү. рағаттықтар, жалпы, мұндай нәзік мәселелер туралы «білеміз», өйткені. Сондықтан, біз тек ақпарат сомасын өлшеу үшін статистикалық тәсіл көмектесе алады. Осылайша, кез келген ақпарат көзінің шығарды байт тізбегі ретінде дискретті түрінде келеді. Осы байт кейбір толығымен кездейсоқ жасалған болса, кез келген нақты құнының пайда ықтималдығы (мысалы, 6Eh) дәл 1/256 еді. Алайда, ең нақты деректер көздеріне түрлі құндылықтарды туындау ықтималдығы, сондай-ақ әр түрлі болады. Біз редакторында мәтінді жазғанда шын мәнінде, біз хат «а» хатында артық ортақ болып табылады деп есептейміз барлық негіз бар «і». Белгілі бір символдар пайда ықтималдығы туралы ақпаратты негізінде мәтін бойымыздағы есептеуге болады. 1948 жылы Клод Шеннон құрылған ақпаратты статистикалық теориясы, энтропия символы бір ақпарат сома ретінде анықталады. Энтропияны нәтиже есептеу үшін формула емес, - соңғы елу жылда, ол осы шығып, еш қиындықсыз оны әкелді кім екенін, бірнеше рет жарияланды. Алайда, ақпарат энтропияның тән кейбір үлгілері, біз сипаттайды. Одан әрі талқылау үшін оның шығу туралы бір-пайда рәміздер көзі ретінде біздің бастапқы мәтін файлды енгізу ыңғайлы болады. Біз келесі таңба қандай болады алдын ала білмеймін, бірақ біз ықтималдығы Р1 және т. б. хат «А» ықтималдығы P2 -bukva бірге «б», пайда білеміз, Қарапайым жағдайда, біз, яғни, бір-біріне мәтіні тәуелсіз барлық таңбаларды мойнына алады Келесі сипаттағы туындау ықтималдығы алдыңғы символы тәуелсіз болып табылады. Әрине, мағыналы мәтін олай емес, бірақ қазір біз өте оңайлатылған жағдайды қарастыру. Бұл жағдайда делінген «таңбасы оның пайда болу ықтималдығы аз, қосымша ақпарат асырады. » Бізге оның әліпби тек 16 әріптер тұратын мәтінді делік: A, B, C, D, E, F, G, H, I, K, L, M, N, O, P және Р. осы таңбалардың Әрбір болуы мүмкін Енді жылдан бастап дейін, тек 4 бит бар кодталған, төмендегідей осы таңбалардың туындау ықтималдығы бөлінген деп елестетіп көріңізші: A B C D E F G H I J K L M N O P Q R 0, 2 0, 15 0, 15 0, 1 0, 08 0, 08 0, 06 0, 04 0, 03 0. 022 0. 018 0. 016 0. 014 0. 014 0. 013 0. 013 Осы Ықтималдықты сомасы табиғи бірі болып табылады. Әр топтың рәміздер аралас ықтималдығы шамамен 0, 5 (1-сур. ) Болды, сондықтан екі топқа осы рәміздер бөліңіз. Біздің мысалда бұл таңбалардың А және D-F тобы болады. бинарлық ағаш (B-ағаш) - суретте топтар шыңдары немесе түйіндері (тораптар) деп аталатын таңбалардың тобы, және осы бірлік өте құрылымын ұсынады. Саны 1 - әрбір түйінде бір торабы 0 санын, және басқа да тағайындау кодын тағайындаңыз. Тағы да, олардың жалпы ықтималдығы бір-біріне жақын болды етіп екі топқа бірінші тобын (A-B) бөліңіз. Саны 1 - саны 0 бірінші ішкі коды, және екінші коды қосу. Біз сондай-ақ ұзақ біздің «ағашының» әрбір шыңында бір таңба қалады-ақ осы операцияны қайталаңыз. Біздің әліпбиін толық ағашы 31 узел болады. Таңба кодтары (оң ағаш түбірін қайырады) тең ұзындығы кодтары бар. Мысалы, А әрпі, біздің ойдан мәтін ықтималдығы р = 0, 2 үшін қол жетімді барлық екі бит арқылы кодталған және әріп P (көрсетілген емес), р ықтималдығы бар = 0, 013, сондай-ақ көптеген алты биттік кодталған комбинациясы. Сондықтан принципі айқын - ортақ кейіпкерлері сирек аз бит кодталған - ұлы. Нәтижесінде, символы бит орташа статистикалық саны тең мұндағы Ni - і-ші символы кодтау бит саны, PI - і-ші символы ықтималдығы. Айтпақшы, кодтау жоғарыда әдісі Шеннон-Fano коды деп аталады. Оған Хаффман коды өте жақын. Бірақ Шеннон-Fano коды, Хаффман коды және бір кемшілігі бар - олар назарға іс жүзінде кез келген мәтін бар таңбалардың арасындағы қарым-қатынас алмайды. Ағылшын тілінде, біз хат Q табылған Мысалы, егер, онда біз оны хатта U кейін барады деп сеніммен айтуға болады. Өзара байланыстарды мысалдары, немесе, техникалық айтқанда, корреляциялық келтіре кетуге болады. Деректер корреляциялық тәуелділіктерді кодтау коды LZW болып табылады. LZW LZW-коды (Lempel-Зив және Уэлш) жоғалтпайтын қысу ең көп таралған кодтарының бірі болып табылады. LZW-қысу коды TIFF, GIF сияқты графикалық форматтарда жүзеге асырылады арқылы модификациялар олардың функциялары өте көп әмбебап Мү. рағаттықтар орындау LZW арқылы Ол, болып табылады. Өкінішке орай, қарапайым тұрғысынан оның жұмысына егжей-тегжейлі сипаттамасы мүмкін емес. Оның жұмысының құжаттама біздің оқырмандар көпшілігі үшін, бәлкім, қиын болар еді тілі C, пайдаланып сипатталған. Тек алгоритм 8 12 бит-тен ұзындығы комбинациясы арқылы кодталған таңбалардың енгізу қайталанатын қатарынан табуға негізделген деп айтуға. Осылайша, ең тиімді жалғыз түсті немесе пиксель қайталанатын ретпен үлкен аудандары, онда мәтін файлдар мен графика файлдар, бойынша алгоритм болып табылады. LZW алгоритм іске асыру қатаң белгіленген және American National Standards Institute (ANSI) халықаралық стандартты, бірақ файлдар белгілі бір түрлерінің жоғары қысу коэффициенті қамтамасыз өте қызықты модификациялары бар - мысалы, бастапқы кодында. LZW-кодтау оның пішімі TIFF негізінде кең таралған туындаған ақпаратты ешқандай шығын. Бұл пішім басып шығару, мысалы, имиджін және кең таралған өлшеміне немесе түсті тереңдігі қандай да бір шектеулер жүктейді емес. GIF - неғұрлым қарабайыр - басқа LZW форматында негізделген, ол сіз 8 бит / пиксель артық емес түс тереңдігі суреттерді сақтауға мүмкіндік береді. Файл сақталған палитрасы - GIF басында 255 0-ден дейін саны және шынайы 24-биттік түсті мағына - үстел индексі түстер арасындағы сәйкестікті орнатады. 8-биттік индекстелген бояғышты түпнұсқа имиджін трансформациясы - Осылайша, бұл формат тек барлық деректер жоғалуы LZW-кодтау алдында жүреді деген мағынада шығынсыз формат деп атауға болады. Бұл формат айқын артықшылығы бір файлда қарабайыр анимацияны қалыптастыру кескіндердің реті сақталады мүмкіндігі болып табылады. Ол кеңінен интернетте пайдаланылады осы мүмкіндіктің арқасында. Қысу коэффициенті GIF пішімін қолдану арқылы жақсартуға болады ретінде? Графикалық редактор көмегімен сіздің сызбаның бояғышты қараңызшы - мысалы, Corel Photo Paint пайдаланып. Сіз бұл өте ұқсас түстер таба алады. Егер сіз түрлі түсті пиксель түстердің бірі пиксель ауыстырсаңыз, сіз, алайда, түсті тереңдігі кейбір жоғалуына байланысты файл айтарлықтай төмендеуін алуға болады. Әр сурет үшін GIF-анимациялық жеке палитра құра алады. Сол файлдың басында - Егер жоқ болса, бұл сурет жаһандық бояғышты пайда болады. Анимация суреттердің барлық ортақ палитрасын болады, егер Сондықтан, сіз айтарлықтай шығыс файл өлшемін азайту болады - әрбір бояғышты 256 * 3 = 768 байт мөлшері бар. Тағы бір ерекшелігі зұлымды GIF анимация жақтаулары сақталған болуы мүмкін, бұл толық өлшемді сурет емес, бірақ алдыңғы кадрдың өзгереді ғана бөлігі. Сіз үйінің үстінен ұшып ұшақты бейнелеу келеді делік. Әрбір кейінгі шеңберінде осы анимацияны жеткілікті сіз іске асыру үшін көрсетіледі ғана ұшақ оның шығу көрсете отырып, алдыңғы кадрдың қатысты ауысты. Әрине, екінші жақтаудың ұшақ толығымен бірінші кадрдың сол тақырыпты жабуға тиіс. Бұл бірнеше есе файл өлшемі азаяды! Интернет анимация тағы бір жолы болуы мүмкін шығарады. Бұл JPEG форматында барлық суреттерді дайындау және нақты ретпен көрсетеді Java-сценарийді өндіру қажет. «Кусочно» тәсіл жоғарыда сипатталғандай Java астам күрделі иелену жүзеге асырылуы мүмкін. JPEG GIF әлдеқайда жоғары тарылуына береді екендігін ескерсек, бұл техника өте тиімді болуы мүмкін. Ал егер сіз . . . Java пайдалана отырып іске асырылуы мүмкін барлық арнайы әсерлер елестету Бірақ біз бірнеше тақырып жалтарған жатыр. Біз JPEG туралы айтып, өйткені Сондықтан, біз осы тамаша графикалық формат көп талқылау. JPEG JPEG алгоритмі компаниялар тобы әзірленді Joint Photographic Experts Group деп аталатын. Жобаның мақсаты жоғары тиімді қысу стандартты ақ-қара және түрлі-түсті суреттер жасау болды, осы мақсатқа қол жеткізуге, сондай-әзірлеушілер болды. Мысалы, Интернет - Қазіргі уақытта JPEG қысу дәрежесі жоғары кең қолдану табады. ... жалғасы

Сіз бұл жұмысты біздің қосымшамыз арқылы толығымен тегін көре аласыз.
Ұқсас жұмыстар
Ақпараттарды шығынмен қысудың жаңашыл тәсілдерін үйрену
Шығынмен ақпаратты қысу
Кодтау және кодтаудың түрлері
Архиватор жайлы түсінік
Электрондық сауда – саттық жүргізуді ұйымдастыру технологиясы
Үздіксіз суық жаймалау станы және болат жолақтарын шынықтыру
Файлдарды архивтеу. архиватор бағдарламалар
Құрылымды мәліметтердің көрінісі
Photoshop қолданбалы бағдарламасына электронды оқулық құру
Файл. Файлдар мен қалталар түсінігі
Пәндер



Реферат Курстық жұмыс Диплом Материал Диссертация Практика Презентация Сабақ жоспары Мақал-мәтелдер 1‑10 бет 11‑20 бет 21‑30 бет 31‑60 бет 61+ бет Негізгі Бет саны Қосымша Іздеу Ештеңе табылмады :( Соңғы қаралған жұмыстар Қаралған жұмыстар табылмады Тапсырыс Антиплагиат Қаралған жұмыстар kz