Википедия

Избыточность информации

Избыточность информации — термин из теории информации, характеризующий степень неодинаковости распределения вероятностей различных элементов алфавита, а также степень взаимной зависимости элементов алфавита, проявляющиеся в уменьшении его энтропии по сравнению с максимальным значением.

Определение

Если алфавит имеет вероятностное распределение, отличное от равномерного, то его энтропия image, рассчитанная с учетом вероятностных связей между его элементами, отлична от максимально возможного значения, равного image, называемого абсолютной энтропией, где image — основание алфавита (число различных элементов алфавита).

Избыточность алфавита (избыточность языка, избыточность сообщения) определяется по формуле:

image

В случае марковского источника image-го порядка, когда условная вероятность появления текущего символа сообщения image зависит только от image предыдущих символов сообщения, то есть при наличия вероятностных связей между символами сообщения (что имеет место в текстовом сообщении), энтропия источника определяется по формуле:

image

где image — вероятность image-го состояния источника, которое определяется image символами сообщения, предшествующих текущему символу image, image — число состояний, image — условная вероятность выбора источником символа image в image-ом состоянии, imageimage-ая последовательность из image символов, предшествующая символу image, image — совместная вероятность появления последовательности image и image.

Для английского текста, состоящего из 26 букв, image. Клодом Шенноном было уcтановлено, что энтропия английского текста при image равна 0.6—1.3 бит/символ, то есть избыточность английского текста составляет 0.72—0.87.

Уменьшение избыточности

Избыточность можно уменьшить с помощью сжатия источника. В случае, когда источник не имеет избыточности (image), то есть вероятности всех символов одинаковы, оптимальным кодированием является равномерное кодирование, при котором каждый символ источника кодируется одинаковым числом битов, равным image. В случае, когда image источник имеет избыточность, и равномерное кодирование не является оптимальным, так как требует image битов для кодирования каждого символа источника. Однако избыточность может быть уменьшена полностью или частично, если при кодировании представлять наиболее вероятные символы короткими последовательностями битов, а менее вероятные — более длинными. В этом случае среднее количество битов, приходящихся на один символ, окажется меньшей, чем в случае равномерного кодирования.

В результате устранения избыточности источник (файл) будет занимать меньший размер, и его символы могут быть переданы по каналу связи более быстро. Однако устранение избыточности имеет следующий недостаток. Последовательности неравномерного кода, лишенные или практически лишенные избыточности, оказываются весьма «хрупкими» при наличии шумов. Эта хрупкость заключается в том, что достаточно исказить один из символов кодовой последовательности, чтобы сделать невозможным правильное декодирование не только символа источника, а который входит кодовый символ, но и ряда последующих символов источника.

Основная теорема кодирования канала без шума гласит, что символы источника с основанием алфавита image, имеющее энтропию image, можно так закодировать посредством кодовых символов с основанием алфавита image, что среднее число кодовых символов на один символ источника image удовлетворяет неравенству:

image

где image — сколь угодно мало.

Это неравенство выполняется в случае, когда символы источника объединяются в группы по image символов, и производится кодирование этих групп кодовыми символами, причём величина image стремится к бесконечности.

Таким образом, среднее число кодовых символов на один символ источника не может быть сделано меньше, чем image. В противном случае, символы источника нельзя достоверно восстановить. Теоретически возможен код, у которого image стремиться к image.

Если кодирование производится двоичными кодовыми символами image, то это означает, что при кодировании без потерь среднее число битов, приходящихся на символ источника, может быть сделано очень близким к энтропии источника, которая и является средним количеством информации (битов), приходящееся на символ источника.

При использовании кодирования избыточность источника после кодирования вычисляется по формуле:

image

где image — энтропия кодовых символов image, image — максимальное значение энтропии кодовых символов, image, где image — основание кодового алфавита (число различных символов кода).

Энтропия источника image при однозначном декодировании связана с энтропией кодовых символов image по формуле:

image.

Таким образом, формула для избыточности источника после кодирования примет вид:

image

Следовательно, использование кода, у которого image, почти полностью устраняет избыточность без потери информации. В этом случае image, то есть кодовые символы должны быть практически равновероятными и независимыми друг от друга.

Сжатие без потерь может быть реализовано с помощью кодирования Хаффмана, кодирования Лемпеля — Зива — Велча или арифметического кодирования.

Таким образом, кодирование источника позволяет уменьшить число кодовых символов, приходящихся на один символ источника. Эту задачу выполняет кодер источника, однако его использование уменьшает точность декодирования при наличии шумов. В то же время в системах передачи информации часто после кодера источника ставится кодер канала, который добавляет к символам на выходе кодера источника (информационным символам) дополнительные (избыточные) символы, которые не несут информации. В результате, избыточность увеличивается, но она позволяет передавать информацию по каналу связи при наличии шумов более точно. Такое кодирование, вносящее избыточность, называется помехоустойчивым кодированием. В пользу использования совокупности кодера источника и кодера канала можно привести следующие доводы:

  • Избыточность источника далеко не всегда соответствует свойствам канала и не может быть полностью использована для повышения точности декодирования, так как всегда можно выбрать наиболее согласованный с каналом помехоустойчивый код.
  • Часть используемых помехоустойчивых кодов позволяет производить обнаружение и исправление ошибочно принятых последовательностей с помощью относительно простых правил в процессе декодирования, в то время как избыточность источника часто обусловлена весьма сложными зависимостями между его символами (например, в текстовом файле) и позволяет обнаружить ошибки после декодирования символов за счет догадок.
  • Когда непосредственным получателем сообщений является не человек, а машина, избыточность источника весьма трудно использовать для повышения точности приёма. При этом сознательно внесённая кодером канала избыточность, согласованная со свойствами канала, позволяет повысить точность передачи информации.

См. также

  • Обнаружение и исправление ошибок
  • Алгоритмическая теория информации
  • Колмогоровская сложность

Примечания

  1. Варгаузин В. А., Цикин И. А. Методы повышения энергетической и спектральной эффективности цифровой радиосвязи, 2013. — С. 18.
  2. Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 27.
  3. Варгаузин В. А., Цикин И. А. Методы повышения энергетической и спектральной эффективности цифровой радиосвязи, 2013. — С. 19.
  4. C. E. Shannon. Prediction and Entropy of Printed English, 1951. — P. 51.
  5. Angelo Vulpiani, Roberto Livi. The Kolmogorov Legacy in Physics, 2003. — P. 98.
  6. Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 70.
  7. Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 80.
  8. Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 93—94.
  9. Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 94.
  10. Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 272.
  11. Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 71.
  12. Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 88—89.

Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Избыточность информации, Что такое Избыточность информации? Что означает Избыточность информации?

Izbytochnost informacii termin iz teorii informacii harakterizuyushij stepen neodinakovosti raspredeleniya veroyatnostej razlichnyh elementov alfavita a takzhe stepen vzaimnoj zavisimosti elementov alfavita proyavlyayushiesya v umenshenii ego entropii po sravneniyu s maksimalnym znacheniem OpredelenieEsli alfavit imeet veroyatnostnoe raspredelenie otlichnoe ot ravnomernogo to ego entropiya H A displaystyle H A rasschitannaya s uchetom veroyatnostnyh svyazej mezhdu ego elementami otlichna ot maksimalno vozmozhnogo znacheniya ravnogo Hmax A log2 M displaystyle H max A log 2 M nazyvaemogo absolyutnoj entropiej gde M displaystyle M osnovanie alfavita chislo razlichnyh elementov alfavita Izbytochnost alfavita izbytochnost yazyka izbytochnost soobsheniya opredelyaetsya po formule r 1 H A Hmax A displaystyle r 1 frac H A H max A V sluchae markovskogo istochnika n displaystyle n go poryadka kogda uslovnaya veroyatnost poyavleniya tekushego simvola soobsheniya ai displaystyle a i zavisit tolko ot n displaystyle n predydushih simvolov soobsheniya to est pri nalichiya veroyatnostnyh svyazej mezhdu simvolami soobsheniya chto imeet mesto v tekstovom soobshenii entropiya istochnika opredelyaetsya po formule H q 1Q i 1MP q pq ai log2 pq ai q 1Q i 1Mp bq ai log2 pq ai displaystyle H sum q 1 Q sum i 1 M P q p q a i log 2 p q a i sum q 1 Q sum i 1 M p b q a i log 2 p q a i gde P q displaystyle P q veroyatnost q displaystyle q go sostoyaniya istochnika kotoroe opredelyaetsya n displaystyle n simvolami soobsheniya predshestvuyushih tekushemu simvolu ai displaystyle a i Q displaystyle Q chislo sostoyanij pq ai displaystyle p q a i uslovnaya veroyatnost vybora istochnikom simvola ai displaystyle a i v q displaystyle q om sostoyanii bq displaystyle b q q displaystyle q aya posledovatelnost iz n displaystyle n simvolov predshestvuyushaya simvolu ai displaystyle a i p bq ai P q pq ai displaystyle p b q a i P q p q a i sovmestnaya veroyatnost poyavleniya posledovatelnosti bq displaystyle b q i ai displaystyle a i Dlya anglijskogo teksta sostoyashego iz 26 bukv Hmax log2 26 4 7 displaystyle H max log 2 26 4 7 Klodom Shennonom bylo uctanovleno chto entropiya anglijskogo teksta pri n 100 displaystyle n 100 ravna 0 6 1 3 bit simvol to est izbytochnost anglijskogo teksta sostavlyaet 0 72 0 87 Umenshenie izbytochnostiIzbytochnost mozhno umenshit s pomoshyu szhatiya istochnika V sluchae kogda istochnik ne imeet izbytochnosti H A Hmax A displaystyle H A H max A to est veroyatnosti vseh simvolov odinakovy optimalnym kodirovaniem yavlyaetsya ravnomernoe kodirovanie pri kotorom kazhdyj simvol istochnika kodiruetsya odinakovym chislom bitov ravnym log2 M displaystyle log 2 M V sluchae kogda H A lt Hmax A displaystyle H A lt H max A istochnik imeet izbytochnost i ravnomernoe kodirovanie ne yavlyaetsya optimalnym tak kak trebuet log2 M displaystyle log 2 M bitov dlya kodirovaniya kazhdogo simvola istochnika Odnako izbytochnost mozhet byt umenshena polnostyu ili chastichno esli pri kodirovanii predstavlyat naibolee veroyatnye simvoly korotkimi posledovatelnostyami bitov a menee veroyatnye bolee dlinnymi V etom sluchae srednee kolichestvo bitov prihodyashihsya na odin simvol okazhetsya menshej chem v sluchae ravnomernogo kodirovaniya V rezultate ustraneniya izbytochnosti istochnik fajl budet zanimat menshij razmer i ego simvoly mogut byt peredany po kanalu svyazi bolee bystro Odnako ustranenie izbytochnosti imeet sleduyushij nedostatok Posledovatelnosti neravnomernogo koda lishennye ili prakticheski lishennye izbytochnosti okazyvayutsya vesma hrupkimi pri nalichii shumov Eta hrupkost zaklyuchaetsya v tom chto dostatochno iskazit odin iz simvolov kodovoj posledovatelnosti chtoby sdelat nevozmozhnym pravilnoe dekodirovanie ne tolko simvola istochnika a kotoryj vhodit kodovyj simvol no i ryada posleduyushih simvolov istochnika Osnovnaya teorema kodirovaniya kanala bez shuma glasit chto simvoly istochnika s osnovaniem alfavita M displaystyle M imeyushee entropiyu H A displaystyle H A mozhno tak zakodirovat posredstvom kodovyh simvolov s osnovaniem alfavita D displaystyle D chto srednee chislo kodovyh simvolov na odin simvol istochnika n displaystyle bar n udovletvoryaet neravenstvu H A log2 D n lt H A log2 D ϵ displaystyle frac H A log 2 D leq bar n lt frac H A log 2 D epsilon gde ϵ displaystyle epsilon skol ugodno malo Eto neravenstvo vypolnyaetsya v sluchae kogda simvoly istochnika obedinyayutsya v gruppy po N displaystyle N simvolov i proizvoditsya kodirovanie etih grupp kodovymi simvolami prichyom velichina N displaystyle N stremitsya k beskonechnosti Takim obrazom srednee chislo kodovyh simvolov na odin simvol istochnika ne mozhet byt sdelano menshe chem H A log2 D displaystyle H A log 2 D V protivnom sluchae simvoly istochnika nelzya dostoverno vosstanovit Teoreticheski vozmozhen kod u kotorogo n displaystyle bar n stremitsya k H A log2 D displaystyle H A log 2 D Esli kodirovanie proizvoditsya dvoichnymi kodovymi simvolami D 2 displaystyle D 2 to eto oznachaet chto pri kodirovanii bez poter srednee chislo bitov prihodyashihsya na simvol istochnika mozhet byt sdelano ochen blizkim k entropii istochnika kotoraya i yavlyaetsya srednim kolichestvom informacii bitov prihodyasheesya na simvol istochnika Pri ispolzovanii kodirovaniya izbytochnost istochnika posle kodirovaniya vychislyaetsya po formule r 1 H X Hmax X displaystyle r 1 frac H X H max X gde H X displaystyle H X entropiya kodovyh simvolov X displaystyle X Hmax X displaystyle H max X maksimalnoe znachenie entropii kodovyh simvolov Hmax X log2 D displaystyle H max X log 2 D gde D displaystyle D osnovanie kodovogo alfavita chislo razlichnyh simvolov koda Entropiya istochnika H A displaystyle H A pri odnoznachnom dekodirovanii svyazana s entropiej kodovyh simvolov H X displaystyle H X po formule H A n H X displaystyle H A bar n H X Takim obrazom formula dlya izbytochnosti istochnika posle kodirovaniya primet vid r 1 H A n log2 D displaystyle r 1 frac H A bar n log 2 D Sledovatelno ispolzovanie koda u kotorogo n H A log2 D displaystyle bar n rightarrow H A log 2 D pochti polnostyu ustranyaet izbytochnost bez poteri informacii V etom sluchae H X Hmax X displaystyle H X rightarrow H max X to est kodovye simvoly dolzhny byt prakticheski ravnoveroyatnymi i nezavisimymi drug ot druga Szhatie bez poter mozhet byt realizovano s pomoshyu kodirovaniya Haffmana kodirovaniya Lempelya Ziva Velcha ili arifmeticheskogo kodirovaniya Takim obrazom kodirovanie istochnika pozvolyaet umenshit chislo kodovyh simvolov prihodyashihsya na odin simvol istochnika Etu zadachu vypolnyaet koder istochnika odnako ego ispolzovanie umenshaet tochnost dekodirovaniya pri nalichii shumov V to zhe vremya v sistemah peredachi informacii chasto posle kodera istochnika stavitsya koder kanala kotoryj dobavlyaet k simvolam na vyhode kodera istochnika informacionnym simvolam dopolnitelnye izbytochnye simvoly kotorye ne nesut informacii V rezultate izbytochnost uvelichivaetsya no ona pozvolyaet peredavat informaciyu po kanalu svyazi pri nalichii shumov bolee tochno Takoe kodirovanie vnosyashee izbytochnost nazyvaetsya pomehoustojchivym kodirovaniem V polzu ispolzovaniya sovokupnosti kodera istochnika i kodera kanala mozhno privesti sleduyushie dovody Izbytochnost istochnika daleko ne vsegda sootvetstvuet svojstvam kanala i ne mozhet byt polnostyu ispolzovana dlya povysheniya tochnosti dekodirovaniya tak kak vsegda mozhno vybrat naibolee soglasovannyj s kanalom pomehoustojchivyj kod Chast ispolzuemyh pomehoustojchivyh kodov pozvolyaet proizvodit obnaruzhenie i ispravlenie oshibochno prinyatyh posledovatelnostej s pomoshyu otnositelno prostyh pravil v processe dekodirovaniya v to vremya kak izbytochnost istochnika chasto obuslovlena vesma slozhnymi zavisimostyami mezhdu ego simvolami naprimer v tekstovom fajle i pozvolyaet obnaruzhit oshibki posle dekodirovaniya simvolov za schet dogadok Kogda neposredstvennym poluchatelem soobshenij yavlyaetsya ne chelovek a mashina izbytochnost istochnika vesma trudno ispolzovat dlya povysheniya tochnosti priyoma Pri etom soznatelno vnesyonnaya koderom kanala izbytochnost soglasovannaya so svojstvami kanala pozvolyaet povysit tochnost peredachi informacii Sm takzheObnaruzhenie i ispravlenie oshibok Algoritmicheskaya teoriya informacii Kolmogorovskaya slozhnostPrimechaniyaVargauzin V A Cikin I A Metody povysheniya energeticheskoj i spektralnoj effektivnosti cifrovoj radiosvyazi 2013 S 18 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 27 Vargauzin V A Cikin I A Metody povysheniya energeticheskoj i spektralnoj effektivnosti cifrovoj radiosvyazi 2013 S 19 C E Shannon Prediction and Entropy of Printed English 1951 P 51 Angelo Vulpiani Roberto Livi The Kolmogorov Legacy in Physics 2003 P 98 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 70 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 80 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 93 94 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 94 Shennon K Raboty po teorii informacii i kibernetike 1963 S 272 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 71 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 88 89

NiNa.Az

NiNa.Az - Абсолютно бесплатная система, которая делится для вас информацией и контентом 24 часа в сутки.
Взгляните
Закрыто