Количество информации
Информацио́нная энтропи́я — мера неопределённости некоторой системы (в статистической физике или теории информации). Энтропия дискретного источника равна среднему количеству информации, приходящейся на один символ (сообщение, элемент) источника. Характеризует непредсказуемость появления какого-либо символа алфавита.
Например, в последовательности букв, составляющих какое-либо предложение на русском языке, разные буквы появляются с разной частотностью, поэтому неопределённость появления для некоторых букв меньше, чем для других. Если же учесть, что некоторые сочетания букв (в этом случае говорят об энтропии -го порядка, см. ниже) встречаются очень редко, то рассчитанная энтропия языка уменьшается ещё сильнее.
Формальные определения
В случае равновероятных символов источника информационная энтропия рассчитывается по формуле Хартли:
,
где — мощность (основание, объём) алфавита (количество различных символов алфавита),
— количество информации в каждом символе. В общем случае, основание логарифма в определении энтропии может быть любым, большим 1 (так как алфавитом, состоящим только из одного символа, нельзя передавать информацию). Выбор основания логарифма определяет единицу измерения информации. Для информационных систем, основанных на двоичной системе счисления, единицей информации является двоичный символ — бит и основание логарифма
. В этом случае энтропия называется двоичной энтропией. В задачах математической статистики более удобным может оказаться применение натурального логарифма (
), в этом случае единицей измерения информации является нат.
Для случайной величины , принимающей
независимых случайных значений
с вероятностями
(
), для энтропии используется формула Шеннона:
Здесь
означает измеряемое в битах количество информации, содержащейся в том событии, что случайная величина приняла значение
(для предложений на русском языке — количество информации, содержащейся в конкретной букве, имеющей номер
в русском алфавите,
),
— среднее количество информации, приходящейся на один символ (для предложений на русском языке — количество информации на одну букву). Эта величина также называется средней энтропией источника. Величина
называется частной энтропией, характеризующей только
-e состояние.
Таким образом, энтропия системы является суммой с противоположным знаком всех вероятностей появления состояния (события) с номером , умноженных на их же двоичные логарифмы. Это определение для дискретных случайных событий можно формально расширить для непрерывных распределений, заданных плотностью распределения вероятностей, однако полученный функционал будет обладать несколько иными свойствами (см. дифференциальная энтропия).
В случае марковского источника -го порядка, когда условная вероятность появления текущего символа
зависит только от
предыдущих символов, то есть при наличия вероятностных связей между символами (что имеет место в текстовом сообщении), энтропия источника определяется по формуле:
где — вероятность
-го состояния источника, которое определяется
символами, предшествующих текущему символу
,
— число состояний,
— условная вероятность выбора источником символа
в
-ом состоянии,
—
-ая последовательность из
символов, предшествующая символу
,
— вероятность появления последовательности
и
.
Клодом Шенноном было уcтановлено, что энтропия английского текста при равна 0.6—1.3 бит/символ. Также с помощью экспериментальных оценок установлено, что энтропия русского языка с учетом вероятностных связей между элементами равна 1.4 бит/символ для разговорной речи, 1.19 бит/символ для литературного текста, 0.83 бит/символ для делового текста. Энтропия французского языка с учетом вероятностных связей между элементами равна 1.5, 1.38, 1.22 бит/символ соответственно.
Определение по Шеннону
Клод Шеннон задал требования к измерению энтропии:
- функция должна быть непрерывной относительно
; то есть изменение значения величины вероятности на малую величину должно вызывать малое результирующее изменение функции;
- в случае, когда все события равновероятны (
), увеличение количества событий
должно увеличивать значение функции, то есть функция должна быть монотонно возрастающей при увеличении
;
- Если выбор распадается на два последовательных выбора, то первоначальное значение функции должна быть взвешенной суммой индивидуальных значений функции.
Эти требования к энтропии можно записать в виде:
определена и непрерывна для всех
, где
для всех
и
. (Эта функция зависит только от распределения вероятностей, но не от алфавита.)
- Для целых положительных
, должно выполняться следующее неравенство:
- Для целых положительных
, где
, должно выполняться равенство
Шеннон показал, что единственная функция, удовлетворяющая этим требованиям, имеет вид:
где — положительная константа (и в действительности нужна только для выбора единицы измерения энтропии; изменение этой константы равносильно изменению основания логарифма).
Шеннон определил, что измерение энтропии (), применяемое к источнику информации, может определить требования к пропускной способности канала, необходимой для надёжной передачи информации в виде закодированных двоичных чисел.
Определение энтропии Шеннона связано с понятием термодинамической энтропии. Больцман и Гиббс проделали большую работу по статистической термодинамике, которая способствовала принятию слова «энтропия» в информационную теорию. Существует связь между термодинамической и информационной энтропией. Например, демон Максвелла также противопоставляет термодинамическую энтропию информации, и получение какого-либо количества информации равно потерянной энтропии.
Определение с помощью собственной информации
Также можно определить энтропию случайной величины, предварительно введя понятие распределения случайной величины , имеющей конечное число значений:
Тогда энтропия определяется как математическое ожидание этой величины:
Единицы измерения информационной энтропии
От основания логарифма зависит единица измерения количества информации и энтропии: бит, нат, трит или хартли.
Свойства
Энтропия является количеством, определённым в контексте вероятностной модели для источника информации. Например, бросание монеты имеет энтропию:
бит на одно кидание (при условии его независимости), а количество возможных состояний равно:
возможных состояния (значения) («орёл» и «решка»).
У источника, который генерирует строку, состоящую только из букв «А», энтропия равна нулю: , а количество возможных состояний равно:
возможное состояние (значение) («А») и от основания логарифма не зависит.
Примером запоминающих устройств, в которых используются разряды с энтропией, равной нулю, но с количеством информации, равным одному возможному состоянию, то есть не равным нулю, являются разряды данных записанных в ПЗУ, в которых каждый разряд имеет только одно возможное состояние.
Свойствами энтропии являются:
- Неотрицательность:
. Энтропия равна нулю, когда все вероятности
, кроме одной, равны нулю, и эта вероятность равна единице.
- Максимальное значение энтропии равно
и достигается в случае, когда все символы алфавита равновероятны, где
— основание алфавита.
- Энтропия — выпуклая вверх функция распределения вероятностей элементов.
- Если
имеют одинаковое распределение вероятностей элементов, то
.
Вариации и обобщения
b-арная энтропия
В общем случае b-арная энтропия (где b равно 2, 3, …) источника с исходным алфавитом
и дискретным распределением вероятности
где
является вероятностью символа
(
), определяется формулой:
В частности, при , мы получаем обычную двоичную энтропию, измеряемую в битах. При
, мы получаем тринарную энтропию, измеряемую в тритах (один трит имеет источник информации с тремя равновероятными состояниями). При
мы получаем информацию, измеряемую в натах.
Условная энтропия
Если следование символов алфавита не независимо (например, во французском языке после буквы «q» почти всегда следует «u», а после слова «передовик» в советских газетах обычно следовало слово «производства» или «труда»), количество информации, которую несёт последовательность таких символов (а, следовательно, и энтропия) меньше. Для учёта таких фактов используется условная энтропия.
Условной энтропией (для марковской модели) называется энтропия для алфавита, где известны вероятности появления одного символа после известной последовательности из
предыдущих символов
:
где — основание алфавита,
—
-ая последовательность из
символов, предшествующая символу
,
— совместная вероятность появления последовательности
и
,
— условная вероятность появления символа
после последовательности
.
Например, для русского текста без буквы «ё» (так принимается по определению),
.
При эта условная энтропия называется энтропией текста.
Условную энтропию можно использовать при определении информационных потерь при передаче данных в канале с помехами. Для этого применяются так называемые канальные матрицы. Для описания потерь со стороны источника (то есть известен посланный символ) рассматривают условную вероятность получения приёмником символа
при условии, что был отправлен символ
. При этом канальная матрица имеет следующий вид:
| … | … | |||||
|---|---|---|---|---|---|---|
| … | … | |||||
| … | … | |||||
| … | … | … | … | … | … | … |
| … | … | |||||
| … | … | … | … | … | … | … |
| … | … |
Вероятности, расположенные по диагонали, описывают вероятность правильного приёма, а сумма всех элементов любой строки даёт 1. Потери, приходящиеся на передаваемый символ , описываются через частную условную энтропию (условная энтропия источника из принятых символов
при фиксированном переданном символе
):
Для вычисления потерь при передаче всех символов используется средняя условная энтропия:
означает энтропию со стороны источника, аналогично рассматривается
— энтропия со стороны приёмника: вместо
всюду указывается
.
Свойства условной энтропии:
,
,
, в случае, когда символы источников
и
независимы.
, в случае, когда символы источников
и
полностью зависимы.
,
.
Энтропия объединения
Энтропия объединения (совместная энтропия, энтропия произведения) предназначена для расчёта энтропии взаимосвязанных систем (энтропии совместного появления символов источника) и обозначается , где
характеризует передатчик, а
— приёмник.
Взаимосвязь переданных и полученных сигналов описывается вероятностями совместных событий , и для полного описания характеристик канала требуется только одна матрица:
| … | … | ||||
| … | … | ||||
| … | … | … | … | … | … |
| … | … | ||||
| … | … | … | … | … | … |
| … | … |
Для более общего случая, когда описывается не канал, а в целом взаимодействующие системы, матрица необязательно должна быть квадратной. Сумма всех элементов столбца с номером даёт
, сумма строки с номером
есть
, а сумма всех элементов матрицы равна 1. Совместная вероятность
событий
и
вычисляется как произведение исходной и условной вероятности:
Условные вероятности производятся по формуле Байеса. Таким образом, имеются все данные для вычисления энтропий источника и приёмника:
Энтропия объединения вычисляется последовательным суммированием по строкам (или по столбцам) всех вероятностей матрицы, умноженных на их логарифм:
где — совместная вероятность того, что символ алфавита
примет значение
, а символ алфавита
примет значение
.
Путём несложных преобразований также получаем:
Энтропия объединения обладает свойством информационной полноты — из неё можно получить все рассматриваемые величины.
Свойства энтропии объединения:
,
, в случае когда символы источников
и
независимы.
, в случае когда символы источников
и
полностью зависимы.
Взаимная информация
Средняя взаимная информация (взаимная энтропия) определяется через энтропию и условную энтропию как:
Средняя взаимная информация представляет собой среднее количество информации в источнике , содержащейся в источнике
.
Величина называется средней условной собственной информацией, то есть средним количеством информации в символах источника
после получения символов источника
.
Средняя взаимная информация вычисляется по формуле:
.
Теоретическое применение
Пропускная способность канала
Пропускная способность канала — максимальная скорость передачи информации по каналу связи. При этом максимум ищется по всевозможным распределениям вероятностей входных символов канала.
Пропускная способность дискретного канала (между входом модулятора передатчика и выходом демодулятора приёмника) равна:
где
— скорость передачи информации по дискретному каналу связи,
— средняя взаимная информация между входными
символами канала и выходными
символами канала,
— среднее время, затрачиваемое на передачу одного символа.
— производительность источника сообщений (скорость создания информации),
— энтропия источника сообщений.
Величина
называется ненадежностью, отнесённой к единице времени, является условной энтропией и называется ненадежностью, то есть средним количеством информации, теряемой при передаче информации и являющейся мерой неопределённости принятого символа. Эта величина зависит от вероятности ошибочного приема символов источника.
В случае отсутствия шума ненадежность равна нулю, поэтому скорость передачи информации равна производительности источника. Так как максимальное значении энтропии
равно
, то пропускная способность дискретного канала без шума равна:
где — основание алфавита источника.
Так как при равномерном кодировании , где
— длительность бита, то пропускная способность дискретного канала без шума равна скорости передачи битов
.
Пропускная способность канала c шумом меньше пропускной способности канала без шума.
Теоремы Шеннона
Теорема Шеннона для дискретного канала без шума гласит, что символы источника с производительностью можно закодировать так, чтобы передавать их сколь угодно точно по дискретному каналу без шума, при условии что
. Это невозможно, если
, где
— производительность источника,
— энтропия источника,
— среднее время, затрачиваемое на передачу одного символа источника,
— пропускная способность канала между выходом кодера источника и входом декодера источника,
— длительность кодового символа,
— основание кодового алфавита (число различных символов кода).
Теорема Шеннона для дискретного канала c шумом гласит, что символы источника с производительностью можно закодировать так, чтобы передавать их сколь угодно точно (со сколь угодной малой ненадёжностью) по дискретному каналу с шумом, при условии что
, где
— пропускная способность канала. Если
, то можно закодировать источник таким образом, что ненадежность будет меньше чем
, где
сколь угодно мало. Не существует способа кодирования, обеспечивающего ненадёжность, меньшую чем
.
Избыточность источника
Избыточностью алфавита (языка, информации) называется степень неодинаковости распределения вероятностей различных элементов алфавита (символов источника), а также степень взаимной зависимости элементов алфавита (символов источника), проявляющиеся в уменьшении его энтропии по сравнению с максимальным значением. Таким образом, если алфавит имеет вероятностное распределение, отличное от равномерного, то его энтропия , рассчитанная с учетом вероятностных связей между его элементами, отлична от максимального значения, равного
, где
— основание алфавита.
Избыточность языка (избыточность информации) определяется по формуле:
Избыточность можно уменьшить с помощью сжатия источника. В случае, когда источник не имеет избыточности (), то есть вероятности всех символов одинаковы, оптимальным кодированием является равномерное кодирование, при котором каждый символ источника кодируется одинаковым числом битов, равным
. В случае, когда
источник имеет избыточность, и равномерное кодирование не является оптимальным, так как требует
битов для кодирования каждого символа источника. Однако избыточность может быть уменьшена полностью или частично, если при кодировании представлять наиболее вероятные символы короткими последовательностями битов, а менее вероятные — более длинными. В этом случае среднее количество битов, приходящихся на один символ, окажется меньшей, чем в случае равномерного кодирования. Поэтому источник (файл) будет занимать меньший размер, и его символы могут быть переданы по каналу связи более быстро.
Основная теорема кодирования канала без шума гласит, что символы источника с основанием алфавита , имеющего энтропию
, можно так закодировать посредством кодовых символов с основанием алфавита
, что среднее число кодовых символов на один символ источника
удовлетворяет неравенству:
где — сколь угодно мало.
Это неравенство выполняется в случае, когда символы источника объединяются в группы по символов, и производится кодирование этих групп кодовыми символами, причём величина
стремится к бесконечности.
Таким образом, среднее число кодовых символов на один символ источника не может быть сделано меньше, чем . В противном случае, символы источника нельзя достоверно восстановить. Теоретически возможен код, у которого
стремиться к
.
Если кодирование производится двоичными кодовыми символами , то это означает, что при кодировании без потерь среднее число битов, приходящихся на символ источника, может быть сделано очень близким к энтропии источника, которая и является средним количеством информации (битов), приходящееся на символ источника.
При использовании кодирования избыточность источника после кодирования вычисляется по формуле:
где — энтропия кодовых символов
,
— максимальное значение энтропии кодовых символов,
, где
— основание кодового алфавита (число различных символов кода).
Энтропия источника при однозначном декодировании связана с энтропией кодовых символов
по формуле:
.
Таким образом, формула для избыточности источника после кодирования примет вид:
Следовательно, использование кода, у которого , почти полностью устраняет избыточность без потери информации. В этом случае
, то есть кодовые символы должны быть практически равновероятными и независимыми друг от друга.
Сжатие без потерь может быть реализовано с помощью кодирования Хаффмана, кодирования Лемпеля — Зива — Велча или арифметического кодирования.
История
В 1948 году, исследуя проблему рациональной передачи информации через зашумлённый коммуникационный канал, Клод Шеннон предложил революционный вероятностный подход к пониманию коммуникаций и создал первую, истинно математическую, теорию энтропии. Его идеи послужили основой разработки двух основных направлений: теории информации, которая использует понятие вероятности и эргодическую теорию для изучения статистических характеристик данных и коммуникационных систем, и теории кодирования, в которой используются главным образом алгебраические и геометрические инструменты для разработки эффективных кодов.
Понятие энтропии как меры случайности введено Шенноном в его статье «Математическая теория связи» (англ. A Mathematical Theory of Communication), опубликованной в двух частях в в 1948 году.
См. также
- Дифференциальная энтропия (энтропия для непрерывного распределения)
- Энтропийное кодирование
- Цепь Маркова
- Расстояние Кульбака — Лейблера
Примечания
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 264.
- Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 59.
- Усенко О. А. Приложения теории информации и криптографии в радиотехнических системах, 2017. — С. 26.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 23.
- Лось А. Б., Нестеренко А. Ю., Рожков М. И. Криптографические методы защиты информации, 2016. — С. 64.
- Варгаузин В. А., Цикин И. А. Методы повышения энергетической и спектральной эффективности цифровой радиосвязи, 2013. — С. 18.
- C. E. Shannon. Prediction and Entropy of Printed English, 1951. — P. 51.
- Angelo Vulpiani, Roberto Livi. The Kolmogorov Legacy in Physics, 2003. — P. 98.
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 260.
- Shannon, Claude E. A Mathematical Theory of Communication // [англ.]. — 1948. — Июль (т. 27, № 3). — С. 419. — P. 11. — doi:10.1002/j.1538-7305.1948.tb01338.x.
- Габидулин Э. М., Пилипчук Н. И. Лекции по теории информации — МФТИ, 2007. — С. 16. — 214 с. — ISBN 978-5-7417-0197-3
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 262.
- Фомичёв В. М. Элементы теории информации в защите информации, 2021. — С. 56.
- Cover, T., King, R. A. convergent gambling estimate of the entropy of English, 1978. — P. 413.
- Лебедев Д. С., Гармаш В. А. О возможности увеличения скорости передачи телеграфных сообщений. — М.: Электросвязь, 1958. — № 1. — С. 68—69.
- Фомичёв В. М. Элементы теории информации в защите информации, 2021. — С. 60.
- Фомичёв В. М. Элементы теории информации в защите информации, 2021. — С. 61.
- Усенко О. А. Приложения теории информации и криптографии в радиотехнических системах, 2017. — С. 33.
- Усенко О. А. Приложения теории информации и криптографии в радиотехнических системах, 2017. — С. 32.
- Усенко О. А. Приложения теории информации и криптографии в радиотехнических системах, 2017. — С. 32—33.
- Усенко О. А. Приложения теории информации и криптографии в радиотехнических системах, 2017. — С. 36.
- Кудряшов В. Д. Теория информации, 2009. — С. 107.
- Фомичёв В. М. Элементы теории информации в защите информации, 2021. — С. 168.
- Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 61.
- Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 65.
- Мазор Ю. Л. и др. Энциклопедия Радиотехника, 2002. — 136.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 23, 24, 49.
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 277.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 47.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 90.
- Варгаузин В. А., Цикин И. А. Методы повышения энергетической и спектральной эффективности цифровой радиосвязи, 2013. — С. 25.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 67.
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 281.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 27.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 70.
- Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 93—94.
- Фано Р. М. Передача информации. Статистическая теория связи, 1965. — С. 94.
- Шеннон К. Работы по теории информации и кибернетике, 1963. — С. 272.
- Финк Л. М. Теория передачи дискретных сообщений, 1970. — С. 71.
Литература
- Шеннон К. Работы по теории информации и кибернетике. — М.: Издательство иностранной литературы, 2002.
- Волькенштейн М. В. Энтропия и информация. — М.: Наука, 2006.
- Цымбал В. П. Теория информации и кодирование. — Киев: Вища Школа, 2003.
- Martin, Nathaniel F.G. & England, James W. Mathematical Theory of Entropy. — Cambridge University Press, 2011. — ISBN 978-0-521-17738-2.
- Шамбадаль П. Развитие и приложение понятия энтропии. — М.: Наука, 1967. — 280 с.
- Мартин Н., Ингленд Дж. Математическая теория энтропии. — М.: Мир, 1988. — 350 с.
- Хинчин А. Я. Понятие энтропии в теории вероятностей // Успехи математических наук. — Российская академия наук, 1953. — Т. 8, вып. 3(55). — С. 3—20.
- Брюллюэн Л. Наука и теория информации. — М., 1960.
- Винер Н. Кибернетика и общество. — М., 1958.
- Винер Н. Кибернетика или управление и связь в животном и машине. — М., 1968.
- Петрушенко Л. А. Самодвижение материи в свете кибернетики. — М., 1974.
- Эшби У. Р. Введение в кибернетику. — М., 1965.
- Яглом А. М., Яглом И. М. Вероятность и информация. — М., 1973.
- Волькенштейн М. В. Энтропия и информация. — М.: Наука, 1986. — 192 с.
- Верещагин Н. К., Щепин Е. В. Информация, кодирование и предсказание. — М.: ФМОП, МЦНМО, 2012. — 238 с. — ISBN 978-5-94057-920-5.
Ссылки
- Shannon C. E. A Mathematical Theory of Communication. The Bell System Technical Journal, 1948.
- Коротаев С. М. Энтропия и информация — универсальные естественнонаучные понятия.
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Количество информации, Что такое Количество информации? Что означает Количество информации?
Informacio nnaya entropi ya mera neopredelyonnosti nekotoroj sistemy v statisticheskoj fizike ili teorii informacii Entropiya diskretnogo istochnika ravna srednemu kolichestvu informacii prihodyashejsya na odin simvol soobshenie element istochnika Harakterizuet nepredskazuemost poyavleniya kakogo libo simvola alfavita Naprimer v posledovatelnosti bukv sostavlyayushih kakoe libo predlozhenie na russkom yazyke raznye bukvy poyavlyayutsya s raznoj chastotnostyu poetomu neopredelyonnost poyavleniya dlya nekotoryh bukv menshe chem dlya drugih Esli zhe uchest chto nekotorye sochetaniya bukv v etom sluchae govoryat ob entropii n displaystyle n go poryadka sm nizhe vstrechayutsya ochen redko to rasschitannaya entropiya yazyka umenshaetsya eshyo silnee Formalnye opredeleniyaV sluchae ravnoveroyatnyh simvolov istochnika informacionnaya entropiya rasschityvaetsya po formule Hartli H logr M displaystyle H log r M gde M displaystyle M moshnost osnovanie obyom alfavita kolichestvo razlichnyh simvolov alfavita H displaystyle H kolichestvo informacii v kazhdom simvole V obshem sluchae osnovanie logarifma v opredelenii entropii mozhet byt lyubym bolshim 1 tak kak alfavitom sostoyashim tolko iz odnogo simvola nelzya peredavat informaciyu Vybor osnovaniya logarifma opredelyaet edinicu izmereniya informacii Dlya informacionnyh sistem osnovannyh na dvoichnoj sisteme schisleniya edinicej informacii yavlyaetsya dvoichnyj simvol bit i osnovanie logarifma r 2 displaystyle r 2 V etom sluchae entropiya nazyvaetsya dvoichnoj entropiej V zadachah matematicheskoj statistiki bolee udobnym mozhet okazatsya primenenie naturalnogo logarifma r e displaystyle r e v etom sluchae edinicej izmereniya informacii yavlyaetsya nat Dlya sluchajnoj velichiny A displaystyle A prinimayushej M displaystyle M nezavisimyh sluchajnyh znachenij ai displaystyle a i s veroyatnostyami p ai pi displaystyle p a i p i i 1 M displaystyle i 1 M dlya entropii ispolzuetsya formula Shennona H i 1Mpilog2 pi displaystyle H sum i 1 M p i log 2 p i Zdes log2 pi displaystyle log 2 p i oznachaet izmeryaemoe v bitah kolichestvo informacii soderzhashejsya v tom sobytii chto sluchajnaya velichina prinyala znachenie ai displaystyle a i dlya predlozhenij na russkom yazyke kolichestvo informacii soderzhashejsya v konkretnoj bukve imeyushej nomer i displaystyle i v russkom alfavite i 1 33 displaystyle i 1 ldots 33 H displaystyle H srednee kolichestvo informacii prihodyashejsya na odin simvol dlya predlozhenij na russkom yazyke kolichestvo informacii na odnu bukvu Eta velichina takzhe nazyvaetsya srednej entropiej istochnika Velichina Hi log2 pi displaystyle H i log 2 p i nazyvaetsya chastnoj entropiej harakterizuyushej tolko i displaystyle i e sostoyanie Takim obrazom entropiya sistemy yavlyaetsya summoj s protivopolozhnym znakom vseh veroyatnostej poyavleniya sostoyaniya sobytiya s nomerom i displaystyle i umnozhennyh na ih zhe dvoichnye logarifmy Eto opredelenie dlya diskretnyh sluchajnyh sobytij mozhno formalno rasshirit dlya nepreryvnyh raspredelenij zadannyh plotnostyu raspredeleniya veroyatnostej odnako poluchennyj funkcional budet obladat neskolko inymi svojstvami sm differencialnaya entropiya V sluchae markovskogo istochnika n displaystyle n go poryadka kogda uslovnaya veroyatnost poyavleniya tekushego simvola ai displaystyle a i zavisit tolko ot n displaystyle n predydushih simvolov to est pri nalichiya veroyatnostnyh svyazej mezhdu simvolami chto imeet mesto v tekstovom soobshenii entropiya istochnika opredelyaetsya po formule H q 1Q i 1MP q pq ai log2 pq ai q 1Q i 1Mp bq ai log2 pq ai displaystyle H sum q 1 Q sum i 1 M P q p q a i log 2 p q a i sum q 1 Q sum i 1 M p b q a i log 2 p q a i gde P q displaystyle P q veroyatnost q displaystyle q go sostoyaniya istochnika kotoroe opredelyaetsya n displaystyle n simvolami predshestvuyushih tekushemu simvolu ai displaystyle a i Q displaystyle Q chislo sostoyanij pq ai displaystyle p q a i uslovnaya veroyatnost vybora istochnikom simvola ai displaystyle a i v q displaystyle q om sostoyanii bq displaystyle b q q displaystyle q aya posledovatelnost iz n displaystyle n simvolov predshestvuyushaya simvolu ai displaystyle a i p bq ai P q pq ai displaystyle p b q a i P q p q a i veroyatnost poyavleniya posledovatelnosti bq displaystyle b q i ai displaystyle a i Klodom Shennonom bylo uctanovleno chto entropiya anglijskogo teksta pri n 100 displaystyle n 100 ravna 0 6 1 3 bit simvol Takzhe s pomoshyu eksperimentalnyh ocenok ustanovleno chto entropiya russkogo yazyka s uchetom veroyatnostnyh svyazej mezhdu elementami ravna 1 4 bit simvol dlya razgovornoj rechi 1 19 bit simvol dlya literaturnogo teksta 0 83 bit simvol dlya delovogo teksta Entropiya francuzskogo yazyka s uchetom veroyatnostnyh svyazej mezhdu elementami ravna 1 5 1 38 1 22 bit simvol sootvetstvenno Opredelenie po Shennonu Klod Shennon zadal trebovaniya k izmereniyu entropii funkciya dolzhna byt nepreryvnoj otnositelno pi displaystyle p i to est izmenenie znacheniya velichiny veroyatnosti na maluyu velichinu dolzhno vyzyvat maloe rezultiruyushee izmenenie funkcii v sluchae kogda vse sobytiya ravnoveroyatny pi 1 M i 1 M displaystyle p i 1 M i 1 M uvelichenie kolichestva sobytij M displaystyle M dolzhno uvelichivat znachenie funkcii to est funkciya dolzhna byt monotonno vozrastayushej pri uvelichenii M displaystyle M Esli vybor raspadaetsya na dva posledovatelnyh vybora to pervonachalnoe znachenie funkcii dolzhna byt vzveshennoj summoj individualnyh znachenij funkcii Eti trebovaniya k entropii H displaystyle H mozhno zapisat v vide H p1 pM displaystyle H p 1 ldots p M opredelena i nepreryvna dlya vseh p1 pM displaystyle p 1 dotsc p M gde pi 0 1 displaystyle p i in 0 1 dlya vseh i 1 M displaystyle i 1 dotsc M i p1 pM 1 displaystyle p 1 dotsb p M 1 Eta funkciya zavisit tolko ot raspredeleniya veroyatnostej no ne ot alfavita Dlya celyh polozhitelnyh M displaystyle M dolzhno vypolnyatsya sleduyushee neravenstvo H 1M 1M M lt H 1M 1 1M 1 M 1 displaystyle H underbrace left frac 1 M ldots frac 1 M right M lt H underbrace left frac 1 M 1 ldots frac 1 M 1 right M 1 Dlya celyh polozhitelnyh bi displaystyle b i gde b1 bk M displaystyle b 1 ldots b k M dolzhno vypolnyatsya ravenstvo H 1M 1M M H b1M bkM i 1kbiMH 1bi 1bi bi displaystyle H underbrace left frac 1 M ldots frac 1 M right M H left frac b 1 M ldots frac b k M right sum i 1 k frac b i M H underbrace left frac 1 b i ldots frac 1 b i right b i Shennon pokazal chto edinstvennaya funkciya udovletvoryayushaya etim trebovaniyam imeet vid H K i 1Mpilog2 pi displaystyle H K sum i 1 M p i log 2 p i gde K displaystyle K polozhitelnaya konstanta i v dejstvitelnosti nuzhna tolko dlya vybora edinicy izmereniya entropii izmenenie etoj konstanty ravnosilno izmeneniyu osnovaniya logarifma Shennon opredelil chto izmerenie entropii H p1log2 p1 pMlog2 pM displaystyle H p 1 log 2 p 1 ldots p M log 2 p M primenyaemoe k istochniku informacii mozhet opredelit trebovaniya k propusknoj sposobnosti kanala neobhodimoj dlya nadyozhnoj peredachi informacii v vide zakodirovannyh dvoichnyh chisel Opredelenie entropii Shennona svyazano s ponyatiem termodinamicheskoj entropii Bolcman i Gibbs prodelali bolshuyu rabotu po statisticheskoj termodinamike kotoraya sposobstvovala prinyatiyu slova entropiya v informacionnuyu teoriyu Sushestvuet svyaz mezhdu termodinamicheskoj i informacionnoj entropiej Naprimer demon Maksvella takzhe protivopostavlyaet termodinamicheskuyu entropiyu informacii i poluchenie kakogo libo kolichestva informacii ravno poteryannoj entropii Opredelenie s pomoshyu sobstvennoj informacii Takzhe mozhno opredelit entropiyu sluchajnoj velichiny predvaritelno vvedya ponyatie raspredeleniya sluchajnoj velichiny A displaystyle A imeyushej konechnoe chislo znachenij p ai pi pi 0 i 1 2 M displaystyle p a i p i quad p i geqslant 0 i 1 2 ldots M i 1Mpi 1 displaystyle sum i 1 M p i 1 i sobstvennoj informacii I ai log2 pi displaystyle I a i log 2 p i Togda entropiya opredelyaetsya kak matematicheskoe ozhidanie etoj velichiny H E I ai i 1Mpilog2 pi displaystyle H mathbb E I a i sum i 1 M p i log 2 p i Edinicy izmereniya informacionnoj entropii Ot osnovaniya logarifma zavisit edinica izmereniya kolichestva informacii i entropii bit nat trit ili hartli SvojstvaEntropiya yavlyaetsya kolichestvom opredelyonnym v kontekste veroyatnostnoj modeli dlya istochnika informacii Naprimer brosanie monety imeet entropiyu H 2 12log2 12 log2 12 log2 2 1 displaystyle H 2 left frac 1 2 log 2 frac 1 2 right log 2 frac 1 2 log 2 2 1 bit na odno kidanie pri uslovii ego nezavisimosti a kolichestvo vozmozhnyh sostoyanij ravno 21 2 displaystyle 2 1 2 vozmozhnyh sostoyaniya znacheniya oryol i reshka U istochnika kotoryj generiruet stroku sostoyashuyu tolko iz bukv A entropiya ravna nulyu H i 1 log2 1 0 displaystyle H sum i 1 infty log 2 1 0 a kolichestvo vozmozhnyh sostoyanij ravno 20 1 displaystyle 2 0 1 vozmozhnoe sostoyanie znachenie A i ot osnovaniya logarifma ne zavisit Primerom zapominayushih ustrojstv v kotoryh ispolzuyutsya razryady s entropiej ravnoj nulyu no s kolichestvom informacii ravnym odnomu vozmozhnomu sostoyaniyu to est ne ravnym nulyu yavlyayutsya razryady dannyh zapisannyh v PZU v kotoryh kazhdyj razryad imeet tolko odno vozmozhnoe sostoyanie Svojstvami entropii yavlyayutsya Neotricatelnost H 0 displaystyle H geq 0 Entropiya ravna nulyu kogda vse veroyatnosti pi displaystyle p i krome odnoj ravny nulyu i eta veroyatnost ravna edinice Maksimalnoe znachenie entropii ravno H log2 M displaystyle H log 2 M i dostigaetsya v sluchae kogda vse simvoly alfavita ravnoveroyatny gde M displaystyle M osnovanie alfavita Entropiya vypuklaya vverh funkciya raspredeleniya veroyatnostej elementov Esli A B displaystyle A B imeyut odinakovoe raspredelenie veroyatnostej elementov to H A H B displaystyle H A H B Variacii i obobsheniyab arnaya entropiya V obshem sluchae b arnaya entropiya gde b ravno 2 3 istochnika S S P displaystyle mathcal S S P s ishodnym alfavitom S a1 aM displaystyle S a 1 ldots a M i diskretnym raspredeleniem veroyatnosti P p1 pM displaystyle P p 1 ldots p M gde pi displaystyle p i yavlyaetsya veroyatnostyu simvola ai displaystyle a i pi p ai displaystyle p i p a i opredelyaetsya formuloj Hb i 1Mpilogb pi displaystyle H b sum i 1 M p i log b p i V chastnosti pri b 2 displaystyle b 2 my poluchaem obychnuyu dvoichnuyu entropiyu izmeryaemuyu v bitah Pri b 3 displaystyle b 3 my poluchaem trinarnuyu entropiyu izmeryaemuyu v tritah odin trit imeet istochnik informacii s tremya ravnoveroyatnymi sostoyaniyami Pri b e displaystyle b e my poluchaem informaciyu izmeryaemuyu v natah Uslovnaya entropiya Esli sledovanie simvolov alfavita ne nezavisimo naprimer vo francuzskom yazyke posle bukvy q pochti vsegda sleduet u a posle slova peredovik v sovetskih gazetah obychno sledovalo slovo proizvodstva ili truda kolichestvo informacii kotoruyu nesyot posledovatelnost takih simvolov a sledovatelno i entropiya menshe Dlya uchyota takih faktov ispolzuetsya uslovnaya entropiya Uslovnoj entropiej dlya markovskoj modeli nazyvaetsya entropiya dlya alfavita gde izvestny veroyatnosti poyavleniya odnogo simvola xn 1 displaystyle x n 1 posle izvestnoj posledovatelnosti iz n displaystyle n predydushih simvolov yq xn xn 1 x1 displaystyle y q x n x n 1 x 1 Hn 1 H Xn 1 Xn Xn 1 X1 q 1Q i 1Mp yq xn 1 log2 pq xn 1 displaystyle H n 1 H X n 1 X n X n 1 X 1 sum q 1 Q sum i 1 M p y q x n 1 log 2 p q x n 1 gde M displaystyle M osnovanie alfavita yq displaystyle y q q displaystyle q aya posledovatelnost iz n displaystyle n simvolov predshestvuyushaya simvolu xn 1 displaystyle x n 1 p yq xn 1 displaystyle p y q x n 1 sovmestnaya veroyatnost poyavleniya posledovatelnosti yq displaystyle y q i xn 1 displaystyle x n 1 pq xn 1 displaystyle p q x n 1 uslovnaya veroyatnost poyavleniya simvola xn 1 displaystyle x n 1 posle posledovatelnosti yq displaystyle y q Naprimer dlya russkogo teksta bez bukvy yo H0 log2 32 5 displaystyle H 0 log 2 32 5 tak prinimaetsya po opredeleniyu H1 4 358 H2 3 52 H3 3 01 displaystyle H 1 4 358 H 2 3 52 H 3 3 01 Pri n displaystyle n rightarrow infty eta uslovnaya entropiya nazyvaetsya entropiej teksta Uslovnuyu entropiyu mozhno ispolzovat pri opredelenii informacionnyh poter pri peredache dannyh v kanale s pomehami Dlya etogo primenyayutsya tak nazyvaemye kanalnye matricy Dlya opisaniya poter so storony istochnika to est izvesten poslannyj simvol rassmatrivayut uslovnuyu veroyatnost p bj ai displaystyle p b j mid a i polucheniya priyomnikom simvola bj displaystyle b j pri uslovii chto byl otpravlen simvol ai displaystyle a i Pri etom kanalnaya matrica imeet sleduyushij vid b1 displaystyle b 1 b2 displaystyle b 2 bj displaystyle b j bM displaystyle b M a1 displaystyle a 1 p b1 a1 displaystyle p b 1 mid a 1 p b2 a1 displaystyle p b 2 mid a 1 p bj a1 displaystyle p b j mid a 1 p bM a1 displaystyle p b M mid a 1 a2 displaystyle a 2 p b1 a2 displaystyle p b 1 mid a 2 p b2 a2 displaystyle p b 2 mid a 2 p bj a2 displaystyle p b j mid a 2 p bM a2 displaystyle p b M mid a 2 ai displaystyle a i p b1 ai displaystyle p b 1 mid a i p b2 ai displaystyle p b 2 mid a i p bj ai displaystyle p b j mid a i p bM ai displaystyle p b M mid a i aM displaystyle a M p b1 aM displaystyle p b 1 mid a M p b2 aM displaystyle p b 2 mid a M p bj aM displaystyle p b j mid a M p bM aM displaystyle p b M mid a M Veroyatnosti raspolozhennye po diagonali opisyvayut veroyatnost pravilnogo priyoma a summa vseh elementov lyuboj stroki dayot 1 Poteri prihodyashiesya na peredavaemyj simvol ai displaystyle a i opisyvayutsya cherez chastnuyu uslovnuyu entropiyu uslovnaya entropiya istochnika iz prinyatyh simvolov B displaystyle B pri fiksirovannom peredannom simvole ai displaystyle a i H B ai jp bj ai log2 p bj ai displaystyle H B mid a i sum j p b j mid a i log 2 p b j mid a i Dlya vychisleniya poter pri peredache vseh simvolov ispolzuetsya srednyaya uslovnaya entropiya H B A ip ai H B ai ip ai jp bj ai log2 p bj ai i jp ai bj log2 p bj ai displaystyle H B mid A sum i p a i H B mid a i sum i p a i sum j p b j mid a i log 2 p b j mid a i sum i sum j p a i b j log 2 p b j mid a i H B A displaystyle H B mid A oznachaet entropiyu so storony istochnika analogichno rassmatrivaetsya H A B displaystyle H A mid B entropiya so storony priyomnika vmesto p bj ai displaystyle p b j mid a i vsyudu ukazyvaetsya p ai bj displaystyle p a i mid b j Svojstva uslovnoj entropii H B A 0 displaystyle H B A geq 0 H B A H B displaystyle H B A leq H B H B A H B displaystyle H B A H B v sluchae kogda simvoly istochnikov B displaystyle B i A displaystyle A nezavisimy H B A 0 displaystyle H B A 0 v sluchae kogda simvoly istochnikov B displaystyle B i A displaystyle A polnostyu zavisimy H B A H AB H A displaystyle H B A H AB H A H B AC H B A displaystyle H B AC leq H B A Entropiya obedineniya Entropiya obedineniya sovmestnaya entropiya entropiya proizvedeniya prednaznachena dlya raschyota entropii vzaimosvyazannyh sistem entropii sovmestnogo poyavleniya simvolov istochnika i oboznachaetsya H AB displaystyle H AB gde A displaystyle A harakterizuet peredatchik a B displaystyle B priyomnik Vzaimosvyaz peredannyh i poluchennyh signalov opisyvaetsya veroyatnostyami sovmestnyh sobytij p ai bj displaystyle p a i b j i dlya polnogo opisaniya harakteristik kanala trebuetsya tolko odna matrica p a1 b1 displaystyle p a 1 b 1 p a1 b2 displaystyle p a 1 b 2 p a1 bj displaystyle p a 1 b j p a1 bM displaystyle p a 1 b M p a2 b1 displaystyle p a 2 b 1 p a2 b2 displaystyle p a 2 b 2 p a2 bj displaystyle p a 2 b j p a2 bM displaystyle p a 2 b M p ai b1 displaystyle p a i b 1 p ai b2 displaystyle p a i b 2 p ai bj displaystyle p a i b j p ai bM displaystyle p a i b M p aM b1 displaystyle p a M b 1 p aM b2 displaystyle p a M b 2 p aM bj displaystyle p a M b j p aM bM displaystyle p a M b M Dlya bolee obshego sluchaya kogda opisyvaetsya ne kanal a v celom vzaimodejstvuyushie sistemy matrica neobyazatelno dolzhna byt kvadratnoj Summa vseh elementov stolbca s nomerom j displaystyle j dayot p bj displaystyle p b j summa stroki s nomerom i displaystyle i est p ai displaystyle p a i a summa vseh elementov matricy ravna 1 Sovmestnaya veroyatnost p ai bj displaystyle p a i b j sobytij ai displaystyle a i i bj displaystyle b j vychislyaetsya kak proizvedenie ishodnoj i uslovnoj veroyatnosti p ai bj p ai p bj ai p bj p ai bj displaystyle p a i b j p a i p b j mid a i p b j p a i mid b j Uslovnye veroyatnosti proizvodyatsya po formule Bajesa Takim obrazom imeyutsya vse dannye dlya vychisleniya entropij istochnika i priyomnika H A i jp ai bj log2 jp ai bj displaystyle H A sum i left sum j p a i b j log 2 sum j p a i b j right H B j ip ai bj log2 ip ai bj displaystyle H B sum j left sum i p a i b j log 2 sum i p a i b j right Entropiya obedineniya vychislyaetsya posledovatelnym summirovaniem po strokam ili po stolbcam vseh veroyatnostej matricy umnozhennyh na ih logarifm H AB i jp ai bj log2 p ai bj displaystyle H AB sum i sum j p a i b j log 2 p a i b j gde p ai bj displaystyle p a i b j sovmestnaya veroyatnost togo chto simvol alfavita A displaystyle A primet znachenie ai displaystyle a i a simvol alfavita B displaystyle B primet znachenie bj displaystyle b j Putyom neslozhnyh preobrazovanij takzhe poluchaem H AB H A H B A H B H A B displaystyle H AB H A H B mid A H B H A mid B Entropiya obedineniya obladaet svojstvom informacionnoj polnoty iz neyo mozhno poluchit vse rassmatrivaemye velichiny Svojstva entropii obedineniya H AB H A H B displaystyle H AB leq H A H B H AB H A H B displaystyle H AB H A H B v sluchae kogda simvoly istochnikov B displaystyle B i A displaystyle A nezavisimy H AB H A H B displaystyle H AB H A H B v sluchae kogda simvoly istochnikov B displaystyle B i A displaystyle A polnostyu zavisimy Vzaimnaya informaciya Osnovnaya statya Vzaimnaya informaciya Srednyaya vzaimnaya informaciya vzaimnaya entropiya opredelyaetsya cherez entropiyu i uslovnuyu entropiyu kak I A B H A H A B displaystyle I A B H A H A mid B Srednyaya vzaimnaya informaciya predstavlyaet soboj srednee kolichestvo informacii v istochnike A displaystyle A soderzhashejsya v istochnike B displaystyle B Velichina H A B displaystyle H A mid B nazyvaetsya srednej uslovnoj sobstvennoj informaciej to est srednim kolichestvom informacii v simvolah istochnika A displaystyle A posle polucheniya simvolov istochnika B displaystyle B Srednyaya vzaimnaya informaciya vychislyaetsya po formule I A B i jp ai bj log2 p ai bj p ai displaystyle I A B sum i sum j p a i b j log 2 frac p a i b j p a i Teoreticheskoe primeneniePropusknaya sposobnost kanala Osnovnaya statya Propusknaya sposobnost kanala Propusknaya sposobnost kanala maksimalnaya skorost peredachi informacii po kanalu svyazi Pri etom maksimum ishetsya po vsevozmozhnym raspredeleniyam veroyatnostej vhodnyh simvolov kanala Propusknaya sposobnost diskretnogo kanala mezhdu vhodom modulyatora peredatchika i vyhodom demodulyatora priyomnika ravna C max R displaystyle C max R gde R I A B Ts H A H A B displaystyle R frac I A B T s H A H A B skorost peredachi informacii po diskretnomu kanalu svyazi I A B H A H A B displaystyle I A B H A H A B srednyaya vzaimnaya informaciya mezhdu vhodnymi A displaystyle A simvolami kanala i vyhodnymi B displaystyle B simvolami kanala Ts displaystyle T s srednee vremya zatrachivaemoe na peredachu odnogo simvola H A 1TsH A displaystyle H A frac 1 T s H A proizvoditelnost istochnika soobshenij skorost sozdaniya informacii H A displaystyle H A entropiya istochnika soobshenij Velichina H A B 1TsH A B displaystyle H A B frac 1 T s H A B nazyvaetsya nenadezhnostyu otnesyonnoj k edinice vremeni H A B displaystyle H A B yavlyaetsya uslovnoj entropiej i nazyvaetsya nenadezhnostyu to est srednim kolichestvom informacii teryaemoj pri peredache informacii i yavlyayushejsya meroj neopredelyonnosti prinyatogo simvola Eta velichina zavisit ot veroyatnosti oshibochnogo priema simvolov istochnika V sluchae otsutstviya shuma nenadezhnost H A B displaystyle H A B ravna nulyu poetomu skorost peredachi informacii ravna proizvoditelnosti istochnika Tak kak maksimalnoe znachenii entropii H A displaystyle H A ravno log2 M displaystyle log 2 M to propusknaya sposobnost diskretnogo kanala bez shuma ravna C log2 M Ts displaystyle C frac log 2 M T s gde M displaystyle M osnovanie alfavita istochnika Tak kak pri ravnomernom kodirovanii Ts Tblog2 M displaystyle T s T b log 2 M gde Tb displaystyle T b dlitelnost bita to propusknaya sposobnost diskretnogo kanala bez shuma ravna skorosti peredachi bitov Rb 1 Tb displaystyle R b 1 T b Propusknaya sposobnost kanala c shumom menshe propusknoj sposobnosti kanala bez shuma Teoremy Shennona Teorema Shennona dlya diskretnogo kanala bez shuma glasit chto simvoly istochnika s proizvoditelnostyu H A displaystyle H A mozhno zakodirovat tak chtoby peredavat ih skol ugodno tochno po diskretnomu kanalu bez shuma pri uslovii chto H A lt C displaystyle H A lt C Eto nevozmozhno esli H A gt C displaystyle H A gt C gde H A H A Ts displaystyle H A frac H A T s proizvoditelnost istochnika H A displaystyle H A entropiya istochnika Ts displaystyle T s srednee vremya zatrachivaemoe na peredachu odnogo simvola istochnika C log2 D Tc displaystyle C frac log 2 D T c propusknaya sposobnost kanala mezhdu vyhodom kodera istochnika i vhodom dekodera istochnika Tc displaystyle T c dlitelnost kodovogo simvola D displaystyle D osnovanie kodovogo alfavita chislo razlichnyh simvolov koda Teorema Shennona dlya diskretnogo kanala c shumom glasit chto simvoly istochnika s proizvoditelnostyu H A displaystyle H A mozhno zakodirovat tak chtoby peredavat ih skol ugodno tochno so skol ugodnoj maloj nenadyozhnostyu po diskretnomu kanalu s shumom pri uslovii chto H A C displaystyle H A leq C gde C displaystyle C propusknaya sposobnost kanala Esli H A C displaystyle H A geq C to mozhno zakodirovat istochnik takim obrazom chto nenadezhnost budet menshe chem H A C ϵ displaystyle H A C epsilon gde ϵ displaystyle epsilon skol ugodno malo Ne sushestvuet sposoba kodirovaniya obespechivayushego nenadyozhnost menshuyu chem H A C displaystyle H A C Izbytochnost istochnika Osnovnaya statya Izbytochnost informacii Izbytochnostyu alfavita yazyka informacii nazyvaetsya stepen neodinakovosti raspredeleniya veroyatnostej razlichnyh elementov alfavita simvolov istochnika a takzhe stepen vzaimnoj zavisimosti elementov alfavita simvolov istochnika proyavlyayushiesya v umenshenii ego entropii po sravneniyu s maksimalnym znacheniem Takim obrazom esli alfavit imeet veroyatnostnoe raspredelenie otlichnoe ot ravnomernogo to ego entropiya H A displaystyle H A rasschitannaya s uchetom veroyatnostnyh svyazej mezhdu ego elementami otlichna ot maksimalnogo znacheniya ravnogo Hmax A log2 M displaystyle H max A log 2 M gde M displaystyle M osnovanie alfavita Izbytochnost yazyka izbytochnost informacii opredelyaetsya po formule r 1 H A Hmax A displaystyle r 1 frac H A H max A Izbytochnost mozhno umenshit s pomoshyu szhatiya istochnika V sluchae kogda istochnik ne imeet izbytochnosti H A Hmax A displaystyle H A H max A to est veroyatnosti vseh simvolov odinakovy optimalnym kodirovaniem yavlyaetsya ravnomernoe kodirovanie pri kotorom kazhdyj simvol istochnika kodiruetsya odinakovym chislom bitov ravnym log2 M displaystyle log 2 M V sluchae kogda H A lt Hmax A displaystyle H A lt H max A istochnik imeet izbytochnost i ravnomernoe kodirovanie ne yavlyaetsya optimalnym tak kak trebuet log2 M displaystyle log 2 M bitov dlya kodirovaniya kazhdogo simvola istochnika Odnako izbytochnost mozhet byt umenshena polnostyu ili chastichno esli pri kodirovanii predstavlyat naibolee veroyatnye simvoly korotkimi posledovatelnostyami bitov a menee veroyatnye bolee dlinnymi V etom sluchae srednee kolichestvo bitov prihodyashihsya na odin simvol okazhetsya menshej chem v sluchae ravnomernogo kodirovaniya Poetomu istochnik fajl budet zanimat menshij razmer i ego simvoly mogut byt peredany po kanalu svyazi bolee bystro Osnovnaya teorema kodirovaniya kanala bez shuma glasit chto simvoly istochnika s osnovaniem alfavita M displaystyle M imeyushego entropiyu H A displaystyle H A mozhno tak zakodirovat posredstvom kodovyh simvolov s osnovaniem alfavita D displaystyle D chto srednee chislo kodovyh simvolov na odin simvol istochnika n displaystyle bar n udovletvoryaet neravenstvu H A log2 D n lt H A log2 D ϵ displaystyle frac H A log 2 D leq bar n lt frac H A log 2 D epsilon gde ϵ displaystyle epsilon skol ugodno malo Eto neravenstvo vypolnyaetsya v sluchae kogda simvoly istochnika obedinyayutsya v gruppy po N displaystyle N simvolov i proizvoditsya kodirovanie etih grupp kodovymi simvolami prichyom velichina N displaystyle N stremitsya k beskonechnosti Takim obrazom srednee chislo kodovyh simvolov na odin simvol istochnika ne mozhet byt sdelano menshe chem H A log2 D displaystyle H A log 2 D V protivnom sluchae simvoly istochnika nelzya dostoverno vosstanovit Teoreticheski vozmozhen kod u kotorogo n displaystyle bar n stremitsya k H A log2 D displaystyle H A log 2 D Esli kodirovanie proizvoditsya dvoichnymi kodovymi simvolami D 2 displaystyle D 2 to eto oznachaet chto pri kodirovanii bez poter srednee chislo bitov prihodyashihsya na simvol istochnika mozhet byt sdelano ochen blizkim k entropii istochnika kotoraya i yavlyaetsya srednim kolichestvom informacii bitov prihodyasheesya na simvol istochnika Pri ispolzovanii kodirovaniya izbytochnost istochnika posle kodirovaniya vychislyaetsya po formule r 1 H X Hmax X displaystyle r 1 frac H X H max X gde H X displaystyle H X entropiya kodovyh simvolov X displaystyle X Hmax X displaystyle H max X maksimalnoe znachenie entropii kodovyh simvolov Hmax X log2 D displaystyle H max X log 2 D gde D displaystyle D osnovanie kodovogo alfavita chislo razlichnyh simvolov koda Entropiya istochnika H A displaystyle H A pri odnoznachnom dekodirovanii svyazana s entropiej kodovyh simvolov H X displaystyle H X po formule H A n H X displaystyle H A bar n H X Takim obrazom formula dlya izbytochnosti istochnika posle kodirovaniya primet vid r 1 H A n log2 D displaystyle r 1 frac H A bar n log 2 D Sledovatelno ispolzovanie koda u kotorogo n H A log2 D displaystyle bar n rightarrow H A log 2 D pochti polnostyu ustranyaet izbytochnost bez poteri informacii V etom sluchae H X Hmax X displaystyle H X rightarrow H max X to est kodovye simvoly dolzhny byt prakticheski ravnoveroyatnymi i nezavisimymi drug ot druga Szhatie bez poter mozhet byt realizovano s pomoshyu kodirovaniya Haffmana kodirovaniya Lempelya Ziva Velcha ili arifmeticheskogo kodirovaniya IstoriyaV 1948 godu issleduya problemu racionalnoj peredachi informacii cherez zashumlyonnyj kommunikacionnyj kanal Klod Shennon predlozhil revolyucionnyj veroyatnostnyj podhod k ponimaniyu kommunikacij i sozdal pervuyu istinno matematicheskuyu teoriyu entropii Ego idei posluzhili osnovoj razrabotki dvuh osnovnyh napravlenij teorii informacii kotoraya ispolzuet ponyatie veroyatnosti i ergodicheskuyu teoriyu dlya izucheniya statisticheskih harakteristik dannyh i kommunikacionnyh sistem i teorii kodirovaniya v kotoroj ispolzuyutsya glavnym obrazom algebraicheskie i geometricheskie instrumenty dlya razrabotki effektivnyh kodov Ponyatie entropii kak mery sluchajnosti vvedeno Shennonom v ego state Matematicheskaya teoriya svyazi angl A Mathematical Theory of Communication opublikovannoj v dvuh chastyah v v 1948 godu Sm takzheDifferencialnaya entropiya entropiya dlya nepreryvnogo raspredeleniya Entropijnoe kodirovanie Cep Markova Rasstoyanie Kulbaka LejbleraPrimechaniyaShennon K Raboty po teorii informacii i kibernetike 1963 S 264 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 59 Usenko O A Prilozheniya teorii informacii i kriptografii v radiotehnicheskih sistemah 2017 S 26 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 23 Los A B Nesterenko A Yu Rozhkov M I Kriptograficheskie metody zashity informacii 2016 S 64 Vargauzin V A Cikin I A Metody povysheniya energeticheskoj i spektralnoj effektivnosti cifrovoj radiosvyazi 2013 S 18 C E Shannon Prediction and Entropy of Printed English 1951 P 51 Angelo Vulpiani Roberto Livi The Kolmogorov Legacy in Physics 2003 P 98 Shennon K Raboty po teorii informacii i kibernetike 1963 S 260 Shannon Claude E A Mathematical Theory of Communication angl 1948 Iyul t 27 3 S 419 P 11 doi 10 1002 j 1538 7305 1948 tb01338 x Gabidulin E M Pilipchuk N I Lekcii po teorii informacii MFTI 2007 S 16 214 s ISBN 978 5 7417 0197 3 Shennon K Raboty po teorii informacii i kibernetike 1963 S 262 Fomichyov V M Elementy teorii informacii v zashite informacii 2021 S 56 Cover T King R A convergent gambling estimate of the entropy of English 1978 P 413 Lebedev D S Garmash V A O vozmozhnosti uvelicheniya skorosti peredachi telegrafnyh soobshenij M Elektrosvyaz 1958 1 S 68 69 Fomichyov V M Elementy teorii informacii v zashite informacii 2021 S 60 Fomichyov V M Elementy teorii informacii v zashite informacii 2021 S 61 Usenko O A Prilozheniya teorii informacii i kriptografii v radiotehnicheskih sistemah 2017 S 33 Usenko O A Prilozheniya teorii informacii i kriptografii v radiotehnicheskih sistemah 2017 S 32 Usenko O A Prilozheniya teorii informacii i kriptografii v radiotehnicheskih sistemah 2017 S 32 33 Usenko O A Prilozheniya teorii informacii i kriptografii v radiotehnicheskih sistemah 2017 S 36 Kudryashov V D Teoriya informacii 2009 S 107 Fomichyov V M Elementy teorii informacii v zashite informacii 2021 S 168 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 61 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 65 Mazor Yu L i dr Enciklopediya Radiotehnika 2002 136 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 23 24 49 Shennon K Raboty po teorii informacii i kibernetike 1963 S 277 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 47 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 90 Vargauzin V A Cikin I A Metody povysheniya energeticheskoj i spektralnoj effektivnosti cifrovoj radiosvyazi 2013 S 25 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 67 Shennon K Raboty po teorii informacii i kibernetike 1963 S 281 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 27 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 70 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 93 94 Fano R M Peredacha informacii Statisticheskaya teoriya svyazi 1965 S 94 Shennon K Raboty po teorii informacii i kibernetike 1963 S 272 Fink L M Teoriya peredachi diskretnyh soobshenij 1970 S 71 LiteraturaShennon K Raboty po teorii informacii i kibernetike M Izdatelstvo inostrannoj literatury 2002 Volkenshtejn M V Entropiya i informaciya M Nauka 2006 Cymbal V P Teoriya informacii i kodirovanie Kiev Visha Shkola 2003 Martin Nathaniel F G amp England James W Mathematical Theory of Entropy Cambridge University Press 2011 ISBN 978 0 521 17738 2 Shambadal P Razvitie i prilozhenie ponyatiya entropii M Nauka 1967 280 s Martin N Inglend Dzh Matematicheskaya teoriya entropii M Mir 1988 350 s Hinchin A Ya Ponyatie entropii v teorii veroyatnostej rus Uspehi matematicheskih nauk Rossijskaya akademiya nauk 1953 T 8 vyp 3 55 S 3 20 Bryullyuen L Nauka i teoriya informacii M 1960 Viner N Kibernetika i obshestvo M 1958 Viner N Kibernetika ili upravlenie i svyaz v zhivotnom i mashine M 1968 Petrushenko L A Samodvizhenie materii v svete kibernetiki M 1974 Eshbi U R Vvedenie v kibernetiku M 1965 Yaglom A M Yaglom I M Veroyatnost i informaciya M 1973 Volkenshtejn M V Entropiya i informaciya M Nauka 1986 192 s Vereshagin N K Shepin E V Informaciya kodirovanie i predskazanie M FMOP MCNMO 2012 238 s ISBN 978 5 94057 920 5 SsylkiShannon C E A Mathematical Theory of Communication The Bell System Technical Journal 1948 Korotaev S M Entropiya i informaciya universalnye estestvennonauchnye ponyatiya
