Частотный анализ
Частотный анализ, частотный криптоанализ — один из методов криптоанализа, основывающийся на предположении о существовании нетривиального статистического распределения отдельных символов и их последовательностей, как в открытом тексте, так и в шифротексте, которое, с точностью до замены символов, будет сохраняться в процессе шифрования и дешифрования.
Упрощённо, частотный анализ предполагает, что частотность появления заданной буквы алфавита в достаточно длинных текстах одна и та же для разных текстов одного языка. При этом, в случае моноалфавитного шифрования, если в шифротексте будет символ с аналогичной вероятностью появления, то можно предположить, что он и является указанной зашифрованной буквой. Аналогичные рассуждения применяются к биграммам (двубуквенным последовательностям), триграммам и т. д. в случае полиалфавитных шифров.
Метод частотного криптоанализа известен с IX века (работы Ал-Кинди), хотя наиболее известным случаем его применения в реальной жизни, возможно, является дешифровка египетских иероглифов Ж.-Ф. Шампольоном в 1822 году. В художественной литературе наиболее известными упоминаниями являются рассказы «Золотой жук» Эдгара По, «Пляшущие человечки» Конан Дойля, а также роман «Дети капитана Гранта» Жюль Верна.
Начиная с середины XX века большинство используемых алгоритмов шифрования разрабатываются устойчивыми к частотному криптоанализу, поэтому он применяется в основном в процессе обучения будущих криптографов.
Описание
Используется тот факт, что вероятность появления отдельных букв, а также их порядок в словах и фразах естественного языка подчиняются статистическим закономерностям: например, пара стоящих рядом букв «ся» в русском языке более вероятна, чем «цы», а «оь» в русском языке не встречается вовсе (зато часто встречается, например, в чеченском). Анализируя достаточно длинный текст, зашифрованный методом замены, можно по частотностям появления символов произвести обратную замену и восстановить исходный текст.
Как упоминалось выше, важными характеристиками текста являются повторяемость букв (количество различных букв в каждом языке ограничено), пар букв, то есть m (m-грамм), сочетаемость букв друг с другом, чередование гласных и согласных и некоторые другие особенности. Примечательно, что эти характеристики являются достаточно устойчивыми.
Идея состоит в подсчёте чисел вхождений каждой nm возможных m-грамм в достаточно длинных открытых текстах T=t1t2…tl, составленных из букв алфавита {a1, a2, …, an}. При этом просматриваются подряд идущие m-граммы текста:
t1t2…tm, t2t3… tm+1, …, ti-m+1tl-m+2…tl.
Если L (ai1ai2 … aim) — число появлений m-граммы ai1ai2…aim в тексте T, а L — общее число подсчитанных m-грамм, то при достаточно больших L частотности L (ai1ai2 … aim)/ L, для данной m-граммы мало отличаются друг от друга.
В силу этого, относительную частотность считают приближением вероятности P (ai1ai2…aim) появления данной m-граммы в случайно выбранном месте текста (такой подход принят при статистическом определении вероятности).
В общем случае частотность букв в процентном выражении можно определить следующим образом: подсчитывается, сколько раз она встречается в шифротексте, затем полученное число делится на общее число символов шифротекста; для выражения в процентах, полученный результат умножается на 100.
Частотность существенно зависит, однако, не только от длины текста, но и от его характера. Например, в техническом тексте обычно редкая буква Ф может появляться гораздо чаще. Поэтому для надёжного определения средней частотности букв желательно иметь набор различных текстов.
См. также
- Шифр Плейфера
- Шифр Виженера
- Полиалфавитный шифр
- Частотность
- Криптоанализ
Литература
- С.Коутинхо. Введение в теорию чисел. Алгоритм RSA. Москва: Постмаркет, 2001. — 328 с.
Ссылки
- Анализ текстов
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Частотный анализ, Что такое Частотный анализ? Что означает Частотный анализ?
Chastotnyj analiz chastotnyj kriptoanaliz odin iz metodov kriptoanaliza osnovyvayushijsya na predpolozhenii o sushestvovanii netrivialnogo statisticheskogo raspredeleniya otdelnyh simvolov i ih posledovatelnostej kak v otkrytom tekste tak i v shifrotekste kotoroe s tochnostyu do zameny simvolov budet sohranyatsya v processe shifrovaniya i deshifrovaniya Uproshyonno chastotnyj analiz predpolagaet chto chastotnost poyavleniya zadannoj bukvy alfavita v dostatochno dlinnyh tekstah odna i ta zhe dlya raznyh tekstov odnogo yazyka Pri etom v sluchae monoalfavitnogo shifrovaniya esli v shifrotekste budet simvol s analogichnoj veroyatnostyu poyavleniya to mozhno predpolozhit chto on i yavlyaetsya ukazannoj zashifrovannoj bukvoj Analogichnye rassuzhdeniya primenyayutsya k bigrammam dvubukvennym posledovatelnostyam trigrammam i t d v sluchae polialfavitnyh shifrov Metod chastotnogo kriptoanaliza izvesten s IX veka raboty Al Kindi hotya naibolee izvestnym sluchaem ego primeneniya v realnoj zhizni vozmozhno yavlyaetsya deshifrovka egipetskih ieroglifov Zh F Shampolonom v 1822 godu V hudozhestvennoj literature naibolee izvestnymi upominaniyami yavlyayutsya rasskazy Zolotoj zhuk Edgara Po Plyashushie chelovechki Konan Dojlya a takzhe roman Deti kapitana Granta Zhyul Verna Nachinaya s serediny XX veka bolshinstvo ispolzuemyh algoritmov shifrovaniya razrabatyvayutsya ustojchivymi k chastotnomu kriptoanalizu poetomu on primenyaetsya v osnovnom v processe obucheniya budushih kriptografov OpisanieIspolzuetsya tot fakt chto veroyatnost poyavleniya otdelnyh bukv a takzhe ih poryadok v slovah i frazah estestvennogo yazyka podchinyayutsya statisticheskim zakonomernostyam naprimer para stoyashih ryadom bukv sya v russkom yazyke bolee veroyatna chem cy a o v russkom yazyke ne vstrechaetsya vovse zato chasto vstrechaetsya naprimer v chechenskom Analiziruya dostatochno dlinnyj tekst zashifrovannyj metodom zameny mozhno po chastotnostyam poyavleniya simvolov proizvesti obratnuyu zamenu i vosstanovit ishodnyj tekst Kak upominalos vyshe vazhnymi harakteristikami teksta yavlyayutsya povtoryaemost bukv kolichestvo razlichnyh bukv v kazhdom yazyke ogranicheno par bukv to est m m gramm sochetaemost bukv drug s drugom cheredovanie glasnyh i soglasnyh i nekotorye drugie osobennosti Primechatelno chto eti harakteristiki yavlyayutsya dostatochno ustojchivymi Ideya sostoit v podschyote chisel vhozhdenij kazhdoj nm vozmozhnyh m gramm v dostatochno dlinnyh otkrytyh tekstah T t1t2 tl sostavlennyh iz bukv alfavita a1 a2 an Pri etom prosmatrivayutsya podryad idushie m grammy teksta t1t2 tm t2t3 tm 1 ti m 1tl m 2 tl Esli L ai1ai2 aim chislo poyavlenij m grammy ai1ai2 aim v tekste T a L obshee chislo podschitannyh m gramm to pri dostatochno bolshih L chastotnosti L ai1ai2 aim L dlya dannoj m grammy malo otlichayutsya drug ot druga V silu etogo otnositelnuyu chastotnost schitayut priblizheniem veroyatnosti P ai1ai2 aim poyavleniya dannoj m grammy v sluchajno vybrannom meste teksta takoj podhod prinyat pri statisticheskom opredelenii veroyatnosti V obshem sluchae chastotnost bukv v procentnom vyrazhenii mozhno opredelit sleduyushim obrazom podschityvaetsya skolko raz ona vstrechaetsya v shifrotekste zatem poluchennoe chislo delitsya na obshee chislo simvolov shifroteksta dlya vyrazheniya v procentah poluchennyj rezultat umnozhaetsya na 100 Chastotnost sushestvenno zavisit odnako ne tolko ot dliny teksta no i ot ego haraktera Naprimer v tehnicheskom tekste obychno redkaya bukva F mozhet poyavlyatsya gorazdo chashe Poetomu dlya nadyozhnogo opredeleniya srednej chastotnosti bukv zhelatelno imet nabor razlichnyh tekstov Sm takzheShifr Plejfera Shifr Vizhenera Polialfavitnyj shifr Chastotnost KriptoanalizLiteraturaS Koutinho Vvedenie v teoriyu chisel Algoritm RSA Moskva Postmarket 2001 328 s SsylkiAnaliz tekstov
