Рейтинг:3

Как именно использовать индекс совпадений в шифротексте?

флаг au

Я столкнулся с зашифрованным текстом, а именно:

        КЦКПКБГУФДПХQТЯВИНРРТМВГРКДНБВФДЭТДГИЛТКСРГУД
        DKOTFMBPVGEGLTGCKQRACQCWDNAWCRXIZAKFTLEWRPTYC
        QKYVXCHKFTPONCQQRHJVAJUWETMCMSPKQDYHJVDAHCTRL
        SVSKCGCZQQDZXGSFRLSWCWSJTBHAFSIASPRJAHKJRJUMV
        GKMITZHFPDISPZLVLGWTFPLKKEBDPGCEBSHCTJRWXBAFS
        PEZQNRWXCVYCGAONWDDKACKAWBBIKFTIOVKCGGHJVLNHI
        FFSQESVYCLACNVRWBBIREPBBVFEXOSCDYGZWPFDTKFQIY
        CWHJVLNHIQIBTKHJVNPIST

Однако, когда я попытался применить IC (индекс совпадения), я не мог понять, зачем использовать

        Столбец 2 3 4 5 6 7 8
        1 0,044 0,064 0,049 0,057 0,079 0,050 0,056
        2 0,0524 0,056 0,054 0,057 0,097 0,062 0,062
        3 0,057 0,049 0,048 0,066 0,063 0,057
        4 0,060 0,049 0,082 0,061 0,063
        5 0,057 0,060 0,064 0,062
        6 0,090 0,064 0,068
        7 0,061 0,063
        8 0,077

учитывая тот факт, что мы знаем, что HJV встречается 5 раз выше с интервалами между вхождениями, равными 18, 138, 54 и 12. Предполагая, что размер ключа равен 6, я по-прежнему не понимаю приведенную выше таблицу.

Рейтинг:2
флаг ru

индекс совпадения является мерой того, насколько набор букв отличается от случайного набора, основанного на повторениях. Для алфавита из 26 букв совершенно случайный набор букв будет иметь индекс совпадения около $1/26\около 0,038$, для текста на английском языке индекс совпадения составляет около 0,067 (некоторые источники не нормализуют индекс и вместо этого используют значения 1 для случайного и около 1,73 для английского).

Если мы посмотрим на таблицу, все выглядит немного выше, чем случайное, но шестой столбец, кажется, заполнен значениями, которые имеют аналогичный или больший индекс совпадения с английским языком (текст может быть надуман, чтобы помочь криптоанализу). То, как таблица была сгенерирована, использует заголовки столбцов, текст разделен на это количество столбцов. Затем, просматривая каждый столбец по очереди, совпадение между парами букв используется для вычисления индекса. Так, например, чтобы создать шестой столбец таблицы, мы пишем

КЦКПКБ
ГУФДПХ
QTYAVI
НРРТМВ
ГРКДНБ
ВФДЭТД
GILTXR
ГУДДКО
TFMBPV
ГЕГЛТГ
CKQRAC
QCWDNA
WCRXIZ
АКФТЛЕ
WRPTYC
QKYVXC
ХКФТПО
NCQQRH
ЖВАЮВ
ETMCMS
PKQDYH
JVDAHC
ТРЛСВ
KCGCZQ
QDZXGS
FRLSWC
WSJTBH
АФСИАС
ПРЯХК
JRJUMV
ГКМИТЦ
ХФПДИС
ПЗЛВЛГ
ВТФПЛК
КЭБДПГ
CEBSHC
TJRWXB
АФСПЕЗ
QNRWXC
ВЫКГАО
СВДДКА
CKAWBB
ИКФТИО
VKCGGH
JVLNHI
FFSQES
ВИКЛАК
НВРВББ
ИРЭПББ
ВФЭКСОС
CDYGZW
ПФДТКФ
QIYCWH
JVLNHI
КИБТХ
JVNPIS
Т

и чтобы вычислить запись в шестом столбце второй строки таблицы, мы спускаемся вниз, вторая находка повторяет RR, CC, RR, EE, KK, KK, что значительно больше, чем мы ожидали бы для списка из 56 букв (где в среднем мы ожидаем 2,15 повторения для случайной коллекции). Точно так же, подсчитывая повторы на расстоянии 2, 3 и т. д., мы можем объединить их в оценку индекса совпадения для каждого столбца. Например, во 2 столбце мы видим 5 Cs, 2 Ds, 3 Es, 8 Fs, 3 Is, 1 J, 9 Ks, 1 N, 8 Rs, 1 S, 3 Ts, 2 Us, 6 Vs, 1 W, 2 Ys и 1 Z (и никаких других букв). Это означает, что если мы посчитаем повторяющиеся пары, то будет 10 пар C, 1 пара D, 3 пары E, 28 пар F, 3 пары Is, 36 пар K, 28 пар R, 3 пары T. , 1 пара Us, 15 пар V и 1 пара Y (и никаких других пар), всего 129 повторяющихся пар из 1540 возможных пар. Деление 129 на 1540 дает индекс выборки столбца 0,0838 (я не уверен, как было рассчитано 0,097 в таблице, но 0,0838 все же значительно выше, чем 1/26). Аналогичные расчеты для остальных записей шестого столбца таблицы дают 0,0649, 0,0838, 0,0494, 0,0649, 0,0429, 0,0733. И наоборот, наше вычисление при делении на семь столбцов составляет 0,0319, 0,0443, 0,0434, 0,0408, 0,0443, 0,0443, 0,0408, а на пять столбцов — 0,0439, 0,0443, 0,0325, 0,0353 и 0,0430. Шестая колонка явно выделяется.

Другие столбцы показываются как более случайные из-за менее выраженных эффектов шифра Виженера, но шестой столбец таблицы выделяется. Это говорит нам о том, что длина ключа, вероятно, будет равна 6. Мы можем дополнительно проверить это, взяв количество гистограмм в приведенных выше столбцах и увидев, что они выглядят как сдвиги одного и того же алфавита.

Можно расширить таблицу за пределы 8 столбцов, но мы обнаружим, что имеем дело с более короткими наборами букв для вычисления нашего индекса.Существуют более мощные статистические тесты, которые можно использовать для наборов букв, но индекс совпадения довольно легко вычислить вручную и на глаз, поэтому он был популярен среди ручных криптоаналитиков.

João Víctor Melo avatar
флаг au
Можете ли вы явно показать данные и вычисления, которые вы обрабатываете?
Daniel S avatar
флаг ru
Не могли бы вы сказать мне, откуда взялась таблица в вашем вопросе? Я хотел бы связать это с методом, используемым там.
João Víctor Melo avatar
флаг au
https://www.cise.ufl.edu/~mssz/Class-Crypto-I/Homework/Homework-1.html
João Víctor Melo avatar
флаг au
Что вы подразумеваете под повторяющейся парой?
Daniel S avatar
флаг ru
Повторяющаяся пара — это пара одинаковых букв в одном столбце.
João Víctor Melo avatar
флаг au
Вы сказали, что было 5C, и после того, как вы сказали, что есть 10 пар C?
Daniel S avatar
флаг ru
Да, потому что есть $({5\поверх 2})=10$ способов выбрать 2 вещи из 5.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.