А давайте предположим, что в новости не абракадабра, а осмысленный, но зашифрованный текст, и посмотрим на неё с этой стороны?
Во-первых, вот собственно текст к расшифровке:
Для сравнения, вот текст из англоязычной новости (возможно, это нам в будущем поможет):
Я тут набросал простенькую программку, немного поиграл со строками и вот что выяснил к этому моменту:
1. В обеих новостях использован один и тот же набор из 33 символов -- первые читаемые символы ASCII, начиная с пробела (х0020..х0040).
2. Частота встречаемости:
В русском тексте:
В английском:
Думаю, можно смело считать, что пробел в обоих случаях -- действительно пробел (так-то это совсем необязательно при шифровании и даже вредно).
3. Следующим логичным шагом была попытка расшифровать текст как простую подстановку, используя частоту встречаемости символов и попытки угадать некоторые части содержимого (аналогично тому, как это было сделано в "Пляшущих человечках" Конан-Дойля, ух, как меня этот рассказ в детстве поразил). Увы, это было бы слишком просто. Ни в английском, ни в русском варианте этот способ не дал результатов.
4. Как лишнее подтверждение предыдущего пункта: я попробовал внимательнее приглядеться к разделу про карты, пытаясь найти там соответствия какому-нибудь из характерных названий (с учётом количества символов или повторяющихся символов). Неа, фейл.
5. Однако, учитывая, что пробелы всё-таки остаются на своих местах, я бы предположил, что сравнение именно по количеству символов в разных словах (в поисках названий карт, в смысле) может дать какой-то результат. Тут потенциально перспективный путь.
И вот здесь меня позвала работа (удалённая, но от этого не менее важная). Так что приглашаю присоединиться других энтузиастов и делюсь наработками. Времени у нас -- всего день, завтра узнаем ответ и так, но это будет уже менее интересно, чем если нам удастся решить эту задачу, согласитесь?
6. А, вот ещё что. Чтоб не ломать глаза об синтаксические символы, я прогнал оба текста, заменив их на набор букв и цифр по следующему соответствию:
!"#$%&'()*+,-./0123456789:;<=>?@
абвгдежзийклмнопрстуфхцчшщъыьэюя
abcdefghijklmnopqrstuvwxyz123456
(Это не расшифровка, это просто для того, чтоб проще искать какие-то закономерности.)
Тексты после такой обработки:
Русский:
Английский: