diff options
author | rusinthread <rusinthread@cock.li> | 2017-01-06 20:45:53 +0300 |
---|---|---|
committer | rusinthread <rusinthread@cock.li> | 2017-01-06 20:45:53 +0300 |
commit | 00c702f66f3f872baa5278456dfbf7a0a605a64b (patch) | |
tree | 57f4896e2ff4c887fb1f8b80d9d31109793daa0a /gen_md.py | |
parent | 2ff29d8e0f3862cfc32e98d0215c47bba59ffc2e (diff) |
update data
Diffstat (limited to 'gen_md.py')
-rwxr-xr-x | gen_md.py | 21 |
1 files changed, 20 insertions, 1 deletions
@@ -9,6 +9,22 @@ from pprint import pprint from data_lib import load_data, decode_auto CWD = os.path.dirname(os.path.realpath(__file__)) +MD_START = """ +### Описание + +Этот файл автоматически генерируется скриптом `gen_md.py` из данных в файле `data.json`. Чтобы открыть картинку в полном размере, кликни на нее. + +Дата не всегда означает, что именно в этот день шифровка появилась в первый раз, потому что многие из них постились по многу раз и не всегда легко определить самую первую дату. + +Тип 1 - это где "ВОЕННОЕ ВМЕШАТЕЛЬСТВО" и тд. Для расшифровки нужно брать первую букву каждого слова, пропуская отдельные слова и словосочетания. См. алгоритм в `data_lib.py`. + +Тип 2 - шифровка составлена из предложений. Для расшифровки нужно брать первую букву второго слова каждого предложения. См. там же. + +Тип 3 - шифровка составлена из предложений. Каждое предложение - одна буква. Для расшифровки нужно удалить все пробелы и использовать скрипт `analyze_new.py` для частотного анализа текста. Надежного алгоритма расшифровки пока нет. + +### Известные шифровки + +""" def sort_data_by_date(item): return int(time.mktime(datetime.datetime.strptime(item['date'], '%d/%m/%y').timetuple())) @@ -41,7 +57,10 @@ def main(): buf = [] for post in data: cipher_type = post['type'] if 'type' in post else 1 - decoded_text = decode_auto(post['text'], cipher_type) + if cipher_type in (1, 2): + decoded_text = decode_auto(post['text'], cipher_type) + elif cipher_type == 3: + decoded_text = post['decoded'] post_buf = '' post_buf += '**Дата**: %s\n\n' % post['date'] |