summaryrefslogtreecommitdiff
path: root/gen_md.py
diff options
context:
space:
mode:
authorrusinthread <rusinthread@cock.li>2017-01-06 20:45:53 +0300
committerrusinthread <rusinthread@cock.li>2017-01-06 20:45:53 +0300
commit00c702f66f3f872baa5278456dfbf7a0a605a64b (patch)
tree57f4896e2ff4c887fb1f8b80d9d31109793daa0a /gen_md.py
parent2ff29d8e0f3862cfc32e98d0215c47bba59ffc2e (diff)
update data
Diffstat (limited to 'gen_md.py')
-rwxr-xr-xgen_md.py21
1 files changed, 20 insertions, 1 deletions
diff --git a/gen_md.py b/gen_md.py
index 23eb76e..78118f6 100755
--- a/gen_md.py
+++ b/gen_md.py
@@ -9,6 +9,22 @@ from pprint import pprint
from data_lib import load_data, decode_auto
CWD = os.path.dirname(os.path.realpath(__file__))
+MD_START = """
+### Описание
+
+Этот файл автоматически генерируется скриптом `gen_md.py` из данных в файле `data.json`. Чтобы открыть картинку в полном размере, кликни на нее.
+
+Дата не всегда означает, что именно в этот день шифровка появилась в первый раз, потому что многие из них постились по многу раз и не всегда легко определить самую первую дату.
+
+Тип 1 - это где "ВОЕННОЕ ВМЕШАТЕЛЬСТВО" и тд. Для расшифровки нужно брать первую букву каждого слова, пропуская отдельные слова и словосочетания. См. алгоритм в `data_lib.py`.
+
+Тип 2 - шифровка составлена из предложений. Для расшифровки нужно брать первую букву второго слова каждого предложения. См. там же.
+
+Тип 3 - шифровка составлена из предложений. Каждое предложение - одна буква. Для расшифровки нужно удалить все пробелы и использовать скрипт `analyze_new.py` для частотного анализа текста. Надежного алгоритма расшифровки пока нет.
+
+### Известные шифровки
+
+"""
def sort_data_by_date(item):
return int(time.mktime(datetime.datetime.strptime(item['date'], '%d/%m/%y').timetuple()))
@@ -41,7 +57,10 @@ def main():
buf = []
for post in data:
cipher_type = post['type'] if 'type' in post else 1
- decoded_text = decode_auto(post['text'], cipher_type)
+ if cipher_type in (1, 2):
+ decoded_text = decode_auto(post['text'], cipher_type)
+ elif cipher_type == 3:
+ decoded_text = post['decoded']
post_buf = ''
post_buf += '**Дата**: %s\n\n' % post['date']