Задавшись подобным вопросом с полгода назад в мой генератор доров были добавлены все знаки препинания с учетом вероятности их появления

Просто взял пару огромных обычных текстов на инглише и проанализировал статистику, сколько в них знаков препинания и каких.