Здравствуйте.

Когда TB обучается различать спам, он делает себе заметки и записывает их в файл training.

При первой обработке он просто все письма может загнать в спам, т.к. не понимает и не различает их.
Потом когда ему говоришь "это не спам" он накапливает данные.
Когда не сделан бэкап и приходится начинать с нуля, он снова всё загоняет.

1) Потому подумал, а если ему подкинуть с другого места этот файл, скажем со второго такого же места,
то он нормально его примет?

2) Не нашёл данные, возможно можно объединять в одно целое? Например 2-3 файла обучения объединить в один.