Problem:
Bei einem frischen / neuinstallierten Server funktioniert der SpamAssassin noch recht langsam. Häufig ist der Grund zu schwache Einstellungen und ein nicht angelernter Bayes-Filter.
Bayes ist aber ein wesentliches Feature und ausschlaggebend für die erfolgreiche Spam-Erkennung.
Erklärungen zu Bayes:
Bayes nutzt eine eigene Datenbank. Diese nennen wir Bayes-DB.
Diese Bayes-DB kann entweder global angelegt werden, dann steht sie in der /etc/spamassassin/local.cf
. Oder pro Mailbox und dann liegt sie in den User-Verzeichnissen (falls vorhanden). Unter Plesk wäre dies z.B. /var/qmail/mailnames/DOMAIN/USER/.spamassassin/
.
In diesem Verzeichnis liegt häufig auch eine eigene local.cf
. Die Einstellungen darin überschreibt dabei die globale Konfiguration.
Nun braucht der Bayes aber 200 Spam- und 200 Ham-Tokens um arbeiten zu können. Solange bringt der Bayes-Filter keine Ergebnisse.
Es gibt generell 2 Methoden um die Bayes-DB zu füttern:
- Spam-Mailboxen per sa-learn anlernen.
- Mit
auto-learn
warten bis genug Mails aufgelaufen sind. Hierfür müssen aber erstmal die Schwellwerte so niedrig wie möglich eingestellt werden, damit Spam grundsätzlich mal erkannt wird und dann auch als automatisch angelernt werden.
Die ersten Schritte sind also folgende Fragen zu überdenken und ggf. zu verändern:
- Globale oder lokale Bayes-DB?
- Gibt es bereits lokale Bayes-DB's?
- Gibt es bereits lokale local.cf's?
Ich persönlich halte mehr von einer zentralen Bayes-DB.
(ACHTUNG: Im Gegensatz zu vielen Berichten ist /root/.spamassassin/
eindeutig der falsche Ort dafür!)