Mail-Server

ID #1176 SpamAssassin: sa-learn anlernen

Problem:

SpamAssassin ist konfiguriert und läuft. Erkennt aber nur einen Bruchteil der eingehenden Spammails.

Erklärung:

SpamAssassin arbeitet zu dem Zeitpunkt nur mit ein paar Mustererkennungen und Regeln. Ein großteil der aktuellen Spam-Wörter ist SpamAssassin noch nicht bekannt. Durch Einrichtung des s.g. Bayes-Filter erfolgt dann eine bessere Erkennungsrate.

Lösung:

SpamAssassin kann aktuelle Spam's lernen. Zum Anlernen gibt es zwei Strategien:
a) Automatisch
b) Manuell

Gerade in der Anfangszeit lohnt es Zweigleissig zu fahren. Denn der Bayesfilter braucht 200 gelernte Spam's bevor er richtig zu arbeiten anfängt.
Später kann man den Autolearn abschalten, wenn es z.B. Performance-Probleme gibt. Ansonsten hilft die Einstellung grundsätzlich uptodate zu bleiben.

Für a) stellt man einfach den auto_learn in der local.cf ein:

# use Bayes-Filter
use_bayes 1
bayes_path /var/spool/spamassassin/bayes
bayes_file_mode 777
# auto-learn einschalten
#fuer Version 2.x:
auto_learn 1
#ab Version 3.0:
bayes_auto_learn 1

Bei b) nutz man das beiliegende Program sa-learn und füttert das mit gesammelter Spammail:

# mbox-Format:
sa-learn --spam --mbox /var/mail/spam

Zurecht kommt jetzt die Frage: Woher bekomme ich die Spammails?
Es gibt überwiegend 2 Antworten:

  1. Man hat bereits selbst gesammlt (z.B. in Outlook oder Thunderbird).
    Der Thunderbird kann direkt einen ganzen Ordner im mbox-Format speichern.
    Für Outlook braucht man exteren Software wie z.B. den MailNavigator.
  2. Die schnellere Methode ist allerdings sich aktuelle Spams im mbox-Format von spamarchive.org runter zuladen.
    Update (da spamarchive.org offline gegangen ist):
    Nicht aktuelle Spam-mboxen finden sich auf der inoffiziellen deutsche TheBat! Seite.
    Weitere Spam-Mailboxen
 

sozial Bookmarking
Bookmarken bei YIGG Bookmarken bei Mister-Wong Bookmarken bei Icio Bookmarken bei del.icio.us Bookmarken bei Technorati Bookmarken bei Furl Bookmarken bei Spurl Bookmarken bei Yahoo Bookmarken bei Google

vom 2006-06-14 09:46, zuletzt 2007-09-11 09:21     Artikel ausdrucken Artikel weiterempfehlen Als PDF-Datei anzeigen

Dieser Inhalt ist unter der Creative-Commons Lizenz lizensiert.

Probleme bitte im Server-Support-Forum diskutieren.

überflüssig 1 2 3 4 5 wertvoll  
Durchschnittliche Bewertung:   4.63 von 5 (8 Bewertungen)

Artikel kommentieren

Kommentar von Frank (2038-01-19 03:14:07):
Danke für den Artikel!
Das geht genau in die Richtung, was ich suche!

Jetzt fehlt mir nur noch eine Anleitung, wie ich in Verbindung mit Plesk den SA dazubringen, Mails nicht nur als SPAM zu markieren sondern auch in eine extra Mailbox zu schieben.
Denn ich finde es recht sinnentleert, dass ich den Spam immer runterladen muß.
Aber wer weiß, vielleicht wird mein Flehen ja erhört ;)

Kommentar von huschi (2038-01-19 03:14:07):
@Frank:
Dein Kommentar paßt nicht wirklich zu diesem Artikel. Nun weiß man nämlich nicht, nach welcher Anleitung Du vorgegangen bist, und meine Kristallkugel ist gerade in Reparatur.
Sorry,
huschi.

Kommentar von daniel (2006-11-01 15:01:27):
hallo,

spamarchiv.org ist leider nicht mehr erreichbar. hast du noch eine quelle wo man mbox´en herbekommt?

danke im voraus!

Kommentar von diter (2006-12-04 17:53:54):
Hi!
Es gibt auch einen OpenSource Outlook2mbox converter:
http://people.freenet.de/ukrebs/dbxconv.html

Kommentar von nh2 (2007-06-18 14:25:04):
Der Link funktioniert leider nicht. Ich wäre wirklich dankbar für eine EINFACHE und schnelle Lösung, um Mails aus Outlook zu MBOXen zu machen, um sie sa-learn zu übergeben.

Kommentar von Markus Thüer (2008-02-12 14:43:39):
Es gibt einen ganz einfachen Weg um Outlook Mails in eine MBox zu bekommen. Einfach auf dem Server das Postfach anlegen (spam@domain.de) Es mit Outlook als IMAP Konto verbinden und in Outlook selbst die Mails in dies Postfach kopieren. Outlook schickt sie dann brav auf den Server.

Kommentar von Dominik George (2008-05-26 13:33:15):
Mein SquidClamAV meldet beim Download der Pakete von der TheBat!-Website, dass das Paket die Malware Worm.Gibe.F-1 enthält.

Damit fütter ich bei mir nix ...

Kommentar von huschi (2008-05-26 16:06:36):
@Dominik George:
a) Sinn und Zweck des Downloads nicht verstanden, gelle!
b) Abgesehen davon erhält man mit Onkel Google Informationen darüber, daß ClamAV so einiges fehlerhaft als "Worm.Gibe.F-1" erkennt.

Kommentar von Stefan König (2008-06-22 16:53:18):
Hm also wenn ich eine eMail an sa-learn --spam verfüttere und dann nochmal genau dieselbe spam nachricht reinkommt, dann lässt SA sie wieder durch weil er sie nicht als SPAM erkennt. bisschen rätselhaft, das SA verhalten hier, vlt. hat jemand eine erklärung. dieses skript arbeitet jedoch so wie es soll :)

Kommentar von huschi (2008-06-22 17:24:22):
@Stefan König:
Dies liegt an der Funktion des Bayes-Filter. Aber es würde zuweit führen, diesen hier zu erklären.

Kommentar von Stefan König (2008-06-22 18:43:35):
Ist mir prinzipiell klar. wenn ich aber genau diese mail als spam lernen lasse und dann sende, sollte die spam wahrscheinlichkeit doch entsprechend höher sein....

Kommentar von huschi (2008-06-22 19:30:12):
Zitat aus diesem "Artikel kommentieren"-Formular:
'Es werden hier keine Fragen diskutiert oder beantwortet!'

huschi.

Kommentar von Kevin Lieser (2010-12-14 14:22:00):
@Frank:

Habe bei mir Plesk 9.5.3 mit SA, ClamAV, Postfix und Dovecot laufen. Und zwar wunderbärchen!

Wenn du danach googlest findest du sicherlich meine "Anleitung/Vorgehensweise" in einem Debian Forum.

Viele Grüße!