Mail-Server

ID #1201 SpamAssassin: jetzt mit Bilderkennung

Problem:

Seit geraumer Zeit vermehren sich Bilder in SpamMails. Meist sieht eine Mail so aus, daß ein (animiertes) Gif-Bild in normalen Text eingebettet wird.
Wer in der local.cf den Parameter ok_languages lediglich auf 'de' gesetzt hat, wird zumindest einen Teil der Spams filtern.

Lösung:

Besser fährt man allerdings mit einem kleinen Plugin für SpamAssassin: FuzzyOcr (als Erweiterung von OcrPlugin).

Vorbemerkung:

Seit Version 2.3 benötigt FuzzyOcr SpamAssasin ab der Version 3.1.4. Es wurde zwar versucht das Programm abwärtskompatibel zu halten, was aber überhaupt nicht funktionier.
Wer eine 2.0 Version hat, sollte wirklich mal updaten.
Wer eine 3.0 Version hat (z.B. mit Debian Sarge), der sollte entweder updaten (Debian-Stichwort: volatile-sloppy) oder die Version FuzzyOcr 2.2beta zurückgreifen.

Vorbereitung für FuzzyOcr:

Das Plugin braucht einiges an Software für den Betrieb. Dennoch fangen wir erst mit dem Plugin an: (aktuelle Version suchen!)

cd /usr/local/src/
wget http://users.own-hero.net/~decoder/fuzzyocr/fuzzyocr-latest.tar.gz
tar xzf fuzzyocr-latest.tar.gz
cd FuzzyOcr-*

Hier lesen wir uns erstmal die Datei INSTALL durch. Vorallem die Notes nach 1.6 für die verschiedenen Linux-Distributionen.

Danach machen wir es so wie es dort steht. Für Debian wäre dies z.B.:

apt-get install netpbm imagemagick libungif-bin

Die Perl-Module installieren wir über CPAN:

perl -MCPAN -e shell
install Digest::MD5
install String::Approx

Installation:

#Achtung: bei Debian gilt /etc/spamassassin/
cp -p FuzzyOcr.* /etc/mail/spamassassin/
cd /etc/mail/spamassassin
mv FuzzyOcr.words.sample FuzzyOcr.words
#evtl. müssen noch die Pfade in der FuzzyOcr.cf angepaßt werden.

#Prüfe die SA-Version (wenn latest-Version):
spamassassin -V
#Wenn kleiner als 3.1.4 muß folgende Zeile in der FuzzyOcr.cf gesetz werden:
focr_pre314 1

#Logfile zum Testen anlegen:
touch FuzzyOcr.log
chmod 666 FuzzyOcr.log

#SpamAssassin neu starten:
/etc/init.d/spamassassin restart
#Anlauffehler sind meist im maillog zu finden.

Testen:

Der Autor hat in der 2.3-Version netterweise bereits ein paar Beispiele mitgeliefert. Einfach mal durchprobieren:

spamassassin -t < /usr/local/src/FuzzyOcr-2.3b/samples/jpeg.eml

 

sozial Bookmarking
Bookmarken bei YIGG Bookmarken bei Mister-Wong Bookmarken bei Icio Bookmarken bei del.icio.us Bookmarken bei Technorati Bookmarken bei Furl Bookmarken bei Spurl Bookmarken bei Yahoo Bookmarken bei Google

huschi, zuletzt 2006-10-23 13:32     Artikel ausdrucken Artikel weiterempfehlen Als PDF-Datei anzeigen

Dieser Inhalt ist unter der Creative-Commons Lizenz lizensiert.

Probleme bitte im Server-Support-Forum diskutieren.

überflüssig 1 2 3 4 5 wertvoll  
Durchschnittliche Bewertung:   5 von 5 (1 Bewertungen)

Artikel kommentieren

Kommentar von Michael (2009-07-15 21:57:06):
Hallo,
unter centos hat diese Paket gefehlt.
yum install netpbm-progs

Ansonsten eine schöne Anleitung.
Danke

Eine Frage habe ich nur und zwar:
Wie stellt man dazu den Score ein?
Oder besser gesagt wie schickt man Bilder SPAM nach /dev/null.