Blog Antispam Massnahmen

Nachdem die letzten Antispam-Maßnahmen recht erfolgreich waren (es gab keinen Comment-Spam mehr seit dieser Zeit und nur noch ganz vereinzelt verirrte sich ein Referrer-Spam in die Statistik) habe ich heute noch ein paar Verbesserungen eingebaut:

[More:]

b2Evolution führt eine Blacklist über die Spammer erkannt werden (anhand von Keywords im Referrer bzw. Kommentar). Das bedeutet natürlich auch, dass diese regelmäßig upgedated werden muss, damit der Mechanismus effektiv arbeiten kann. Mit diesem Hack wird die Blacklist automatisiert über einen Cron-Job auf den neuesten Stand gebracht. Wer keine Cron-Jobs auf seinem Webserver ausführen darf (so wie ich), kann z.B. auf einen Service von CronJob.de zurückgreifen.

Da manchmal in der Blacklist Einträge auftauchen, die bereits durch andere Einträge abgehandelt werden könnten, rufe ich innerhalb des obigen Cronjobs noch das Skript “Blacklist Pruner” auf (zusätzliche Zeile “include dirname(__FILE__) . ‘/b2antispam_prune.php’;” am Ende des Skripts einfügen). Dadurch werden alle doppelten Einträge automatisch gelöscht.

Zusätzlich rufe ich in dem Cron-Job auch noch dieses Skript auf, welches dafür sorgt, dass Zugriffe mit einem Referrer, der in der Blacklist enthalten ist, über die .HTACCESS-Datei gesperrt werden. Das Skript erstellt die nötigen Einträge in der .HTACCESS-Datei automatisch.

Auch wenn die Spammer nicht mehr in den Kommentaren oder Statistiken auftauchen, verbrauchen sie doch wertvollen Traffic, da sie immer zuerst die komplette Seite zurückgeliefert bekommen, bevor sie von der Antispam-Logik erkannt werden. Dieser Hack wird nun gleich am Anfang der Seite ausgeführt und schickt den Spammer sofort auf die Seite zurück, die er als Referrer angibt bzw. liefert einen Error 404 zurück, wenn kein Referrer-String gesetzt ist.

Wenn neue Key-Words zur Antispam-Blacklist hinzugefügt werden, durchsucht b2evolution leider nicht automatisch Kommentare und Statistiken nach diesen Schlüsselwörtern. Man muss ein manuelles Re-Check für diese Keywords durchführen. Dieser Hack ermöglicht nun diesen Check automatisch durchzuführen. Daduch habe ich bei mir auch noch einige Spam-Kommentare vom April gefunden, die ich übersehen hatte. Ein automatischer Aufruf dieses Skripts in meinem Cron-Job scheitert jedoch bisher immer. Die Ursache habe ich leider noch nicht herausgefunden.

Sprache ermitteln

Vielleicht kann es ja mal nützlich sein: Wenn man mal einen Text vorliegen hat, der in einer unbekannten Sprache verfasst ist, dann kann man über die Tools bei Xerox und Steve Huffmann eventuell die Sprache automatisch ermitteln. Die Erkennungsrate von Xerox war bei meinen Tests allerdings zuverlässiger. Habe aber nur gängige Sprachen getestet.

[via cyDome]

Instant Messaging mit IBM-Mitarbeitern

Seit kurzem können IBM-Kunden und Business Partner jeden IBM-Mitarbeiter (auch mich …) weltweit per Sametime-Chat erreichen. Dazu notwendig ist nur ein Web-Browser sowie eine IBM ID. Natürlich muss man die Internet-Adresse seines Ansprechpartners bei IBM kennen, aber die ist auch sehr einfach herauszufinden.

Nachtrag: Wenn man einen Sanmetime-Client nutzt, muss man den folgenden Server eintragen: “messaging.ngi.ibm.com”.

New Toy arrived

Nachdem ich in letzter Zeit doch mehr fotografiere und öfters an die Grenzen meiner kleinen Canon Ixus 500 stoße, habe ich mir gestern den “großen Bruder” Canon EOS 350D gekauft.

Hauptgrund war die relativ schlechte Lichtstärke der Ixus. Sie muss fast überall blitzen, auch bei Außenaufnahmen wenn das Wetter etwas bedeckt ist und dadurch werden soclhe Bilder meistens nicht so gut.

Deswegen habe ich mir als Standardobjektiv für die EOS auch ein lichtstärkeres Objektiv geleistet, das Sigma 18-50mm F2,8 EX DC. Eigentlich wollte ich ja ein Universalobjektiv was den gesamten Brennweitenbereich von 18-200 mm abdeckt (wie z.B. das Sigma 18-200mm F3,5-6,3 DC). Aber diese Objektive sind dann wieder lichtschwächer und dadurch habe ich das gleiche Problem wieder.

Vermutlich werde ich mir dann noch irgendwann das Sigma 55-200mm F4-5,6 DC dazu holen. Noch schrecke ich ein wenig davor zurück in Zukunft doch mit einem großen Fotokoffer auf Reisen gehen zu müssen 🙂

Beeindruckend ….

… der gestrige Besuch im Druckzentrum Mörfelden der Frankfurter Societät, wo u.a. auch die FAZ und die Frankfurter Neue Presse gedruckt werden.

Auf 33.000 qm Nutzfläche werden dort im Monat ca. 6000 Tonnen Papier bedruckt. In der Halle stapeln sich die 1,6m breiten Papierrollen, jede davon wiegt 1600 kg und ist 21 km lang.

100 Zeitungen á 64 Seiten können dort im mehrfarbigen Offsetdruck gedruckt werden, pro Sekunde (!).

Das Druckzentrum benötigt 25GWh Strom pro Jahr (ausreichend um eine Kleinstadt zu versorgen) und verbraucht 40.000 m3 Wasser.

Auch die vollautomatische Weiterverarbeitung nach dem Druck (Schneiden, falzen, Werbeprospekte beilegen, abzählen und verpacken etc.) war sehr interessant. Man macht sich beim täglichen Zeitunglesen gar nicht so große Gedanken was da vorher im Hintergrund alles abläuft.