Yop

Aller au contenu | Aller au menu | Aller à la recherche

Spam/Virus

Tout ce qui a rapport avec les spams ou les virus

Fil des billets - Fil des commentaires

jeudi, 12 avril 2007

Live Spam Challenge 2007

24 heures de spams (et de hams) en continu.
Qui trouvera le maximum de spams en faisant le moins de false positive ?

La page d'information
Le Pdf de description

(Microsoft est dans les parages...
...Via Slashdot)

lundi, 18 décembre 2006

La fin d'ORDB

Extrait de http://ordb.org/news/?id=38

We regret to inform you that ORDB.org [...] is shutting down.[...]
We encourage system owners to remove ORDB checks from their mailers immediately and start investigating alternative methods of spam filtering.[...]
DNS and the mailing lists will vanish today, December 18, 2006.

jeudi, 16 novembre 2006

Spam camouflage

Encore un petite nouveauté...

Je vois 2 raisons à ce "camouflage":

La 1ère, c'est que l'OCR sera plus difficile car certaines lettres seront sur un fond de la même couleur.

La 2ème, c'est le ratio "pixels par octets":

En effet, devant l'explosion des spams contenant des images, des nouveaux moyens de défense ont dus êtres trouvés pour identifier les images contenant essentiellement du texte (à priori un spam).

L'une de ces nouvelles techniques pour détecter les images "spam" est d'étudier le ratio "pixels par octets"...


  • spamNormal.gif

12259 octets (12 Ko)
508x560 -> 284 480 pixels
Nombres de pixels par octets (ratio): 23


  • ImageNormale508x560pasSpam.gif

124793 octets (122 Ko)
508x560 -> 284 480 pixels
Nombres de pixels par octets (ratio): 2.2


  • NouvelleImageSpamCamouflage.gif

27154 octets (26,5 Ko)
700x400 -> 280 000 pixels
Nombres de pixels par octets (ratio): 10.3


A priori, la moyenne des images spams non "camouflage", a un ratio allant de 7 à 60 (en moyenne 35) alors qu'une image non spam a plutôt en général un ratio entre 1 et 10 (en moyenne 3).
Tant que les fonds d'images spams sont unis, le ratio étant en moyenne de 35, c'est très significatif, mais avec ce nouveau spam "camouflage" avec un ratio de 10, çà l'est beaucoup moins...

Tout le monde aura noté également l'anti OCR avec les lettres décalées...

Edit 20/11/2006 :

jeudi, 9 novembre 2006

Spam sans URL

De plus en plus de spams n'ayant pas de liens vers des sites webs...
Ceci pour contrer les détections basées sur les URLs (comme SURBL )

Ici la technique consiste à montrer l'URL dans un beau gif animé:

Le spam:

Le gif animé:

lundi, 23 octobre 2006

Spam en gif animé et OCR

En ce moment, la mode est au gif animés.
Le but étant de contourner les différentes méthodes implémentant de l'OCR pour la détection de spam.

L'image finale:

Le séquencement à l'intérieur du gif:

- page 2 de 6 -