giovedì 27 aprile 2006

Maledetti spammer

Ora si fanno più furbi... Quanti saranno i lettori di questo blog? non lo so, una decina? Venti?
Bene ora ne ho uno in più, un software che analizza i blog, e tramite le api standard condivise da diversi blog-engine, lascia messaggi.
Un esempio? In questi giorni ho la casella di posta con una decina di messaggi in attesa di moderazione (funzione molto utile di wordpress),  che pubblicizzano pillole dimagranti o pillole blu...
Il robot-spammer che ha analizzato il mio blog ha beccato il post sulle "Pillole di saggezza del sabato", e ha inviato diversi commenti, tra cui "very good site" e "i'm agree" con un link al loro blog (ovvero il sito delle famose pilloline).

Attualmente esistono due modi per combattere lo spam: classica black list e filtri bayesiani.
Le black list sono una tecnica vecchia e collaudata, ma ha lo svantaggio di creare dei falsi negativi (ovvero messaggi non spam, catalogati come spam). Un filtro bayesiano è molto più complesso da realizzare ma è molto più efficace. L'apprendimento del filtro bayesiano è semplice: l'utente raggruppa una serie di spam e una serie di messaggi leciti e li sottopone al filtro. Questo analizza ogni parola delle e-mail - non solo il testo del messaggio ma anche gli header, il codice HTML e i JavaScript - e determina quanto frequentemente un termine appare nello spam e la sua frequenza nelle e-mail normali. Un termine che si trovi solo nello spam (per esempio "V1AGRA", con la lettera I modificata per trarre in inganno i flitri classici) ha il 100% di probabilità di essere una parola-spam, i termini "innocenti" presenti perlopiù nei messaggi leciti sono indicatori positivi, molti termini generici si troveranno equamente distribuiti tra spam e non-spam. Esaminare anche i codici è molto utile: la "parola" FF0000, ad esempio, è un forte indicatore di spam perché è il codice HTML per il colore rosso acceso.
Uno dei vantaggi principali dell'analisi bayesiana è che limita i falsi positivi, ossia le mail lecite ma catalogate come spam. Un filtro basato su un dizionario di parole proibite potrebbe bloccare uno scambio di messaggi tra due medici che parlano di Viagra, mentre un filtro bayesiano che avesse "imparato" le caratteristiche della loro posta sarebbe più cauto.
Dopo l'addestramento, un filtro bayesiano controlla un messaggio di posta verificando se al suo interno ci sono termini "colpevoli" o "innocenti" e, in base a queste rilevazioni, calcola la probabilità complessiva che sia spam. Una volta stabilita la "spammosità" di una mail il software antispam la passa al client di posta del destinatario evidenziandone il grado di pericolosità.
L'utente non deve essere passivo: se rileva dei falsi positivi o dei falsi negativi (spam catalogato come mail lecita) deve risottoporli al software di filtering perché questo possa mantenere aggiornato il suo livello di addestramento.


Ciao Piero

sabato 22 aprile 2006

Debian Backports

Chi utilizza Debian Sarge (ovvero "Stable") spesso sclera per la mancanza di software aggiornato. Diversi sviluppatori debian da tempo hanno avviato un progetto di backports, ovvero il porting dei pacchetti da unstable... risultato? una stable / unstable...

Tralasciando il fatto che per me ha poco senso installare i pacchetti unstable su stable, il link è il seguente

www.backports.org/

Sono presenti i respository per eseguire le operazioni di update/upgrade.

Ciao Piero.

Debian Live

Per chi non lo sapesse è possibile provare Debian (ovvero LA distribuzione di Linux per eccellenza) tramite un comodissimo cd live.

E' possibile scaricare il Live Cd di Sid ovvero la versione "Unstable"

il link è http://live.debian.net

Happy downloading & trying

Ciao Piero

sabato 15 aprile 2006

Odio Internet Explorer...

O meglio odio i programmatori...

Se esistono degli standard perche' non rispettarli? Mi rifersico ai web-developer (una specie di sottocategoria dei programmatori) che quando sviluppano i loro sitarelli non si preoccupano di fare i test di compatibilita' dei browser. Cosa costa installarsi Firefox o qualunque altro browser e fare un po di test?

Per esempio, per lavoro, sto mettendo in piedi un piccolo sito di e-commerce, basato principalmente sui sistemi di pagamento di paypal.

Ho sclerato mezza mattinata perche' non riuscivo a trovare diverse voci inerenti alla gestione del carrello e degli articoli nell'amministrazione di paypal. Perche'? Perche' paypal funziona bene solo con internet explorer...

E noi utenti Linux, MacOsX o di qualunque altra cosa che non utilizzi IE... cosa facciamo?

Scleriamo...

lunedì 10 aprile 2006

Complimenti Wikipedia

Complimenti a Wikipedia, che ha superato le 150.000 voci!

Speriamo che continui a crescere (anche in qualità...)
Ciao Piero

sabato 8 aprile 2006

GUI - Guarda Un Imbecille (davanti al pc)!

Non credo che il significato della sigla sia proprio quello del titolo (anzi GUI starebbe per Graphical User Interface), ma poco ci manca.

Che siano state una grande invenzione non lo metto in dubbio, per molte persone oggi sarebbe impossibile lavorare senza di esse, ma quanto questo è un bene?

Questo non vuole essere un articolo contro Windows, ma uno spunto per far capire ai vari Windowsiani uno dei tanti motivi perchè il mondo Unix ci piace così tanto.

Tante volte i vari Windowsiani accusano noi Unixiani di voler utilizzare le cli (leggasi Command Line Interface - ovvero le shell) per farci grandi verso gli altri, facendo vedere quanto siamo bravi a utilizzare tutti quei comandi che potrebbero essere benissimo impartiti con il mouse facendo click su un pulsante, ma ciò che questi utenti non capiscono è che noi lo facciamo per comodità.

Comodità? Si!

Le shell sono comode, performanti e altamente configurabili. Il fatto è che l'utente professionista medio/alto di windows si immagina la shell come una specie di prompt dei comandi di DOS... il problema è far capire a questi user che non è così!

Primo vantaggio di una shell: sono comode

Problema: devo visualizzare il contenuto di una cartella.

GUI:

1) Apro Konqueror/Nautilus/Windows Explorer (e aspetto in media 2 secondi per il caricamento)
2) Clicco sull'icona del disco/directory radice
3) Apro tutte le sottocartelle fino alla catella desiderata
4) Guardo il contenuto della cartella
CLI (tipo bash):

1) digito "ls /percorso/cartella"

fine... e posso utilizzare pure combinazioni di caratteri jolly e caratteri alfanumerici per fare delle "query" al filesystem

senza contare che con l'autocompletamento dei parametri e comandi, solitamente si digita il 10-20% dei caratteri necessari per impartire il comando

Secondo vantaggio: sono veloci (e stabili)

Problema: copiare un direttorio o un file

GUI:

1) Apro la mia interfaccia (attendo il caricamento)
2) Eseguo le operazioni riportate precedentemente per la visualizzazione della directory che voglio copiare/spostare
3) Apro la mia seconda interfaccia e attendo il caricamento
4) Eseguo le operazioni riportate precedentemente per la visualizzazione della directory di destinazione
5) (a volte) posiziono le due finestre in modo tale che non si sovrappongono
6) cerco la cartella/file da copiare e la trascino nella directory di destinazione.

CLI (tipo bash):

1) per sposotare un cartella: "mv /percorso/directory_da_copiare /dir_destinazione" oppure per copiare sostituisco "mv" con "cp"
Fine...

Terzo vantaggio: applicazioni più semplici da usare

Problema: cambiare indirizzo ip alla mia scheda di rete

GUI (esempio con Windows, vado a memoria):

1) Clicco su start
2) Apro il pannello di controllo
3) Apro le Impostazioni di rete
4) Apro le impostazioni relativi alla scheda di rete interessata
5) Clicco sul vecchio ip, (sposto la mano da mouse alla tastiera) digito il nuovo IP
6) Clicco su OK
7) Riclicco su Ok
8) Chiudo le finestre

CLI:

1) Digito "ifconfig scheda ipnuovo" (per esempio sulla mia macchina Linux: "ifconfig eth0 192.168.1.10")

Finito... Non è più semplice?

Si tratta solo di imparare qualche comando e tutto ciò permette di lavorare senza aspettare eventuali tempi morti dell'interfaccia grafica (o sistema operativo, dato che la più grande scemata di tutti i tempi è stata includere in kernel space di windows la gui di quel sistema... Credo che quando Tanenbaum abbia saputo la notizia abbia fatto pace con Tordvalds :-) (chi conosce la storia di Linux capirà...) ) evitando pure i vari errori dovuti all'utente che trascina le icone dove non deve o dove non si aspettava.

Il solo problema è che per familiarizzare con le CLI ci vuole solo un pò più di tempo che con le GUI, ma credetemi, ne vale la pena...

Attendo molte critiche...

Ciao Piero

mercoledì 5 aprile 2006

Una delle più grandi delusioni...

Spero solo che si fermino qui... mi hanno un po' deluso... principalmente io comprerei un mac non tanto per un fattore estetico (anche se mi attira parecchio) ma per MacOsX... e ci deve girare SOLO macOsX o qualche os open come linux o bsd... ma non windows vi prego!

Per capire di cosa stò parlando... cliccate qui

Apple Tornate Indietro!

Don't go to the dark side of the source!

Apple ricordate! "Think Different!"

Ciao Piero

Basta con i problemi del kernel!

Molti utenti linux, in particolar modo quelli piu' esperti, plasmano il kernel della propria macchina a piacimento, a volte per cercar di far funzionare periferiche che si pensa che non siano supportate.

Un sito che ci sara' sicuramente utile e'

http://kmuto.jp/debian/hcl/

inserendo qui l'output del vostro 'lspci -n' vi saranno indicati i moduli del kernel necessari per far funzionare le vostre periferiche...

Ciao Piero

Pink Floyd... analisi di "The Wall"

Ho trovato un sito molto interessante...

fa un'analisi dettagliata di "The Wall" la famosa opera dei Pink Floyd, scritta da Roger Waters...

http://home.mchsi.com/~ttint/ 

Tecnologia utile....

Da una notizia su /.


FleaPlus writes "The Boston Globe reports that WowWee Toys, the creators of robots like the hack-friendly Robosapien series, has announced a collaboration with Evolution Robotics. WowWee's next generation of robots will make use of Evolution's tech for visual object recognition and indoor navigation, hopefully with future versions being able to not just entertain, but also 'perform useful tasks such as fetching a beer or even helping to carry the groceries.'"



Ne ordinerò uno.... :-)

Ciao Piero

lunedì 3 aprile 2006

Mr.Spok & endless loop

Ho appena finito di vedere una puntata di Star Trek dove Spok, il vulcaniano dalle orecchie a punta e dalla logica ferrea, per salvare la situazione, manda in un ciclo infinito un robot con una frase che tutti noi conosciamo, e che viene studiata nei corsi di logica:

"io ti dico la verità: tutto ciò che dico sono bugie..."

Dopo questa frase il robot incomincia ad impazzire... e a far fuoriuscire il fumo dalle orecchie...

Fortuna che i pc di oggi non fanno così ad ogni endless loop... (ci pensa già windows quando gira normalmente....)

Ciao Piero

anti-Phishing by Google

Per chi non lo sapesse (io l'ho scoperto 5 minuti fa!) google ha realizzato un filtro antiphishing basato non sulle black list, ovvero liste di siti "neri", ma su filtri euristici (una tecnica matematica). Il filtro è raggiungibile qui.


Happy browsing....


Ciao Piero