Oggi vi voglio parlare di un argomento non propriamente legato all’ambito “dev” ma, fidatevi,  vi tornerà utile!

Se avete un sito web, un blog o un e-commerce, lo avrete sicuramente collegato ad un tool di analytics con lo scopo di misurare il traffico verso il sito e capire il comportamento degli utenti.

A questo proposito Google Analytics è una delle scelte più ovvie: è semplice da impostare e ha un piano free (con dei limiti abbastanza irraggiungibili) che consente di utilizzarlo senza spendere un euro.

Il problema

Fin qui tutto bene se non fosse che, ahimè, il servizio di Google Analytics è bombardato costantemente da traffico SPAM.

Perché lo fanno?

Lo scopo è quello dello SPAM più becero, ovvero, ad esempio far finire nei vostri report degli eventi contenti dei link che puntano a siti non proprio raccomandabili.

Ma come fanno?

In realtà è molto semplice: inviano al server di Google Analytics delle hit simulate, come se fossero state generate da un vero visitatore del vostro sito, in modo che finiscano nei vostri report. Questo è possibile poiché Google Analytics nella sua configurazione di default, non esegue alcun controllo sul dominio da cui proviene la richiesta. Vi ho già praticamente detto metà della soluzione al problema 🙂

Sono pericolose?

Essenzialmente no, basta non farsi fregare e non cliccare sui link che vi propongono. Il vero problema è che falsano, anche pesantemente, i dati che Google Analytics raccoglie! Nel nostro caso abbiamo verificato che, per quanto riguarda il nostro sito, in alcuni casi il traffico SPAM presente nei report di Google Analytics raggiungeva il 30% del traffico totale!

Come faccio a capire se anche il mio sito è coinvolto?

Semplicissimo: basta accedere a Google Analytics, andare nella sezione Pubblico/Tecnologia/Rete e selezionando nella griglia che vi si presenta la voce Nome host come Dimensione principale. Se nella tabella sottostante troverete più di una riga, beh, ahimè, ci siete dentro!

report_host_ga

La soluzione?

Se cercate online troverete decine di blog che vi suggeriranno di inserire una quantità non ben definita di filtri senza poi risolvere davvero il problema. La soluzione in realtà è molto semplice e consiste in un singolo filtro che, come avrete già intuito, sfrutta il fatto che il traffico SPAM proviene (per forza di cose) da un dominio diverso da quello effettivo del vostro sito.

Per impostare il filtro vi basta:

  1. accedere alla sezione Amministrazione del vostro Google Analytics;
  2. selezionare la voce Filtri nella sezione Vista;
  3. selezionare Aggiungi filtro;
  4. comporre il filtro in questo modo:
    1. Tipo di filtro: predefinito;
    2. Nelle combobox successive: Includi solo/traffico verso il nome host/uguali a;
    3. Nome host: il nome del nostro sito.

filtro_ga

Salvate il filtro e…..fatto! D’ora in poi i dati che verranno raccolti da Google Analytics proverranno esclusivamente dal vostro dominio. Per verificare l’efficacia del filtro vi basta attendere qualche giorno e accedere alla tabella che avete consultato in precedenza, impostare la data di partenza del report al giorno successivo all’attivazione del filtro (poiché il filtro non è retroattivo) e noterete che sarà presente una sola riga, quella del vostro sito!

Questo è tutto, fateci sapere se vi è tornato utile! 🙂 Alla prossima!