Certe volte capita che nella normale attività di Consulenza SEO ci imbattiamo in ventagli di backlink abbastanza particolari che ci fanno domandare se tutte le teorie sulla semantica e il web, sulla capacità di Google di capire i contenuti o di individuare in poco tempo attività di spam o in generale malevole, siano davvero reali.
Analisi del Sito
Dovevamo fare l’Analisi SEO di un potenziale cliente e analizzando i suoi attuali posizionamenti tramite Seozoom abbiamo visto come il suo sito avesse ottenuto nell’ultimo mese un boost di indicizzazione. Questo di seguito il grafico che ci siamo trovati davanti:
+544.69% di aumento del traffico negli ultimi 3 mesi! Il primo pensiero è stato: questo cliente non ha bisogno di un SEO!
Se il traffico è cambiato così drasticamente da inizio marzo sicuramente hanno avviato qualche attività sul web, vediamo cosa hanno fatto per migliorare così.
Andiamo quindi a controllare i posizionamenti e troviamo una prima “anomalia”: il sito che stiamo analizzando tratta prodotti ortopedici ma è indicizzato, e anche discretamente bene, per parole chiave long tail branded “Timberland”.
O la Timberland fa anche prodotti ortopedici (e lo ignoravamo) o c’è qualche cosa che non va.
Questo un’estratto dei posizionamenti individuati. Le parole chiave con “timberland” sono molte di più di quelle attinenti al sito:
A questo punto, nonostante non stiamo parlando di chiavi ad alto traffico, il commento generale è: però!, salti in serp di 30-40 posizioni direttamente in prima pagina non sono male, tutti con “Timberland” nella ricerca poi, come diavolo hanno fatto e perché?
Analisi delle Landing
Per prima cosa andiamo a vedere quali sono le pagine di atterraggio di tutte quelle keyword per capire quali contenuti di qualità e originali hanno creato per ottenere un tale successo, e qui arriva la prima doccia fredda.
Le landing sono pagine create in un attacco malevolo che ha iniettato nel sito, probabilmente tramite qualche falla dell’applicativo, numerose pagine di spam con lunghi elenchi di parole chiave a tema “timberland”.
Questo un esempio del link indicizzato:
http://www.sito.estensione/Providers/style/1924414/cw67n/97543/index.php
e questo come appare:
Struttura della Landing
Questa a fianco è una scansione della pagina fatta con il tool Browseo che estrapola le informazioni dalle pagine come verrebbero viste da un crawler.
La pagina è composta:
- Un tag H1 contenente un frase più lunga dei canonici 70 caratteri / 67 pixel e un testo che è praticamente una lista di keyword (keyword stuffing)
- Una Description di 31 caratteri su cui c’è poco da dire
- Le defunte Keyword che ormai non contano più niente ma ci sono
- Testo di 145 parole anch’esse senza un senso, solo lista di keyword (keyword stuffing).
- Infine 11 links esterni follow verso altre pagine similari su altri siti vittime della stessa azione di spam con anchor text uguali alle parole chiave
Questa pagina è posizionata in 1a e 2a pagina di Google per molte keyword a tema “timberland” ma con volumi molto modesti (sotto le 100 ricerche / mese).
Link Esterni
Come detto i link presenti nel “footer” della pagina puntano ad altre pagine spam similari postate su altri siti che hanno subito la stessa ondata di injection di pagine.
Curiosi come un gatto abbiamo iniziato a seguire tutti i link ciclicamente. Quindi partendo dalla pagina in cui siamo incappati abbiamo seguito i link a cui puntava ripetendo questa operazione per 5 livelli link.
Cosa abbiamo scoperto?
I siti coinvolti erano 23 quasi tutti italiani di cui l’80% hostati presso lo stesso provider. Quasi tutti hanno avuto dei boost nel ranking per parole chiave a tema “timberland”, argomento non attinente con i loro main topic. Parliamo di siti di Hotel, Pro Loco, Bed and Breakfast, Officine meccaniche e molto altro. Tutto tranne che attività anche solo lontanamente avvicinabili al concetto di “scarpe, timberland, etc”.
Abbiamo contattato il provider che ospitava la maggior parte dei siti coinvolti e a seguito delle opportune verifiche hanno individuato una falla nei siti vittima escludendo qualsiasi problema a livello di Server.
Da questa analisi abbiamo estratto anche numero parole chiave che sono state utilizzate in questa attività e per quelle a più alto volume abbiamo voluto verificare l’andamento nel tempo.
Eccovi di seguito i grafici del posizionamento del “sito vittima” rispetto a queste 5 parole chiave:
#1 – Spaccio Timberland
#2 – Rivenditori Timberland
#3 – Timberland Outlet Online Store
#4 – Timberland Usate
#5 – Timberland Reboot
Ok, non stiamo parlando di parole chiave ad alto o medio traffico, ma vedere una crescita repentina a seguito di un’azione di spam come questa illustrata dovrebbe far strabuzzare gli occhi a più di qualche Consulente SEO.
A questo punto la nostra analisi ci aveva spiegato bene o male lo schema, i siti coinvolti, le parole chiave da posizionare ma rimaneva ancora un punto da risolvere.
A che pro? Chi ci guadagna?
Proprio così! Ok, tramite tecniche illecite sono riusciti ad inserire pagine di pessima qualità che spammano a ripetizione specifiche parole chiave e si linkano tra di loro. E poi?
Se un sito di un’officina si indicizza per “timberland usate” cosa succede? Come avviene la conversione?
E così, ci siamo rimessi a scavare tra la fitta rete di link coinvolti nell’attacco trovando 2 link che mostrano siti “cloni” di brand più noti.
Clone 1 – Scarpe e Scarpe
Il primo clone è pubblicato all’interno di un sito di un Hotel e mostra una copia molto fedele di un brand noto del mondo delle calzature: Scarpe e Scarpe.
Il sito originale sarebbe questo: http://www.scarpescarpestore.com/it_it/brand-di-scarpe/timberland.html
La versione clone è formata da una sola pagina che poi rimanda direttamente ai link corretti del sito originale di Scarpe e Scarpe con link “follow”.
Lo staff di SeoZoom si è reso disponibile a fornirci un confronto di posizionamento del sito “Scarpe e Scarpe” prima e dopo questi eventi di injection per vedere se in un qualche modo c’è stato un beneficio o un danno a seguito dell’attacco.
Clone 2 – Timberland
Ovviamente visto che il main topic di questo attacco spam era Timberland non poteva mancare il clone del loro sito italiano.
Proprio nel sito vittima da cui è iniziato tutto, un sito di calzature ortopediche, abbiamo trovato il clone di Timberland Italia:
Il sito originale sarebbe il seguente ma differisce un po dal clone presumibilmente perché la versione clone è stata realizzata in tempi diversi: http://www.timberland.it/it/uomo-calzature/
In questo caso il sito risulta correttamente navigabile in tutto e per tutto e i link finali portano al sito “http://italia.timberlandnu.com/” già noto per essere un sito SCAM.
Considerazioni sulla SEO
Il sito vittima ha guadagnato qualcosa come 45 posizioni e si è stabilito in prima pagina per parole chiave non attinenti al sito, con contenuti estremamente poveri inseriti all’interno di uno schema di link abbastanza ovvio e facile da individuare!
Può un’azione artificiosa e illecita come questa posizionarsi e godere per il tempo che durerà di posizionamenti in 1a e 2a pagina? La risposta sembra essere Si.
Google non dovrebbe individuare facilmente questi schemi di link e provvedere ad intraprendere azioni manuali o similari? Dovrebbe, ma calcolando che l’evento dell’infezione di spam è partito ad inizio Marzo e siamo qui, a fine Aprile, a constatare i risultati SEO ottenuti, direi che non sempre Google è così reattivo.
Da una parte attendiamo il gran giorno quando Penguin o Panda diventeranno algoritmi in real time, dall’altra un’azione malevola che dalla sera alla mattina genera una rete di link e di pagine piene di keyword dimostra di funzionare, purtroppo, piuttosto bene.
Già sentiamo in lontananza echi di SEO che ci diranno “ma stiamo parlando di key inutili e a basso volume”.
E noi rispondiamo che avete ragione, abbiamo perso tempo a fare questa analisi e scrivere questo articolo ma… c’è un ma.
E’ accettabile che Google consenta di “spammare” le SERP in questo modo con questa “apparente” facilità?
Ecco questo screenshot per spiegare il concetto di “spammare la SERP”:
9 risultati su 10 della 2a pagina della key “Zalando Timberland Uomo” sono pagine frutto di questa infezione di cui abbiamo parlato fino ad ora. (Alcuni link al momento daranno error 404 poiché a seguito della nostra segnalazione le pagine sono state rimosse)
Per chi fa il Consulente SEO come noi e passa giornate a monitorare costantemente l’andamento dei siti, le novità che Google tira fuori dal cilindro periodicamente (HTTPS, AMP, Algoritmi in tempo reale, RankBrain, il super computer quantistico, etc) vedere che dopo tutta l’evoluzione che c’è stata nei motori di ricerca ci sono ancora tecniche blackhat seo che riescono ad “invadere le serp” e a rimanere lì per dei mesi ci lasciano alquanto perplessi.
Ci sono clienti o Consulenti che si fanno il problema di copiare una frase da un altro testo perché Google se ne accorge e penalizza, che investono grandissima parte del tempo (giustamente) per creare contenuti originali e di qualità seguendo il motto “Content Is The King“, che analizzano ogni singolo byte del sito web per evitare che ci sia un rel=canonical sbagliato altrimenti Google penalizza, che eliminano backlink non attinenti al sito perché altrimenti Google capisce che non parliamo della stessa cosa e penalizza e poi, alla fine della fiera, con una falla informatica che permette di creare migliaia di pagine piene di keyword abbiamo visto come anche i siti “vittima” si stiano posizionando per chiavi a tema calzature.
Ovviamente ribadiamo che l’analisi è stata fatta consci che si trattava di Keyword Long Tail, Branded e a basso volume ma ci è sembrato un buon “pretesto” per poter sollevare la discussione circa l’efficacia di Google e il suo tempo di reazione.