Que levante la mano aquél de vosotros que ha abierto un blog y que, midiéndolo con Google Analytics, se ha encontrado con la grata (y envenenada) sorpresa de recibir 500 visitas una semana después de la apertura. Seguro que sois unos cuantos.

En mi caso, si algo tienen en común todos los blogs que he abierto (y ya són unas cuantos) es este dato. ¿Qué pasa? ¿Resulta que soy un puto gurú del SEO y yo sin saberlo? ¿Que mi content ralla una calidad tan alta que Google, solo olerlo, me mete en su simiente de calidad, justo entre el NYT y la Wikipedia?

Al principio, evidentemente, te alegras un montón: ni en mis mejores previsiones hubiese imaginado generar un tráfico así en tan poco tiempo. Entonces empiezas a rascar, y ves que ese tráfico proviene exclusivamente de Referral y que te aporta entre un 90% y un 100% de rebote (calidad suprema). Que el tiempo de estancia en el site no llega a 1 segundo (ayayay…). Y que las visitas vienen de lugares tan próximos a mí como son USA o Rusia (en este último caso, por cierto, la mayoría procedentes de la bonita localidad de Samara, a la cual quise dedicar un post en un blog un poco distinto, para agradecerle los servicios prestados).

Buscas un poco más en foros y blogs y constatas tus suspechas: se trata de visitas NO REALES, es decir, SPAM, que se insertan como métrica en Analytics pero que en realidad no han pasado por tu site. La alegría se transforma rápidamente en decepción (fase 1) y cabreo (fase 2). Se me ocurren dos cuestiones:

  • ¿Cual es el sentido de mandar visitas ficticias a mi site? ¿Penalizar mi inexistente (aún) SEO? ¿Reir un rato?
  • ¿Cómo lo hago para eliminar este tipo de visitas de mis mediciones?

La primera pregunta aún no la he resuelto. Si alguno de vosotros lo sabe, que me lo diga porque estoy francamente interesado. Pero es la segunda pregunta la importante ya que estas visitas pervierten las métricas y es necesario descartarlas.

Cómo filtramos el tráfico fantasma (SPAM)

La solución que he encontrado hasta la fecha se basa en combinar filtros con la instalación de un pluggin (Spam Referrer Block). Vamos a los filtros.

En un principio mis filtros se basaban en EXCLUIR parámetros de visita. Por ejemplo, el nombre del host…

Cómo evitar el tráfico SPAM en Google Analytics - Leyendo entre datos

…o la ciudad (o país) que me enviaba las visitas:

Cómo evitar el tráfico SPAM en Google Analytics - Leyendo entre datos

Son filtros que funcionan, pero mi principal problema es que acabé así:

Cómo evitar el tráfico SPAM en Google Analytics - Leyendo entre datos

Es decir, añadiendo un flitro cada vez que detectaba algun fantasma que se colaba en mi blog. Sinceramente, hay tantos (cada vez más) que no es escalable.

Haciendo frente a mi desesperación, busqué y rebusqué y un buen día encontré este enlace de Jarfer que me dio más esperanzas. Él lo explica muy bien en su post, pero bàsicamente se trata de filtrar con un INCLUIR (y no Excluir) añadiendo este parámetro en el filtro de la vista…

midominio\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com|jarfer\.us9\.list\-manage\.com

…donde la zona destacada en azul sería la que debe contener la URL de tu site. A partir de ahí, rellenar los siguientes campos:

  • Nombre del filtro: el que queremos (Sesiones sin SPAM?)
  • Tipo de filtro: Personalizado / Incluir
  • Campo del filtro: Nombre del host
  • Patrón del filtro: el anteriomente comentado
  • Guardar

En definitiva, de este modo:

Cómo evitar el tráfico SPAM en Google Analytics - Leyendo entre datos

El objetivo es incluir en las mediciones de Analytics, mediante expresiones regulares, solo las visitas que efectivamente han estado en nuestro site. Jarfer además, incluye alguna expresión regular más para no excluir las visitas de Mailchimp por ejemplo.

Este filtro es muy efectivo y realmente he conseguido reducir en un 90% los Referral spam, cosa que evidentemente es muy positiva (para comprobarlo, simplemente haced el ejercicio de tener dos vistas: una con el filtro y otra sin él. Y comparad).

Pero, por desgracia, algunos cabrones se siguen colando. Finalmente, he añadido por una tercera variable: un pluggin de WordPress que me han recomendado: Spam Referrer Block.

Cómo evitar el tráfico SPAM en Google Analytics - Leyendo entre datos

Es un pluggin sencillo que incluye un listado de los host que envían visitas fantasma y bloquea su acceso a nuestra cuenta de Google Analytics. El listado se puede ampliar añadiendo tu propia black list, que puedes optar por enviar a los desarrolladores del pluggin para que poco a poco vayan ampliando su propia lista (y de paso ayudar a todos aquellos que se encuentren en la misma situación).

Hace poco que lo he instalado, y de momento entre los filtros y el pluggin parece que estoy manteniendo a raya el tráfico fantasma (dos semanas, cero visitas spam). ¡Que dure!

¡Espero que este post os resulte útil :)!