Segmento Analytics Spam referral

Segmento de Google Analytics para detectar el SPAM referral

Posted by Lucía Marín on Jul 20, 2016

Llevamos ya un buen tiempo viéndonos un poco o muy acosados, según el caso, por el dichoso SPAM «referral» (y lo pongo entre comillas porque como sabéis ahora entra por todas partes, no solo como tráfico de referencia…). Google ha hecho y hace sus intentos por minimizarlo, pero aún llega. Para mí hasta ahora lo que mejor ha funcionado ha sido incluir la dimensión antispam desde Tag Manager, para solo contabilizar los hits que controlo y envío yo misma activamente.

Si aun así te llega Spam, o como a mí, te a pasado que «en casa de herrero cuchillo de palo»… Puedes probar a detectar tus fuentes y medios de tráfico SPAM de manera sencilla, y bastante rápida. Aunque se trata solo de una aproximación más, claro está que ningún sistema es perfecto. Y desde ya aviso que conlleva REVISIÓN MANUAL.

Vamos a ver un segmento de Google Analytics que puede ayudarnos a detectar el Spam, y para ello nos basamos en el comportamiento de los usuarios en las sesiones.

¡OJO! Ni están todos los que son ni son todos los que están, pero se aproxima.

En cualquier caso lo que vamos a hacer es separar el tráfico basura, o junk traffic, que suena mejor :P, el tráfico al que no le interesa nuestra página.

Y ya revisamos y volvemos a examinar a ojo para ver qué tráfico es Spam.

Es un poco laborioso, pero para hacer a posteriori funciona.

 

SEGMENTO GOOGLE ANALYTICS: Candidatos a SPAM

Para ello, creamos estas condiciones para el segmento:

A nivel de SESIÓN:

  1. Páginas por sesión = 1
  2. Rebotes = 1 (por sesión, equivale a Rebote 100%)
  3. Tiempo en página = 0

El segmento para detectar candidatos a SPAM quedaría así:
Segmento de Google Analytics para detectar SPAM Referral - Lucia Marin

Aquí puedes importarlo (link a la galería de soluciones de GA).

IMPORTAR Segmento de Google Analytics: Candidatos a SPAM

 

Esta última parte es otra condición OPCIONAL:

Si el anterior segmento incluye demasiado tráfico real, podríamos añadir otra condición a nivel de usuario (los que realizan una única visita). Aunque mejor no incluirla en la mayoría de casos porque restringe demasiado.

A nivel de USUARIO:

  1. Sesiones = 1 (por usuario)

Este segmento más restrictivo quedaría así:

Lucia Marin: Segmento de Google Analytics para detectar SPAM Referral

Aquí puedes importarlo (link a la galería de soluciones de GA):

IMPORTAR Segmento de Google Analytics: Candidatos a SPAM 2

 

Una vez apliquemos el segmento, como decía antes, no todo el tráfico resultante va a ser SPAM, puede ser tráfico basura natural ajaj el que todo sitio tiene.

Por ello, para seguir explorando los sitios obtenidos y dictaminar mejor si son Spam o no, podemos añadir ciertas dimensiones secundarias en el informe de Fuente / Medio, dentro de Adquisición en Google Analytics.

 

Bueno, al tajo, veamos qué sale tras aplicar el segmento:

Segmento de Analytics para candidatos a Spam, por Lucia Marin

En principio, ya se ven dominios extraños y claramente de Spam (law-enforcement-ee.xyz, ¿os suena?, ¿китай.с.новым.годом.рф?, ¿WTF? jaja).

Otros dominios normales que no son sospechosos (Google, Twitter, Linkedin, Xataka :D).

Pero OJO!! no os fiéis: en google / organic todavía podemos tener Spam

 

Una última IDEA para el SPAM organic

ORGANIC: Ya no todo el SPAM es referral, así que tenemos que revisar las keywords de búsqueda un poco. Al igual que en referencias miramos la URL, en búsqueda lo que puede darnos pistas son las palabras clave.

En lugar de mirar todas las sesiones, lo hacemos ahora solo con este segmento concreto de «candidatos a Spam», así lo ponemos a prueba :P.

Para ello, indagamos más a fondo el tráfico de buscadores con la dimensión secundaria «Palabra clave«:

Organic Spam en Google Analytics - por Lucia Marin

Ajá, cuántas keywords de dominios extraños, ¿eh? ¡Cazados!

Podemos revisar a simple vista si no hay mucha información de palabras clave, o filtrar más en caso necesario. Podemos quitar: np –, por aquella moda del filtro para not provided. O podemos filtrar solo keywords que tengan por ejemplo un punto (la mayoría del spam organic muestra su URL en la keyword, cómo les gusta firmar todo… jaja). Todo dependerá del volumen de hits analizado y de líneas a examinar.

Filtros de busqueda avanzada en Google Analytics

 

CONCLUSIÓN: Me repito y os digo que la mejor manera de limpiar es con la dimensión antispam, pero oye, no está mal esto tampoco (para hacer a posteriori). Eso sí, toca hacer filtros a mano con expresiones regulares para excluir a todos los intrusos, uno por uno.

 

Si necesitas aprender Google Tag Manager y Analytics, entonces te interesa mi curso online. Consta de material PDF actualizado constantemente. Un sitio para hacer tus prácticas. Y está tutorizado por foro/email durante 2 meses (más opción a clases particulares).

O si prefieres una formación in company, en tu empresa, sobre:

  • Tag Manager y Píxeles de Conversión
  • Google Analytics básico o avanzado
  • Data Studio
  • Supermetrics Functions
  • SEO
  • Google Ads
contacta con nosotros, seguro que podemos ayudarte :)

Sobre mí