Llevamos ya un buen tiempo viéndonos un poco o muy acosados, según el caso, por el dichoso SPAM «referral» (y lo pongo entre comillas porque como sabéis ahora entra por todas partes, no solo como tráfico de referencia…). Google ha hecho y hace sus intentos por minimizarlo, pero aún llega. Para mí hasta ahora lo que mejor ha funcionado ha sido incluir la dimensión antispam desde Tag Manager, para solo contabilizar los hits que controlo y envío yo misma activamente.
Si aun así te llega Spam, o como a mí, te a pasado que «en casa de herrero cuchillo de palo»… Puedes probar a detectar tus fuentes y medios de tráfico SPAM de manera sencilla, y bastante rápida. Aunque se trata solo de una aproximación más, claro está que ningún sistema es perfecto. Y desde ya aviso que conlleva REVISIÓN MANUAL.
Vamos a ver un segmento de Google Analytics que puede ayudarnos a detectar el Spam, y para ello nos basamos en el comportamiento de los usuarios en las sesiones.
¡OJO! Ni están todos los que son ni son todos los que están, pero se aproxima.
En cualquier caso lo que vamos a hacer es separar el tráfico basura, o junk traffic, que suena mejor :P, el tráfico al que no le interesa nuestra página.
Y ya revisamos y volvemos a examinar a ojo para ver qué tráfico es Spam.
Es un poco laborioso, pero para hacer a posteriori funciona.
SEGMENTO GOOGLE ANALYTICS: Candidatos a SPAM
Para ello, creamos estas condiciones para el segmento:
A nivel de SESIÓN:
- Páginas por sesión = 1
- Rebotes = 1 (por sesión, equivale a Rebote 100%)
- Tiempo en página = 0
El segmento para detectar candidatos a SPAM quedaría así:
Aquí puedes importarlo (link a la galería de soluciones de GA).
IMPORTAR Segmento de Google Analytics: Candidatos a SPAM
Esta última parte es otra condición OPCIONAL:
Si el anterior segmento incluye demasiado tráfico real, podríamos añadir otra condición a nivel de usuario (los que realizan una única visita). Aunque mejor no incluirla en la mayoría de casos porque restringe demasiado.
A nivel de USUARIO:
- Sesiones = 1 (por usuario)
Este segmento más restrictivo quedaría así:
Aquí puedes importarlo (link a la galería de soluciones de GA):
IMPORTAR Segmento de Google Analytics: Candidatos a SPAM 2
Una vez apliquemos el segmento, como decía antes, no todo el tráfico resultante va a ser SPAM, puede ser tráfico basura natural ajaj el que todo sitio tiene.
Por ello, para seguir explorando los sitios obtenidos y dictaminar mejor si son Spam o no, podemos añadir ciertas dimensiones secundarias en el informe de Fuente / Medio, dentro de Adquisición en Google Analytics.
Bueno, al tajo, veamos qué sale tras aplicar el segmento:
En principio, ya se ven dominios extraños y claramente de Spam (law-enforcement-ee.xyz, ¿os suena?, ¿китай.с.новым.годом.рф?, ¿WTF? jaja).
Otros dominios normales que no son sospechosos (Google, Twitter, Linkedin, Xataka :D).
Pero OJO!! no os fiéis: en google / organic todavía podemos tener Spam…
Una última IDEA para el SPAM organic
ORGANIC: Ya no todo el SPAM es referral, así que tenemos que revisar las keywords de búsqueda un poco. Al igual que en referencias miramos la URL, en búsqueda lo que puede darnos pistas son las palabras clave.
En lugar de mirar todas las sesiones, lo hacemos ahora solo con este segmento concreto de «candidatos a Spam», así lo ponemos a prueba :P.
Para ello, indagamos más a fondo el tráfico de buscadores con la dimensión secundaria «Palabra clave«:
Ajá, cuántas keywords de dominios extraños, ¿eh? ¡Cazados!
Podemos revisar a simple vista si no hay mucha información de palabras clave, o filtrar más en caso necesario. Podemos quitar: np –, por aquella moda del filtro para not provided. O podemos filtrar solo keywords que tengan por ejemplo un punto (la mayoría del spam organic muestra su URL en la keyword, cómo les gusta firmar todo… jaja). Todo dependerá del volumen de hits analizado y de líneas a examinar.
CONCLUSIÓN: Me repito y os digo que la mejor manera de limpiar es con la dimensión antispam, pero oye, no está mal esto tampoco (para hacer a posteriori). Eso sí, toca hacer filtros a mano con expresiones regulares para excluir a todos los intrusos, uno por uno.
O si prefieres una formación in company, en tu empresa, sobre:
- Tag Manager y Píxeles de Conversión
- Google Analytics básico o avanzado
- Data Studio
- Supermetrics Functions
- SEO
- Google Ads