Jan-Willem Bobbink compartió una opinión sobre X, que los rastreadores de visibilidad de IA están rompiendo silenciosamente los análisis de las marcas que les pagan para que los rastreen. Es hora de que nos centremos más en este tema, ya que está provocando desalineamiento, informes erróneos y malgasto de recursos y presupuesto de marketing en el clamor por ser más visible en la IA.
Jan-Willem aborda la cuestión de la falta de atribución en los bucles RAG. Cuando un rastreador activa un mensaje, y ese mensaje activa una búsqueda, la marca esencialmente está pagando a una herramienta para generar su propia visibilidad de IA y comienza a informar sobre sí misma.
Esto se conoce como ouroboros, que es una palabra que probablemente verá aparecer cada vez más en la industria del SEO a medida que describimos los AI/LLM.
El efecto ouroboros de cómo la IA comienza a citarse a sí misma, algo que Pedro Dias ha tratado recientemente.
Un gran número de herramientas de visibilidad de la IA han recibido importantes cantidades de financiación en los últimos meses, y algunas de ellas cobran a las marcas decenas de miles de dólares por “seguir” la visibilidad, pero este efecto de bucle está empezando a convertirse en una realidad, y la forma en que las herramientas de terceros rastrean la visibilidad de la IA tendrá un efecto en cadena.
Un ejemplo que menciono con frecuencia es la caída en las citas que produjo ChatGPT cuando lanzó el modelo 5.0 en agosto de 2025.
Varias herramientas que brindan visibilidad a ChatGPT vieron disminuir los gráficos, no porque los sitios web hubieran violado las políticas de spam o sus tácticas a corto plazo hubieran seguido su curso, sino debido a cómo las herramientas rastrearon las citas y el modelo produjo menos. Esta no es una medida de visibilidad, sino una versión renovada del seguimiento de rangos, y estos gráficos pueden costar contratos de proveedores, informar incorrectamente el gasto presupuestario y crear pánico falso (o celebración falsa).
Los peligros del efecto observador
En física, el efecto observador establece que el acto de monitorear un fenómeno lo cambia. Esto está sucediendo en tiempo real para la industria del SEO.
La mayoría de los rastreadores de LLM utilizan un navegador sin cabeza o una API especializada. Cuando Perplexity o ChatGPT “buscan” información nueva para responder al mensaje de su rastreador, no solo llega a su página de inicio; realiza una búsqueda RAG y puede acceder a varias URL.
Debido a que estos bots a menudo rotan IP/proxies o usan encabezados “ocultos” para evitar ser bloqueados por muros anti-scraping, parecen rastreos de descubrimiento orgánico legítimos. Así es como funcionan varias herramientas de seguimiento de clasificación durante varios años.
Debido a esto, podría informar a un cliente u otras partes interesadas que “el interés de la IA en las páginas de nuestros productos ha aumentado un 40%”, cuando en realidad, el 35% de ese porcentaje fue solo su propia herramienta de seguimiento que actualizó su caché u otras herramientas de seguimiento que lo buscaron como competidor de su marca.
El ruido de seguimiento de la IA es peor que el ruido de seguimiento de clasificación
Como señaló Jan-Willem, solíamos ignorar el ruido del rastreador de clasificación en Google Search Console porque las impresiones eran una métrica “suave”. Pero los datos de los archivos de registro son datos concretos que se utilizan para la infraestructura, para comprender cómo los robots acceden a su sitio web (análisis de archivos de registro del servidor) y ahora, en la era de la IA, para comprender cómo interactúan las plataformas de IA con su sitio.
Cuando presenta un informe a su cliente, a sus pares o a su director de marketing, está intentando demostrar la preferencia de marca dentro de un modelo de lenguaje amplio. Si sus datos están contaminados por su propio seguimiento (y el seguimiento de otras personas), corre el riesgo de una estrategia de “falso positivo”.
Puede duplicar el contenido que en realidad no es popular entre los usuarios reales de IA, pero que es simplemente el contenido que su herramienta de seguimiento activa con más frecuencia.
Qué hacer ahora mismo
Hasta que un proveedor cree la API de “Registro limpio” que Jan-Willem pide, hay que tratar los archivos de registro con escepticismo.
Ejecute sus herramientas de seguimiento en un entorno de preparación “silencioso” o en un conjunto específico de URL de sacrificio para medir el “nivel de ruido” creado por la propia herramienta.
Busque patrones específicos (huellas digitales de usuario-agente) en los registros que se correlacionen con los tiempos de escaneo de su herramienta. Incluso si las IP rotan, la sincronización a menudo muestra patrones que pueden identificarse fácilmente.
Y deje de informar “obtenciones totales de IA” como métrica de éxito. Concéntrese en la frecuencia con la que se menciona su marca en relación con la competencia, que es una métrica derivada del resultado de LLM, no de los registros de su servidor.
Más recursos:
Imagen de portada: Master1305/Shutterstock

