Un tercio de las fintech es invisible para los agentes de IA

- Advertisement -spot_img

Un tercio de los principales sitios web de tecnología financiera del mundo ofrecen menos del 80% del contenido de su página de inicio en HTML sin formato. Esa es la versión de la página que obtiene un agente de IA cuando la visita, antes de decidir si gastará el cálculo en una representación completa del navegador. La mayoría de ellos no lo hacen.

El pilar Estructura de Machine-First Architecture dice que la información crítica no debe depender del JavaScript del lado del cliente. Prestando independencia. Hasta el mes pasado, este era un principio de diseño. Ahora es un número, y el número resulta incómodo.

El 25 de mayo, medí 274 páginas de inicio de fintech de la lista CNBC World’s Top Fintech Companies 2025. Hice dos mediciones secuenciales en cada una: una recuperación HTTP sin formato sin ejecución de JavaScript y una representación completa del navegador con Playwright. La brecha entre las dos lecturas es la brecha que un agente de IA tiene que cerrar por sí solo. El 36% de estos sitios web les obligan a realizar ese trabajo para la página más importante de la propiedad. El estudio completo está publicado en Web Performance Tools.

La mayor parte de la cobertura de visibilidad de IA omite el paso de renderizado

La mayor parte de la cobertura de visibilidad de la IA se centra en el marcado de esquemas, el contenido estructurado, las señales de autoridad de la marca y la optimización de las descripciones generales de la IA, la búsqueda de ChatGPT, las citas de Perplexity y el canal de conexión a tierra de Gemini. Los consejos se acumulan rápidamente.

Todo eso supone que el agente vio su contenido en primer lugar.

La mayoría de los rastreadores de IA no procesan JavaScript. GPTBot, ClaudeBot, PerplexityBot, el panorama de agentes de usuario de IA que alimentan los modelos por los que intentas ser citado, realizan búsquedas HTTP y se alejan. No son navegadores. Ejecutar una instancia real de Chromium por página cuesta un cálculo que se multiplica por los millones de páginas que estos sistemas quieren leer. Entonces no lo hacen, por defecto. Toman lo que regresa en la respuesta HTTP sin procesar y siguen adelante.

Hay excepciones. El rastreador de Google ejecuta un proceso de renderizado diferido para algunas páginas. Algunos sistemas de IA renderizarán objetivos de alto valor o lo harán de forma selectiva cuando la respuesta bruta parezca vacía. El patrón no es absoluto. Pero el valor predeterminado de producción para los rastreadores que alimentan los sistemas de inteligencia artificial más grandes de la web hoy en día es la recuperación HTTP sin formato, sin JavaScript, tomemos lo que hay allí.

Esto crea una brecha que los usuarios no ven. Un visitante real abre su sitio web en un navegador. Se ejecuta JavaScript. La página se ensambla en la ventana gráfica. El contenido se carga, el diseño se estabiliza y llega la imagen principal. El visitante ve lo que construiste. El agente de IA obtiene la respuesta antes de que eso suceda. Lo que no aparece en la primera respuesta HTML, para ese agente, no está allí.

De esto se trata el pilar Estructura de la Arquitectura Machine-First. La información crítica no debe depender del JavaScript del lado del cliente. La página debe poder analizarse desde la respuesta HTTP sin formato, no desde la vista renderizada por el navegador cinco segundos después. Esta no es una preferencia de desempeño disfrazada de arquitectura. Es un requisito de visibilidad para los agentes de IA que ahora leen la web en nombre de los usuarios.

Hasta hace poco, el requisito de independencia de representación era un argumento. Podría leer las especificaciones, observar el comportamiento del rastreador, sacar la conclusión y aún no estar de acuerdo sobre el problema que representa en la práctica. No había ningún número al que pudieras señalar.

Los datos de fintech te dan la cifra.

Dos lecturas en la misma página: HTML sin procesar, luego renderizado del navegador

La prueba en cada una de las 274 páginas de inicio de fintech fue simple: dos mediciones secuenciales, realizadas el 25 de mayo de 2026, desde Portugal. La primera fue una búsqueda HTTP sin formato en la página de inicio canónica, no se ejecutó JavaScript, independientemente de los bytes que regresaron en la respuesta. El segundo fue un renderizado completo del navegador usando Playwright 1.60.0 con Chromium 148.0.7778.96 en modo no sin cabeza, capturando la página cinco segundos después de TTFB y nuevamente en la red inactiva. Todas las mediciones se realizaron desde Portugal el 25 de mayo de 2026, en banda ancha residencial, ventana gráfica de 1280 por 800, sin limitación de red.

Para cada sitio web, el contenido se extrajo de la

,

o elemento y convertido a Markdown para preservar los elementos estructurales. El texto sin formato se midió como un porcentaje del texto inactivo de la red. Si la recuperación sin procesar devolvió el 80% o más de lo que finalmente mostró el navegador, el sitio web tuvo visibilidad total. Entre el 60% y el 79% fue parcial. Entre el 30% y el 59% era bajo. Por debajo del 30% era casi cero.

Tres lecturas en la misma página, en la misma sesión, separadas por lo que el navegador tuvo que hacer para completar la página: recuperación sin formato, renderizado de cinco segundos, red inactiva.

La parte interesante de la curva no es la lectura de red inactiva al final. Casi todos los sitios web del ejemplo resuelven el contenido completo cuando la red está inactiva. La parte interesante es la lectura sin procesar al principio, porque la recuperación sin procesar es la lectura que realmente realizan la mayoría de los rastreadores de IA.

El 36% entrega menos del 80% de su contenido sin JavaScript

De 274 páginas de inicio de fintech medidas, 99 arrojaron menos del 80% de su contenido final a partir de la recuperación HTTP sin procesar. Ese es el número del titular. Treinta y seis por ciento.

Dentro de ese 99, la distribución es pronunciada. Cincuenta y cinco sitios web (20% de la muestra completa) devolvieron menos del 30% de su contenido sin JavaScript. Cuarenta y siete de esos sitios web arrojaron cero. La respuesta HTML incluía un shell, el andamio de diseño, algunos scripts en línea y ningún contenido legible. Cualquier cosa que la página de inicio pretendiera comunicar requería un tiempo de ejecución de JavaScript para comunicarlo.

Los 47 sitios web de contenido cero incluyen importantes bolsas, neobancos conocidos, grandes plataformas de préstamos, varias empresas públicas y marcas que una persona en finanzas reconocería sin que se lo pidieran. No voy a mencionarlos individualmente. Nombrar los sitios web distraería la atención de la observación arquitectónica que se encuentra debajo. Que su página de inicio se muestre a un agente de IA actualmente depende de decisiones en las que nadie en el equipo estaba pensando en esos términos cuando se tomaron.

Los 24 sitios web en la banda de visibilidad parcial de 60 a 79 tienen un problema diferente. Se presentan al agente, pero no del todo. El agente obtiene un titular destacado, tal vez la navegación principal, tal vez una propuesta de valor. No recibe las descripciones de los productos, las señales de confianza, las llamadas a la acción ni los logotipos de terceros. Lo que se decidió renderizar en el lado del cliente es la parte que el agente no ve, y esa parte tiende a ser la parte que se hizo dinámica porque alguien quería que se sintiera interactiva.

Hay una curva de recuperación, y en ella es donde la historia se agudiza. De los 274 sitios web, 273 alcanzan más del 80% de visibilidad una vez que un navegador real muestra la página durante cinco segundos. Noventa y nueve por ciento. El contenido existe. Los sitios web no están rotos. Están encerrados detrás de un tiempo de ejecución por el que los rastreadores de IA de producción no pagan.

El sitio web mediano de la muestra tarda 21 veces más en llegar a la red inactiva que en devolver su recuperación HTTP sin formato. Treinta y cuatro sitios web (12%) no llegan a la red inactiva dentro del límite de 30 segundos. Se trata de un problema aparte, pero apunta a la misma causa fundamental. La brecha de costos entre buscar un sitio web y leerlo se está ampliando, y los rastreadores no pueden seguir absorbiendo la diferencia.

Stripe, Adyen y Plaid demuestran que la pila no es el problema

Ciento un sitios web de la muestra devolvieron el 100 % del contenido de su página de inicio en la recuperación HTTP sin formato. Visibilidad completa antes de ejecutar cualquier JavaScript. La lista incluye Stripe, Plaid, Adyen, Marqeta, Remitly, Starling Bank, Neo Financial, Backbase, Thought Machine y 92 más.

Fiserv devolvió una página de inicio completa en 58 milisegundos. Bellotas en 76. Confiable en 89. Libro mayor en 100. Mire cuáles son realmente esos sitios web. Fiserv es una empresa de infraestructura bancaria y de pagos a una escala de 60 mil millones de dólares. Acorns ejecuta una aplicación para consumidores. Ledger es un proveedor de billeteras de hardware con un catálogo de productos. Están utilizando pilas modernas, sistemas de gestión de contenidos, CDN regionales, todo eso. Han decidido que el contenido que la página de inicio pretende comunicar estará allí en la respuesta sin procesar y no han permitido que la elección del marco anule esa decisión.

Ésta es la respuesta al evidente rechazo. La desventaja es que una pila moderna requiere renderizado del lado del cliente, que las aplicaciones de una sola página son la forma en que se construye la web ahora, que pedir HTML renderizado por el servidor es pedirle a la ingeniería que retroceda cinco años. La muestra fintech lo desmiente por sí sola. Los sitios web que ejecutaron las respuestas sin procesar más rápidas tomaron en serio el requisito de independencia de representación cuando tomaron decisiones arquitectónicas, o se reconstruyeron para tomarlo en serio después del hecho.

Hay excepciones a esta lectura dentro del ejemplo. Tres sitios web tuvieron un rendimiento inferior en la ventana de renderizado de cinco segundos, aunque finalmente se completaron. Las tres son empresas asiáticas medidas desde Portugal, y la penalización de latencia probablemente se deba a las curvas más que a la arquitectura.

El estudio de Web Performance Tools probó páginas de inicio únicamente, de un origen geográfico, en un día, con una medición por sitio web. No midió las páginas interiores. No probó varias regiones. No probó el contenido bloqueado tras el desplazamiento o el clic. La imagen que ofrece este conjunto de datos es la página de inicio de las mayores empresas de tecnología financiera del mundo, en un solo día de mayo, obtenida de Europa Occidental. Eso es un trozo. Una porción útil para la cuestión de la carga de la que trata este artículo, pero una porción.

La pregunta fundamental es si el requisito de independencia de renderizado se mantiene a escala en una cohorte comercial grande, moderna y con buenos recursos. La muestra fintech lo responde. La mayoría de la cohorte lo hace bien. Un tercero se equivoca, y el tercero que se equivoca incluye marcas lo suficientemente grandes como para que las decisiones arquitectónicas casi con seguridad hayan pasado por varias rondas de revisión de ingeniería senior sin que nadie mencione la visibilidad de la IA como una limitación.

Fintech es donde la página de inicio es la señal de confianza

La mayoría de las categorías pueden permitirse el lujo de que parte de su página de inicio sea invisible. Una empresa de consumo SaaS puede perder un subtítulo destacado y la mayoría de sus visitantes no sentirán la diferencia. Un sitio web de medios puede llevar la cabecera a través del esquema y aún así clasificarse según los temas que cubre el cuerpo. Fintech no es la mayoría de las categorías.

Para una fintech, la página de inicio es donde se encuentran las divulgaciones reguladas. La nota al pie de la licencia. El lenguaje del seguro de depósitos. La atribución banco-socio. Las certificaciones de seguridad. La matriz de disponibilidad del país. La advertencia de riesgo bajo la cotización de tipos. Estos son los elementos que hacen que una marca pase de ser “un producto interesante” a “algo en lo que realmente invertiría dinero”. Un lector que escanea la página de inicio los está buscando. También lo es un agente de IA que responde una pregunta sobre en qué proveedor confiar para un caso de uso específico.

Cuando el 17% de la cohorte no arroja contenido en la respuesta bruta, lo que desaparece es la capa regulatoria y de confianza de la marca. El agente no ve al socio del banco. No ve el seguro de depósitos. No ve las certificaciones de seguridad. Ve una concha.

La categoría agrava el problema de una segunda manera. Las decisiones de compra de fintech requieren mucha investigación. Una persona que abre una cuenta de ahorros, elige un procesador de pagos, decide qué corredor financiar, evalúa una billetera, pasa por varias rondas de comparación antes de actuar. Ese bucle de comparación es la parte del embudo que ha migrado más rápido a las superficies de IA. El estudio de flujo de clics de Eric van Buskirk de 846.000 sesiones de Google mostró que los usuarios del Modo AI cierran sus bucles dentro de la IA el 64% del tiempo, sin hacer clic nunca.

El ciclo de investigación de fintech ocurre cada vez más dentro de una superficie de IA, y el agente que realiza el trabajo para el usuario elige entre un conjunto de candidatos ensamblados a partir del HTML sin procesar que podría recuperar. Si la página de inicio de una fintech no devuelve contenido en la respuesta sin procesar, la marca nunca ingresa al conjunto de candidatos entre los que elige el agente. Está ausente antes de que comience la comparación.

Para eso existe el pilar Estructura de la Arquitectura Machine-First. El pilar es el requisito ascendente que hace posible cada estrategia de visibilidad de IA descendente. El marcado de esquema no ayuda cuando el agente no puede leer la página. La estrategia de citas no ayuda cuando el modelo nunca vio el contenido a citar. Las señales de autoridad de marca no ayudan cuando la página de inicio que las contiene devuelve bytes vacíos a GPTBot. La estructura es el piso. Todo lo demás se acumula.

La muestra de fintech muestra que el piso está roto para una de cada tres de las marcas más importantes de la categoría. La muestra es una instantánea. Mañana, algunos de esos sitios web serán diferentes y algunos de los sitios web que obtuvieron buenos resultados hoy se habrán desviado en la dirección equivocada. El 36% se mudará. Lo que importa es que hasta el mes pasado no había ningún número, y ahora la conversación sobre la visibilidad de la IA para esta categoría tiene una medida de carga adjunta.

Ejecute la auditoría en su propia página de inicio

Abre Chrome. Abra Herramientas de desarrollo. Golpear Cmd+Mayús+P en Mac o Ctrl+Mayús+P en Windows. Escribe “Desactivar JavaScript” y pulsa Intro. Vuelva a cargar su página de inicio.

Lo que ves es lo que ve el agente. Si su héroe, su propuesta de valor, la descripción de su producto, sus señales de confianza, sus CTA y sus divulgaciones regulatorias son todos visibles, su página de inicio está pasando el pilar de Estructura. Si el héroe está allí pero el cuerpo ya no está, estás en la banda de visibilidad parcial, entre el 60% y el 79% de tu contenido final. Si la página está en blanco o cerca de ella, se encuentra en el mismo nivel que los 47 sitios web sin contenido de la muestra de tecnología financiera.

Esta es la auditoría más barata en la categoría de visibilidad de la IA. Tarda 30 segundos. Sin análisis de archivos de registro, sin herramientas pagas, sin reuniones con ingeniería. El resultado es lo suficientemente binario como para que no sea necesario discutir sobre metodología. O el agente puede leer su página de inicio o no.

Si la auditoría falla, las rutas de solución son específicas del marco pero bien conocidas. Next.js tiene renderizado del lado del servidor y generación estática, los cuales devuelven contenido en la respuesta HTTP sin formato. Astro y SvelteKit se envían renderizados en servidor de forma predeterminada. Las aplicaciones React se pueden renderizar previamente ruta por ruta utilizando herramientas como Prerender.io o la capa de renderizado previo de Cloudflare Pages, que ofrecen una instantánea de la página renderizada a los rastreadores sin cambiar la arquitectura de tiempo de ejecución para los usuarios. Vue y Angular tienen patrones equivalentes.

La elección entre estos caminos es una conversación de arquitectura, no una conversación de contenido. La mayoría de los equipos no necesitan reconstruirse. Necesitan agregar una capa de renderizado de servidor para un conjunto específico de rutas: página de inicio, precios, páginas de productos, índice de blogs, cualquier cosa de la que dependa la marca para obtener una primera impresión o señales de confianza. El cambio arquitectónico no tiene por qué afectar a toda la aplicación.

Stripe, Adyen, Plaid, Marqeta y los otros 97 sitios web en la lista de visibilidad 100% bruta de la muestra fintech no eligieron pilas más simples. Eligieron arquitecturas que respetaban el requisito de independencia de representación y enviaron el contenido en la respuesta sin formato. El retroceso que el pilar Estructura requiere para volver al PHP renderizado por servidor de 2009 es la forma incorrecta de retroceso. El pilar requiere que el contenido esté en la capa de respuesta HTTP. La forma de conseguirlo depende de la pila que ya tienes.

Lo que esta muestra no le dice

El estudio midió 274 páginas de inicio en un día desde un origen. Las páginas interiores estaban fuera del alcance, lo que significa que un sitio web con una buena página de inicio y páginas de productos débiles pasaría la prueba y aún tendría problemas de visibilidad en las rutas que impulsan la conversión. La variación geográfica estaba fuera de alcance. El comportamiento por rastreador se infirió a partir de la brecha entre formato sin procesar y renderizado en lugar de investigarlo directamente. El contenido bloqueado tras desplazarse o hacer clic es su propia categoría de falla de visibilidad del agente, y el estudio no lo probó.

Una pregunta que este conjunto de datos no puede responder es si los rastreadores de IA comenzarán a generar más páginas a medida que bajen los costos de computación. Podrían hacerlo. Algunos ya lo hacen para objetivos de alto valor. Si todos lo hicieran, todo el encuadre de esta pieza cambiaría. El 36% seguiría siendo invisible en la capa de obtención sin formato, pero sería legible en la capa renderizada, y la urgencia del requisito de independencia de representación se suavizaría. No creo que eso vaya a suceder a gran escala pronto, pero estoy atento.

Lograr la independencia siempre fue real. Ahora tiene un número

Un tercio de los principales sitios web de tecnología financiera del mundo son parcialmente invisibles para los agentes de IA. Ofrecer independencia ya no es un principio de diseño sobre el que discutir. Tiene un número.

El agente volverá mañana. El rastreo será el mismo rastreo. El HTML será el mismo HTML. Si su página de inicio no devuelve su contenido en la respuesta sin formato, el agente que la obtuvo trabajará desde un shell y la respuesta que le dé al usuario que preguntó sobre su categoría se recopilará a partir de los sitios web que sí devolvieron su contenido.

Abra Herramientas de desarrollo. Deshabilite JavaScript. Vuelva a cargar su página de inicio. La página que se carga es la página que vio el agente.

Más recursos:


Esta publicación se publicó originalmente en No Hacks.


Imagen de portada: Roman Samborskyi/Shutterstock

Leer  Por qué importa más de lo que piensas
spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares