El 20 de marzo de 2026, Google a帽adi贸 silenciosamente una nueva entrada a su lista oficial de buscadores web. No es un rastreador. No es un robot de entrenamiento. Un agente.
Google-Agent es la cadena de agente de usuario para los sistemas de inteligencia artificial que se ejecutan en la infraestructura de Google y navegan por sitios web en nombre de los usuarios. Cuando alguien le pide a un asistente de inteligencia artificial que investigue un producto, complete un formulario o compare opciones entre sitios web, el Agente de Google es lo que realmente visita la p谩gina. Project Mariner, la herramienta experimental de navegaci贸n mediante inteligencia artificial de Google, es el primer producto que la utiliza.
Este no es el robot de Google. El robot de Google rastrea la web continuamente e indexa p谩ginas para realizar b煤squedas. El Agente de Google s贸lo aparece cuando un humano se lo pide. Esa distinci贸n cambia todo acerca de c贸mo opera.
Robots.txt no se aplica
Google clasifica a Google-Agent como un buscador activado por el usuario. La categor铆a incluye herramientas como Google Read Aloud (texto a voz), NotebookLM (an谩lisis de documentos) y Feedfetcher (RSS). Todos ellos comparten una propiedad: un humano inici贸 la solicitud. La posici贸n de Google es que los buscadores activados por el usuario “generalmente ignoran las reglas de robots.txt” porque la b煤squeda fue solicitada por una persona.
La l贸gica: si escribe una URL en Chrome, el navegador busca la p谩gina independientemente de lo que diga robots.txt. Google-Agent opera seg煤n el mismo principio. El agente es el proxy del usuario, no un rastreador aut贸nomo.
Esta es una desviaci贸n significativa de c贸mo OpenAI y Anthropic manejan tr谩fico similar. ChatGPT-User y Claude-User funcionan como recuperadores activados por el usuario, pero respetan las directivas robots.txt. Si bloquea ChatGPT-User en robots.txt, ChatGPT no buscar谩 su p谩gina cuando un usuario le solicite que navegue. Google hizo una llamada diferente.
Los propietarios de sitios web que confiaban en robots.txt como mecanismo de control de acceso universal ahora tienen una brecha. Si necesita restringir el acceso desde el Agente de Google, necesitar谩 autenticaci贸n del lado del servidor o controles de acceso. Las mismas herramientas que usar铆as para bloquear a un visitante humano.
Identidad criptogr谩fica: autenticaci贸n de bot web
El desarrollo m谩s significativo est谩 enterrado en una sola l铆nea de la documentaci贸n de Google: Google-Agent est谩 experimentando con el web-bot-auth protocolo utilizando la identidad https://agent.bot.goog.
Web Bot Auth es un borrador de est谩ndar del IETF que funciona como un pasaporte digital para bots. Cada agente posee una clave privada, publica su clave p煤blica en un directorio y firma criptogr谩ficamente cada solicitud HTTP. El sitio web verifica la firma y sabe, con certeza criptogr谩fica, que el visitante es quien dice ser.
Cualquiera puede falsificar las cadenas de agentes de usuario. La autenticaci贸n de Web Bot no puede. La adopci贸n de este protocolo por parte de Google, incluso de forma experimental, indica hacia d贸nde se dirige la identidad del agente. Akamai, Cloudflare y Amazon (AgentCore Browser) ya lo admiten. Google aporta la masa cr铆tica.
Esto es importante porque la web est谩 a punto de tener un problema de identidad. A medida que aumenta el tr谩fico de agentes, los sitios web deben distinguir entre agentes de IA leg铆timos que act煤an en nombre de usuarios reales y raspadores que pretenden ser agentes. La verificaci贸n de IP ayuda, pero las firmas criptogr谩ficas escalan mejor y son m谩s dif铆ciles de falsificar.
Qu茅 significa esto para su sitio web
Google-Agent crea un modelo de visitantes de tres niveles para la web:
- Visitantes humanos navegando directamente.
- Rastreadores indexaci贸n de contenidos para b煤squeda y formaci贸n (Googlebot, GPTBot, Google-Extended).
- Agentes actuando en nombre de humanos espec铆ficos en tiempo real (Agente de Google, Usuario de ChatGPT, Usuario de Claude).
Cada nivel tiene diferentes reglas de acceso, diferentes intenciones y diferentes expectativas. Un rastreador quiere indexar su contenido. Un agente quiere completar una tarea. Puede ser leer la p谩gina de un producto, comparar precios, completar un formulario de contacto o reservar una cita.
Esto es lo que debe hacer ahora:
Supervise sus registros. Google-Agent se identifica con una cadena de agente de usuario que contiene compatible; Google-Agent. Google publica rangos de IP para su verificaci贸n. Comience a realizar un seguimiento de la frecuencia con la que visitan los agentes, a qu茅 p谩ginas acceden y qu茅 intentan hacer.
Verifique su CDN y las reglas de firewall. Si sus herramientas de seguridad bloquean agresivamente el tr谩fico que no es del navegador, es posible que el Agente de Google sea rechazado antes de que llegue a su servidor. Verifique que los rangos de IP publicados por Google est茅n permitidos.
Pruebe sus formularios y flujos. El Agente de Google puede enviar formularios y navegar por procesos de varios pasos. Si sus formularios de pago, reserva o contacto se basan en patrones de JavaScript que confunden a los sistemas automatizados, los visitantes de los agentes fallar谩n silenciosamente. El HTML sem谩ntico y las etiquetas claras siguen siendo la base.
Acepte que robots.txt ya no es una herramienta de control de acceso completa. Para el contenido que realmente necesita restringir, utilice la autenticaci贸n. robots.txt fue dise帽ado para rastreadores. La era de los agentes necesita l铆mites diferentes.
La Web h铆brida no llega. Est谩 registrado
Hace un a帽o, la idea de que los agentes de IA navegaran por sitios web junto con los humanos fue una predicci贸n de una conferencia. Hoy en d铆a, tiene una cadena de agente de usuario, rangos de IP publicados, un protocolo de identidad criptogr谩fico y una entrada en la documentaci贸n oficial de Google.
La web no se dividi贸 en humanos y m谩quinas. Se fusion贸. Cada p谩gina que publicas ahora sirve a ambas audiencias simult谩neamente, y Google acaba de hacer posible ver exactamente cu谩ndo aparece la audiencia no humana.
M谩s recursos:
Esta publicaci贸n se public贸 originalmente en No Hacks.
Imagen de portada: Summit Art Creations/Shutterstock

