Durante años, la estructura de la URL fue una casilla de verificación técnica de SEO. Sea breve, utilice guiones, incluya la palabra clave y listo.
Si bien ese manual todavía funciona, es cada vez más incompleto. Una proporción cada vez mayor del público objetivo ahora descubre contenido a través de asistentes de inteligencia artificial y grandes modelos de lenguaje como ChatGPT, Perplexity, Claude, AI Overviews de Google y más.
Estos sistemas recuperan y sintetizan información de manera diferente a los rastreadores de búsqueda tradicionales, y si su arquitectura de URL no está diseñada con eso en mente, aumenta sus posibilidades de no ser citado por los LLM.
En la nueva era de la búsqueda, debemos ampliar esos fundamentos de SEO para alinearlos también con los robots de inteligencia artificial y la forma en que rastrean las URL.
Por qué los sistemas de inteligencia artificial leen las URL de manera diferente
Los motores de búsqueda han pasado décadas desarrollando una sofisticada infraestructura de rastreo e indexación. Siguen redirecciones, resuelven canónicos, analizan JavaScript (a veces…) y pueden inferir el contexto de una página cuando la URL es una cadena de caracteres aleatorios.
Los sistemas de recuperación de IA, en particular los canales de recuperación de generación aumentada (RAG) y los LLM conectados a la web, a menudo funcionan de manera diferente.
Hay tres partes fundamentales en el funcionamiento de RAG:
- El mensaje de entrada se convierte en una incrustación de vector.
- Luego, los pasajes relevantes se recuperan de URL indexados, documentos y gráficos de conocimiento en resultados de búsqueda tradicionales como Google y Bing.
- Un LLM como ChatGPT o similar procesará esta información y generará una respuesta refinada.
Un sistema RAG creado por desarrolladores utilizará esencialmente fuentes de datos de URL para extraer contenido: rastrearán la URL, convertirán el contenido web en “fragmentos” con capacidad de búsqueda y los almacenarán como vectores numéricos para su posterior recuperación.
Esto ahora también está evolucionando hacia un ámbito de base contextual de URL, que es específico de Gemini. El objetivo de la conexión a tierra del contexto de URL es ayudar a Gemini (y presumiblemente a AI Overviews/AI Mode) a comprender y responder mejor preguntas sobre el contenido y los datos en URL individuales sin realizar el procesamiento RAG tradicional.
El objetivo aquí es que el LLM extraiga específicamente información directa de múltiples URL, analice múltiples informes y combine información de varias fuentes para generar resúmenes más precisos. En teoría, esto debería ayudar a mejorar la precisión fáctica de la IA y reducir las alucinaciones.
Luego está la clasificación de tiro cero, una técnica que permite a los modelos categorizar el propósito de una página web sin ningún dato de entrenamiento específico de la tarea.
En lugar de depender de ejemplos etiquetados, el modelo analiza señales semánticas como estructuras de URL (tratadas como cadenas de texto sin formato) y las asigna a categorías predefinidas utilizando métodos como la similitud de coseno o el razonamiento basado en indicaciones.
Esto funciona aprovechando el conocimiento del lenguaje previamente entrenado del modelo para inferir la función probable de una página, al mismo tiempo que detecta patrones distintos en las palabras y frases que indican qué tipo de contenido contiene la página.
Esto ha sido particularmente útil para identificar enlaces de phishing y otros enlaces maliciosos basados únicamente en sus patrones de URL, pero también indica cómo los LLM podrían comenzar a aprovechar la clasificación de tiro cero para confiar únicamente en las URL para inferir relevancia semántica.
Una URL que no comunica nada obliga a los modelos LLM a trabajar más duro e introduce ambigüedad en la forma en que se categoriza el contenido.
De manera más práctica, cuando un sistema de inteligencia artificial cita una fuente en una respuesta, a menudo muestra la URL junto con el extracto. Esa URL se vuelve visible para los usuarios reales, de la misma manera que lo hace en un resultado de búsqueda, y ellos tomarán decisiones reales sobre si hacer clic o no.
Una ruta limpia y descriptiva genera confianza de una manera que algo como /p?id-4821 nunca lo haré.
El principio básico de las URL como señales semánticas
Piense en su estructura de URL como una capa de contenido secundaria, una que comunica jerarquía, tema y especificidad independientemente del título de la página o H1, u otros metadatos.
Una URL como /recursos/seo/estructura-url-ai-recuperación/ le dice a un sistema de recuperación varias cosas a la vez: esto se encuentra en un centro de recursos, está dentro de una categoría de SEO y cubre un subtema específico a nivel granular.
Esa es una señal útil. Muestra cómo los sistemas de inteligencia artificial intentan comprender la procedencia y relevancia del contenido antes de mostrarlo en una respuesta.
Esto es importante especialmente para:
- Consultas de cola larga y basadas en preguntas, donde los sistemas de inteligencia artificial buscan coincidencias precisas con necesidades de información específicas.
- Autoridad temática, donde su jerarquía de URL puede reforzar que su dominio posee un área temática.
- Calidad de las citas, donde una URL descriptiva aumenta la probabilidad de que un agente de IA haga referencia a su contenido en lugar de una página casi idéntica de la competencia.
Principios prácticos de la arquitectura
Hay una serie de principios arquitectónicos prácticos que se deben considerar tanto para la búsqueda tradicional como para la búsqueda con IA.
Utilice una jerarquía lógica y superficial
Anidamiento profundo (es decir, /blog/categoría/subcategoría/año/mes/post-título/) crea ruido y su contenido está a varios pasos de la página de inicio. Una estructura de tres niveles de profundidad casi siempre es suficiente, es decir, dominio > categoría > página específica. Hay algunas configuraciones de CMS, como Shopify, en las que te obligan a utilizar cuatro o cinco, dependiendo de tu tema (es decir, dominio/blog/nombre-del-blog/título-de-la-publicación-del-blog/), pero siempre que agregue contexto significativo y no desorden administrativo, su estructura estará alineada con el principio.
Haga que cada segmento sea descriptivo y legible para humanos
Evite abreviaturas, jerga interna o números de identificación en las URL públicas. Una URL como /optimización-de-búsqueda-ai comunica el tema directamente, mientras que una URL como /aso-v2 No comunica nada sin conocimiento previo.
Alinee las URL con la intención de búsqueda real, no solo con la palabra clave
Hay una gran diferencia entre /marketing por correo electrónico y /mejores-practicas-de-email-marketing-b2b. El segundo indica especificidad. Es más probable que surja cuando un sistema de inteligencia artificial genera una respuesta a una pregunta precisa, porque la propia URL reduce el alcance de la relevancia incluso antes de que se analice el contenido.
Sea coherente con los nombres de categorías en su sitio
Si tu estrategia de contenidos utiliza /guías/ para contenidos educativos de larga duración y /blog/ para comentarios más breves, manténgalo de manera consistente. Es probable que los sistemas de recuperación de IA creen un modelo de la estructura de su sitio con el tiempo. La inconsistencia desdibuja la señal sobre qué tipo de contenido se encuentra en cada lugar.
Evite el relleno de palabras clave en las URL
Este es un viejo consejo de SEO, pero también se aplica aquí. Una URL repleta de palabras clave parece spam para los usuarios humanos que la ven citada en una respuesta de IA, lo que socava el beneficio de confianza que está tratando de generar. Una palabra clave o frase principal por segmento es la decisión correcta.
¿Cómo se ve esto en la práctica?
Si dos especialistas en marketing diferentes escriben sobre el mismo tema, la estructura de la URL podría ser clave para que los sistemas RAG comprendan mejor el contexto de la página como parte de la recuperación de contenido.
Un ejemplo:
El comercializador A publica /blog/2024/03/consejos-de-correo-electrónico-parte-4.
El comercializador B publica /recursos/marketing-por correo electrónico/guía-de-entregabilidad-b2b.
La estructura de URL del comercializador B comunica adecuadamente la jerarquía (centro de recursos), la categoría (marketing por correo electrónico) y un enfoque específico (capacidad de entrega B2B) antes de que se procese una sola palabra del cuerpo del texto.
También es más probable que los usuarios se beneficien de que se cite esta URL porque pueden entenderla de inmediato.
Se puede argumentar que este tipo de claridad y especificidad podría agravarse ya que la estructura de su URL y la arquitectura de información del sitio pueden dictar toda la estructura temática de su sitio, ayudando también a comunicar tanto experiencia como relevancia.
El problema de la redirección y la consolidación
Esto es más relevante para los sitios empresariales que han acumulado deuda de URL, como redirecciones, rutas duplicadas y slugs inconsistentes debido a migraciones históricas del sistema de gestión de contenido.
Esto podría crear un problema específico para la recuperación de IA si hay cadenas de redireccionamiento y rutas duplicadas, ya que es posible que los rastreadores no lleguen consistentemente a la versión canónica de una página y los diferentes sistemas de recuperación manejan la resolución de redireccionamiento de manera diferente.
Una solución práctica será priorizar las URL de su sitio web. Audite su mayor tráfico y sus páginas de mayor valor, y confirme que sus URL canónicas sean limpias, accesibles y estructuradas de acuerdo con su taxonomía actual.
Luego trabaje hacia atrás.
No es necesario reestructurar todo el sitio para tener la posibilidad de ser citado en las respuestas de IA, pero especialmente para las páginas de mayor valor, debe asegurarse de ofrecer las mejores señales de URL posibles.
Lo que debes evitar cambiar
Es importante no perseguir siempre lo grande y brillante, así que no reestructure completamente la arquitectura de URL de su sitio solo para obtener ganancias marginales en la recuperación de IA.
La reestructuración de URL conlleva un riesgo real de SEO y tiempo para recuperar la equidad de los enlaces si se implementan redireccionamientos 301, y ha habido muchas historias de terror de migración web que pueden dar fe de lo que puede suceder cuando no se implementan correctamente.
El objetivo es aplicar estos principios a contenido nuevo y señalar problemas estructurales en páginas existentes de alto valor donde el caso para remediar estos problemas es claro y de menor riesgo.
Si su estructura de URL actual ya sigue convenciones jerárquicas, descriptivas y limpias (que es una parte estándar de las mejores prácticas de SEO), ¡felicidades! Has estado optimizando la recuperación de IA sin siquiera saberlo.
En resumen
La estructura de URL siempre ha sido una señal relativamente pequeña, pero a medida que los asistentes de IA se convierten en un canal de descubrimiento más significativo, las estructuras de URL tienen el potencial de ser citadas en más lugares además de Google y Bing.
Pueden ayudarle a aparecer en las respuestas generadas por IA, pueden dar forma a la calidad de las citas y pueden contribuir a cómo los sistemas de recuperación categorizarán su contenido antes que nada.
Simplemente cree URL que cuenten claramente la historia de su contenido, antes de que el usuario haga clic en él.
Más recursos:
Imagen de portada: Vitya_M/Shutterstock

