Lighthouse falla en su Llms.txt sin enlaces de rebajas

- Advertisement -spot_img

La nueva auditoría de navegación Lighthouse Agentic de Chrome trata su .txt archivo como un documento de rebajas. Si su llms.txt no utiliza la sintaxis de enlace de rebajas, no pasará la auditoría, incluso cuando todos los enlaces del archivo sean precisos y funcionen. Realicé la auditoría en nohacks.co. Dos de seis auditorías pasaron. Tres resultaron no aplicables. Uno falló: la auditoría llms.txt, con el error textual “El archivo no parece contener ningún enlace”. La solución fue de cinco caracteres por enlace. El archivo todavía se presenta como texto sin formato. Sólo cambió el resultado de la auditoría.

Lighthouse 13.3.0 incluyó la categoría Navegación agente junto con Rendimiento, Accesibilidad, SEO y Mejores prácticas. Seis auditorías en el conjunto predeterminado: accesibilidad del árbol bien formado (agent-accessibility-tree), cambio de diseño acumulativo (cumulative-layout-shift), detectabilidad de llms.txt (llms-txt), y tres comprobaciones WebMCP (webmcp-registered-tools, webmcp-form-coverage, webmcp-schema-validity). La categoría arroja una proporción de aprobación fraccionaria en lugar de una puntuación de 0 a 100, porque los estándares para la web agencial todavía están en movimiento.

1 de 6 auditorías fallidas en Nohacks.co

Ejecuté la auditoría a través de Lighthouse CLI: npx lighthouse@latest https://nohacks.co --only-categories=agentic-browsing. Se regresaron seis auditorías. Tres resultaron no aplicables, todos WebMCP: webmcp-registered-tools, webmcp-form-coveragey webmcp-schema-validity. Lighthouse no da ninguna razón para un resultado no aplicable, simplemente marca la auditoría y sigue adelante. nohacks.co expone WebMCP, pero solo a través del imperativo experimental navigator.modelContext API (dos herramientas de glosario, dos para un directorio de navegador agente), sin anotaciones en forma declarativa. El análisis se ejecutó en un Chrome 150 sin cabeza predeterminado sin bandera WebMCP, por lo que el veredicto de no aplicable podría significar que el sitio web no expone nada que estas auditorías reconozcan, o que el entorno de análisis no tenía ninguna API WebMCP activa en ese momento. Lighthouse no dice cuál. Dos auditorías pasaron limpiamente: agent-accessibility-tree reportado “Todas las auditorías pasaron” confirmar que la estructura semántica HTML y ARIA está lo suficientemente bien formada para que los agentes puedan navegar, y cumulative-layout-shift volvió a cero.

Una auditoría falló: llms-txt. El mensaje de error textual de Lighthouse fue:

El archivo no parece contener ningún enlace.

La puntuación de la categoría fue 0,67. Esa fue la primera sorpresa. El archivo en nohacks.co/llms.txt tiene muchos enlaces. Rutas de navegación a artículos, episodios, invitados, glosario. URL de fuentes RSS. Patrones de URL de archivos de audio. El archivo tiene más de cinco kilobytes de contenido estructurado. Entonces, ¿por qué Lighthouse informó cero enlaces?

Leer  M&S sobre por qué su 'gran' estructura de redes sociales impulsa la viralidad

Análisis del faro .txt Como Markdown y rechaza enlaces de texto sin formato

La extensión del archivo es .txtpero Lighthouse analiza el contenido como descuento y exige la sintaxis del enlace de descuento para que cualquier texto cuente como un enlace. El archivo se llama llms.txt. El servidor HTTP lo devuelve con un text/plain Tipo MIME. Ábralo en un navegador y verá texto sin formato. Pero la especificación llms.txt en llmstxt.org define el formato como un documento de rebajas. La especificación es explícita: “Cada sección contiene una lista de enlaces con viñetas rebajadas. Cada elemento de la lista tiene un enlace seguido de notas opcionales sobre el enlace, separadas del enlace por dos puntos”. El analizador de Lighthouse lo aplica estrictamente. Cada enlace debe estar codificado como sintaxis de enlace de rebajas, (text)(url)con corchetes alrededor del texto del enlace y paréntesis alrededor de la URL.

Mi archivo había estado usando un formato de texto sin formato más natural:

- Homepage: / - Publication masthead, cornerstone series, latest articles and episodes
- Articles: /blog - All articles on AXO, the agentic web, and AI agents
- Episode: /episode/(slug) - Full show notes, transcript, audio player

Mismos destinos. Mismas descripciones. Misma información. El analizador de Lighthouse no registra esas líneas como enlaces. En todo el archivo, registró exactamente cero. La auditoría falla.

un archivo con un .txt extensión, servida con un text/plain Tipo MIME, que no pasa una auditoría a menos que tenga formato Markdown. Se trata de un desajuste sobre el cual la capa de auditoría tendrá que ser más honesta. La extensión dice una cosa. El tipo MIME dice una cosa. El analizador es la fuente de la verdad y exige rebajas.

Leer  Google dice en qué deberían centrarse los creadores de IA

La solución es 5 caracteres por enlace

Envuelva cada destino de enlace en la sintaxis de pares de corchetes de rebajas, (text)(url)y reemplace el - separador antes de cada descripción con : . Cinco caracteres por enlace. Conversión mecánica, repetida en todo el archivo.

- (Homepage)(/): Publication masthead, cornerstone series, latest articles and episodes
- (Articles)(/blog): All articles on AXO, the agentic web, and AI agents
- (Episode)(/episode/(slug)): Full show notes, transcript, audio player

Hice la edición. Vuelva a ejecutar la auditoría. La puntuación pasó de 0,67 a 1,0. El título de la auditoría cambió de “llms.txt no sigue las recomendaciones” a “llms.txt sigue las recomendaciones”. No hay elementos detallados en el informe posterior. Pase limpio.

El archivo todavía se sirve como text/plain. La extensión del archivo sigue siendo .txt. El contenido del archivo sigue siendo el mismo. Sólo cambió la codificación del enlace.

Lighthouse mide la sintaxis de enlaces analizables, no la calidad del archivo

La auditoría comprueba si su archivo es analizable mecánicamente. No comprueba si el archivo describe su sitio web de forma útil. Ambas lecturas son verdaderas al mismo tiempo.

La primera decía: La auditoría está midiendo algo real. La sintaxis del enlace Markdown se puede analizar mecánicamente. Las líneas descriptivas de texto sin formato no lo son. Si un agente de IA (o el analizador Lighthouse que reemplaza a un agente) necesita extraer enlaces del archivo mediante programación, se requiere el formato Markdown. La auditoría es correcta y dice que las herramientas estándar no pudieron analizar el archivo anterior a mi corrección en busca de enlaces. La conversión a la sintaxis de enlace Markdown soluciona una brecha real de interoperabilidad.

La segunda decía: el cumplimiento del formato no es lo mismo que la calidad del archivo. Un llms.txt completo, preciso y cuidadosamente escrito que utilice descripciones en texto plano no supera esta auditoría. Un llms.txt delgado y generado automáticamente con pases de sintaxis de enlaces de rebajas. La auditoría no puede distinguir entre los dos. El complemento de WordPress AIOSEO, utilizado por más de 3 millones de sitios web según su lista de WordPress.org, genera archivos llms.txt con sintaxis de enlace de rebajas de forma predeterminada, un comportamiento predeterminado que Glenn Gabe descubrió y la propia documentación del complemento lo confirma. Esos archivos generados automáticamente utilizan la sintaxis de enlace de rebajas porque eso es lo que emite el generador. La mayoría de ellos probablemente pasen esta auditoría. La mayoría de los archivos llms.txt cuidadosamente seleccionados y conscientes del propietario probablemente fallen.

Leer  Cómo Aerie está luchando contra el contenido de IA con Pamela Anderson

Vale la pena pensar en esa brecha antes de tratar la aprobación/rechazo de la auditoría como una medida de qué tan preparado está realmente su sitio web para los agentes. La auditoría comprueba si su archivo es analizable. No comprueba si su archivo es útil.

¿Debería importarle la comprobación Llms.txt de Lighthouse Agentic Browsing?

Sí, pero por poco. Lighthouse puede decirle si su llms.txt se puede analizar como descuento. No puede decirle si el archivo describe su sitio web honestamente. Ese cheque es tuyo. Abra Chrome DevTools, haga clic en la pestaña Lighthouse, verifique que la categoría Agentic Browsing esté marcada y ejecute Analizar en su URL. La auditoría lleva menos de un minuto. Si falla por el error de falta de enlaces, la solución es cinco caracteres por enlace y cinco minutos de edición. Si se aprueba, la pregunta más difícil es la que Lighthouse no puede formular. ¿El archivo fue generado automáticamente por un complemento que usted no configuró, o lo escribió usted mismo y, de cualquier manera, describe cuál es realmente su sitio web?

La arquitectura primero en la máquina Pilar de estructura se encuentra debajo de todo esto: modelos de datos antes de los diseños de página, independencia de representación, contenido que no depende del JavaScript del lado del cliente o de los valores predeterminados de visualización humana para ser legible por máquina. La auditoría de llms.txt es una verificación limitada en esa capa. La cuestión estructural más importante, si su superficie legible por máquina describe con precisión su sitio web, es suya.

Más recursos:


Esta publicación se publicó originalmente en No Hacks.


Imagen de portada: Darko 1981/Shutterstock

spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares