El punto fue el desastre

- Advertisement -spot_img

Semrush publicó una infografía la semana pasada. Del tipo creado para ser capturado en carruseles de LinkedIn y pegado en presentaciones de seminarios web. Cuatro pilares. El cuarto se llama “GEO técnico”: esquema, datos estructurados, arquitectura limpia. La línea que lo justifica: “Garantiza que los motores de IA puedan analizar y conectar su contenido”.

Asegura.

Véalo en vivo en X/Twitter. Crédito de la imagen: Pedro Días

Esa es la pieza completa en una palabra. La arquitectura de los grandes modelos de lenguaje es, por diseño, lo opuesto a lo garantizado. Y el esquema no tiene nada que ver con si un LLM puede analizar texto. Los LLM analizan el texto leyéndolo.

Semrush está lejos de ser el único. Todos los proveedores de SaaS con aspectos de este juego ejecutan variaciones del mismo juego. Controlabilidad de la era SEO, reenvasada bajo un nuevo acrónimo. Los mismos porcentajes, pilares y pirámides. Todo vestido para un sistema que fue construido específicamente para no funcionar de esta manera.

Ya hice la versión estratégica de este caso antes, en “Su estrategia de IA no es una estrategia”. Esta pieza es el suelo técnico que hay debajo.

Creado para leer lo que sea que haya allí

Los modelos de lenguaje existen porque la web es un desastre. Foros, resúmenes de Wikipedia, publicaciones de blogs escritas a las 2 a.m., copias raspadas de productos, basura traducida automáticamente, comentarios de código, oraciones a medio formar, errores tipográficos, contradicciones, todos los registros, desde el artículo de una revista hasta la publicación de subreddit. Los datos previos al entrenamiento son la web pública, y la web pública nunca ha sido estructurada.

La arquitectura transformadora maneja esto tratando el lenguaje como secuencias de tokens. No hay ningún analizador dentro del modelo buscando etiquetas. No hay preferencia por el marcado de preguntas frecuentes. El modelo lee las palabras. Ese es el mecanismo.

En el momento de la inferencia, el modelo genera más tokens condicionados a la entrada. Ninguno de esos canales lee microdatos.

Schema.org tiene trabajos reales. Proporciona resultados ricos en la búsqueda clásica. Admite la desambiguación de entidades en el gráfico de conocimiento. Ayuda a los asistentes de voz a extraer campos estructurados. Estas son funciones bien definidas dentro de sistemas específicos. No son el mecanismo por el cual un LLM entiende una oración.

Entonces, cuando un proveedor afirma que los datos estructurados “garantizan que los motores de inteligencia artificial puedan analizar y conectar su contenido”, no hay nada que pueda garantizar. La capa de análisis que están imaginando no está ahí. El modelo ya analizó tu frase. Lo hizo leyendo la frase.

Un truco, tres colores de marca

Mire los explicadores GEO y AEO más importantes del mercado en este momento y encontrará el mismo manual de estrategias de la era SEO con el acrónimo intercambiado.

Semrush ya está cubierto. El cuarto pilar de su “GEO técnico” presenta esquemas y datos estructurados como garantía de algo que la arquitectura no puede garantizar.

AirOps publicó un gráfico titulado “15 formas de ser citado por ChatGPT, Perplexity y Google”. Es el ejemplar del género con más números que he visto este año. El marcado de esquema aumenta la probabilidad de citación en un 13%. Las etiquetas secuenciales H2 a H4 duplican sus posibilidades. Los párrafos cortos hacen que el contenido tenga un 49% más de probabilidades de aparecer en las respuestas de IA. Perplexity cita UGC en el 91% de las respuestas, frente a las 7 de Gemini. Lea las notas fuente y el rastro de la metodología llegará a casa. Los números en el gráfico se remontan al “Informe de búsqueda sobre el estado de la IA de 2026” de AirOps. AirOps cita a AirOps sobre la cuestión de si sus recetas funcionan.

Peec AI hace un trabajo más honesto en algunos lugares. Su guía completa de GEO reconoce la naturaleza probabilística del sistema y admite que los modelos básicos ya están entrenados, por lo que la optimización se centra en la capa de recuperación. Luego, obtiene las mismas prescripciones: jerarquía de encabezados, listas de viñetas, marcado de preguntas frecuentes, múltiples tipos de esquemas en capas en cada página, resúmenes en la parte superior de las secciones, todo basado en la afirmación de que los párrafos largos salen perdiendo porque el motor extrae fragmentos en lugar de artículos completos.

Leer  Construyendo un centro de excelencia

Profound, citando la lista de verificación de Aleyda Solís, es el más explícito en su artículo: “Optimizar para la recuperación a nivel de fragmentos”. Cada sección, un fragmento independiente. Cada página, un buffet del que el motor toma lo que quiere. La locomotora, en esta narración, es un invitado educado que sólo acepta lo que se le ha presentado.

Tres vendedores. El mismo supuesto operativo: una disciplina técnica prescriptiva y controlable se sitúa entre un editor y una cita, y ocupa aproximadamente la misma forma que el SEO clásico. Esquema, títulos, estructura, actualidad, formatos legibles por máquina. Familiar. Facturable. Reportable hasta un director de marketing.

¿Qué hace realmente el esquema?

El esquema no es el objetivo aquí. El esquema tiene usos reales y bien definidos. La búsqueda clásica de Google lo utiliza para obtener resultados enriquecidos: precios, calificaciones, horarios de eventos, los campos estructurados que impulsan las funciones de la página de resultados del motor de búsqueda. El gráfico de conocimiento lo utiliza para desambiguar entidades. Los asistentes de voz extraen campos estructurados.

Nada de eso desaparece. Si eres responsable del SEO técnico, sigue implementando el esquema donde se gana la vida.

Schema no puede llegar a un transformador y mejorar su comprensión de su prosa. El modelo no está diseñado para leer el esquema como esquema. Recibe cualquier texto que el motor haya obtenido y elegido incluir, y procesa ese texto como tokens de idioma. Toda la capa de marketing GEO/AEO se basa en combinar dos afirmaciones distintas: que el esquema es útil en la búsqueda clásica y que el esquema alimenta el LLM. Lo primero es cierto. El segundo es un error de categoría.

La fragmentación no es suya para optimizar

Crédito de la imagen: Pedro Días

Los consejos de fragmentación siguen reapareciendo porque suena técnico, se ubica claramente dentro de un diagrama de flujo y le brinda al equipo de contenido algo concreto que hacer el lunes por la mañana. También es incoherente.

La fragmentación ocurre en el momento de la recuperación. Perplexity, ChatGPT y Gemini ejecutan cada uno un recuperador sobre documentos candidatos, los dividen según sus propias configuraciones (longitud, superposición, modelo de incrustación, a veces límites semánticos) y alimentan los k fragmentos principales en el contexto del modelo. Esas configuraciones pertenecen al motor. Se sintonizan de manera diferente en todos los sistemas y se vuelven a sintonizar según cronogramas que ningún editor conoce. La vista que tiene el editor del fragmentador es la vista que tiene el editor del modelo: caja negra, solo resultados.

Entonces, cuando un proveedor dice “optimizar para la recuperación a nivel de fragmentos”, lo que en realidad recomienda es una buena redacción. Párrafos breves y autónomos. Definiciones claras cerca de la parte superior de las secciones. Estructura lógica interna. Estas son disciplinas reconocibles: arquitectura de la información, redacción técnica, legibilidad. Han sido disciplinas reconocibles desde mucho antes de que se inventara el transformador. No son una nueva capa técnica.

Una versión más honesta del discurso sería: contrate a alguien competente escribiendo para la web. Esa frase no cabe en una página de precios.

El periódico que no leen

Existe un artículo académico real llamado “GEO”. Aggarwal y coautores, KDD 2024. Es lo más parecido a una fuente citable que tiene la capa SaaS cuando vende la optimización generativa de motores como disciplina. También es fácil de leer, en términos de documentos. Se prueban nueve “métodos de optimización” en un punto de referencia de 10.000 consultas, con resultados.

¿Qué encontró que funcionó el periódico?

Agregar citas de fuentes creíbles. Agregar citas de fuentes relevantes. Agregando estadísticas. Mejorando la fluidez. Hacer que la prosa sea más fácil de entender. Los métodos que produjeron los mayores aumentos de visibilidad fueron esencialmente: escribir contenido con más evidencia en una prosa más limpia.

¿Qué hizo la prueba en papel y encontró que no funcionó?

Relleno de palabras clave, el análogo más cercano en el artículo al manual de estrategia de la era SEO que los proveedores actuales de GEO y AEO han reempaquetado. Resultado: por debajo del valor inicial. Los autores del artículo señalan en términos sencillos que las técnicas efectivas en los motores de búsqueda “pueden no traducirse en éxito en este nuevo paradigma”.

Leer  ¿Aio lastimando el tráfico? Cómo identificar la pérdida de visibilidad de SERP (seminario web)

Observe lo que no está en la lista de nueve métodos. Esquema. Datos estructurados. Marcado de preguntas frecuentes. Jerarquía de encabezados. Formatos legibles por máquina. Ninguno de estos se prueba en el artículo, porque ninguno de ellos es la superficie de optimización que el artículo estudia. El artículo estudia las intervenciones a nivel de contenido: lo que se pone en las palabras, no los metadatos colocados alrededor de las palabras.

La capa SaaS tomó prestado el acrónimo. Los hallazgos permanecieron en el periódico. “Technical GEO” es el manual de estrategias de SEO con diferentes pegatinas en las mismas cajas, que se vende en comparación con investigaciones que apuntan en otra dirección.

La suposición introducida de contrabando

El discurso de SaaS sólo tiene sentido si se introduce de contrabando una suposición: que el sistema que se está optimizando tiene la misma forma que el que ha estado facturando a los clientes de SEO durante un cuarto de siglo. Entradas que usted controla. Salidas que responden. Una cadena causal recuperable entre los dos.

Ese modelo siempre fue una simplificación de cómo funcionaba la búsqueda. Estaba lo suficientemente cerca como para mantener la industria en funcionamiento y lo suficientemente cerca como para que las facturas siguieran saliendo.

Nada de esa simplificación sobrevive al contacto con los sistemas generativos. El mismo mensaje produce diferentes respuestas según las sesiones, los usuarios, las temperaturas, las versiones del modelo y los días. Comportamiento observado en los principales motores, no es una propiedad limpia de ninguno de ellos. La capa de recuperación frente al modelo también se mueve: las fuentes candidatas cambian, la clasificación cambia, las ventanas de actualización cambian. No hay ninguna cadena causal entre “Agregué el esquema de preguntas frecuentes” y “el modelo citó mi página”. Lo que corre entre ellos es una distribución de probabilidad, y las cosas que controlas afectan esa distribución de maneras que nadie puede atribuir claramente. Ni siquiera las personas que crearon estos sistemas.

Esta es la línea establecida sobre las herramientas de visibilidad de la IA, que se repite aquí porque se aplica a toda la capa prescriptiva. Datos estadísticamente no verificables extraídos de sistemas no deterministas. ¿Un aumento del 13% en las citas, medido cómo, contra qué contrafactual, con qué reproducibilidad? Las preguntas metodológicas no son lo que esos números pretenden responder. Los números son la respuesta. Aterrizan en un gráfico, se representan como ROI en un tablero y la conversación continúa.

Algo que decir en la reunión

Aquí está la parte que el argumento de la arquitectura y el argumento de la metodología no explican, por sí solos. ¿Por qué toda la capa SaaS sigue vendiendo con éxito estas cosas a personas que no son estúpidas?

La versión honesta de la respuesta es algo así como: estamos operando con visibilidad reducida en un sistema que no expone sus mecanismos, que devuelve diferentes resultados a diferentes personas para la misma consulta, que cambia mes a mes y que ha doblado una parte sustancial del embudo en una caja negra. Podemos seguir haciendo el trabajo que siempre ha sido el trabajo: escribir bien, ser útiles, generar autoridad, mantener el sitio. Podemos monitorear qué aparece y dónde. El panel de control determinista que solíamos tener no volverá.

Esa frase es indecible en una reunión de marketing. Admite que la palanca no está conectada. Le dice a los líderes que la línea presupuestaria que aprobaron no tiene una acción correspondiente. No le da al equipo nada que incluir en el plan del próximo trimestre.

Entonces la capa SaaS llena el vacío. Fabrica palancas. Pilares, marcos, aumentos porcentuales, auditorías de esquemas, optimización de fragmentación, formatos legibles por máquina. Actividad reportable. Gasto defendible. Algo que decir en la reunión. Nada de esto te da visibilidad. El motor decide eso. Lo que se ofrece es la apariencia de control, vendida a personas que preferirían pagar antes que admitir que el control abandonó la sala.

Una vez comprada la palanca, hay que accionarla. Se programan auditorías de esquemas. Se revisan las listas de verificación fragmentadas. Las probabilidades de citas se rastrean, actualizan y comparan. El panel por el que pagó el equipo se convierte en el panel contra el cual el equipo optimiza, y el panel reemplaza silenciosamente el problema real con la parte del problema que puede ver. Cuando alguien se da cuenta, la capa SaaS está escribiendo el informe.

Leer  Twitter agrega cuenta de la vista pública a los tweets

Nada de esto es un fracaso moral por parte del comprador. Lo que estamos observando es lo que sucede cuando una industria ha estado organizada durante un cuarto de siglo en torno a la premisa de que se puede tirar de una palanca y observar cómo se mueve el medidor, y el medidor se desconecta silenciosamente de la palanca. Los vendedores no están estafando. Están satisfaciendo la demanda de lo único que el comprador ya no puede permitirse prescindir: una respuesta que cabe en una diapositiva.

Rango y tanque, todo de nuevo

Sigo volviendo a una frase que encaja en todo este momento: bailar al son de las melodías de los tanques (la tomé prestada de David McSweeney). El ciclo continúa: el proveedor vende el marco de disciplina controlable, las agencias lo adoptan, los equipos de contenido escalan la producción en torno a las recetas, los artículos generados por IA se publican en volumen porque las recetas son fáciles de modelar. Algunos de ellos se ubican por un tiempo. La mayor parte eventualmente se derrumba porque las prescripciones nunca fueron el mecanismo, y el motor se ajusta, o la ventana de frescura se cierra, o el sistema simplemente sigue adelante.

La industria del SEO ha hecho esto antes. Hilado. Páginas programáticas masivas. Contenido de entrada. Cada ciclo seguía la misma forma: una entrada controlable vestida como una disciplina, vendida a escala, brevemente efectiva, eventualmente castigada por el motor, reemplazada por la siguiente entrada controlable vestida como una disciplina.

GEO y OEA son el ciclo actual. Los pilares, porcentajes y pirámides son las plantillas de este ciclo. Debajo de ellos, las estrategias se bifurcan.

Un camino es la explotación de la presencia de marca. Planta tu nombre donde miran los motores. Hilos de Reddit, listas de las X principales, la misma cita aparece una y otra vez. El ciclo se retroalimenta: los motores citan las superficies, las marcas trabajan las superficies, las superficies alimentan los motores. He escrito sobre este bucle antes; Lo llamé el patrón Ouroboros. La versión corta es que el bucle es menos estable de lo que supone la estrategia.

El otro camino es el contenido a escala. Produzca variaciones, aumente el volumen, trate el resultado con plantilla como contenido que podría ganar una cita. He escrito sobre este enfoque antes, en el artículo “Scaling Disappointment”. La versión corta es que la singularidad no es valor y, al ritmo que permiten estas prescripciones, la revisión cualitativa deja de ser posible. El volumen de copias generadas por IA producidas según este camino es la externalidad de este ciclo.

El próximo ciclo venderá la limpieza.

Olvídate por un segundo de si tu “GEO Técnico” está configurado correctamente. Pregunte si vale la pena leer lo que está poniendo en la página. Se diseñaron modelos de lenguaje de gran tamaño para leer todo lo que haya allí. Si lo que hay es bueno, será leído. Si lo que hay es contenido plantillado y de baja utilidad optimizado según una heurística de fragmentación que no existe, eventualmente será filtrado: por el motor, por el usuario o por el próximo artículo académico que demuestre que la calidad de la recuperación se degrada exactamente por este tipo de desperdicio.

La ventaja, cuando se acumula, la obtendrán las personas que no se distraen. Quienes no se suscriben al tablero. Que siguen trabajando en el SEO impulsado por el producto y las bases que siempre han conectado el contenido con las personas. Hay señales tempranas de esto en las líneas de tiempo que leo. Los profesionales cuestionan abiertamente si la optimización frente a una superficie no determinista tiene algún sentido y se preguntan si su atención vuelve a la búsqueda clásica; que, al final de la cadena, es lo que de todos modos alimenta estos sistemas.

El desorden siempre fue el punto. La arquitectura lo maneja. La industria simplemente necesita dejar de fingir que el problema es el desorden.

Más recursos:


Esta publicación se publicó originalmente en The Inference.


Imagen de portada: Roman Samborskyi/Shutterstock

spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares