La deposición de Googler ofrece la vista de los sistemas de clasificación de Google

- Advertisement -spot_img

El testimonio redactado de un ingeniero de Google publicado en línea por el Departamento de Justicia de los Estados Unidos ofrece un aspecto dentro de los sistemas de clasificación de Google, ofreciendo una idea sobre los puntajes de calidad de Google y presenta una misteriosa señal de popularidad que utiliza datos de Chrome.

El documento ofrece una visión de alto nivel y muy general de las señales de clasificación, proporcionando una idea de lo que hacen los algoritmos pero no los detalles.

Señales hechas a mano

Por ejemplo, comienza con una sección sobre la “elaboración de manos” de las señales que describe el proceso general de tomar datos de evaluadores de calidad, clics, etc. y aplicar fórmulas matemáticas y estadísticas para generar un puntaje de clasificación a partir de tres tipos de señales. Medios hechos a mano algoritmos escalados que están ajustados por los ingenieros de búsqueda. No significa que estén clasificando manualmente sitios web.

Señales ABC de Google

El documento del DOJ enumera tres tipos de señales que se denominan señales ABC y corresponden a las siguientes:

  • A – Anclas (páginas que vinculan a las páginas objetivo),
  • B – Cuerpo (términos de consulta de búsqueda en el documento),
  • C – clics (tiempo de permanencia del usuario antes de regresar al SERP)

La declaración sobre las señales ABC es una generalización de una parte del proceso de clasificación. La clasificación de los resultados de búsqueda es mucho más complejo e implica cientos, si no miles de algoritmos adicionales, en cada paso del proceso de clasificación, desde la indexación, el análisis de enlaces, los procesos anti-Spam, la personalización, el reanimiento y otros procesos. Por ejemplo, Liz Reid ha discutido los sistemas de topicalidad central como parte del algoritmo de clasificación y Martin Splitt ha discutido las anotaciones como parte de la comprensión de las páginas web.

Esto es lo que dice el documento sobre las señales ABC:

“Las señales ABC son los componentes clave de la tópica (o una puntuación base), que es la determinación de Google de cómo el documento es relevante para la consulta.

T* (topicalidad) combina efectivamente (al menos) estas tres señales de una manera relativamente hecha a mano. Google usa para juzgar la relevancia del documento basado en los términos de la consulta “.

El documento ofrece una idea de la complejidad de las páginas web de clasificación:

“El desarrollo de clasificación (especialmente la actualidad) implica resolver muchos problemas matemáticos complejos. Para la actualidad, puede haber un equipo de ingenieros que trabajan continuamente en estos problemas difíciles dentro de un proyecto determinado.

La razón por la cual la gran mayoría de las señales están hechas a mano es que si algo rompe Google sabe qué solucionar. Google quiere que sus señales sean completamente transparentes para que puedan dispararlas y mejorarlas ”.

El documento compara su enfoque hecho a mano con el enfoque automatizado de Microsoft, diciendo que cuando algo rompe en Bing es mucho más difícil de solucionar que con el enfoque de Google.

Leer  Instagram agrega nueva herramienta Teleprompter a las ediciones

Interacción entre la calidad y la relevancia de la página

Un punto interesante revelado por el ingeniero de búsqueda es que la calidad de la página es independiente de la consulta. Si se determina que una página es de alta calidad, confiable, se considera confiable en todas las consultas relacionadas, lo que es lo que se entiende por la palabra estática, no se recalcula dinámicamente para cada consulta. Sin embargo, existen señales relacionadas con la relevancia en la consulta que se pueden usar para calcular las clasificaciones finales, lo que muestra cómo la relevancia juega un papel decisivo en la determinación de lo que se clasifica.

Esto es lo que dijeron:

“Calidad
Generalmente estático en múltiples consultas y no está conectada a una consulta específica.

Sin embargo, en algunos casos, la señal de calidad incorpora información de la consulta además de la señal estática. Por ejemplo, un sitio puede tener información de alta calidad pero general, por lo que una consulta interpretada como una búsqueda de información muy estrecha/técnica puede usarse para dirigir a un sitio de calidad que sea más técnico.

Q* (calidad de página (es decir, la noción de confiabilidad)) es increíblemente importante. Si los competidores ven los registros, entonces tienen una noción de “autoridad” para un sitio determinado.

El puntaje de calidad es muy importante incluso hoy. La calidad de la página es algo de lo que la gente se queja más … “

AI da motivo a las quejas contra Google

El ingeniero afirma que las personas se quejan de la calidad, pero también dice que la IA agrava la situación al empeorarla.

Leer  Búsqueda de Google Mobile actualizada con desplazamiento continuo

Dice sobre la calidad de la página:

“Hoy en día, la gente todavía se queja de la calidad y la IA lo empeora.

Esto fue y continúa siendo mucho trabajo, pero podría ser fácilmente moderado porque Q está en gran medida estático y en gran medida relacionado con el sitio en lugar de la consulta “.

EdeePrank: una forma de entender las clasificaciones de LLM

El Googler enumera otras señales de clasificación, incluida una llamada EdeePrank, que es un sistema basado en LLM que usa Bert, que es un modelo relacionado con el lenguaje.

Él explica:

“EdeePrank es un sistema LLM que usa Bert, Transformers. Esencialmente, Edeeeprank intenta tomar señales basadas en LLM y descomponerlas en componentes para hacerlas más transparentes”.

Esa parte sobre la descomposición de las señales de LLM en componentes parece ser una referencia de hacer que las señales de clasificación basadas en LLM sean más transparentes para que los ingenieros de búsqueda puedan entender por qué el LLM está clasificando algo.

PageRank vinculado a algoritmos de clasificación de distancia

PageRank es la innovación de clasificación original de Google y desde entonces se ha actualizado. Escribí sobre este tipo de algoritmo hace seis años. Los algoritmos de distancia de enlace calculan la distancia desde sitios web autorizados para un tema determinado (llamado sitios de semillas) a otros sitios web en el mismo tema. Estos algoritmos comienzan con un conjunto de semillas de sitios autorizados en un tema y sitios determinados que están más lejos de su sitio de semillas respectivo están determinados como menos confiables. Los sitios que están más cerca de los conjuntos de semillas son más probables para ser más autorizados y confiables.

Esto es lo que dijo el Googler sobre PageRank:

“PageRank. Esta es una sola señal relacionada con la distancia desde una buena fuente conocida, y se usa como una entrada para la puntuación de calidad”.

Leer  Tiktok comparte los últimos datos sobre las eliminaciones de contenido de la UE y los números de usuario

Lea sobre este tipo de algoritmo de clasificación de enlaces: algoritmos de clasificación de distancia de enlace

Señal de popularidad críptica basada en cromo

Hay otra señal cuyo nombre está redactado relacionado con la popularidad.

Aquí está la descripción críptica:

“(Redactada) (popularidad) que usa datos de Chrome”.

Se puede hacer una afirmación plausible de que esto confirma que la fuga de API de Chrome se trata de factores de clasificación reales. Sin embargo, muchos SEO, incluido yo mismo, creen que esas API son herramientas orientadas al desarrollador utilizadas por Chrome para mostrar métricas de rendimiento como Core Web Vitals dentro de la interfaz de Chrome Dev Tools.

Sospecho que esta es una referencia a una señal de popularidad que podríamos no conocer.

El ingeniero de Google se refiere a otra filtración de documentos que hacen referencia a los “componentes del sistema de clasificación” reales del sistema de clasificación de Google, pero que no tienen suficiente información para la ingeniería inversa del algoritmo.

Ellos explican:

“Hubo una filtración de documentos de Google que nombraron ciertos componentes del sistema de clasificación de Google, pero los documentos no entran en detalles de las curvas y los umbrales.

Por ejemplo
Los documentos por sí solos no le dan suficientes detalles para resolverlo, pero los datos probablemente lo hacen “.

Llevar

El documento recientemente publicado resume una deposición del Departamento de Justicia de los Estados Unidos de un ingeniero de Google que ofrece un esquema general de partes de los sistemas de clasificación de búsqueda de Google. Discute el diseño de la señal elaborada a mano, el papel de las puntuaciones de calidad de la página estática y una misteriosa señal de popularidad derivada de los datos de Chrome.

Proporciona una mirada rara de cómo se diseñan señales como la actualidad, la confiabilidad, el comportamiento de clic y la transparencia basada en LLM y ofrece una perspectiva diferente sobre cómo Google clasifica los sitios web.

Imagen destacada de Shutterstock/Fran_kie

(Tagstotranslate) Noticias

spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares