Google confirma que usa algo similar a Muvera

- Advertisement -spot_img

Gary Illyes de Google respondi贸 preguntas durante la reciente Search Central Live Deep Dive en Asia sobre si usan o no la nueva recuperaci贸n de vectores m煤ltiples a trav茅s del m茅todo de recuperaci贸n de codificaciones de dimensi贸n fija (MUVERA) y tambi茅n si est谩n utilizando modelos de cimientos gr谩ficos.

Mover

Google anunci贸 recientemente a MUVERA en una publicaci贸n de blog y un trabajo de investigaci贸n: un m茅todo que mejora la recuperaci贸n al convertir la b煤squeda compleja de vectores m煤ltiples en una b煤squeda r谩pida de un solo vector. Comprime conjuntos de incrustaciones de token en vectores de dimensi贸n fija que se aproximan estrechamente a su similitud original. Esto le permite usar m茅todos de b煤squeda de vectores 煤nicos optimizados para encontrar r谩pidamente buenos candidatos, luego volver a clasificarlos utilizando la similitud exacta de vectores m煤ltiples. En comparaci贸n con los sistemas m谩s antiguos como el cuadrado, Muvera es m谩s r谩pido, recupera menos candidatos y a煤n mejora el recuerdo, lo que lo convierte en una soluci贸n pr谩ctica para la recuperaci贸n a gran escala.

Los puntos clave sobre Muvera son:

  • Muvera convierte conjuntos de vectores m煤ltiples en vectores fijos utilizando codificaciones dimensionales fijas (FDE), que son representaciones de un solo vector de conjuntos de vectores m煤ltiples.
  • Estas FDE (codificaciones dimensionales fijas) coinciden con las comparaciones originales de vectores m煤ltiples lo suficientemente cerca como para respaldar la recuperaci贸n precisa.
  • La recuperaci贸n de Muvera utiliza MIPS (b煤squeda m谩xima de productos internos), una t茅cnica de b煤squeda establecida utilizada en la recuperaci贸n, lo que facilita la implementaci贸n a escala.
  • Reranking: despu茅s de usar una b煤squeda r谩pida de un solo vector (MIPS) para reducir r谩pidamente las coincidencias m谩s probables, Muvera los vuelve a clasificar utilizando la similitud de chafl谩n, un m茅todo de comparaci贸n de vectores m煤ltiples m谩s detallado. Este paso final restaura la precisi贸n total de la recuperaci贸n de vectores m煤ltiples, por lo que obtienes velocidad y precisi贸n.
  • Muvera puede encontrar m谩s documentos precisamente relevantes con un tiempo de procesamiento m谩s bajo que la l铆nea de base de recuperaci贸n de 煤ltima generaci贸n (a cuadros) con los que se compar贸.
Leer  Las mejores agencias de SEO para nuevas empresas y peque帽as empresas en 2025

Google confirma que usan muvera

Jos茅 Manuel Morgal (perfil de LinkedIn) relat贸 su pregunta con Gary Illyes de Google y su respuesta fue preguntar en broma qu茅 era Muvera y luego confirm贸 que usaban una versi贸n:

As铆 es como Jos茅 describi贸 la pregunta y la respuesta:

鈥淪e ha publicado un art铆culo en Google Research sobre Muvera y hay un art铆culo asociado. 驴Est谩 actualmente en producci贸n en b煤squeda?

Su respuesta fue preguntarme qu茅 era M煤vera jaja y luego coment贸 que usan algo similar a Muvera, pero no lo nombran as铆 “.

驴Google usa Modelos de Fundaci贸n Graph (GFMS)?

Google public贸 recientemente un anuncio de blog sobre un avance de IA llamado Modelo de Fundaci贸n Graph.

El Modelo de Fundaci贸n Graph de Google (GFM) es un tipo de IA que aprende de bases de datos relacionales al convertirlas en gr谩ficos, donde las filas se convierten en nodos y las conexiones entre las tablas se convierten en bordes.

A diferencia de los modelos m谩s antiguos (modelos de aprendizaje autom谩tico y las redes neuronales gr谩ficas (GNN)) que solo funcionan en un conjunto de datos, GFMS puede manejar nuevas bases de datos con diferentes estructuras y caracter铆sticas sin reentrenarse en los nuevos datos. GFMS usa un modelo de IA grande para aprender c贸mo los puntos de datos se relacionan entre las tablas. Esto permite a GFMS encontrar patrones que se pierden los modelos regulares, y funcionan mucho mejor en tareas como detectar spam en los sistemas escalados de Google. Los GFM son un gran paso adelante porque aportan flexibilidad del modelo de base a datos estructurados complejos.

Los modelos de Foundation Graph representan un logro notable porque sus mejoras no son incrementales. Son una mejora de orden de magnitud, con ganancias de rendimiento de 3x a 40x en precisi贸n promedio.

Leer  8 de cada 10 videos de Tiktok por marcas no pueden captar la atenci贸n

A continuaci贸n, Jos茅 le pregunt贸 a Illyes si Google usa modelos de Foundation Graph y Gary nuevamente fingi贸 en broma sin saber de qu茅 estaba hablando Jos茅.

Relacion贸 la pregunta y la respuesta:

鈥淪e ha publicado un art铆culo en Google Research sobre Modelos de Fundaci贸n Graph para datos, esta vez no hay papel asociado con 茅l. 驴Est谩 actualmente en producci贸n en b煤squeda?

Su respuesta fue la misma que antes, pregunt谩ndome qu茅 modelos de Fundaci贸n Graph para los datos, y pens贸 que no estaba en producci贸n. No lo sab铆a porque no hay documento asociado y, por otro lado, me coment贸 que no controlaba lo que se publica en Google Research Blog “.

Gary expres贸 su opini贸n de que el Modelo de Fundaci贸n Graph no se usaba actualmente en la b煤squeda. En este punto, esa es la mejor informaci贸n que tenemos.

Ver tambi茅n: El nuevo modelo de Fundaci贸n Graph de Google mejora la precisi贸n por hasta 40x

驴GFM est谩 listo para la implementaci贸n escalada?

El anuncio oficial del Modelo de la Fundaci贸n Graph Graph dice que se prob贸 en una tarea interna, detecci贸n de spam en anuncios, lo que sugiere fuertemente que se utilizaron sistemas y datos internos reales, no solo puntos de referencia o simulaciones acad茅micas.

Esto es lo que relata el anuncio de Google:

鈥淥perating at Google scale means processing graphs of billions of nodes and edges where our JAX environment and scalable TPU infrastructure particularly shines. Such data volumes are amenable for training generalist models, so we probed our GFM on several internal classification tasks like spam detection in ads, which involves dozens of large and connected relational tables. Typical tabular baselines, albeit scalable, do not consider connections between rows of different Tablas y, por lo tanto, se pierden el contexto que podr铆a ser 煤til para predicciones precisas.

Comida para llevar

Gary Illyes de Google confirm贸 que una forma de muvera est谩 en uso en Google. Su respuesta sobre GFM parec铆a expresarse como una opini贸n, por lo que es algo menos clara, ya que est谩 relacionado como Gary dice que cree que no est谩 en producci贸n.

Leer  Actualizaciones de monetizaci贸n de YouTube en forma larga, pantalones cortos y en vivo

Imagen destacada de Shutterstock/Krakenimages.com

(Tagstotranslate) Noticias

spot_img
spot_img

Art铆culos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Art铆culos populares