Sergey Brin de Google ve un camino hacia la AGI, pero no más allá

- Advertisement -spot_img

En una entrevista reciente de AGI House, Sergey Brin describió a Gemini como un sistema cuyas capacidades no sólo están evolucionando sino que integran el conocimiento mundial a través de idiomas y modalidades. Dijo que el software que ejecuta la IA también ha evolucionado más allá de lo que fue diseñado originalmente, y aunque Brin puede imaginar a Gemini logrando AGI, tampoco podía ver lo que viene después.

AGI: Inteligencia General Artificial

AGI es un nivel de IA que puede aprender, comprender y aplicar conocimientos en diferentes tareas de manera similar a los humanos. La IA actual puede producir respuestas útiles, escribir código, analizar imágenes y resolver muchos problemas concretos, pero todavía no comprende el mundo ni aplica conocimientos de forma independiente en distintos dominios como puede hacerlo un ser humano.

OpenAI, Google DeepMind y Anthropic están desarrollando AGI, pero enfatizan diferentes razones de lo que quieren hacer con ella. OpenAI se centra en los beneficios económicos, Google DeepMind enfatiza los descubrimientos científicos y Anthropic prioriza el progreso humano.

Próxima gran novedad: las capacidades de IA están convergiendo

Brin dijo que el progreso anterior de la IA de Google se basó en modelos especializados que fueron construidos para tareas específicas. Pero dijo que Gemini está logrando cada vez más un desempeño de vanguardia en múltiples dominios como las matemáticas y el razonamiento científico. Lo que Google está viendo es que capacidades que solían depender de modelos entrenados para hacer cosas específicas ahora están dando paso a familias de modelos que pueden hacerlo todo: la convergencia.

También dijo que la convergencia era algo que sucedía; No era algo que esperaba cuando Google comenzó a desarrollar IA.

El contexto de su respuesta fue una pregunta sobre cuál será el próximo gran avance, y su respuesta fue la convergencia.

Brin respondió:

“Creo que lo interesante es que todas estas cosas están convergiendo en los mismos modelos generales.

En el pasado, tendríamos que contar con modelos especializados. Y en el caso del plegamiento de proteínas, obviamente todavía lo hacemos.

Pero cada vez más, nuestros principales LLM Gemini pueden ser lo último en matemáticas, por ejemplo, y en otros tipos de cuestiones científicas. Así que esa convergencia es, no lo sé, supongo que no es algo que realmente hubiera predicho desde el principio. Pero ha sido algo increíble de ver.

Y supongo que dentro de eso está este concepto de transferencia, solo la idea de que cuando entrenas para una determinada clase de problemas, digamos que estás entrenando para codificación, eso en realidad puede ayudarte con tu razonamiento matemático y viceversa.

Y ha sido realmente emocionante verlo… la capacidad multimodal también es un ejemplo de ello. Por ejemplo, ¿puedes realmente obtener una transferencia de poder procesar imágenes a poder pensar en problemas de texto geométricos también?

El aprendizaje por transferencia es una de las razones por las que se está produciendo la convergencia. El aprendizaje por transferencia es donde entrenas un modelo en una cosa y resulta que tiene beneficios para realizar tareas en otra cosa que aparentemente no está relacionada. Entonces, lo que está sucediendo ahora es que Google está descubriendo que combinar aspectos como el entrenamiento de la visión, las matemáticas y el razonamiento está contribuyendo a mejorar múltiples capacidades.

Leer  Las citas de ChatGPT cambiaron después de GPT-5.5, según muestran los datos de SISTRIX

Los transformadores son “extrañamente flexibles”

Se le preguntó a Brin si los transformadores desempeñarán un papel en AGI. Los transformadores son el software que ejecuta la IA y el avance que permitió cosas como ChatGPT. La respuesta de Brin menciona MOE, que significa Mixture Of Experts. MOE es una técnica para enrutar tareas específicas a “expertos” internos especializados para aumentar la eficiencia.

A la pregunta de si AGI funcionará con transformadores, Brin respondió:

“Los Transformers han sido extrañamente flexibles. Los usamos para imágenes y videos además de texto. Por lo tanto, han excedido su capacidad original.

Ahora, para ser justos, a lo largo del camino, ellos también han cambiado. Quiero decir, tenemos cualquier tipo de MOE escaso, transformadores. Quiero decir, hay muchos pequeños detalles que han cambiado a lo largo del camino, por lo que no es exactamente lo mismo que el papel transformador.

Si pudiera adivinar, ¿podría algo parecido ser AGI? Yo diría que sí.

Esa es mi suposición, simplemente porque han podido evolucionar mucho.

Pero como dije, están cambiando. No es exactamente lo mismo que el papel original del transformador”.

Los modelos mundiales están convergiendo con Géminis

Se le preguntó a Brin si los modelos mundiales ayudarían a la IA a lograr el AGI, si eso es parte del logro de ese objetivo. Un modelo mundial es una simulación interna de la realidad realizada por una IA que la ayuda a anticipar lo que podría suceder a continuación. Al predecir las consecuencias de diferentes acciones, puede tomar mejores decisiones y planificar el futuro.

Mencionó el Gemini Omni de Google como ejemplo de esta dirección en IA. Gemini Omni se presentó a mediados de mayo en Google I/O. Google lo describe como su nueva familia de modelos de IA multimodal “cualquier entrada a salida”. Combina las capacidades de razonamiento de Gemini con capacidades de medios generativos, comenzando con la creación y edición de videos. Google lo describe como un modelo que eventualmente puede “crear cualquier cosa a partir de cualquier entrada”.

Leer  Lo que Sundar Pichai no te dirá

La pregunta formulada fue:

“¿Cuál es su perspectiva sobre cómo los modelos mundiales pueden ayudar a alcanzar el AGI?”

Brin respondió:

“Sí, quiero decir, los modelos mundiales son como videos, básicamente, modelos. Y supongo que hay un par: la gente habla de AGI de manera bastante amplia.

Pienso que AGI es la idea de que la IA realmente puede mejorarse a sí misma.

Pero otras personas, y creo que probablemente esas personas tengan más razón, piensan que AGI significa, bueno, que la IA debe poder hacer cualquier cosa que una persona pueda hacer.

Y esas son dos cosas diferentes.

Entonces, para hacer cualquier cosa que una persona pueda hacer, es absolutamente necesario poder comprender e interactuar con el mundo físico.

Entonces, para eso, poder saber, soñar, imaginar lo que sucederá en el mundo si haces algo y comprenderlo es obviamente importante.

Entonces, creo que los modelos mundiales, sí, si vas a hacer de todo y eso, ya sabes, se extiende a la robótica y cosas así, los modelos mundiales son clave.

Y sí, ustedes probablemente hayan tenido más tiempo que yo para jugar con nuestro modelo Gem Omni, honestamente, porque estoy inmerso en un juego de superación personal.

Pero sí, hemos estado trabajando en eso durante mucho tiempo, Omni es la última versión de eso.

Omni también es genial porque es lo mismo, ya sabes, Gemini, como lo entrenamos también con todo el texto y todas las demás cosas, entrena exactamente de la misma manera.

El hecho de que estos converjan es algo sorprendente. Pero sí, necesitas esa capacidad para poder interactuar físicamente”.

La conclusión es que Géminis está tomando una nueva dirección con la convergencia de modelos mundiales. Es la siguiente etapa de crecimiento.

¿Qué viene después de AGI?

Alguien le preguntó a Brin qué viene después de AGI, lo cual fue una muy buena pregunta. Lo interesante de la respuesta de Brin es que no tenía ninguna. La respuesta de Brin fue que realmente no podía ver más allá. Comparó la IA con oleadas tecnológicas anteriores como la web y la informática móvil, pero no identificó un paradigma de lo que vendrá después.

La implicación es que descubrir qué viene después de AGI sería en sí mismo una gran oportunidad.

Él dijo:

“Vaya, esa es una gran pregunta.

¿Qué sigue después de que lleguemos a AGI?

Quiero decir, creo que todo el mundo está bastante centrado en acelerar el crecimiento de la IA en este momento. ¿Qué viene después?

Obviamente, comenzamos con la web y la búsqueda en Internet. En cierto modo pasamos por la generación móvil, que fue otra explosión bastante grande.

Supongo que ahora la gente lo es, ahora la IA es una nueva y enorme tendencia en la industria. ¿Y qué viene después de eso?

Vaya… quiero decir, creo que si puedes responder a eso, tendrás una compañía fantástica en tus manos”.

Lo que todo significa

  • Brin considera que la IA avanza hacia la AGI a través de la convergencia.
  • Las capacidades que alguna vez fueron manejadas por modelos separados se están fusionando en familias de modelos más amplias.
  • La transferencia de aprendizaje ayuda a que un tipo de experiencia mejore el desempeño en otro.
  • Los transformadores continúan evolucionando.
  • Los modelos mundiales pueden ser la próxima etapa de crecimiento de Géminis.
  • Puede ser que nadie sepa lo que viene después de AGI hasta que lo haya logrado.
Leer  Cómo gestionar las partes interesadas cuando llega una actualización de algoritmo

OpenAI, Google DeepMind y Anthropic están trabajando para crear AGI, priorizando diferentes objetivos.

La descripción que hace Brin de Gemini ofrece una idea de cómo Google cree que se puede lograr AGI. Describió un proceso de convergencia, en el que capacidades que antes requerían sistemas separados aparecen cada vez más dentro de la misma familia de modelos. Una razón por la que esto sucede es el aprendizaje por transferencia, donde entrenar un modelo en un dominio mejora sus habilidades en otro.

Esa misma convergencia se está extendiendo ahora a los modelos mundiales. En lugar de tratar la comprensión del mundo físico como una disciplina separada, Google está integrando esas capacidades en el propio Gemini. Brin señaló a Gemini Omni como un ejemplo de cómo el razonamiento, la comprensión multimodal y las capacidades de modelo mundial se están convirtiendo cada vez más en parte del mismo sistema.

Lo que vendrá después de AGI sigue siendo una cuestión abierta. Brin dijo que puede imaginar que las arquitecturas de IA actuales continúen evolucionando hacia AGI, pero cuando se le preguntó qué sigue, no tuvo una respuesta. Si la AGI es la próxima frontera, lo que venga después podría ser la base de una generación completamente nueva de empresas y tecnologías.

Y hacia ahí es hacia donde nos dirigimos con la IA.

Mira la entrevista aquí:

Imagen destacada/Captura de pantalla

spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares