Google confirma que el contenido generado por IA debe ser revisado por humanos

- Advertisement -spot_img

Gary Illyes de Google confirm贸 que el contenido de IA est谩 bien siempre que la calidad sea alta. Dijo que “humano creado” no es precisamente la forma correcta de describir su pol铆tica de contenido de IA, y que una descripci贸n m谩s precisa ser铆a “comisariada humana”.

Kenichi Suzuki hizo las preguntas en el contexto de una entrevista exclusiva con Illyes.

Descripci贸n general de la IA y modelos de modo AI

Kenichi pregunt贸 sobre los modelos AI utilizados para las descripciones de IA y el modo AI, y respondi贸 que son modelos Gemini personalizados.

Illyes respondi贸:

“Entonces, como se帽al贸, el modelo que usamos para AIO (para las descripciones de IA) y para el modo AI es un modelo de G茅minis personalizado y eso podr铆a significar que estaba entrenado de manera diferente. No s茅 los detalles exactos, c贸mo fue entrenado, pero definitivamente es un modelo personalizado”.

Kenichi luego pregunt贸 si las descripciones de IA (AIO) y el modo AI utilizan 铆ndices separados para la conexi贸n a tierra.

La conexi贸n a tierra es donde un LLM conectar谩 las respuestas a una base de datos o un 铆ndice de b煤squeda para que las respuestas sean m谩s confiables, veraces y basadas en hechos verificables, lo que ayuda a reducir las alucinaciones. En el contexto del modo AIO y AI, la conexi贸n a tierra generalmente ocurre con los datos basados en la web del 铆ndice de Google.

Suzuki pregunt贸:

“Entonces, 驴eso significa que las descripciones de IA y el modo AI usan 铆ndices separados para la conexi贸n a tierra?”

Los Illyes de Google respondieron:

“Hasta donde yo s茅, Gemini, la descripci贸n general de la IA y el modo AI usan Google Search para la conexi贸n a tierra. Por lo tanto, b谩sicamente emiten m煤ltiples consultas en Google Search y luego la b煤squeda de Google devuelve resultados para esas consultas particulares”.

Kenichi estaba tratando de obtener una respuesta sobre el rastreador extendido de Google, y la respuesta de Illyes fue explicar cu谩ndo entra en juego el rastreador extendido de Google.

“Entonces, 驴eso significa que los datos de entrenamiento son utilizados por el modo AIO y AI recopilados por Google regular y no Google extendido?”

Y Illyes respondi贸:

“Debe recordar que cuando ocurre la conexi贸n a tierra, no hay IA involucrada. Por lo tanto, b谩sicamente es la generaci贸n la que se ve afectada por Google.

Contenido de IA en LLM e 铆ndice de b煤squeda

La siguiente pregunta que respondi贸 Illyes fue sobre si el contenido de IA publicado en l铆nea est谩 contaminando LLMS. Illyes dijo que esto no es un problema con el 铆ndice de b煤squeda, pero puede ser un problema para LLMS.

Leer  Estructura organizativa efectiva de SEO para una empresa global

Pregunta de Kenichi:

“A medida que AI crea m谩s contenido, y los LLM aprenden de ese contenido. 驴Qu茅 piensas sobre esta tendencia y cu谩les son sus inconvenientes potenciales?”

Illyes respondi贸:

“No estoy preocupado por el 铆ndice de b煤squeda, pero la capacitaci贸n de modelos definitivamente necesita descubrir c贸mo excluir el contenido generado por la IA. De lo contrario, terminas en un bucle de entrenamiento que realmente no es excelente para la capacitaci贸n. No estoy seguro de cu谩nto problema es este momento, o tal vez porque c贸mo seleccionamos los documentos en los que entrenamos”.

Calidad de contenido y contenido generado por IA

Suzuki sigui贸 con una pregunta sobre la calidad del contenido y la IA.

Pregunt贸:

“Entonces no te importa c贸mo se crea el contenido … 驴siempre que la calidad sea alta?”

Illyes confirm贸 que una consideraci贸n l铆der para los datos de entrenamiento de LLM es la calidad del contenido, independientemente de c贸mo se generara. 脡l cit贸 espec铆ficamente la precisi贸n objetiva del contenido como un factor importante. Otro factor que mencion贸 es que la similitud de contenido es problem谩tica, y dice que el contenido similar “extremadamente” no deber铆a estar en el 铆ndice de b煤squeda.

Tambi茅n dijo que a Google esencialmente no le importa c贸mo se crea el contenido, pero con algunas advertencias:

“Claro, pero si puede mantener la calidad del contenido y la precisi贸n del contenido y asegurarse de que sea de alta calidad, entonces t茅cnicamente no importa.

El problema comienza a surgir cuando el contenido es extremadamente similar a algo que ya se cre贸, que con suerte no vamos a tener en nuestro 铆ndice para entrenar de todos modos.

Y luego, el segundo problema es cuando est谩 entrenando en datos inexactos y ese es probablemente el m谩s riesgoso porque luego comienza a introducir sesgos y comienzan a introducir datos contrafactuales en sus modelos.

Mientras la calidad del contenido sea alta, lo que generalmente hoy en d铆a requiere que el humano revisa el contenido generado, est谩 bien para el entrenamiento de modelos “.

Contenido generado por la IA revisado por humanos

Illyes continu贸 su respuesta, esta vez centr谩ndose en el contenido generado por IA que es revisado por un humano. Hace hincapi茅 en la revisi贸n humana, no como algo que los editores necesitan se帽alar en su contenido, sino como algo que los editores deben hacer antes de publicar el contenido.

Leer  Operai lanza la aplicaci贸n Sora iOS junto con el modelo de video Sora 2

Una vez m谩s, “Human Revisado” no significa agregar redacci贸n en una p谩gina web de que el contenido es revisado por humanos; Esa no es una se帽al confiable, y no es lo que sugiri贸.

Esto es lo que dijo Illyes:

鈥淣o creo que vamos a cambiar nuestra orientaci贸n en el corto plazo sobre si necesita revisarla o no.

Entonces, b谩sicamente, cuando decimos que es humano, creo que la palabra humana creada est谩 mal. B谩sicamente, debe ser curado humano. Entonces, b谩sicamente, alguien ten铆a una supervisi贸n editorial sobre su contenido y valid贸 que en realidad es correcto y preciso “.

Comida para llevar

La pol铆tica de Google, como lo resume libremente por Gary Illyes, es que el contenido generado por IA est谩 bien para la b煤squeda y la capacitaci贸n de modelos si es de hecho preciso, original y revisado por los humanos. Esto significa que los editores deben aplicar la supervisi贸n editorial para validar la precisi贸n objetiva del contenido y garantizar que no sea “extremadamente” similar al contenido existente.

Mira la entrevista:

https://www.youtube.com/watch?v=pstff6tcqxk

Imagen destacada de Shutterstock/Supatman

(Tagstotranslate) Noticias

spot_img
spot_img

Art铆culos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Art铆culos populares