La documentaci贸n p煤blica del rastreador de OpenAI ahora incluye OAI-AdsBot, un bot que puede visitar p谩ginas enviadas como anuncios ChatGPT para verificar el cumplimiento de la pol铆tica y ayudar a determinar la relevancia de los anuncios.
La entrada se encuentra junto a OAI-SearchBot, GPTBot y ChatGPT-User en la p谩gina de documentos del rastreador de OpenAI, lo que eleva el recuento de bots documentados a cuatro.
OpenAI afirma que OAI-AdsBot solo visita p谩ginas enviadas como anuncios y que los datos que recopila no se utilizan para entrenar sus modelos b谩sicos de IA generativa.
Qu茅 hace el robot
Seg煤n los documentos de OpenAI, OAI-AdsBot puede visitar la p谩gina de inicio de un anuncio despu茅s de enviarlo. El bot comprueba si la p谩gina cumple con las pol铆ticas publicitarias de OpenAI. Tambi茅n puede utilizar contenido de la p谩gina de destino para ayudar a decidir cu谩ndo mostrar el anuncio a los usuarios de ChatGPT.
El bot se identifica con la cadena usuario-agente Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; OAI-AdsBot/1.0; +https://openai.com/adsbot.
OAI-SearchBot y GPTBot tienen la versi贸n 1.3, seg煤n los documentos de OpenAI. El rastreador solo visita p谩ginas enviadas como p谩ginas de destino de anuncios, no la Web en general.
Lo que el robot no hace
Los datos recopilados por OAI-AdsBot no se utilizan para entrenar modelos b谩sicos de IA generativa. Esto mantiene a OAI-AdsBot fuera del territorio de GPTBot, que se encarga de la recopilaci贸n de datos de entrenamiento.
Tambi茅n mantiene a OAI-AdsBot separado de los otros robots de OpenAI. OAI-SearchBot muestra contenido en la b煤squeda de ChatGPT, mientras que ChatGPT-User busca p谩ginas durante la navegaci贸n iniciada por el usuario y OAI-AdsBot se limita a la validaci贸n de anuncios.
OAI-SearchBot y GPTBot se pueden controlar de forma independiente a trav茅s de robots.txt. ChatGPT-User es iniciado por el usuario y la compa帽铆a se帽ala que es posible que las reglas de robots.txt no se le apliquen. La entrada de OAI-AdsBot no dice c贸mo trata el bot el archivo robots.txt.
A煤n no hay lista de IP p煤blicas
OpenAI publica archivos de rango de IP para sus tres bots anteriores en openai.com/searchbot.json, openai.com/gptbot.jsony openai.com/chatgpt-user.json. En el momento de la publicaci贸n, no hay equivalente openai.com/adsbot.json El archivo aparece en los documentos de OpenAI.
Sin una lista publicada, verificar una visita real a OAI-AdsBot se vuelve m谩s dif铆cil. Las cadenas de agente de usuario se pueden falsificar y las listas de IP le brindan una forma de verificar los otros tres robots de OpenAI. Para OAI-AdsBot, esa verificaci贸n cruzada no est谩 disponible.
Por qu茅 esto importa
OAI-AdsBot tiene dos audiencias. Los anunciantes que compran ubicaciones en ChatGPT necesitan que el bot llegue a sus p谩ginas de destino; de lo contrario, es posible que el anuncio no se valide. Cualquiera que rastree la actividad de los robots de IA en los registros del servidor obtiene un nuevo agente de usuario al que observar, uno vinculado al inventario pago en lugar de a la b煤squeda o la capacitaci贸n.
La protecci贸n agresiva contra bots a trav茅s de Cloudflare, Akamai o herramientas similares puede bloquear OAI-AdsBot antes de que llegue a la p谩gina. Eso podr铆a crear fricciones de validaci贸n para los anunciantes que utilizan herramientas estrictas de mitigaci贸n de bots.
Mirando hacia el futuro
El programa publicitario de ChatGPT ha avanzado r谩pidamente desde que OpenAI comenz贸 a probar anuncios el 9 de febrero. A medida que el acceso se abra a m谩s anunciantes, el tr谩fico OAI-AdsBot comenzar谩 a aparecer en m谩s registros del servidor. Est茅 atento a un eventual archivo de rango de IP en openai.com/adsbot.json si OpenAI decide publicar uno. Por ahora, la cadena usuario-agente es con lo que tienes que trabajar.
Imagen destacada: Estudio de stock de flores/Shutterstock

