OpenAI ofrece respuestas de salud mejoradas al ChatGPT gratuito

- Advertisement -spot_img

OpenAI dice que GPT-5.5 Instant, el modelo predeterminado para usuarios gratuitos de ChatGPT, ahora tiene un rendimiento comparable a sus modelos de pensamiento de vanguardia en cuestiones de salud. La afirmaci贸n se basa en las propias evaluaciones de salud de la empresa.

La salud es una de las categor铆as que suscita m谩s escrutinio sobre las respuestas generadas por la IA. Por ejemplo, una investigaci贸n de The Guardian inform贸 que algunas descripciones generales de IA de Google proporcionaban orientaci贸n m茅dica inexacta y, posteriormente, Google elimin贸 las descripciones generales de IA para determinadas consultas m茅dicas. La actualizaci贸n de OpenAI cae en esa misma categor铆a de alto riesgo, pero con una afirmaci贸n de mejora en lugar de retroceso.

Para los editores y SEO en salud, eso significa que una audiencia grande y gratuita puede obtener respuestas m茅dicas en ChatGPT en lugar de hacer clic para acceder a una fuente.

Lo que inform贸 OpenAI

OpenAI apunta a ganancias en HealthBench y HealthBench Professional, la versi贸n cl铆nica. Dice que GPT-5.5 Instant obtiene puntuaciones m谩s altas que GPT-5.3 Instant, el modelo al que reemplaz贸.

La compa帽铆a tambi茅n inform贸 de una ca铆da en los problemas de factualidad en el tr谩fico en vivo. Dice que la tasa de respuestas de salud se帽aladas por al menos un posible problema de factibilidad cay贸 un 71% en dos meses. Esa cifra proviene de los monitores que OpenAI ejecuta en el tr谩fico de producci贸n.

OpenAI realiz贸 una tercera comparaci贸n con los m茅dicos. Pidi贸 a los m茅dicos que escribieran respuestas a conversaciones de salud representativas y luego un panel separado de m茅dicos las compar贸 con respuestas modelo. En esa comparaci贸n, el panel calific贸 las respuestas de GPT-5.5 Instant por encima de las escritas por los m茅dicos en criterios que incluyen precisi贸n, comunicaci贸n e integridad, en 3500 respuestas revisadas.

Leer  La actividad de rastreo de OpenAI se triplic贸 desde GPT-5, seg煤n muestran los datos

OpenAI dice que el modelo mostr贸 menos modos de falla que los modelos m谩s antiguos y los m茅dicos. Se帽al贸 que hubo menos casos en los que se pas贸 por alto una se帽al de alerta o no se pidi贸 m谩s contexto al usuario.

C贸mo lo midi贸 OpenAI

HealthBench es un punto de referencia que la compa帽铆a construy贸 con su red de m茅dicos, utilizando r煤bricas escritas por m茅dicos en lugar de preguntas estilo examen.

OpenAI dice que trabaja con m谩s de 260 m茅dicos en 60 pa铆ses y que los m茅dicos han revisado m谩s de 700.000 respuestas de ejemplo hasta la fecha. La compa帽铆a ha citado la cifra de 260 m茅dicos desde que lanz贸 ChatGPT Health en enero. Ninguno de los resultados ha sido publicado para revisi贸n externa.

La salud ya es uno de los casos de uso m谩s importantes de ChatGPT

OpenAI ha dicho que m谩s de 230 millones de personas hacen preguntas sobre salud y bienestar a ChatGPT cada semana, una de las razones m谩s comunes por las que la gente usa el chatbot.

La salud tambi茅n se encuentra en una categor铆a protegida en las pol铆ticas de OpenAI. Cuando la compa帽铆a comenz贸 a probar anuncios en ChatGPT, dijo que no los publicar铆a en conversaciones sobre salud, salud mental o pol铆tica.

Por qu茅 esto importa

Las consultas m茅dicas ya atraen una gran exposici贸n a las respuestas de IA, con la tasa m谩s alta de cualquier categor铆a en un an谩lisis reciente de Ahrefs de las descripciones generales de IA de Google. Una mayor parte de esa demanda que se traslade al nivel gratuito de ChatGPT podr铆a aumentar la presi贸n de cero clics sobre los editores.

Leer  Por qu茅 las conexiones genuinas impulsar谩n las redes sociales en 2025

Es m谩s dif铆cil actuar sobre las afirmaciones de exactitud. OpenAI realiz贸 las pruebas internamente, por lo que se enfrenta a la misma brecha de medici贸n que con otras respuestas de IA en el 谩mbito de la salud. La compa帽铆a dice que sus respuestas de salud mejoraron, pero las afirmaciones no est谩n verificadas por un tercero independiente.

Mirando hacia el futuro

La publicaci贸n no especifica c贸mo los cambios afectan las citas. Si m谩s plataformas trasladan las respuestas de salud a niveles gratuitos, verificar las respuestas y manejar la p茅rdida de tr谩fico se convierte en responsabilidad de los profesionales.

spot_img
spot_img

Art铆culos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Art铆culos populares