Google Gemini ahora puede controlar su computadora. Los piratas informáticos ya están apuntando a agentes de inteligencia artificial

- Advertisement -spot_img

Google ha trasladado el “uso de la computadora” de un modelo especializado a Google Gemini 3.5 Flash, haciendo que el control estilo agente de navegadores, aplicaciones y flujos de trabajo de escritorio sea una capacidad incorporada en lugar de un producto separado. Eso significa que Gemini ahora puede ver e interactuar con las interfaces de usuario, razonar sobre lo que hay en la pantalla de una computadora y tomar acciones directas. Un científico senior de Google DeepMind advirtió recientemente que los agentes de IA escalados crean incentivos “para que personas malintencionadas hagan cosas maliciosas”.

Los desarrolladores ahora pueden crear agentes que hagan mucho más que llamar a las API. Pueden automatizar flujos de trabajo basados ​​únicamente en GUI, como probar software, completar formularios, navegar por paneles o usar aplicaciones heredadas sin acceso a API. Esto reduce los cuellos de botella para la automatización y amplía lo que los agentes de IA pueden hacer de manera realista en producción.

Si el software tiene una interfaz gráfica de usuario (GUI) pero no una API, un agente de IA aún puede usarlo. Se puede pedir a los agentes que inicien sesión en un panel, exporten los informes de SEO de ayer a una hoja de cálculo, los comparen con los datos de la semana pasada y envíen un resumen por correo electrónico al usuario. El flujo de trabajo se maneja con lenguaje natural en lugar de depender de scripts personalizados para conectar el panel, la hoja de cálculo y el correo electrónico.

Lo que significa para SEO

Las herramientas de SEO pueden volverse mucho más efectivas en un futuro próximo. En lugar de simplemente mostrar datos, la IA podría iniciar sesión en Google Search Console, auditar sitios, rastrear un sitio con Screaming Frog, extraer puntos de datos específicos para comparar y ejecutar flujos de trabajo de optimización repetitivos.

Leer  Threads lanza una expansión de texto de caracteres de 10k para publicaciones

Para los propietarios de sitios, también implica que otro conjunto de agentes de IA pueden actuar como “visitantes”, lo que podría afectar la forma en que los propietarios de sitios interpretan las interacciones y las señales de participación para la optimización del sitio y las ventas.

Los agentes de IA serán atacados

El anuncio de Google es bastante optimista, pero vale la pena prestar atención al documento de “mejores prácticas de seguridad” al que se vincula, porque si no se hace bien esta parte, se pueden producir robos y otras malas experiencias de usuario.

El documento explica:

“El uso de la computadora presenta riesgos operativos y de seguridad únicos, ya que un modelo que actúa en nombre de un usuario puede encontrar contenido no confiable en las pantallas o cometer errores al ejecutar acciones”.

Ese “contenido no confiable en las pantallas” puede ser una referencia a las “trampas” colocadas para los agentes de inteligencia artificial contra las cuales advirtió el científico senior de Google DeepMind.

Google recomienda siete mejores prácticas cuando se utiliza este nuevo agente de IA:

1. Humano en el circuito (HITL):
Hacer cumplir la confirmación del usuario: cuando la respuesta de seguridad indique require_confirmation (o una decisión de seguridad heredada lo requiera), solicite la aprobación del usuario.
Proporcione instrucciones de seguridad personalizadas: implemente una instrucción de sistema personalizada para definir y hacer cumplir sus propios límites de seguridad.

2. Entorno de ejecución seguro:
Ejecute su agente en un entorno seguro y aislado para limitar su impacto potencial. Puede ser una máquina virtual (VM) aislada, un contenedor (por ejemplo, Docker) o un perfil de navegador dedicado con permisos limitados.

3. Sanitización de insumos:
Desinfecte todo el texto generado por el usuario en las indicaciones para mitigar el riesgo de instrucciones no deseadas o inyección rápida. Esta es una capa de seguridad útil, pero no reemplaza un entorno de ejecución seguro.

4. Barandillas de contenido:
Utilice barreras de seguridad y API de seguridad de contenido para evaluar las entradas del usuario, las entradas y salidas de las herramientas y las respuestas del agente para determinar si son apropiadas, la inyección rápida y la detección de jailbreak.

5. Listas permitidas y listas de bloqueo:
Implementar mecanismos de filtrado para controlar dónde puede navegar el modelo y qué puede hacer. Una lista de bloqueo de sitios web prohibidos es un buen punto de partida, mientras que una lista de permitidos más restrictiva es aún más segura.

6. Observabilidad y registro:
Mantenga registros detallados para depuración, auditoría y respuesta a incidentes. Su cliente debe registrar indicaciones, capturas de pantalla, acciones sugeridas por el modelo (function_call), respuestas de seguridad y todas las acciones finalmente ejecutadas por el cliente.

7. Gestión ambiental:
Asegúrese de que el entorno de la GUI sea coherente. Las ventanas emergentes, notificaciones o cambios inesperados en el diseño pueden confundir al modelo. Si es posible, comience desde un estado limpio y conocido para cada nueva tarea.

Tenga cuidado con los sitios web llenos de trampas

A medida que crecen las superficies de ataque, mayor es la probabilidad de que los piratas informáticos intenten explotarlas. Lo que eso significa es que a medida que prolifere el número de agentes de IA en la web, los piratas informáticos centrarán su atención en explotarlos. Los sitios web se convierten en el campo de batalla desde el que los atacantes lanzan ataques contra agentes de IA.

Leer  Reddit publica sólidos resultados del cuarto trimestre y del año completo

Un científico senior de Google DeepMind dijo recientemente que actores maliciosos ya están poniendo trampas para robar dinero a los humanos apuntando a sus agentes de inteligencia artificial.

Eso no es una exageración. Este mes, un experto en ciberseguridad en California experimentó cargos ilícitos en su tarjeta de crédito debido al agente de inteligencia artificial de Anthropic Claude. Según el artículo, parece haber descargado un archivo Skills.md que puede haber contenido una trampa de agente de IA.

El artículo informa:

“…encontró un complemento problemático conectado a Claude, denominado “habilidad”, similar a un complemento. ‘Eso básicamente le dijo a Claude que intentara comprar diferentes tipos de cuentas de regalo con mi información almacenada. Así que fue usando la billetera digital que estaba en mi computadora para que Claude comenzara a realizar estas compras…'”

Los propietarios de sitios pueden necesitar controles de bot más estrictos y la capacidad de identificar cuándo los piratas informáticos han ocultado instrucciones de inyección rápida en sus sitios. Pero eso no es algo que los propietarios de sitios web estén buscando, lo que agrava el problema para los usuarios que utilizan agentes de inteligencia artificial como el que acaba de lanzar Google.

Leer más: Google DeepMind: las trampas para los agentes de IA ya están robando dinero

Imagen destacada de Shutterstock/blocberry

spot_img
spot_img

Artículos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Artículos populares