OpenAI presentó GPT-5.4, su nuevo modelo insignia de inteligencia artificial, diseñado para trabajar con sistemas de agentes capaces de ejecutar acciones directamente en una computadora.
El modelo ya está disponible a través de ChatGPT —donde aparece como GPT-5.4 Thinking—, así como en la API de OpenAI y en OpenAI Codex.
IA que puede “hacer”, no solo recomendar
Una de las novedades principales de GPT-5.4 es su capacidad de interactuar con el ordenador mediante agentes de IA. Esto significa que el modelo puede emitir instrucciones para realizar acciones concretas en el sistema.
Entre las funciones destacadas se encuentran:
- Hacer clic con el ratón mediante comandos para un agente de IA.
- Escribir comandos de teclado.
- Editar archivos en el sistema.
- Analizar capturas de pantalla.
- Navegar por interfaces de programas o páginas web.
Estas capacidades representan un cambio importante frente a modelos anteriores, que solo podían explicar cómo realizar una tarea.
Mejor razonamiento y trabajo con datos
El nuevo modelo también introduce mejoras en el rendimiento y la eficiencia.
Según la compañía, GPT-5.4 ofrece:
- Mayor capacidad de razonamiento.
- Resolución de problemas utilizando menos tokens, lo que reduce costos de uso.
- Mejor desempeño en hojas de cálculo.
- Presentación de un plan inicial antes de ejecutar tareas complejas, permitiendo al usuario revisar o modificar la estrategia.
Integración con aplicaciones y herramientas
Cuando se utiliza dentro de ChatGPT, el modelo sigue limitado al entorno del chatbot y a sus integraciones con servicios externos, como Google Drive, Spotify o Adobe Photoshop.
Sin embargo, cuando funciona a través de la API o en Codex, GPT-5.4 puede interactuar directamente con el sistema operativo y ejecutar acciones mediante agentes.
El avance hacia computadoras gestionadas por IA
El desarrollo apunta a una tendencia creciente: computadoras controladas por agentes de inteligencia artificial capaces de ejecutar tareas complejas de forma autónoma.
En ese escenario, los usuarios podrían dar instrucciones generales —por ejemplo, equilibrar cuentas en un software financiero— y el agente, guiado por el modelo de IA, abriría el programa, navegaría por la interfaz y realizaría las operaciones necesarias.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]