OpenAI anunció el lanzamiento de ChatGPT Agent, una herramienta avanzada que permite al modelo no solo conversar, sino también razonar, actuar y ejecutar tareas completas de forma autónoma. Este nuevo agente funciona como un asistente virtual equipado con su propia «computadora», capaz de navegar, analizar, escribir, programar y generar archivos utilizando múltiples herramientas integradas.

El sistema combina tres componentes centrales:

  • Las capacidades de Operator, para operar sitios web,
  • Las fortalezas de Deep Research, para investigar y sintetizar información, y
  • Las habilidades conversacionales de ChatGPT.

ChatGPT Agent utiliza múltiples herramientas según la tarea: un navegador visual, un navegador en texto, una terminal de comandos y acceso a APIs (como Gmail o Google Calendar). Esto le permite seleccionar el camino más eficiente para cumplir con cada solicitud.

El modelo aprende mientras trabaja, ajustando su enfoque para mejorar la velocidad y la precisión en cada ejecución. Además, puede integrarse con conectores de ChatGPT para acceder de forma segura a información contextual relevante.

📈 Funcionalidades relevantes para profesionales en Ciencias Económicas

El Agente está diseñado para realizar tareas de principio a fin, alternando entre razonamiento y acción. Algunos ejemplos destacados por OpenAI incluyen:

  • Actualizar hojas de cálculo con nuevos datos sin alterar el formato original, una función útil para quienes trabajan a diario con Excel o Google Sheets.
  • Construir modelos financieros complejos, como proyecciones de tres estados o modelos de compra apalancada.
  • Pedirle a ChatGPT “Analiza a tres competidores y crea una presentación”, el agente “navegará por sitios web de forma inteligente, seleccionará fechas, filtrará resultados, te pedirá iniciar sesión de forma segura, ejecutará código y generará entregables pulidos y editables, como presentaciones y hojas de cálculo que resuman las conclusiones”, según informa OpenAI.

💡 Tal vez te interese leer: ¿Cuál es la IA más inteligente en Ciencias Económicas?

📊 Evaluaciones y desempeño en tareas técnicas

Las capacidades avanzadas del Agente ChatGPT se reflejan en su rendimiento líder en evaluaciones académicas y en entornos del mundo real. Destacamos algunas de las más relevantes:

  • Humanity’s Last Exam: En esta evaluación que mide el rendimiento de la IA en una amplia variedad de materias a nivel experto, el modelo que impulsa al Agente ChatGPT ha logrado una puntuación récord de 43.1%, solo apenas superada por el recientemente presentado Grok 4 Heavy de xAI.
  • SpreadsheetBench: Para los profesionales en Ciencias Económicas, esta es una de las evaluaciones más interesantes. En SpreadsheetBench, que mide la capacidad de los modelos para editar hojas de cálculo en escenarios reales, el Agente ChatGPT establece un nuevo récord, duplicando el rendimiento de GPT-4o. Con la capacidad de editar directamente archivos .xlsx, el agente obtiene un impresionante 45,5% de precisión, comparable al 20% de Copilot en Excel, y acercándose significativamente al rendimiento humano del 71,3%.
  • Tareas de Modelado de Banca de Inversión: En una prueba interna que mide la capacidad del modelo para realizar tareas de analista de banca de inversión de primer a tercer año (como la creación de modelos financieros complejos), el Agente ChatGPT supera ampliamente a los modelos anteriores como investigación en profundidad y o3.
ChatGPT Agent reduce la brecha entre la capacidad de la IA y un humano en editar hojas de cálculo en escenarios reales. Fuente: OpenAI

🔒 Seguridad, control y limitaciones

OpenAI implementó diversas medidas de seguridad y control:

  • El agente solicita autorización explícita antes de realizar acciones sensibles, como enviar formularios o reservar servicios.
  • Algunas tareas requieren supervisión activa, especialmente en casos donde se accede a datos personales o se producen interacciones externas.
  • El modelo rechaza solicitudes riesgosas o de alto impacto, como transacciones financieras o asesoramiento legal.

También se incorporaron defensas contra ataques adversos y protocolos para proteger la privacidad: los datos utilizados por el navegador no se almacenan, y es posible borrar el historial de navegación y cerrar sesiones activas en un solo paso.

No obstante, OpenAI advierte que el agente aún se encuentra en etapa inicial y puede cometer errores. Algunas funciones, como la creación de presentaciones, están en fase beta y pueden requerir ajustes posteriores por parte del usuario.

📅 ¿Cuándo estará disponible?

ChatGPT Agent está siendo implementado progresivamente desde el 17 de julio de 2025 para suscriptores de los planes Pro, Plus y Team, con acceso mediante el selector de herramientas o el comando “/agent”. En las próximas semanas se sumarán los planes Enterprise y Education.

Los usuarios Pro cuentan con un uso mensual casi ilimitado. En el caso de Plus y Team, el límite inicial es de 50 tareas por mes.

Un comentario en «OpenAI lanzó ChatGPT Agent: su agente autónomo para tareas complejas»

Los comentarios están cerrados.