Skip to content
Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore
Source: aws.amazon.com

Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore

Sources: https://aws.amazon.com/blogs/machine-learning/build-agentic-workflows-with-openai-gpt-oss-on-amazon-sagemaker-ai-and-amazon-bedrock-agentcore, https://aws.amazon.com/blogs/machine-learning/build-agentic-workflows-with-openai-gpt-oss-on-amazon-sagemaker-ai-and-amazon-bedrock-agentcore/, AWS ML Blog

TL;DR

  • OpenAI lanzó dos modelos de peso abierto, gpt-oss-120b (117B parámetros) y gpt-oss-20b (21B parámetros), ambos con una ventana de contexto de 128K y un diseño MoE disperso.
  • El artículo demuestra desplegar gpt-oss-20b en endpoints gestionados de SageMaker AI utilizando un contenedor vLLM, y orquestar un analizador de acciones multiagente con LangGraph, para luego desplegar en Amazon Bedrock AgentCore Runtime.
  • Una arquitectura de tres agentes (Data Gathering Agent, Stock Performance Analyzer Agent, Stock Report Generation Agent) opera dentro de Bedrock AgentCore, mientras que GPT-OSS maneja la comprensión y generación de lenguaje a través de SageMaker AI.
  • La cuantización de 4 bits (MXFP4) reduce los pesos a 63 GB (120B) o 14 GB (20B), permitiendo ejecutar en una única GPU H100, con opciones de implementación que incluyen BYOC (bring-your-own-container) y hosting totalmente gestionado por SageMaker AI.
  • La solución enfatiza sistemas agenticos serverless, modulares y escalables con memoria persistente y orquestación de flujos de trabajo, además de pasos claros para implementación, invocación y limpieza. Consulte el blog de AWS para más detalles. Este artículo se basa en el enfoque descrito por AWS y OpenAI en documentación y demostraciones para construir flujos agenticos con GPT OSS en SageMaker AI y Bedrock AgentCore. AWS blog

More news