Skip to content
Construir Fluxos de Trabalho Agenticos com GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore
Source: aws.amazon.com

Construir Fluxos de Trabalho Agenticos com GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore

Sources: https://aws.amazon.com/blogs/machine-learning/build-agentic-workflows-with-openai-gpt-oss-on-amazon-sagemaker-ai-and-amazon-bedrock-agentcore, https://aws.amazon.com/blogs/machine-learning/build-agentic-workflows-with-openai-gpt-oss-on-amazon-sagemaker-ai-and-amazon-bedrock-agentcore/, AWS ML Blog

TL;DR

  • A OpenAI lançou dois modelos de peso aberto, gpt-oss-120b (117B parâmetros) e gpt-oss-20b (21B parâmetros), ambos com janela de contexto de 128K e design MoE esparso.
  • O post mostra a implantação do gpt-oss-20b em endpoints gerenciados do SageMaker AI usando um contêiner vLLM e a orquestração de um analisador de ações com LangGraph, seguido da implantação no Amazon Bedrock AgentCore Runtime.
  • Uma arquitetura de três agentes (Data Gathering Agent, Stock Performance Analyzer Agent e Stock Report Generation Agent) opera no Bedrock AgentCore, enquanto o GPT-OSS lida com compreensão e geração de linguagem via SageMaker AI.
  • A quantização de 4 bits (MXFP4) reduz os pesos para 63 GB (120B) ou 14 GB (20B), permitindo uso em GPUs H100 únicas, com opções de implantação incluindo BYOC (bring-your-own-container) e hospedagem totalmente gerenciada pelo SageMaker AI.
  • A solução enfatiza sistemas agentics serverless, modulares e escaláveis com memória persistente e orquestração de fluxos de trabalho, além de etapas claras para implantação, invocação e limpeza. Consulte o blog da AWS para detalhes. Este artigo baseia-se na abordagem descrita pela AWS e pela OpenAI em documentação e demonstrações sobre a construção de fluxos agentic com GPT OSS no SageMaker AI e no Bedrock AgentCore. AWS blog

More news