Crie um fluxo de trabalho agentic de planejamento de viagem com Amazon Nova e LangGraph
Sources: https://aws.amazon.com/blogs/machine-learning/create-a-travel-planning-agentic-workflow-with-amazon-nova, aws.amazon.com
TL;DR
- Construa um fluxo de trabalho agentic para planejamento de viagem usando Amazon Nova e LangGraph para gerenciar tarefas dinâmicas e com múltiplos passos.
- Arquitetura de três camadas baseada em Lambda (serverless) com Docker, implantada via AWS CDK, incluindo Lambda, DynamoDB e configurações de API.
- Nó de roteamento usa Amazon Nova Lite para análise rápida de consultas; cinco nós complexos utilizam Amazon Nova Pro para instrução avançada e operações multi-step, com janela de contexto de 300.000 tokens e suporte a múltiplos idiomas.
- Camada de integração unifica dados de várias fontes; o estado da sessão é mantido com AgentState para garantir acesso confiável ao contexto entre os nós. Recomendações de produtos aparecem como links ao vivo na Amazon.com.
- A implantação é escalável horizontalmente e projetada para ser extensível com APIs e fontes de dados adicionais; referências a recursos de Bedrock Agents indicam o roadmap para agentes de IA.
Contexto e antecedentes
Planejar viagens envolve desafios reais: escolher hospedagem, planejar atividades e organizar transporte local, tudo dentro de preferências e orçamento. Avanços recentes em IA gerativa permitem fluxos agentic, onde modelos de linguagem (LLMs) possam acessar ferramentas e dados externos para suportar tarefas dinâmicas e em várias etapas. Este post demonstra como construir uma solução de planejamento de viagem usando agentes de IA, com o agente alimentado por Amazon Nova e orquestrado pelo LangGraph. O Amazon Nova oferece um equilíbrio entre desempenho e custo, apresentado como vantajoso frente a outros LLMs comerciais, e o LangGraph fornece uma estrutura de orquestração com estado para coordenar componentes especializados. A abordagem emprega uma arquitetura serverless com AWS Lambda e três camadas de arquitetura para separar interação com o usuário, processamento central e serviços de integração. O design serverless se apoia em containers Docker e funções Lambda, com LangGraph orquestrando uma arquitetura de grafo com nós que tratam de aspectos distintos do planejamento de viagem. Um nó roteador analisa a consulta do usuário e, conhecendo os 14 nós de ação disponíveis, decide quais devem ser executados. Os nós de ação executam suas próprias cadeias de LLM, com Nova Pro ou Nova Lite, para realizar tarefas como pesquisa na web, recomendações personalizadas, consultas de clima, buscas de produtos e gerenciamento de carrinho de compras. A capacidade dos modelos envolve janela de contexto de 300.000 tokens e suporte a texto, imagem e vídeo, com suporte a mais de 200 idiomas. A arquitetura é projetada para ser extensível, permitindo que organizações incorporem APIs e fontes de dados próprias conforme as necessidades evoluem. Para mais sobre o tema de agentes alimentados por LLM e recursos de Bedrock, veja o post de origem e os recursos citados fonte. Neste solução, as sessões de usuário são acompanhadas por uma estrutura de dados AgentState, um dicionário Python tipado que impõe tipos de dados para prevenir erros e armazenar detalhes da sessão, como histórico de conversas, informações de perfil, status de processamento e saídas finais. A arquitetura suporta consultas simples resolvidas por um único nó e interações complexas que exigem coordenação entre vários componentes. O sistema foi projetado para escalar de forma horizontal e permitir a adição de novas capacidades por meio de mais nós de ação e integrações de API. A implantação usa o AWS CDK, que gera um template do CloudFormation para provisionar recursos como funções Lambda, tabelas DynamoDB e configurações de API, além de exibir o URL do endpoint da frontend. O post descreve passos para bootstrap, gerenciamento de chaves com Secrets Manager e criação de um usuário Cognito para acessar a aplicação. O artigo aplica a arquitetura a um cenário de planejamento de viagem com uma persona de viajante de negócios para ilustrar roteamento, precisão de chamadas de função, qualidade das respostas e latência. O roteador direciona perguntas aos nós apropriados (por exemplo, acomodação, clima ou recomendações de produtos) mantendo o contexto ao longo da conversa. O fluxo de ponta a ponta suporta tanto consultas simples quanto orquestração entre vários nós, com recomendações de produtos que apontam para itens ao vivo. Os autores destacam também o processo de implantação e desmontagem do ambiente usando CloudFormation, apontando para o repositório GitHub para detalhes da implementação. Este trabalho demonstra uma aplicação prática de Amazon Nova e LangGraph para resolver desafios reais de negócios. A conclusão é que o Nova Lite pode gerenciar orquestração de tarefas e geração de conteúdo simples, enquanto o Nova Pro lida com tarefas mais complexas e instruções avançadas. O framework mostra potencial para expansão com abordagens de orquestração mais dinâmicas, como o ReAct, conforme observado pelos autores. Para desenvolvedores e equipes de empresa, o post oferece passos concretos para reproduzir a solução e referências a recursos da AWS para entender melhor agentes alimentados por LLM.
O que há de novo
- A assistente de planejamento de viagem implementa uma arquitetura de três camadas baseada em serverless com AWS Lambda, containers Docker e implantação via AWS CDK, provisionando funções Lambda, tabelas DynamoDB e configurações de API.
- Uma camada central de processamento baseada em LangGraph coordena um grafo de nós, com um nó roteador que analisa a consulta do usuário e decide quais 14 nós de ação invocar.
- O roteador usa Nova Lite para análise rápida e geração de conteúdo, enquanto cinco nós complexos dependem de Nova Pro para tarefas avançadas, permitindo planejamento de viagem detalhado e recomendações.
- Tanto Nova Lite quanto Nova Pro suportam janela de contexto de 300.000 tokens e entrada de texto, imagem e vídeo, com suporte a mais de 200 idiomas.
- A solução demonstra recomendações de produtos ao vivo da Amazon.com e mantém o estado da conversa via AgentState para contexto contínuo.
- Os passos de implantação incluem clonar o repositório do GitHub, armazenar chaves de API em Secrets Manager, criar um usuário Cognito para autenticação e implantar o stack com CDK. O post também aponta recursos de Bedrock para uma compreensão mais profunda de agentes.
Por que isso importa (impacto para desenvolvedores/empresas)
- Demonstra um padrão prático e com validade de produção para construir fluxos agentic que equilibram desempenho e custo em planejamento de viagens dinâmico.
- A arquitetura permite expansão modular adicionando mais nós de ação e integrações, permitindo adaptar o agente a fontes de dados e ferramentas de reserva.
- O LangGraph oferece uma base escalável para coordenar sequências complexas de ações entre vários LLMs e serviços externos.
- O foco em segurança e prontidão operacional é evidente na gestão de credenciais via Secrets Manager, na implantação com CDK e na autenticação de usuários via Cognito, alinhando-se a práticas comuns de empresas.
- A integração de links de produtos ao vivo destaca como agentes de IA podem apresentar jornadas de compra, indo além de apenas fornecer informações.
- A documentação posiciona Nova e LangGraph como uma combinação prática para empresas que buscam agentes de IA custo-efetivos com acesso a dados em tempo real e integração de sistemas.
Detalhes técnicos ou Implementação
A solução adota uma arquitetura de três camadas:
- Frontend: interface para o usuário que comunica com a API de backend.
- Processamento central: LangGraph coordena um grafo em que o nó roteador decide quais nós de ação invocar com base na descrição da consulta.
- Serviços de integração: adaptadores e APIs conectando-se a fontes de dados, serviços e ferramentas externas (como serviços de clima ou catálogos de produtos). Componentes e capacidades-chave:
- Modelos Amazon Nova: Nova Lite para roteamento e tarefas simples; Nova Pro para tarefas complexas e multi-etapas.
- Gerenciamento de contexto e estado: AgentState (TypedDict) armazena histórico, dados de perfil, status de processamento e saídas.
- Gestão de dados e segredos: Secrets Manager para chaves; DynamoDB para perfis; Cognito para autenticação de usuários; funções Lambda para processamento; DynamoDB armazena perfis e preferências.
- Orquestração: LangGraph coordena a arquitetura de grafo com nós especializados (por exemplo, acomodações, consultas de clima, buscas de produtos).
- Fontes de dados e saídas: a camada de integração unifica várias fontes de dados e serviços; recomendações de produtos são links vivos para itens na Amazon.com, com opções de verificar ou adicionar ao carrinho.
- Implantação e escalabilidade: projetada para escalar horizontalmente; novas capacidades podem ser adicionadas introduzindo mais nós de ação e integrações. A implantação usa CDK para gerar um template CloudFormation e exibir o URL do endpoint da frontend.
- Requisitos e passos de implantação: clonar o repositório do GitHub, configurar chaves de API e Secrets Manager, criar um arquivo .env, bootstrap do CDK (se é a primeira vez) e implantar com o script fornecido, localizar o stack no CloudFormation para ver as saídas e desmontar quando terminar.
- Desempenho prático: o fluxo de mensagens foi testado com uma persona de viajante de negócios, validando roteamento, precisão e latência. O roteador mantém o contexto para que detalhes anteriores influenciem recomendações futuras (por exemplo, um destino discutido influencia clima e itens de bagagem).
Tabela de componentes-chave
| Componente | Descrição |
|---|---|
| Nó roteador | Usa Nova Lite para analisar consultas e decidir quais nós de ação chamar |
| Nós de ação | Cinco nós complexos alimentados por Nova Pro para tarefas multi-etapas |
| Armazenamento de dados | DynamoDB para perfis; Secrets Manager para chaves; Cognito para credenciais de usuário |
| Modelos e entradas | Nova Lite para roteamento; Nova Pro para tarefas complexas; 300k tokens; suporte a texto, imagem e vídeo; 200+ idiomas |
| O post enfatiza benefícios práticos, incluindo roteamento eficiente, preservação de contexto e integração de dados em tempo real com dados de produtos para uma experiência de compra contínua. A extensibilidade também é destacada, permitindo a adição de novas APIs e fontes de dados conforme necessário. Para entender melhor agentes alimentados por LLM, o artigo aponta recursos da AWS Bedrock e o repositório de exemplos do Bedrock Agents no GitHub. |
Principais conclusões
- Fluxos agentic com modelos Nova mistos ajudam a equilibrar desempenho e custo para planejamento de viagem em produção.
- LangGraph oferece uma base estável para coordenar várias operações entre diferentes modelos e serviços.
- Dados em tempo real e recomendações de produtos permitem jornadas de usuário completas, da pergunta à compra.
- A solução é escalável horizontalmente e pode ser estendida com novas capacidades e fontes de dados.
- Práticas de implantação (CDK, Secrets Manager, Cognito) estão alinhadas com padrões corporativos.
FAQ
- Q: Quais modelos são usados no roteador e quais são usados para tarefas complexas? A: O roteador usa Nova Lite para roteamento; cinco nós complexos usam Nova Pro para operações avançadas e multi-etapas.
- Q: Como o contexto do usuário é preservado ao longo da conversa? A: A arquitetura utiliza AgentState para armazenar histórico, perfil e status de processamento entre os nós.
- Q: Como a implantação é gerenciada e reproduzível? A: A implantação é via AWS CDK, que gera um template CloudFormation e o URL do endpoint; os requisitos incluem Secrets Manager para chaves e Cognito para autenticação.
- Q: A arquitetura pode se integrar a APIs externas além das incluídas? A: Sim, a camada de integração é extensível para incorporar APIs próprias e fontes de dados adicionais.
- Q: Onde encontrar orientação adicional sobre agentes alimentados por LLMs da AWS? A: O post faz referência à documentação de Bedrock Agents da AWS e ao repositório GitHub AWS Bedrock Agent Samples para guias de aplicação de vários agentes com Bedrock.
Referências
- Post do blog da AWS: Create a travel planning agentic workflow with Amazon Nova https://aws.amazon.com/blogs/machine-learning/create-a-travel-planning-agentic-workflow-with-amazon-nova
More news
Levar agentes de IA do conceito à produção com Amazon Bedrock AgentCore
Análise detalhada de como o Amazon Bedrock AgentCore ajuda a transformar aplicações de IA baseadas em agentes de conceito em sistemas de produção de nível empresarial, mantendo memória, segurança, observabilidade e gerenciamento de ferramentas escalável.
Monitorar Bedrock batch inference da Amazon usando métricas do CloudWatch
Saiba como monitorar e otimizar trabalhos de bedrock batch inference com métricas do CloudWatch, alarmes e painéis para melhorar desempenho, custo e governança.
Prompting para precisão com Stability AI Image Services no Amazon Bedrock
O Bedrock now oferece Stability AI Image Services com nove ferramentas para criar e editar imagens com maior precisão. Veja técnicas de prompting para uso empresarial.
Aumente a produção visual com Stability AI Image Services no Amazon Bedrock
Stability AI Image Services já estão disponíveis no Amazon Bedrock, oferecendo capacidades de edição de mídia prontas para uso via Bedrock API, ampliando os modelos Stable Diffusion 3.5 e Stable Image Core/Ultra já existentes no Bedrock.
Use AWS Deep Learning Containers com o SageMaker AI gerenciado MLflow
Explore como os AWS Deep Learning Containers (DLCs) se integram ao SageMaker AI gerenciado pelo MLflow para equilibrar controle de infraestrutura e governança robusta de ML. Um fluxo de trabalho de predição de idade de ostra com TensorFlow demonstra rastreamento de ponta a ponta, governança de model
Construir Fluxos de Trabalho Agenticos com GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore
Visão geral de ponta a ponta para implantar modelos GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore, alimentando um analisador de ações com múltiplos agentes usando LangGraph, incluindo quantização MXFP4 de 4 bits e orquestração serverless.