Crea un flujo de trabajo agente para la planificación de viajes con Amazon Nova

Planificar viajes puede ser agradable, pero también complejo de gestionar. Este artículo explora cómo construir una solución de planificación de viajes basada en agentes IA que tiene acceso a herramientas externas, datos en tiempo real y sistemas de reserva. El enfoque se centra en Amazon Nova, que según la publicación ofrece un equilibrio favorable entre rendimiento y costo en comparación con otros LLM comerciales, combinado con LangGraph para la orquestación a fin de crear un asistente práctico y escalable para viajes. La solución está diseñada para ejecutarse en una arquitectura serverless de Lambda de AWS usando contenedores Docker y sigue una estructura de tres capas: interacción de frontend, procesamiento central e servicios de integración. El diseño enfatiza modularidad, extensibilidad y eficiencia de costos, permitiendo flujos de planificación complejos y de múltiples pasos para implementaciones en producción. El artículo destaca la colaboración entre Nova y LangGraph como ejemplo de cómo los flujos agentic pueden manejar tareas dinámicas de planificación manteniendo un control de costos para despliegues de producción. Puedes obtener más información sobre los conceptos subyacentes y el alcance de este enfoque en la publicación original de AWS, que ofrece orientación sobre arquitectura, implementación y consideraciones prácticas.

TL;DR

Construye un asistente de planificación de viajes usando Amazon Nova y LangGraph en una arquitectura serverless con AWS Lambda. Nova Lite gestiona el enrutamiento y nodos simples; Nova Pro maneja tareas complejas. La ventana de contexto es de 300,000 tokens y admite entradas multimodales (texto, imagen y video).
Emplea una arquitectura de tres capas (frontend, procesamiento central e integración) y despliega con AWS CDK, que genera un CloudFormation para aprovisionar funciones Lambda, tablas DynamoDB y configuraciones de API.
La personalización y la integración de productos se demuestran con perfiles DynamoDB de ejemplo y enlaces directos a artículos en Amazon.com, con Cognito para control de acceso y Secrets Manager para claves de API.
La arquitectura es escalable horizontalmente y extensible con nuevos nodos de acción e integraciones API; futuras direcciones incluyen explorar orquestación más dinámica con enfoques como ReAct.
Este artículo ofrece pautas para reproducir la solución desde un repositorio GitHub y confirma resultados prácticos en enrutamiento, calidad de respuestas y latencia en flujos de planificación.

Contexto y antecedentes

Planificar viajes implica coordinar alojamiento, actividades, transporte local y precios de manera coherente y receptiva a las preferencias del usuario. Los profesionales de viajes han ayudado durante mucho tiempo a gestionar estas decisiones, pero los avances en IA generativa han hecho posible algo nuevo: asistentes inteligentes que entienden conversaciones naturales, acceden a datos en tiempo real e interactúan con herramientas de reserva. Los flujos de trabajo agentic—modelos de lenguaje con acceso a herramientas externas—son especialmente prometedores para simplificar procesos dinámicos y de múltiples pasos como la planificación de viajes. Este artículo demuestra cómo construir una solución de planificación de viajes usando Amazon Nova, una nueva generación de modelos de base disponibles exclusivamente en Amazon Bedrock, que ofrece alto rendimiento a un costo eficiente, y LangGraph para orquestación con estado. El núcleo del sistema es una arquitectura en grafo con componentes (nodos) que abordan distintos aspectos de la planificación, y un nodo router que orquesta el flujo de información entre ellos. El router utiliza un LLM para analizar cada consulta y, con acceso a la descripción de los 14 nodos de acción, decide cuáles deben ejecutarse. Los nodos de acción, cada uno con su propia cadena LLM, se ejecutan con Amazon Nova Pro o Amazon Nova Lite, dependiendo de la complejidad de la tarea. Nova Lite se usa para el enrutamiento y nodos más simples, proporcionando procesamiento rápido a bajo costo, mientras que Nova Pro gestiona operaciones complejas y de múltiples pasos para la planificación de viajes detallada. Ambos modelos admiten una ventana de contexto de 300.000 tokens y pueden procesar entradas de texto, imagen y video; el procesamiento de texto está disponible en más de 200 idiomas para atender a una audiencia global. La capa de integración unifica múltiples fuentes y servicios a través de una interfaz definida, y AgentState (TypedDict) administra el estado de la conversación para evitar errores de datos y permitir que las distintas acciones accedan y actualicen información de manera fiable. Desde el punto de vista de la implementación, el asistente de planificación se ejecuta en un entorno serverless con AWS Lambda usando contenedores Docker. La arquitectura sigue tres capas: interacción con el usuario, procesamiento central y servicios de integración. El despliegue se gestiona con AWS CDK, que genera un CloudFormation template para aprovisionar funciones Lambda, tablas DynamoDB y configuraciones API. Tras el despliegue, la consola de CloudFormation muestra las salidas, incluido el URL del endpoint de la API para el frontend. En la demostración, se creó una persona de viajero corporativo para simular un flujo de conversación típico y evaluar el enrutamiento, la precisión de las llamadas a funciones, la calidad de las respuestas y la latencia. La solución también demuestra personalización mediante perfiles de usuario de ejemplo almacenados en DynamoDB, que pueden integrarse con bases de datos de clientes y sistemas de reservas para ofrecer asistencia personalizada. Las recomendaciones de productos se presentan como enlaces en vivo a artículos de Amazon.com para que el usuario explore o añada productos al carrito. Los detalles completos de implementación, incluidos el código de funciones Lambda y los patrones de integración de API, están disponibles en el repositorio de GitHub asociado al artículo.

Novedades

La solución de planificación de viajes introduce un flujo de trabajo agentic práctico y apto para producción, que combina Amazon Nova y LangGraph para gestionar decisiones complejas en tiempo real. Las innovaciones clave incluyen:

Arquitectura serverless en tres capas (frontend, procesamiento central e integración) mediante AWS Lambda y contenedores Docker.
Un modelo de grafo con un nodo router que evalúa la entrada del usuario y dirige las tareas a nodos de acción especializados, cada uno con su propia cadena LLM.
Una mezcla de Nova Lite y Nova Pro: Nova Lite se utiliza para enrutamiento y nodos simples; cinco nodos complejos emplean Nova Pro para tareas avanzadas.
Una ventana de contexto de 300.000 tokens y soporte multimodal (texto, imagen, video), con procesamiento de texto en más de 200 idiomas.
Una capa de integración que unifica diversas fuentes de datos a través de una API común, facilitando la incorporación de APIs propias y fuentes de datos.
Gestión del estado de la conversación mediante AgentState (TypedDict), garantizando coherencia de datos entre nodos.
Un enfoque de implantación con CDK que genera un CloudFormation y expone un endpoint API, con prerequisitos como Secrets Manager para claves API y Cognito para autenticación de usuarios.
Personalización con perfiles de usuario de ejemplo en DynamoDB, y recomendaciones de productos con enlaces directos a Amazon.com.
Escalabilidad horizontal y posibilidades de extender la solución añadiendo nuevos nodos de acción e integraciones API; también se contempla una exploración de orquestación más dinámica con enfoques como ReAct.
Un repositorio GitHub con detalles de implementación para reproducir o ampliar el planificador de viajes.

Por qué importa (impacto para desarrolladores/empresas)

Para desarrolladores y empresas, el flujo de trabajo agentic de planificación de viajes demuestra cómo entregar capacidades de planificación en tiempo real con control de costos, al tiempo que se mantiene la flexibilidad para integrar herramientas externas y datos en tiempo real. Al combinar Nova con LangGraph, las organizaciones pueden construir agentes modulares que coordinan tareas especializadas sin depender de una arquitectura monolítica. La estructura facilita la experimentación rápida y la evolución: se pueden añadir nuevos nodos de acción e integraciones API para satisfacer necesidades empresariales cambiantes. La personalización se fortalece mediante el almacenamiento y uso de perfiles de usuario y del contexto de la conversación, manteniendo la integridad de datos gracias a un modelo de estado sólido. El uso de Cognito para la autenticación de usuarios y Secrets Manager para la gestión de claves de API favorece despliegues en producción seguros y auditables. La capa de integración ofrece flexibilidad para incorporar servicios externos, flujos de datos en tiempo real y sistemas de reservas, proporcionando información actualizada y recorridos de usuario más fluidos. En resumen, este enfoque ilustra cómo las arquitecturas cloud modernas pueden combinar modelos de base avanzados con una orquestación robusta para entregar asistentes IA útiles y rentables en escenarios complejos.

Detalles técnicos o Implementación

La arquitectura sigue un diseño serverless de tres capas:

Capa de interacción frontend: maneja las conversaciones y presenta resultados.
Capa de procesamiento central: utiliza LangGraph para implementar un grafo de agente con un nodo router y múltiples nodos de acción. El nodo router evalúa la entrada del usuario y decide qué nodos de acción deben ejecutarse, guiado por las descripciones de los 14 nodos.
Capa de integración: unifica diversas fuentes de datos y servicios mediante una interfaz definida, permitiendo el acceso a datos de clima, catálogos de productos, reservas y otros datos. Características clave del modelo y datos:
Nova Lite alimenta el router y nodos simples, proporcionando procesamiento rápido a menor costo para tareas de enrutamiento y generación de contenido simple.
Cinco nodos complejos utilizan Nova Pro para tareas que requieren seguimiento de instrucciones avanzadas y operaciones multi-etapas.
Ambos modelos soportan una ventana de contexto de 300.000 tokens y pueden procesar entradas multimodales (texto, imagen y video).
El procesamiento de texto está disponible en más de 200 idiomas, aumentando el alcance global.
La capa de integración está diseñada para ser extensible, permitiendo incorporar APIs externas y fuentes de datos según sea necesario.
El estado de la conversación se gestiona mediante AgentState (TypedDict), asegurando consistencia de datos entre nodos.
La arquitectura soporta escalabilidad horizontal y facilita la adición de nuevos nodos de acción y fuentes de datos. Pasos de implementación y recursos:
El despliegue se realiza con AWS CDK, que genera un CloudFormation para aprovisionar funciones Lambda, tablas DynamoDB y configuraciones de API.
Una vez desplegado, la consola de CloudFormation muestra las salidas, incluido el URL del endpoint de API para el frontend.
Los prerequisitos incluyen clonar el repositorio de la solución, crear claves API para servicios externos y almacenarlas de forma segura en Secrets Manager. Un archivo .env en la raíz del proyecto contiene configuraciones locales y un paso de bootstrap prepara el entorno CDK para la implementación inicial.
Los perfiles de usuario en DynamoDB incluyen viajes próximos y preferencias; en producción, estos perfiles pueden integrarse con bases de datos de clientes y sistemas de reservas para ofrecer una asistencia personalizada.
Las recomendaciones de productos se presentan como enlaces en vivo a artículos en Amazon.com, permitiendo a los usuarios explorar o añadir artículos al carrito.
Los detalles completos de implementación, incluido el código de funciones Lambda y patrones de integración de API, están disponibles en el repositorio GitHub asociado al post.

Resumen de modelos (visión rápida)

| Modelo | Uso principal | Ventana de contexto |

Entradas multimodales
---
---
---
Amazon Nova Lite
Texto, imagen, video
Amazon Nova Pro
Texto, imagen, video

Observaciones adicionales

El nodo router utiliza un LLM para determinar qué nodos de acción deben ejecutarse, basándose en las descripciones de los nodos.
Cada nodo de acción ejecuta su propia cadena LLM para funciones especializadas (investigación web, consultas de clima, gestión de carrito, etc.).
La capa de integración proporciona una interfaz unificada para diversas fuentes de datos, facilitando la extensión con nuevas API.
Una dirección futura mencionada es explorar una orquestación más dinámica con enfoques como ReAct, reflejando la experimentación continua en flujos agentic.

Conclusiones clave

Amazon Nova, combinado con LangGraph, facilita flujos de planificación de viajes agenticos prácticos y escalables.
Nova Lite maneja enrutamiento y tareas simples de forma rápida; Nova Pro maneja tareas complejas y multi-etapas.
Una arquitectura en tres capas basada en serverless ofrece modularidad, control de costos y escalabilidad horizontal.
La personalización se demuestra mediante perfiles de usuario y recomendaciones de productos vinculadas a Amazon.com.
El despliegue con CDK y prácticas de seguridad con Secrets Manager y Cognito proporcionan una base sólida para producción.
El enfoque es extensible para añadir más fuentes de datos e integraciones API, permitiendo la evolución continua de los flujos de planificación con IA.

Preguntas frecuentes (FAQ)

P: ¿Qué es un flujo de trabajo agentico en este contexto de planificación de viajes? R: Es un flujo en el que un nodo router basado en un LLM interpreta la entrada del usuario y dirige las tareas hacia nodos de acción especializados que pueden consultar herramientas externas y datos en tiempo real.
P: ¿Cómo se utilizan Nova Lite y Nova Pro en la solución? R: Nova Lite maneja el enrutamiento y nodos simples para un procesamiento rápido y de bajo costo; Nova Pro se encarga de tareas complejas y operaciones multi-etapas en los nodos correspondientes.
P: ¿Cómo se maneja la implantación y la seguridad? R: La implantación se realiza con AWS CDK para generar un CloudFormation; Secrets Manager almacena de forma segura las claves API y Cognito gestiona la autenticación de usuarios.