Skip to content
Capa de acceso multimodal unificada para Poe de Quora usando Amazon Bedrock
Source: aws.amazon.com

Capa de acceso multimodal unificada para Poe de Quora usando Amazon Bedrock

Sources: https://aws.amazon.com/blogs/machine-learning/unified-multimodal-access-layer-for-quoras-poe-using-amazon-bedrock, https://aws.amazon.com/blogs/machine-learning/unified-multimodal-access-layer-for-quoras-poe-using-amazon-bedrock/, AWS ML Blog

TL;DR

  • Una API wrapper unificada habilita un enfoque build-one, deploy-many para modelos Bedrock en Poe.
  • La arquitectura traduce el protocolo Server-Sent Events (SSE) de Poe a REST de Bedrock, con uso híbrido de la Converse API introducida por Bedrock en mayo de 2024.
  • Un sistema de configuración basado en plantillas reduce enormemente el tiempo de despliegue a unos 15 minutos y permite integrar más de 30 modelos Bedrock en texto, imagen y video.
  • La solución reduce cambios de código hasta en un 95% y soporta producción de alto volumen con manejo robusto de errores, conteo de tokens y autenticación segura de AWS.

Contexto y antecedentes

Las organizaciones dependen cada vez más de arquitecturas Generative AI Gateway para acceder a múltiples FMs a través de una única API normalizada. Construir y mantener integraciones separadas para cada modelo implica un gran esfuerzo de ingeniería, desafíos de mantenimiento y fricción para incorporar nuevos modelos. El AWS Generative AI Innovation Center y Quora colaboraron para crear una API wrapper unificada que estandariza el acceso a los Bedrock FMs de Poe. Poe es el sistema de IA multimodal de Quora, que permite a los usuarios interactuar con una biblioteca de modelos de IA y asistentes de varios proveedores. La integración requirió armonizar la arquitectura basada en SSE de Poe con Bedrock REST, patrones de uso del AWS SDK, autenticación SigV4, disponibilidad de modelos por región y opciones de streaming. El esfuerzo destacó la necesidad de mantenimiento y onboarding rápidos cuando nuevos modelos Bedrock están disponibles. En mayo de 2024, Bedrock introdujo la Converse API, que ofrece beneficios de estandarización que simplificaron la arquitectura de la integración. La solución descrita aquí usa la Converse API cuando corresponde, manteniendo la compatibilidad con las API específicas de cada modelo para capacidades especializadas. Este enfoque híbrido ofrece flexibilidad y estandarización en una sola integración.

Qué hay de nuevo

El avance principal es una API wrapper modular que se ubica entre Poe y Bedrock, proporcionando una interfaz unificada y una capa de traducción que normaliza diferencias entre modelos y protocolos mientras se conservan las capacidades de cada modelo. Componentes clave:

  • Bot Factory: crea dinámicamente el manejador de modelo según el tipo de modelo solicitado (texto, imagen o video).
  • Service Manager: orquesta los servicios especializados necesarios para procesar la solicitud, incluyendo servicios de tokens, streaming y manejo de errores.
  • Capa de traducción: conecta SSE de Poe con endpoints REST de Bedrock, gestionando diferencias sutiles entre modelos para asegurar el formato esperado por Poe.
  • ErrorService: manejo de errores consistente entre modelos.
  • AwsClientService: gestión segura de autenticación y conexiones a Bedrock.
  • Configuración basada en plantillas: sistema central de configuración con valores predeterminados compartidos y anulación específica del modelo, facilitando onboarding rápido.
  • Conteo y optimización de tokens: permite estimaciones de costo precisas y uso eficiente de modelos.
  • Pool de conexiones con aiobotocore: soporta alto volumen de solicitudes manteniendo un pool de conexiones Bedrock.
  • Uso de Converse API: cuando procede, para estandarización, manteniendo capacidades de los modelos. La capacidad de despliegue “construir una vez, desplegar varios modelos” permitió que Poe ampliara su catálogo de modelos Bedrock, con más de 30 modelos integrados en texto, imagen y video, en pocas semanas en lugar de meses. La arquitectura modular facilita la expansión futura.

Por qué importa (impacto para desarrolladores/empresas)

  • Despliegue multi-modelo más rápido: la configuración por plantillas y la capa de traducción reducen el tiempo de onboarding y el esfuerzo de ingeniería.
  • Diversidad de modelos: Poe puede ampliar rápidamente su catálogo Bedrock sin reescribir integraciones para cada modelo.
  • Control operativo y fiabilidad: manejo consistente de errores, conteo de tokens y autenticación segura garantizan un comportamiento predecible.
  • Mantenimiento simplificado: una única capa de abstracción reduce la carga ante cambios en APIs.
  • Preparación para producción: la arquitectura está diseñada para manejar cargas elevadas con estrategias de escalabilidad.

Detalles técnicos o Implementación

El mayor desafío fue enlazar el modelo SSE de Poe con la API REST de Bedrock. El equipo implementó una capa de traducción de protocolo robusta que normaliza las respuestas y mantiene el formato esperado por Poe. Componentes y prácticas clave:

  • BotConfig y configuración por plantillas: la clase BotConfig ofrece definiciones estructuradas con validación de tipos para configurar bots de forma coherente.
  • Manejo de errores: ErrorService garantiza mensajes de error claros y consistentes.
  • Conteo de tokens: facilita estimaciones de costo y uso eficiente de modelos.
  • AwsClientService para autenticación: gestiona la autenticación segura con los servicios de AWS.
  • Enfoque híbrido: uso de Converse API para estandarización, manteniendo compatibilidad con APIs específicas de modelos.
  • Soporte multi-modal: demuestra capacidades en texto, imagen y video con varios modelos Bedrock.
  • Preparación para producción: pool de conexiones Bedrock gestionado por aiobotocore para alto rendimiento. Un impacto destacado es una mejora en la eficiencia de despliegue: la incorporación de más de 30 modelos Bedrock en varias modalidades se logró en semanas en lugar de meses. La arquitectura unificada y la capa de traducción aceleran los ciclos de innovación manteniendo control operativo.

Contexto de despliegue y catálogo de modelos

El Catálogo Bedrock funciona como un hub central para descubrir y evaluar modelos de múltiples proveedores. En Poe, la integración permite una experiencia de catálogo escalable donde los modelos se presentan como chatbots individuales en la interfaz, permitiendo a los usuarios interactuar con múltiples proveedores a través de una única plataforma.

Métricas y comparación en formato de tabla

| Métrica | Antes de la integración | Después de la integración |---|---|---| | Tiempo de despliegue para incorporar modelos Bedrock | meses | ~15 minutos |Número de modelos Bedrock integrados | no escalable | >30 en texto, imagen y video |Cambios en el código por onboarding | significativos | reducción de hasta 95% |Estrategia de concurrencia | conexiones manuales separadas | pool de conexiones Bedrock con aiobotocore |

Conclusiones clave

  • Una capa de abstracción bien diseñada simplifica fuertemente el despliegue multi-modelo al normalizar protocolos e interfaces.
  • La configuración basada en plantillas acelera el onboarding y reduce el riesgo de divergencias entre modelos.
  • Enfoques híbridos con APIs estandarizadas (Converse) y APIs específicas permiten coherencia y capacidades.
  • Prácticas operativas sólidas (manejo de errores, contabilización de tokens y autenticación segura) son cruciales para sistemas de IA multi-modelos en producción.
  • Las arquitecturas modulares permiten expandir rápidamente el catálogo de modelos manteniendo un comportamiento predecible.

FAQ

  • ¿Qué problema resuelve la API wrapper?

    Proporciona una interfaz unificada para Poe que normaliza diferencias entre SSE de Poe y REST de Bedrock, reduciendo la complejidad de integración y la carga de mantenimiento.

  • ¿Cómo se conecta SSE de Poe con REST de Bedrock?

    través de una capa de traducción de protocolo que garantiza que las respuestas sigan el formato esperado por Poe, usando Bedrock REST y, cuando corresponde, la Converse API para estandarización.

  • ¿Qué función tiene Converse API en esta integración?

    Ofrece beneficios de estandarización que la wrapper utiliza cuando aplica, manteniendo compatibilidad con APIs específicas de cada modelo para capacidades especializadas.

  • ¿Cuántos modelos Bedrock se integraron y en qué modalidades?

    Más de 30 modelos Bedrock integrados en texto, imagen y video.

Referencias

More news