Oldcastle acelera el procesamiento de documentos con Amazon Bedrock y Textract
Sources: https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock, https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/, AWS ML Blog
TL;DR
- Oldcastle APG procesa entre 100,000 y 300,000 tickets de envío al mes en más de 200 instalaciones, una tarea previamente obstaculizada por un OCR poco fiable. AWS ML Blog
- La empresa pasó a un flujo de trabajo de extremo a extremo impulsado por eventos, usando Amazon SES, Notificaciones de Eventos de S3, Textract y Amazon Bedrock para automatizar el procesamiento de documentos POD. AWS ML Blog
- Bedrock, junto con Textract, proporcionó procesamiento por lotes rentable y extracción coherente de campos en formatos de documentos similares, reduciendo la intervención manual. AWS ML Blog
- Oldcastle contempla expandirse a facturas de cuentas por pagar, validación de W-9 y flujos de aprobación de documentos automatizados, mostrando un camino escalable para el procesamiento de documentos con IA. AWS ML Blog
Contexto y antecedentes
Oldcastle APG, una de las redes globales más grandes en la industria de productos arquitectónicos, enfrentaba un proceso de manejo de documentos de comprobante de entrega (POD), conocidos como tickets de envío, que era laborioso y propenso a errores. El sistema OCR existente era poco confiable y requería mantenimiento constante y intervención manual. El resultado era baja precisión, alto consumo de recursos y retrasos en más de 200 instalaciones. El desafío era automatizar el procesamiento de POD y también implementar una solución para procesar facturas de proveedores y conciliarlas con órdenes de compra, dadas las variaciones en los formatos de los documentos. AWS ML Blog La operación dependía de operarios en campo dedicados al manejo manual, con 4–5 horas diarias gastadas en el procesamiento de tickets. El equipo de TI soportaba mantenimiento continuo y desarrollo para mantener el OCR funcionando. Solution Architects de AWS trabajaron con ingenieros de Oldcastle para diseñar una solución escalable que automatizara el flujo de procesamiento de documentos de extremo a extremo. AWS ML Blog El enfoque de Oldcastle se centra en una arquitectura orientada a eventos que comienza con Amazon Simple Email Service (Amazon SES) recibiendo tickets de envío enviados directamente por los conductores. El flujo utiliza Notificaciones de Eventos de S3 para procesar documentos a escala y enrutarlos a un orquestador de trabajos con autoescalado. La arquitectura resalta cómo Amazon Textract maneja archivos PDF grandes, produciendo salidas con las geometrías necesarias para rotar y corregir el diseño antes de generar Markdown. Una Markdown de calidad es esencial para que Amazon Bedrock identifique los pares clave-valor correctos. AWS ML Blog
Novedades
La integración combina varios servicios de AWS para automatizar el procesamiento POD y la conciliación de facturas con pedidos, con énfasis en la eficiencia de costos y escalabilidad:
- Ingesta por correo electrónico con Amazon SES para tickets de envío
- Procesamiento orientado a eventos con Notificaciones de Eventos de S3
- Orquestador de trabajos con autoescalado
- Extracción de documentos con Textract, incluyendo gestión de PDFs grandes y generación de Markdown con geometrías para corregir el layout
- Formateo de datos y carga en Bedrock, enfocándose en extraer solo los datos necesarios para limitar tokens de salida
- Bedrock elegido por su costo-efectividad y por la capacidad de procesar formatos donde los campos a extraer son los mismos
- Una vía para ampliar a facturas AP, validación de W-9 y flujos de aprobación automáticos Estos pasos muestran un enfoque práctico y escalable que puede adaptarse a otros desafíos de procesamiento de documentos y optimización de procesos empresariales con IA. AWS ML Blog
Por qué importa (impacto para desarrolladores/empresas)
Este caso demuestra cómo una operación grande y distribuida puede modernizar sus flujos de trabajo de documentos con una pipeline de IA de extremo a extremo. Puntos clave:
- Una arquitectura orientada a eventos de extremo a extremo puede escalar para manejar cientos de miles de documentos al mes reduciendo la intervención manual. AWS ML Blog
- Aprovechar Textract junto con Bedrock permite explotar las fortalezas de una herramienta OCR/extracción de estructuras y una plataforma de modelos de lenguaje para extraer campos consistentes en formatos similares. AWS ML Blog
- El diseño centrado en costos hace viable el procesamiento de documentos con IA a gran escala mediante la limitación de tokens de salida y el procesamiento por lotes de Bedrock. AWS ML Blog
- La solución abre oportunidades para ampliar a otros casos de uso, como procesamiento de facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. AWS ML Blog
Detalles técnicos o Implementación
La arquitectura se centra en una canalización robusta, escalable y segura:
- Ingreso: los tickets de envío llegan a través de Amazon SES y se entregan al sistema desde los conductores en el campo. AWS ML Blog
- Ingesta y enrutamiento: los documentos se procesan mediante una arquitectura orientada a eventos con Notificaciones de Eventos de S3, lo que permite procesamiento a escala a medida que llegan nuevos tickets. AWS ML Blog
- Orquestación: un orquestador de tareas con autoescalado gestiona las tareas de procesamiento. AWS ML Blog
- Extracción y manejo de layout: Textract procesa PDFs grandes y genera salidas con geometrías para corregir el layout antes de generar Markdown. Markdown de calidad facilita la extracción de pares clave-valor por Bedrock. AWS ML Blog
- Modelado de datos y control de costos: los datos extraídos se formatean para Bedrock, limitando los tokens de salida y usando procesamiento por lotes para reducir costes. AWS ML Blog
- Elección de plataforma: Bedrock se seleccionó por su costo-efectividad y por la capacidad de procesar formatos donde los campos a extraer son los mismos. AWS ML Blog La implementación sirve como modelo para escenarios similares, como el procesamiento de facturas de proveedores y su conciliación con pedidos, mostrando un camino reproducible para flujos de documentos con IA. La publicación original describe estas decisiones y resultados. AWS ML Blog
Conclusiones (takeaways)
- El procesamiento de documentos mediante IA puede reemplazar OCR frágil por una solución escalable de extremo a extremo, desde la recepción por correo hasta la extracción guiada por IA. AWS ML Blog
- Una arquitectura orientada a eventos puede gestionar grandes volúmenes de documentos en múltiples instalaciones con menor intervención manual. AWS ML Blog
- Textract y Bedrock trabajan juntos para extraer y estructurar datos de forma eficiente, con decisiones de diseño centradas en costos. AWS ML Blog
- La solución abre oportunidades para ampliar a casos como facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. AWS ML Blog
FAQ
-
¿Qué problema enfrentó Oldcastle?
Un flujo de procesamiento de POD ineficiente y laborioso, con un OCR poco confiable que requería mantenimiento constante. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
¿Cómo funciona la solución a alto nivel?
Ingesta por correo con SES, procesamiento orientado a eventos con Notificaciones de S3, un orquestador escalable, Textract para extracción y Bedrock para procesamiento de datos en campos estandarizados. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
¿Cómo se gestionan los costos?
Limitando los tokens de salida y usando procesamiento por lotes de Bedrock para reducir costos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
¿Qué usos futuros se contemplan?
Expansión hacia procesamiento de facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
Referencias
- AWS ML Blog: Oldcastle acelera el procesamiento de documentos con Amazon Bedrock. https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/
More news
Llevar agentes de IA de concepto a producción con Amazon Bedrock AgentCore
Análisis detallado de cómo Amazon Bedrock AgentCore facilita la transición de aplicaciones de IA basadas en agentes desde un concepto de prueba hasta sistemas de producción empresariales, conservando memoria, seguridad, observabilidad y gestión escalable de herramientas.
Monitorear la inferencia por lotes de Bedrock de AWS con métricas de CloudWatch
Descubra cómo monitorear y optimizar trabajos de inferencia por lotes de Bedrock con métricas, alarmas y paneles de CloudWatch para mejorar rendimiento, costos y operación.
Solicitando precisión con Stability AI Image Services en Amazon Bedrock
Bedrock incorpora Stability AI Image Services con nueve herramientas para crear y editar imágenes con mayor precisión. Descubre técnicas de prompting para uso empresarial.
Escala la producción visual con Stability AI Image Services en Amazon Bedrock
Stability AI Image Services ya está disponible en Amazon Bedrock, ofreciendo capacidades de edición de imágenes listas para usar a través de la API de Bedrock y ampliando los modelos Stable Diffusion 3.5 y Stable Image Core/Ultra ya presentes.
Usar AWS Deep Learning Containers con Amazon SageMaker AI MLflow gestionado
Vea cómo los AWS Deep Learning Containers (DLCs) se integran con SageMaker AI gestionado por MLflow para equilibrar el control de la infraestructura y una gobernanza de ML sólida. Un flujo de TensorFlow para predicción de edad de abalones ilustra el seguimiento de extremo a extremo y la trazabilidad
Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore
Visión general de extremo a extremo para implementar modelos GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore, impulsando un analizador de acciones multiagente con LangGraph, con cuantización MXFP4 de 4 bits y orquestación serverless.