Oldcastle acelera el procesamiento de documentos con Amazon Bedrock y Textract

TL;DR

Oldcastle APG procesa entre 100,000 y 300,000 tickets de envío al mes en más de 200 instalaciones, una tarea previamente obstaculizada por un OCR poco fiable. AWS ML Blog
La empresa pasó a un flujo de trabajo de extremo a extremo impulsado por eventos, usando Amazon SES, Notificaciones de Eventos de S3, Textract y Amazon Bedrock para automatizar el procesamiento de documentos POD. AWS ML Blog
Bedrock, junto con Textract, proporcionó procesamiento por lotes rentable y extracción coherente de campos en formatos de documentos similares, reduciendo la intervención manual. AWS ML Blog
Oldcastle contempla expandirse a facturas de cuentas por pagar, validación de W-9 y flujos de aprobación de documentos automatizados, mostrando un camino escalable para el procesamiento de documentos con IA. AWS ML Blog

Contexto y antecedentes

Oldcastle APG, una de las redes globales más grandes en la industria de productos arquitectónicos, enfrentaba un proceso de manejo de documentos de comprobante de entrega (POD), conocidos como tickets de envío, que era laborioso y propenso a errores. El sistema OCR existente era poco confiable y requería mantenimiento constante y intervención manual. El resultado era baja precisión, alto consumo de recursos y retrasos en más de 200 instalaciones. El desafío era automatizar el procesamiento de POD y también implementar una solución para procesar facturas de proveedores y conciliarlas con órdenes de compra, dadas las variaciones en los formatos de los documentos. AWS ML Blog La operación dependía de operarios en campo dedicados al manejo manual, con 4–5 horas diarias gastadas en el procesamiento de tickets. El equipo de TI soportaba mantenimiento continuo y desarrollo para mantener el OCR funcionando. Solution Architects de AWS trabajaron con ingenieros de Oldcastle para diseñar una solución escalable que automatizara el flujo de procesamiento de documentos de extremo a extremo. AWS ML Blog El enfoque de Oldcastle se centra en una arquitectura orientada a eventos que comienza con Amazon Simple Email Service (Amazon SES) recibiendo tickets de envío enviados directamente por los conductores. El flujo utiliza Notificaciones de Eventos de S3 para procesar documentos a escala y enrutarlos a un orquestador de trabajos con autoescalado. La arquitectura resalta cómo Amazon Textract maneja archivos PDF grandes, produciendo salidas con las geometrías necesarias para rotar y corregir el diseño antes de generar Markdown. Una Markdown de calidad es esencial para que Amazon Bedrock identifique los pares clave-valor correctos. AWS ML Blog

Novedades

La integración combina varios servicios de AWS para automatizar el procesamiento POD y la conciliación de facturas con pedidos, con énfasis en la eficiencia de costos y escalabilidad:

Ingesta por correo electrónico con Amazon SES para tickets de envío
Procesamiento orientado a eventos con Notificaciones de Eventos de S3
Orquestador de trabajos con autoescalado
Extracción de documentos con Textract, incluyendo gestión de PDFs grandes y generación de Markdown con geometrías para corregir el layout
Formateo de datos y carga en Bedrock, enfocándose en extraer solo los datos necesarios para limitar tokens de salida
Bedrock elegido por su costo-efectividad y por la capacidad de procesar formatos donde los campos a extraer son los mismos
Una vía para ampliar a facturas AP, validación de W-9 y flujos de aprobación automáticos Estos pasos muestran un enfoque práctico y escalable que puede adaptarse a otros desafíos de procesamiento de documentos y optimización de procesos empresariales con IA. AWS ML Blog

Por qué importa (impacto para desarrolladores/empresas)

Este caso demuestra cómo una operación grande y distribuida puede modernizar sus flujos de trabajo de documentos con una pipeline de IA de extremo a extremo. Puntos clave:

Una arquitectura orientada a eventos de extremo a extremo puede escalar para manejar cientos de miles de documentos al mes reduciendo la intervención manual. AWS ML Blog
Aprovechar Textract junto con Bedrock permite explotar las fortalezas de una herramienta OCR/extracción de estructuras y una plataforma de modelos de lenguaje para extraer campos consistentes en formatos similares. AWS ML Blog
El diseño centrado en costos hace viable el procesamiento de documentos con IA a gran escala mediante la limitación de tokens de salida y el procesamiento por lotes de Bedrock. AWS ML Blog
La solución abre oportunidades para ampliar a otros casos de uso, como procesamiento de facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. AWS ML Blog

Detalles técnicos o Implementación

La arquitectura se centra en una canalización robusta, escalable y segura:

Ingreso: los tickets de envío llegan a través de Amazon SES y se entregan al sistema desde los conductores en el campo. AWS ML Blog
Ingesta y enrutamiento: los documentos se procesan mediante una arquitectura orientada a eventos con Notificaciones de Eventos de S3, lo que permite procesamiento a escala a medida que llegan nuevos tickets. AWS ML Blog
Orquestación: un orquestador de tareas con autoescalado gestiona las tareas de procesamiento. AWS ML Blog
Extracción y manejo de layout: Textract procesa PDFs grandes y genera salidas con geometrías para corregir el layout antes de generar Markdown. Markdown de calidad facilita la extracción de pares clave-valor por Bedrock. AWS ML Blog
Modelado de datos y control de costos: los datos extraídos se formatean para Bedrock, limitando los tokens de salida y usando procesamiento por lotes para reducir costes. AWS ML Blog
Elección de plataforma: Bedrock se seleccionó por su costo-efectividad y por la capacidad de procesar formatos donde los campos a extraer son los mismos. AWS ML Blog La implementación sirve como modelo para escenarios similares, como el procesamiento de facturas de proveedores y su conciliación con pedidos, mostrando un camino reproducible para flujos de documentos con IA. La publicación original describe estas decisiones y resultados. AWS ML Blog

Conclusiones (takeaways)

El procesamiento de documentos mediante IA puede reemplazar OCR frágil por una solución escalable de extremo a extremo, desde la recepción por correo hasta la extracción guiada por IA. AWS ML Blog
Una arquitectura orientada a eventos puede gestionar grandes volúmenes de documentos en múltiples instalaciones con menor intervención manual. AWS ML Blog
Textract y Bedrock trabajan juntos para extraer y estructurar datos de forma eficiente, con decisiones de diseño centradas en costos. AWS ML Blog
La solución abre oportunidades para ampliar a casos como facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. AWS ML Blog

FAQ

¿Qué problema enfrentó Oldcastle?

Un flujo de procesamiento de POD ineficiente y laborioso, con un OCR poco confiable que requería mantenimiento constante. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
¿Cómo funciona la solución a alto nivel?

Ingesta por correo con SES, procesamiento orientado a eventos con Notificaciones de S3, un orquestador escalable, Textract para extracción y Bedrock para procesamiento de datos en campos estandarizados. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
¿Cómo se gestionan los costos?

Limitando los tokens de salida y usando procesamiento por lotes de Bedrock para reducir costos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
¿Qué usos futuros se contemplan?

Expansión hacia procesamiento de facturas AP, validación de W-9 y flujos automáticos de aprobación de documentos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)