Oldcastle acelera o processamento de documentos com Amazon Bedrock e Textract

TL;DR

A Oldcastle APG processa de 100.000 a 300.000 tickets de envio por mês em mais de 200 instalações, uma tarefa anteriormente prejudicada por um OCR pouco confiável. AWS ML Blog
A empresa migrou para um fluxo de trabalho de ponta a ponta orientado por eventos, usando Amazon SES, Notificações de Eventos do S3, Textract e Amazon Bedrock para automatizar o processamento de documentos POD. AWS ML Blog
Bedrock, aliado ao Textract, forneceu processamento de lote com custo eficiente e extração consistente de campos em formatos de documentos similares, reduzindo a intervenção manual. AWS ML Blog
A Oldcastle está explorando expansão para faturas de contas a pagar, validação de W-9 e fluxos de aprovação de documentos automatizados, sinalizando um caminho escalável para processamento de documentos com IA. AWS ML Blog

Contexto e antecedentes

A Oldcastle APG, uma das maiores redes globais no setor de produtos arquitetônicos, enfrentava um processo de manuseio de documentos de comprovante de entrega (POD), conhecidos como tickets de envio, que era laborioso e sujeito a erros. O sistema de OCR existente era pouco confiável e exigia manutenção constante e intervenção manual. O resultado era baixa precisão, alto consumo de recursos e atrasos em mais de 200 instalações. O desafio era automatizar o processamento de POD e implementar uma solução para processar faturas de fornecedores e conciliá-las com pedidos de compra, dada a variabilidade dos formatos dos documentos. AWS ML Blog A operação da empresa dependia de trabalhadores em campo dedicados à manipulação manual, com 4–5 horas por dia gastas no processamento de tickets. A equipe de TI também suportava a manutenção contínua e o desenvolvimento para manter o OCR funcionando. Os Solutions Architects da AWS colaboraram com engenheiros da Oldcastle para projetar uma solução escalável que automatizasse o fluxo de processamento de documentos de ponta a ponta. AWS ML Blog A abordagem da Oldcastle concentra-se em uma arquitetura orientada a eventos que começa com o Amazon Simple Email Service (Amazon SES) recebendo tickets de envio enviados diretamente pelos motoristas. O fluxo de trabalho utiliza Notificações de Eventos do Amazon S3 para processar documentos em escala e encaminhá-los a um orquestrador de tarefas com escalonamento automático. A arquitetura destaca como o Amazon Textract lida com PDFs grandes, produzindo saídas com geometrias usadas para girar e corrigir o layout antes de converter o conteúdo em Markdown. Qualidade do Markdown é essencial para o Bedrock identificar os pares-chave corretos do conteúdo. AWS ML Blog

O que há de novo

A integração combina vários serviços da AWS para automatizar o processamento de POD e o pareamento de faturas com pedidos, com foco em custo-eficiência e escalabilidade:

Ingestão por e-mail via Amazon SES para tickets de envio
Processamento orientado a eventos com Notificações de Eventos do S3
Orquestrador de tarefas com escalonamento automático
Extração de documentos com Textract, incluindo o manuseio de PDFs grandes e a geração de Markdown com geometrias para correção de layout
Modelagem de dados e formatação para Bedrock, com foco em extrair apenas os dados necessários para limitar tokens de saída
Bedrock utilizado por sua eficiência de custo e pela capacidade de processar formatos onde os campos a serem extraídos são os mesmos
Um caminho para expansão futura para faturas de contas a pagar, validação de W-9 e fluxos de aprovação automatizados Esses passos demonstram uma abordagem prática e escalável que pode ser adaptada para outros desafios de processamento de documentos e para a otimização de processos de negócios com IA. AWS ML Blog

Por que isso importa (impacto para desenvolvedores/empresas)

Este caso demonstra como uma operação grande e distribuída pode modernizar seus fluxos de documentos com uma pipeline de IA de ponta a ponta. Pontos-chave:

Uma arquitetura orientada a eventos de ponta a ponta pode escalar para centenas de milhares de documentos por mês, reduzindo a intervenção manual. AWS ML Blog
Aproveitar Textract junto com Bedrock permite explorar a força de uma ferramenta de OCR/extração de estruturas e de uma plataforma de modelos de linguagem para extrair campos consistentes em formatos semelhantes. AWS ML Blog
O design com foco em custo é viável ao limitar tokens de saída e usar processamento em lote no Bedrock, tornando o processamento de documentos com IA economicamente viável em escala. AWS ML Blog
A solução abre caminhos para adoção mais ampla de IA, incluindo processamento de faturas, validação de W-9 e fluxos automáticos de aprovação de documentos, sinalizando um modelo escalável para fluxos de trabalho empresariais. AWS ML Blog

Detalhes técnicos ou Implementação

A arquitetura concentra-se em um pipeline robusto, escalável e seguro:

Ingestão: Tickets de envio chegam via Amazon SES e são entregues ao sistema pelos motoristas no campo. AWS ML Blog
Ingestão e roteamento: Documentos são disponibilizados por meio de uma arquitetura orientada a eventos com Notificações de Eventos do S3, permitindo processamento escalável conforme surgem novos tickets. AWS ML Blog
Orquestração: Um orquestrador de tarefas com escalonamento automático gerencia as tarefas de processamento. AWS ML Blog
Extração e tratamento de layout: O Textract processa PDFs grandes, gerando saídas com geometrias para girar e corrigir layout antes de gerar Markdown. O Markdown é usado para facilitar a extração de pares-chave pelo Bedrock. AWS ML Blog
Modelagem de dados e controle de custos: Os dados extraídos são moldados para Bedrock, limitando tokens de saída e usando processamento em lote para reduzir custos de token. AWS ML Blog
Escolha da plataforma: Bedrock foi escolhido pela relação custo-benefício e pela capacidade de processar formatos onde os campos a extrair são os mesmos, permitindo uma extração consistente. AWS ML Blog A implementação é apresentável como modelo para cenários semelhantes, como processamento de faturas de fornecedores e correspondência com pedidos, mostrando um caminho reutilizável para fluxos de documentos com IA. A publicação original descreve essas escolhas e resultados. AWS ML Blog

Destaques (takeaways)

Fluxos de processamento de documentos com IA podem substituir OCR frágil por uma solução escalável de ponta a ponta que vai do recebimento por e-mail até a extração de dados orientada por IA. AWS ML Blog
Uma arquitetura orientada a eventos facilita o tratamento de grandes volumes de documentos em centenas de instalações com menos intervenção manual. AWS ML Blog
Textract e Bedrock trabalham em conjunto para extrair e estruturar dados de forma eficiente, com escolhas de design focadas em custos. AWS ML Blog
A solução abre caminho para uso em casos adicionais, como processamento de faturas de contas a pagar, validação de W-9 e fluxos de aprovação de documentos automatizados. AWS ML Blog

FAQ

Qual foi o problema que a Oldcastle enfrentou?

Um fluxo de processamento de POD ineficiente e laborioso, combinado com um OCR pouco confiável que exigia manutenção contínua. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
Como funciona a solução em alto nível?

Ingestão por e-mail com SES, processamento orientado a eventos com Notificações do S3, um orquestrador escalável, Textract para extração e Bedrock para processamento de dados com custo efetivo em campos padronizados. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
Como o custo é gerenciado?

Limitando os tokens de saída com a extração de apenas os dados necessários e usando o processamento em lote do Bedrock para reduzir custos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
uais usos futuros são previstos?

Possível expansão para processamento de faturas de contas a pagar, validação de W-9 e fluxos automáticos de aprovação de documentos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)