Oldcastle acelera o processamento de documentos com Amazon Bedrock e Textract
Sources: https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock, https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/, AWS ML Blog
TL;DR
- A Oldcastle APG processa de 100.000 a 300.000 tickets de envio por mês em mais de 200 instalações, uma tarefa anteriormente prejudicada por um OCR pouco confiável. AWS ML Blog
- A empresa migrou para um fluxo de trabalho de ponta a ponta orientado por eventos, usando Amazon SES, Notificações de Eventos do S3, Textract e Amazon Bedrock para automatizar o processamento de documentos POD. AWS ML Blog
- Bedrock, aliado ao Textract, forneceu processamento de lote com custo eficiente e extração consistente de campos em formatos de documentos similares, reduzindo a intervenção manual. AWS ML Blog
- A Oldcastle está explorando expansão para faturas de contas a pagar, validação de W-9 e fluxos de aprovação de documentos automatizados, sinalizando um caminho escalável para processamento de documentos com IA. AWS ML Blog
Contexto e antecedentes
A Oldcastle APG, uma das maiores redes globais no setor de produtos arquitetônicos, enfrentava um processo de manuseio de documentos de comprovante de entrega (POD), conhecidos como tickets de envio, que era laborioso e sujeito a erros. O sistema de OCR existente era pouco confiável e exigia manutenção constante e intervenção manual. O resultado era baixa precisão, alto consumo de recursos e atrasos em mais de 200 instalações. O desafio era automatizar o processamento de POD e implementar uma solução para processar faturas de fornecedores e conciliá-las com pedidos de compra, dada a variabilidade dos formatos dos documentos. AWS ML Blog A operação da empresa dependia de trabalhadores em campo dedicados à manipulação manual, com 4–5 horas por dia gastas no processamento de tickets. A equipe de TI também suportava a manutenção contínua e o desenvolvimento para manter o OCR funcionando. Os Solutions Architects da AWS colaboraram com engenheiros da Oldcastle para projetar uma solução escalável que automatizasse o fluxo de processamento de documentos de ponta a ponta. AWS ML Blog A abordagem da Oldcastle concentra-se em uma arquitetura orientada a eventos que começa com o Amazon Simple Email Service (Amazon SES) recebendo tickets de envio enviados diretamente pelos motoristas. O fluxo de trabalho utiliza Notificações de Eventos do Amazon S3 para processar documentos em escala e encaminhá-los a um orquestrador de tarefas com escalonamento automático. A arquitetura destaca como o Amazon Textract lida com PDFs grandes, produzindo saídas com geometrias usadas para girar e corrigir o layout antes de converter o conteúdo em Markdown. Qualidade do Markdown é essencial para o Bedrock identificar os pares-chave corretos do conteúdo. AWS ML Blog
O que há de novo
A integração combina vários serviços da AWS para automatizar o processamento de POD e o pareamento de faturas com pedidos, com foco em custo-eficiência e escalabilidade:
- Ingestão por e-mail via Amazon SES para tickets de envio
- Processamento orientado a eventos com Notificações de Eventos do S3
- Orquestrador de tarefas com escalonamento automático
- Extração de documentos com Textract, incluindo o manuseio de PDFs grandes e a geração de Markdown com geometrias para correção de layout
- Modelagem de dados e formatação para Bedrock, com foco em extrair apenas os dados necessários para limitar tokens de saída
- Bedrock utilizado por sua eficiência de custo e pela capacidade de processar formatos onde os campos a serem extraídos são os mesmos
- Um caminho para expansão futura para faturas de contas a pagar, validação de W-9 e fluxos de aprovação automatizados Esses passos demonstram uma abordagem prática e escalável que pode ser adaptada para outros desafios de processamento de documentos e para a otimização de processos de negócios com IA. AWS ML Blog
Por que isso importa (impacto para desenvolvedores/empresas)
Este caso demonstra como uma operação grande e distribuída pode modernizar seus fluxos de documentos com uma pipeline de IA de ponta a ponta. Pontos-chave:
- Uma arquitetura orientada a eventos de ponta a ponta pode escalar para centenas de milhares de documentos por mês, reduzindo a intervenção manual. AWS ML Blog
- Aproveitar Textract junto com Bedrock permite explorar a força de uma ferramenta de OCR/extração de estruturas e de uma plataforma de modelos de linguagem para extrair campos consistentes em formatos semelhantes. AWS ML Blog
- O design com foco em custo é viável ao limitar tokens de saída e usar processamento em lote no Bedrock, tornando o processamento de documentos com IA economicamente viável em escala. AWS ML Blog
- A solução abre caminhos para adoção mais ampla de IA, incluindo processamento de faturas, validação de W-9 e fluxos automáticos de aprovação de documentos, sinalizando um modelo escalável para fluxos de trabalho empresariais. AWS ML Blog
Detalhes técnicos ou Implementação
A arquitetura concentra-se em um pipeline robusto, escalável e seguro:
- Ingestão: Tickets de envio chegam via Amazon SES e são entregues ao sistema pelos motoristas no campo. AWS ML Blog
- Ingestão e roteamento: Documentos são disponibilizados por meio de uma arquitetura orientada a eventos com Notificações de Eventos do S3, permitindo processamento escalável conforme surgem novos tickets. AWS ML Blog
- Orquestração: Um orquestrador de tarefas com escalonamento automático gerencia as tarefas de processamento. AWS ML Blog
- Extração e tratamento de layout: O Textract processa PDFs grandes, gerando saídas com geometrias para girar e corrigir layout antes de gerar Markdown. O Markdown é usado para facilitar a extração de pares-chave pelo Bedrock. AWS ML Blog
- Modelagem de dados e controle de custos: Os dados extraídos são moldados para Bedrock, limitando tokens de saída e usando processamento em lote para reduzir custos de token. AWS ML Blog
- Escolha da plataforma: Bedrock foi escolhido pela relação custo-benefício e pela capacidade de processar formatos onde os campos a extrair são os mesmos, permitindo uma extração consistente. AWS ML Blog A implementação é apresentável como modelo para cenários semelhantes, como processamento de faturas de fornecedores e correspondência com pedidos, mostrando um caminho reutilizável para fluxos de documentos com IA. A publicação original descreve essas escolhas e resultados. AWS ML Blog
Destaques (takeaways)
- Fluxos de processamento de documentos com IA podem substituir OCR frágil por uma solução escalável de ponta a ponta que vai do recebimento por e-mail até a extração de dados orientada por IA. AWS ML Blog
- Uma arquitetura orientada a eventos facilita o tratamento de grandes volumes de documentos em centenas de instalações com menos intervenção manual. AWS ML Blog
- Textract e Bedrock trabalham em conjunto para extrair e estruturar dados de forma eficiente, com escolhas de design focadas em custos. AWS ML Blog
- A solução abre caminho para uso em casos adicionais, como processamento de faturas de contas a pagar, validação de W-9 e fluxos de aprovação de documentos automatizados. AWS ML Blog
FAQ
-
Qual foi o problema que a Oldcastle enfrentou?
Um fluxo de processamento de POD ineficiente e laborioso, combinado com um OCR pouco confiável que exigia manutenção contínua. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
Como funciona a solução em alto nível?
Ingestão por e-mail com SES, processamento orientado a eventos com Notificações do S3, um orquestrador escalável, Textract para extração e Bedrock para processamento de dados com custo efetivo em campos padronizados. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
Como o custo é gerenciado?
Limitando os tokens de saída com a extração de apenas os dados necessários e usando o processamento em lote do Bedrock para reduzir custos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
-
uais usos futuros são previstos?
Possível expansão para processamento de faturas de contas a pagar, validação de W-9 e fluxos automáticos de aprovação de documentos. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/)
References
- AWS ML Blog: Oldcastle accelerates document processing with Amazon Bedrock. https://aws.amazon.com/blogs/machine-learning/oldcastle-accelerates-document-processing-with-amazon-bedrock/
More news
Levar agentes de IA do conceito à produção com Amazon Bedrock AgentCore
Análise detalhada de como o Amazon Bedrock AgentCore ajuda a transformar aplicações de IA baseadas em agentes de conceito em sistemas de produção de nível empresarial, mantendo memória, segurança, observabilidade e gerenciamento de ferramentas escalável.
Monitorar Bedrock batch inference da Amazon usando métricas do CloudWatch
Saiba como monitorar e otimizar trabalhos de bedrock batch inference com métricas do CloudWatch, alarmes e painéis para melhorar desempenho, custo e governança.
Prompting para precisão com Stability AI Image Services no Amazon Bedrock
O Bedrock now oferece Stability AI Image Services com nove ferramentas para criar e editar imagens com maior precisão. Veja técnicas de prompting para uso empresarial.
Aumente a produção visual com Stability AI Image Services no Amazon Bedrock
Stability AI Image Services já estão disponíveis no Amazon Bedrock, oferecendo capacidades de edição de mídia prontas para uso via Bedrock API, ampliando os modelos Stable Diffusion 3.5 e Stable Image Core/Ultra já existentes no Bedrock.
Use AWS Deep Learning Containers com o SageMaker AI gerenciado MLflow
Explore como os AWS Deep Learning Containers (DLCs) se integram ao SageMaker AI gerenciado pelo MLflow para equilibrar controle de infraestrutura e governança robusta de ML. Um fluxo de trabalho de predição de idade de ostra com TensorFlow demonstra rastreamento de ponta a ponta, governança de model
Construir Fluxos de Trabalho Agenticos com GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore
Visão geral de ponta a ponta para implantar modelos GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore, alimentando um analisador de ações com múltiplos agentes usando LangGraph, incluindo quantização MXFP4 de 4 bits e orquestração serverless.