Skip to content
Como a Skello usa Amazon Bedrock para consultar dados em multitenant com limites lógicos
Source: aws.amazon.com

Como a Skello usa Amazon Bedrock para consultar dados em multitenant com limites lógicos

Sources: https://aws.amazon.com/blogs/machine-learning/how-skello-uses-amazon-bedrock-to-query-data-in-a-multi-tenant-environment-while-keeping-logical-boundaries, https://aws.amazon.com/blogs/machine-learning/how-skello-uses-amazon-bedrock-to-query-data-in-a-multi-tenant-environment-while-keeping-logical-boundaries/, AWS ML Blog

TL;DR

  • A Skello criou um assistente com IA usando Amazon Bedrock e AWS Lambda para consultar dados em um ambiente multitenant, mantendo limites lógicos estritos.
  • A solução se baseia em esquemas de dados padronizados, nomenclatura consistente e visões pré-agregadas para entregar respostas rápidas e confiáveis.
  • A segurança é em várias camadas: RBAC, autenticação JWT/SAML, Bedrock SessionParameters e Bedrock Guardrails para evitar injeção de prompts e conteúdo inadequado, alinhado com OWASP LLM06.
  • Os limites de dados são aplicados tanto no nível de banco de dados quanto de API, com logs de auditoria imutáveis para proteger dados dos clientes e conformidade com GDPR.
  • As visualizações são geradas automaticamente a partir de consultas, facilitando a narrativa de dados para usuários com diferentes níveis de habilidade.

Contexto e antecedentes

A Skello é uma plataforma HR SaaS voltada para agendamento de funcionários e gestão de força de trabalho, atendendo setores como hospitalidade, varejo, saúde, construção e outros. Até 2024, a Skello suportava aproximadamente 20.000 clientes e 400.000 usuários diários na Europa. Com o crescimento da plataforma, surgiu a necessidade de acesso mais fácil aos dados da força de trabalho. Ferramentas de consultas tradicionais estavam técnicas e demoradas para muitos usuários de RH e operações. Isso levou a empresa a explorar como modelos de linguagem grandes (LLMs) e IA generativa poderiam traduzir perguntas em linguagem natural para consultas estruturadas, mantendo-se em conformidade com privacidade e GDPR. A abordagem da Skello concentra-se na transformação de consultas em linguagem natural em consultas de banco de dados estruturadas. A arquitetura prioriza manter limites de dados em um ambiente multitenant, para que clientes possam fazer perguntas em linguagem natural e receber saídas precisas sem expor dados de outros clientes. A implementação usa uma pilha sem servidor baseada em AWS Lambda e Amazon Bedrock, um serviço gerenciado que oferece modelos de base por meio de uma única API, com segurança, privacidade e IA responsável. Este post de blog explica os desafios de aplicar LLMs à consulta de dados, descreve como a Skello equilibra capacidades de IA com requisitos rigorosos de proteção de dados e mostra como Bedrock e Lambda foram orquestrados para fornecer um assistente de IA pronto para empresas.

O que é novo

A inovação central é o assistente de IA da Skello, que permite aos usuários finais consultar seus próprios dados em um ambiente multitenant mantendo limites lógicos claros e conformidade com GDPR. A arquitetura demonstra como traduzir perguntas em linguagem natural para consultas estruturadas, assegurando que o contexto do usuário e permissões permaneçam fora do processamento do LLM. Pontos-chave:

  • Arquitetura de alto nível com AWS Lambda e Amazon Bedrock para transformar perguntas em linguagem natural em consultas de banco de dados.
  • Modelo de dados e estratégia de organização com esquemas padronizados, formatos consistentes para campos de data e nomes de campo claros (por exemplo, employee_type).
  • Otimização de busca e visões: indexação com base no uso e visões pré-agregadas para relatórios comuns, permitindo respostas quase instantâneas a perguntas como “Quem está trabalhando hoje?”
  • Controles de segurança alinhados ao OWASP (LLM06) com sessão de contexto do usuário via Bedrock e Guardrails para evitar injeção de prompts e conteúdo inadequado.
  • Limites de dados por meio de compartmentalização no banco de dados e verificações de API, garantindo que gerentes de departamento acessem apenas os dados de suas equipes, com logs de auditoria imutáveis para proteção de integridade.
  • Geração automática de visualizações profissionais a partir de consultas, tornando a exploração de dados acessível mesmo para usuários sem experiência avançada em visualização. Por exemplo, a Skello demonstra como um usuário pode pedir por análises como “paridade de gênero” ou consultas mais complexas como “horas trabalhadas por semana por posição nos últimos 3 meses”, com a solução traduzindo para saídas estruturadas e visualizações.

Por que isso importa (impacto para desenvolvedores/empresas)

Essa abordagem importa para desenvolvedores e empresas que buscam liberar acesso assistido por IA a dados em plataformas multitenant sem comprometer a segurança ou a conformidade. Implicações-chave:

  • Acesso a dados facilitado: usuários podem consultar seus dados em linguagem natural, reduzindo a necessidade de SQL ou ferramentas BI especializadas e acelerando decisões.
  • Privacidade e conformidade regulatória: a arquitetura impõe limites rigorosos entre dados de clientes, suporta GDPR e mantém logs auditáveis para demonstrar conformidade.
  • Integração IA segura: ao separar controles de segurança do LLM, usando Bedrock SessionParameters e Guardrails, a solução mitiga riscos comuns de IA e promove uso responsável.
  • Modelos de dados escaláveis e fáceis de manter: esquemas padronizados, nomenclaturas claras e visões pré- agregadas otimizam desempenho conforme cresce o número de clientes.
  • Visualizações rápidas e acessíveis: geração automática de gráficos facilita a narrativa de dados para mais usuários. Esses resultados mostram como uma abordagem sem servidor aliada à IA pode oferecer acesso a dados seguro e prático em ambientes multitenant, equilibrando capacidades de IA com governança e privacidade.

Detalhes técnicos ou Implementação

A implementação envolve uma pilha sem servidor e uma camada de dados cuidadosamente projetada, complementada por controles de segurança e governança. Componentes centrais:

  • Arquitetura sem servidor: a solução usa AWS Lambda para conectar solicitações de usuários ao Bedrock e retornar consultas estruturadas, oferecendo escalabilidade sob demanda.
  • Bedrock como base de IA: Amazon Bedrock oferece acesso a modelos de base através de uma única API, habilitando capacidades de IA generativa com salvaguardas de segurança e privacidade.
  • Modelo de dados padronizado: esquemas padronizados com formatos consistentes para campos de data e nomes de campos amigáveis, como employee_type, reduzem ambiguidades.
  • Indexação e visões: indexação baseada em padrões de uso e visões pré- agregadas para acelerar relatórios comuns.
  • Relacionamentos e contexto: relações claras conectam funcionários a departamentos, turnos e gerentes, permitindo consultas complexas.
  • Visualização automatizada: resultados são convertidos em visualizações profissionais que integram relatórios e apresentações.
  • Segurança e controles de acesso: alinhamento com OWASP LLM06, autenticação via JWT/SAML, e autorização granular para determinar permissões de dados.
  • Guardrails e segurança de prompts: Bedrock Guardrails protegem contra injeção de prompts, conteúdo inadequado e tópicos proibidos.
  • Limites de dados e auditoria: isolamento entre clientes, com logs de auditoria imutáveis que registram ações com carimbos de data/hora e identificadores de usuário, mantendo integridade.
  • Considerações GDPR: equilíbrio entre capacidades de IA e proteção de dados, mantendo isolamento entre inquilinos.

Tabela de dados de segurança

AspectoDescrição
Esquemas de dadosDefinições padronizadas, formatos consistentes para campos de data, nomes claros de campos
IndexaçãoPadrões baseados no uso para acelerar buscas comuns
VisõesVisões pré- agregadas para relatórios frequentes
SegurançaAutenticação JWT/SAML, RBAC, Bedrock SessionParameters, Guardrails
Limites de dadosCompartimentalização de banco de dados e verificações de API
AuditoriaLogs imutáveis com ações, timestamps e IDs de usuário

Considerações finais

  • Interfaces em linguagem natural podem converter perguntas em consultas estruturadas sem expor dados de outros clientes, mantendo limites de multitenant.
  • Modelos de dados padronizados e visões pré- agregadas elevam desempenho e precisão para perguntas de RH comuns.
  • Controles de segurança em várias camadas, incluindo Guardrails e separação entre controles de segurança e IA, ajudam a gerenciar riscos de IA.
  • Auditoria imutável e RBAC promovem responsabilidade e conformidade com GDPR em ambientes multitenant.
  • Visualizações automáticas democratizam insights, ampliando a participação na tomada de decisões com base em dados.

FAQ

  • Qual o papel do Amazon Bedrock na solução da Skello?

    Bedrock fornece acesso a modelos de IA de base por meio de uma API única, permitindo consultas em linguagem natural e insights de dados com salvaguardas de segurança e privacidade para uso empresarial.

  • Como os limites de dados são mantidos no ambiente multitenant?

    Limites são mantidos no nível de banco de dados e API, com compartmentalização de dados, RBAC e logs de auditoria imutáveis para impedir vazamento entre clientes.

  • uais medidas de segurança protegem os componentes de IA?

    Segue-se o OWASP LLM06, com serviços de segurança dedicados para autenticação/autorização, Bedrock SessionParameters para isolar o contexto do usuário e Guardrails para evitar injeção de prompts e conteúdo inadequado.

  • Como os esquemas padronizados ajudam na usabilidade?

    Nomes de campos claros, formatos consistentes e convenções tornaram as consultas em linguagem natural mais compreensíveis para a IA e mais rápidas de traduzir em resultados confiáveis.

Referências

More news

aws.amazon.com

Use AWS Deep Learning Containers com o SageMaker AI gerenciado MLflow

Explore como os AWS Deep Learning Containers (DLCs) se integram ao SageMaker AI gerenciado pelo MLflow para equilibrar controle de infraestrutura e governança robusta de ML. Um fluxo de trabalho de predição de idade de ostra com TensorFlow demonstra rastreamento de ponta a ponta, governança de model