AI Sheets: ferramenta no‑code para criar e enriquecer datasets com modelos abertos
Sources: https://huggingface.co/blog/aisheets
TL;DR
- AI Sheets é uma ferramenta open-source sem código, com interface tipo planilha, para construir, transformar e enriquecer datasets com modelos de IA.
- Pode ser usada no navegador através de uma Space da Hugging Face ou baixada e executada localmente a partir do GitHub.
- Oferece acesso a milhares de modelos do Hub via Inference Providers ou modelos locais (incluindo gpt-oss da OpenAI) e permite iterar usando edições manuais como exemplos few-shot.
Contexto e antecedentes
A Hugging Face lançou o AI Sheets para permitir que usuários construam e refinem datasets de forma interativa usando modelos de IA sem precisar programar. A interface lembra uma planilha, onde cada coluna nova é gerada a partir de um prompt em linguagem natural que pode referenciar colunas existentes. AI Sheets integra-se ao Hugging Face Hub e ao ecossistema de modelos open-source, com acesso a modelos via Inference Providers ou execução local. A ferramenta incentiva fluxos de trabalho experimentais: começar com poucas linhas para ajustar prompts e comportamento antes de escalar para gerações maiores e mais custosas. É possível experimentar imediatamente na Space hospedada ou instalar o código para deploy local.
O que há de novo
AI Sheets traz um ambiente no‑code para vários fluxos de trabalho com dados:
- Criar datasets do zero descrevendo estrutura e conteúdo em linguagem natural (recurso de “auto-dataset” ou “prompt-to-dataset”).
- Importar datasets existentes e adicionar colunas geradas por IA para transformação, classificação, análise, enriquecimento (com busca na web quando ativada) e geração sintética.
- Refinamento iterativo de prompts direto na planilha: edições manuais e validações são incorporadas automaticamente como exemplos few-shot para regenerar colunas.
- Comparação de modelos e avaliação automatizada: adicionar uma coluna por modelo para comparar saídas e criar uma coluna de juiz que usa um LLM para avaliar ou ranquear respostas. Teste a ferramenta sem instalar: https://huggingface.co/spaces/aisheets/sheets. Código-fonte e deploy local: https://github.com/huggingface/sheets.
Por que importa (impacto para desenvolvedores e empresas)
AI Sheets reduz a barreira para experimentação rápida centrada em dados, combinando uma interface familiar de planilha com automação por modelos. Impactos principais:
- Iteração mais rápida em prompts e formatos de dados: equipes podem validar saídas em poucas linhas antes de gastar recursos computacionais em gerações em larga escala.
- Acesso flexível a modelos: usar milhares de modelos do Hub via Inference Providers ou modelos locais facilita testar modelos abertos e integrá-los a fluxos proprietários. O anúncio cita explicitamente o suporte a gpt-oss da OpenAI.
- Aumento e limpeza de dados: tarefas como remoção de pontuação indesejada, extração de ideias, categorização de textos ou preenchimento de campos faltantes (por exemplo, CEP) são tratadas via prompts simples.
- Reprodutibilidade e portabilidade: exportar para o Hub gera um arquivo de configuração reutilizável para geração em escala e para uso posterior em aplicações. Para equipes construindo pipelines de dados ou preparando dados de treinamento, AI Sheets oferece uma forma rápida de prototipar transformações, comparar modelos sobre os mesmos insumos e capturar correções humanas que melhoram resultados automáticos.
Detalhes técnicos ou implementação
Modelo de interação do usuário
- Interface: AI Sheets apresenta uma interface parecida com uma planilha. Cada dataset aparece como linhas e colunas editáveis, e novas colunas são criadas escrevendo prompts que podem referenciar colunas existentes usando a sintaxe
{{coluna}}. - Loop de iteração: após gerar uma coluna, o usuário pode editar células manualmente ou marcar resultados com “like”; essas edições e likes são usados automaticamente como exemplos few-shot quando a coluna é regenerada ou expandida.
- Configuração de coluna: é possível mudar o prompt, trocar modelos ou provedores, ativar opções como “Search the web” para consultas externas e então regenerar a coluna. Acesso a modelos e deployment
- Demo hospedado: experimente AI Sheets sem instalação em https://huggingface.co/spaces/aisheets/sheets.
- Deploy local: o código-fonte está em https://github.com/huggingface/sheets para quem quiser executar AI Sheets localmente. Para uso local, a Hugging Face recomenda assinar PRO para obter 20x de uso mensal de inferência, caso deseje maior capacidade.
- Modelos: AI Sheets pode chamar milhares de modelos disponíveis no Hugging Face Hub via Inference Providers ou usar modelos locais; o texto do anúncio cita gpt-oss da OpenAI como exemplo. Exportação e escala
- Exportar para o Hub: ao exportar um dataset para o Hub, AI Sheets gera um arquivo de configuração que descreve os prompts e os exemplos few-shot derivados de edições/validações. Esse config pode ser reutilizado para gerar datasets maiores com jobs automatizados e para reaplicar prompts em aplicações posteriores. Exemplos práticos e fluxos
- Comparação de modelos: importe um dataset de prompts/perguntas e adicione uma coluna por modelo com um prompt como: “Answer the following:
{{prompt}}”; adicione uma coluna juiz para avaliar múltiplas respostas. - Limpeza e transformação: normalize textos adicionando uma coluna com um prompt do tipo: “Remove extra punctuation marks from the following text:
{{text}}” e regenere após validar exemplos. - Classificação e análise: adicione colunas para categorizar ou extrair ideias com prompts como “Categorize the following text:
{{text}}” ou “Extract the most important ideas from the following:{{text}}”. - Enriquecimento e busca na web: para tarefas como encontrar CEPs faltantes, ative “Search the web” e use um prompt que referencie a coluna de endereço.
- Geração sintética: descreva o esquema desejado (por exemplo, uma coluna de biografia profissional) e gere colunas dependentes como e-mails realistas escritos por essa persona.
| Tarefa | Exemplo de prompt de coluna
|---
|---
|Responder prompts / comparação de modelos | Answer the following:
{{prompt}}|Limpar texto | Remove extra punctuation marks from the following text:{{text}}|Classificação | Categorize the following text:{{text}}|Análise / extração | Extract the most important ideas from the following:{{text}}|Enriquecimento (web) | Find the zip code of the following address:{{address}}|
Principais conclusões
- AI Sheets oferece uma experiência no‑code e em estilo planilha para criação, transformação, enriquecimento e comparação de datasets com modelos abertos ou locais.
- Edições manuais e validações são reaproveitadas como exemplos few-shot para melhorar gerações posteriores.
- A ferramenta está disponível em uma Space para teste imediato e no GitHub para deploy local; exportar ao Hub gera configs reutilizáveis para escala.
FAQ
-
Como testar o AI Sheets sem instalar nada?
Você pode acessar a demo hospedada em https://huggingface.co/spaces/aisheets/sheets.
-
Onde encontro o código-fonte para rodar localmente?
O repositório está em https://github.com/huggingface/sheets.
-
Quais modelos posso usar com AI Sheets?
AI Sheets pode usar milhares de modelos do Hugging Face Hub via Inference Providers ou modelos locais; o anúncio cita gpt-oss da OpenAI.
-
Como as edições manuais influenciam as gerações?
As células editadas ou marcadas com like são utilizadas como exemplos few-shot ao regenerar ou expandir colunas.
Referências
- Demo hospedada: https://huggingface.co/spaces/aisheets/sheets
- Código e deploy local: https://github.com/huggingface/sheets
- Exemplo de dataset criado com AI Sheets: https://huggingface.co/datasets/dvilasuero/jsvibes-qwen-gpt-oss-judged
- Anúncio original: https://huggingface.co/blog/aisheets
More news
Scaleway Como Novo Fornecedor de Inferência no Hugging Face para Inferência serverless de Baixa Latência
A Scaleway é agora um Fornecedor de Inferência compatível no Hugging Face Hub, permitindo inferência serverless diretamente nas páginas de modelo com as SDKs JS e Python. Acesse modelos abertos populares com operações escaláveis e baixa latência.
Monitorar Bedrock batch inference da Amazon usando métricas do CloudWatch
Saiba como monitorar e otimizar trabalhos de bedrock batch inference com métricas do CloudWatch, alarmes e painéis para melhorar desempenho, custo e governança.
Construir Fluxos de Trabalho Agenticos com GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore
Visão geral de ponta a ponta para implantar modelos GPT OSS da OpenAI no SageMaker AI e no Bedrock AgentCore, alimentando um analisador de ações com múltiplos agentes usando LangGraph, incluindo quantização MXFP4 de 4 bits e orquestração serverless.
Reduzindo a Latência de Cold Start para Inferência de LLM com NVIDIA Run:ai Model Streamer
Análise detalhada de como o NVIDIA Run:ai Model Streamer reduz o tempo de cold-start na inferência de LLMs ao transmitir pesos para a memória da GPU, com benchmarks em GP3, IO2 e S3.
Maximizando a Baixa Latência de Rede para Serviços Financeiros com NVIDIA Rivermax e NEIO FastSocket
Examina como NVIDIA Rivermax e NEIO FastSocket oferecem latência ultra‑baixa e alto rendimento, usando kernel bypass, zero‑copy e GPUDirect para mover dados diretamente do NIC para GPUs.
Conectando Centros de Dados Distribuídos em Grandes Fábricas de IA com Scale-Across Networking
O Spectrum-XGS Ethernet da NVIDIA habilita scale-across Networking para unir centros de dados dispersos em uma única fábrica de IA, proporcionando ganhos de largura de banda NCCL e desempenho previsível em longas distâncias.