AI Sheets: herramienta no‑code para crear y enriquecer datasets con modelos abiertos
Sources: https://huggingface.co/blog/aisheets
TL;DR
- AI Sheets es una herramienta open-source sin código, con interfaz tipo hoja de cálculo, para construir, transformar y enriquecer datasets con modelos de IA.
- Se puede usar en el navegador vía una Space de Hugging Face o descargar y desplegar localmente desde GitHub.
- Permite acceder a miles de modelos del Hub mediante Inference Providers o modelos locales (incluyendo gpt-oss de OpenAI) y usar ediciones manuales como ejemplos few-shot.
Contexto y antecedentes
Hugging Face presentó AI Sheets, una herramienta diseñada para permitir la creación y refinamiento interactivo de datasets usando modelos de IA sin escribir código. La interfaz simula una hoja de cálculo donde cada nueva columna se crea a partir de un prompt en lenguaje natural que puede referenciar columnas existentes. AI Sheets está integrada con el Hugging Face Hub y el ecosistema open-source, ofreciendo acceso a modelos mediante Inference Providers o ejecutándolos localmente. El flujo recomendado favorece la experimentación rápida: empezar con un conjunto pequeño de filas para perfeccionar prompts antes de ejecutar pipelines de generación largos o costosos. Se puede probar la herramienta en la Space alojada o instalar el código para ejecución local.
Qué hay de nuevo
AI Sheets introduce capacidades enfocadas en el trabajo con datos:
- Generar datasets desde cero describiendo la estructura y el contenido en lenguaje natural (función de “auto-dataset” o “prompt-to-dataset”).
- Importar datasets existentes y agregar columnas generadas por IA para transformación, clasificación, análisis, enriquecimiento (incluyendo búsqueda web cuando se habilita) y generación sintética.
- Iteración directa: las ediciones manuales y las validaciones se incorporan como ejemplos few-shot para regenerar columnas.
- Comparación de modelos y evaluación automática: añade una columna por modelo para comparar salidas y crea una columna juez que usa un LLM para evaluar o clasificar respuestas. Prueba la demo en https://huggingface.co/spaces/aisheets/sheets. Código fuente y despliegue local en https://github.com/huggingface/sheets.
Por qué importa (impacto para desarrolladores y empresas)
AI Sheets reduce la fricción para experimentos centrados en datos al combinar una interfaz familiar de hoja de cálculo con automatización por modelos. Impactos clave:
- Iteración rápida en prompts y formatos: validar salidas en pocas filas antes de invertir en cómputo a gran escala.
- Acceso flexible a modelos: usar miles de modelos del Hub vía Inference Providers o modelos locales permite evaluar modelos abiertos y usarlos en flujos propios; el anuncio menciona explícitamente gpt-oss de OpenAI.
- Limpieza y enriquecimiento de datos: normalizar texto, extraer ideas principales, categorizar o completar campos faltantes (p. ej., código postal) mediante prompts sencillos.
- Reproducibilidad y portabilidad: exportar al Hub genera un archivo de configuración reutilizable para generar más datos con jobs y para usar prompts en aplicaciones posteriores. Para equipos que construyen pipelines o preparan datos de entrenamiento, AI Sheets ofrece una forma rápida de prototipar transformaciones, comparar modelos con los mismos insumos y capturar correcciones humanas que mejoran las salidas automáticas.
Detalles técnicos o implementación
Interacción del usuario
- Interfaz: AI Sheets muestra los datos como una hoja de cálculo editable. Las columnas nuevas se crean escribiendo prompts que referencian columnas existentes usando la sintaxis
{{columna}}. - Bucle iterativo: tras generar una columna, se pueden editar celdas o marcarlas con “like”; estas acciones se usan como ejemplos few-shot cuando se regenera la columna o se añade más contenido.
- Configuración de columna: se puede cambiar el prompt, alternar modelos o proveedores, activar “Search the web” para búsquedas externas y luego regenerar. Acceso a modelos y despliegue
- Demo hospedada: prueba AI Sheets sin instalar en https://huggingface.co/spaces/aisheets/sheets.
- Despliegue local: el código está en https://github.com/huggingface/sheets para quienes quieran ejecutar AI Sheets localmente. Para uso local, Hugging Face recomienda suscribirse a PRO para obtener 20x de uso mensual de inferencia si se desea mayor capacidad.
- Modelos: AI Sheets puede invocar miles de modelos del Hugging Face Hub vía Inference Providers o usar modelos locales; el anuncio menciona gpt-oss de OpenAI como ejemplo. Exportación y escalado
- Exportar al Hub: al exportar un dataset al Hub, AI Sheets genera un archivo de configuración que describe los prompts y los ejemplos few-shot derivados de las ediciones/validaciones. Ese config puede reutilizarse para generar datasets mayores mediante jobs automatizados y para reaplicar prompts en aplicaciones downstream. Ejemplos prácticos
- Comparación de modelos: importa un dataset con preguntas y añade una columna por modelo con un prompt como: “Answer the following:
{{prompt}}”; añade una columna juez que evalúe varias respuestas. - Limpieza/transformación: añade una columna con un prompt tipo “Remove extra punctuation marks from the following text:
{{text}}” y regenera tras validar ejemplos. - Clasificación/Análisis: prompts como “Categorize the following text:
{{text}}” o “Extract the most important ideas from the following:{{text}}”. - Enriquecimiento web: para encontrar códigos postales faltantes, activa “Search the web” y usa un prompt que haga referencia a la columna de dirección.
- Generación sintética: crea una columna de biografía profesional y luego una columna con correos electrónicos realistas escritos por esa persona.
| Tarea | Ejemplo de prompt de columna
|---
|---
|Responder / comparar modelos | Answer the following:
{{prompt}}|Limpiar texto | Remove extra punctuation marks from the following text:{{text}}|Clasificación | Categorize the following text:{{text}}|Extracción / análisis | Extract the most important ideas from the following:{{text}}|Enriquecimiento (web) | Find the zip code of the following address:{{address}}|
Puntos clave
- AI Sheets ofrece una experiencia no‑code tipo hoja de cálculo para crear, transformar, enriquecer y comparar datasets con modelos abiertos o locales.
- Las ediciones manuales y validaciones se usan como ejemplos few-shot para mejorar generaciones posteriores.
- La herramienta está disponible en una Space para prueba inmediata y en GitHub para despliegue local; exportar al Hub crea configs reutilizables.
FAQ
-
¿Cómo puedo probar AI Sheets sin instalar nada?
Puedes probar la demo en https://huggingface.co/spaces/aisheets/sheets.
-
¿Dónde está el código para ejecutar localmente?
El repositorio está en https://github.com/huggingface/sheets.
-
¿Qué modelos admite AI Sheets?
AI Sheets puede usar miles de modelos del Hugging Face Hub vía Inference Providers o modelos locales; el anuncio menciona gpt-oss de OpenAI.
-
¿Las ediciones manuales afectan la generación?
Sí. Las celdas editadas o marcadas con like se incorporan como ejemplos few-shot al regenerar o expandir columnas.
Referencias
- Demo: https://huggingface.co/spaces/aisheets/sheets
- Código y despliegue local: https://github.com/huggingface/sheets
- Ejemplo de dataset creado con AI Sheets: https://huggingface.co/datasets/dvilasuero/jsvibes-qwen-gpt-oss-judged
- Anuncio original: https://huggingface.co/blog/aisheets
More news
Scaleway se une a los Proveedores de Inferencia de Hugging Face para Inferencia Serverless y de Baja Latencia
Scaleway es ahora un Proveedor de Inferencia soportado en Hugging Face Hub, lo que permite inferencia serverless directamente en las páginas de modelos con los SDK de JS y Python. Accede a modelos open-weight populares y disfruta de flujos de IA escalables y de baja latencia.
Monitorear la inferencia por lotes de Bedrock de AWS con métricas de CloudWatch
Descubra cómo monitorear y optimizar trabajos de inferencia por lotes de Bedrock con métricas, alarmas y paneles de CloudWatch para mejorar rendimiento, costos y operación.
Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore
Visión general de extremo a extremo para implementar modelos GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore, impulsando un analizador de acciones multiagente con LangGraph, con cuantización MXFP4 de 4 bits y orquestación serverless.
Reduciendo la latencia en frío para la inferencia de LLM con NVIDIA Run:ai Model Streamer
Análisis detallado de cómo NVIDIA Run:ai Model Streamer disminuye los tiempos de arranque en frío al transmitir pesos a la memoria GPU, con benchmarks en GP3, IO2 y S3.
Modelos Qwen3-Next MoE Híbridos de Código Abierto: Mayor Precisión y Inferencia Más Rápida en la Plataforma NVIDIA
Las previews open source de Qwen3-Next 80B-A3B-Thinking y 80B-A3B-Instruct introducen una arquitectura MoE híbrida para contexto largo e inferencia eficiente, con opciones de despliegue y herramientas abiertas de NVIDIA.
Conectar Centros de Datos Distribuidos en Grandes Fábricas de IA con Scale-Across Networking
El Spectrum-XGS Ethernet permite scale-across networking para unir centros de datos dispersos en una única fábrica de IA, logrando ganancias de ancho de banda NCCL y rendimiento predecible a largas distancias.