AI Sheets: herramienta no‑code para crear y enriquecer datasets con modelos abiertos

TL;DR

AI Sheets es una herramienta open-source sin código, con interfaz tipo hoja de cálculo, para construir, transformar y enriquecer datasets con modelos de IA.
Se puede usar en el navegador vía una Space de Hugging Face o descargar y desplegar localmente desde GitHub.
Permite acceder a miles de modelos del Hub mediante Inference Providers o modelos locales (incluyendo gpt-oss de OpenAI) y usar ediciones manuales como ejemplos few-shot.

Contexto y antecedentes

Hugging Face presentó AI Sheets, una herramienta diseñada para permitir la creación y refinamiento interactivo de datasets usando modelos de IA sin escribir código. La interfaz simula una hoja de cálculo donde cada nueva columna se crea a partir de un prompt en lenguaje natural que puede referenciar columnas existentes. AI Sheets está integrada con el Hugging Face Hub y el ecosistema open-source, ofreciendo acceso a modelos mediante Inference Providers o ejecutándolos localmente. El flujo recomendado favorece la experimentación rápida: empezar con un conjunto pequeño de filas para perfeccionar prompts antes de ejecutar pipelines de generación largos o costosos. Se puede probar la herramienta en la Space alojada o instalar el código para ejecución local.

Qué hay de nuevo

AI Sheets introduce capacidades enfocadas en el trabajo con datos:

Generar datasets desde cero describiendo la estructura y el contenido en lenguaje natural (función de “auto-dataset” o “prompt-to-dataset”).
Importar datasets existentes y agregar columnas generadas por IA para transformación, clasificación, análisis, enriquecimiento (incluyendo búsqueda web cuando se habilita) y generación sintética.
Iteración directa: las ediciones manuales y las validaciones se incorporan como ejemplos few-shot para regenerar columnas.
Comparación de modelos y evaluación automática: añade una columna por modelo para comparar salidas y crea una columna juez que usa un LLM para evaluar o clasificar respuestas. Prueba la demo en https://huggingface.co/spaces/aisheets/sheets. Código fuente y despliegue local en https://github.com/huggingface/sheets.

Por qué importa (impacto para desarrolladores y empresas)

AI Sheets reduce la fricción para experimentos centrados en datos al combinar una interfaz familiar de hoja de cálculo con automatización por modelos. Impactos clave:

Iteración rápida en prompts y formatos: validar salidas en pocas filas antes de invertir en cómputo a gran escala.
Acceso flexible a modelos: usar miles de modelos del Hub vía Inference Providers o modelos locales permite evaluar modelos abiertos y usarlos en flujos propios; el anuncio menciona explícitamente gpt-oss de OpenAI.
Limpieza y enriquecimiento de datos: normalizar texto, extraer ideas principales, categorizar o completar campos faltantes (p. ej., código postal) mediante prompts sencillos.
Reproducibilidad y portabilidad: exportar al Hub genera un archivo de configuración reutilizable para generar más datos con jobs y para usar prompts en aplicaciones posteriores. Para equipos que construyen pipelines o preparan datos de entrenamiento, AI Sheets ofrece una forma rápida de prototipar transformaciones, comparar modelos con los mismos insumos y capturar correcciones humanas que mejoran las salidas automáticas.

Detalles técnicos o implementación

Interacción del usuario

Interfaz: AI Sheets muestra los datos como una hoja de cálculo editable. Las columnas nuevas se crean escribiendo prompts que referencian columnas existentes usando la sintaxis {{columna}}.
Bucle iterativo: tras generar una columna, se pueden editar celdas o marcarlas con “like”; estas acciones se usan como ejemplos few-shot cuando se regenera la columna o se añade más contenido.
Configuración de columna: se puede cambiar el prompt, alternar modelos o proveedores, activar “Search the web” para búsquedas externas y luego regenerar. Acceso a modelos y despliegue
Demo hospedada: prueba AI Sheets sin instalar en https://huggingface.co/spaces/aisheets/sheets.
Despliegue local: el código está en https://github.com/huggingface/sheets para quienes quieran ejecutar AI Sheets localmente. Para uso local, Hugging Face recomienda suscribirse a PRO para obtener 20x de uso mensual de inferencia si se desea mayor capacidad.
Modelos: AI Sheets puede invocar miles de modelos del Hugging Face Hub vía Inference Providers o usar modelos locales; el anuncio menciona gpt-oss de OpenAI como ejemplo. Exportación y escalado
Exportar al Hub: al exportar un dataset al Hub, AI Sheets genera un archivo de configuración que describe los prompts y los ejemplos few-shot derivados de las ediciones/validaciones. Ese config puede reutilizarse para generar datasets mayores mediante jobs automatizados y para reaplicar prompts en aplicaciones downstream. Ejemplos prácticos
Comparación de modelos: importa un dataset con preguntas y añade una columna por modelo con un prompt como: “Answer the following: {{prompt}}”; añade una columna juez que evalúe varias respuestas.
Limpieza/transformación: añade una columna con un prompt tipo “Remove extra punctuation marks from the following text: {{text}}” y regenera tras validar ejemplos.
Clasificación/Análisis: prompts como “Categorize the following text: {{text}}” o “Extract the most important ideas from the following: {{text}}”.
Enriquecimiento web: para encontrar códigos postales faltantes, activa “Search the web” y usa un prompt que haga referencia a la columna de dirección.
Generación sintética: crea una columna de biografía profesional y luego una columna con correos electrónicos realistas escritos por esa persona. | Tarea | Ejemplo de prompt de columna |--- |--- |Responder / comparar modelos | Answer the following: {{prompt}} |Limpiar texto | Remove extra punctuation marks from the following text: {{text}} |Clasificación | Categorize the following text: {{text}} |Extracción / análisis | Extract the most important ideas from the following: {{text}} |Enriquecimiento (web) | Find the zip code of the following address: {{address}} |

Puntos clave

AI Sheets ofrece una experiencia no‑code tipo hoja de cálculo para crear, transformar, enriquecer y comparar datasets con modelos abiertos o locales.
Las ediciones manuales y validaciones se usan como ejemplos few-shot para mejorar generaciones posteriores.
La herramienta está disponible en una Space para prueba inmediata y en GitHub para despliegue local; exportar al Hub crea configs reutilizables.

FAQ

¿Cómo puedo probar AI Sheets sin instalar nada?

Puedes probar la demo en https://huggingface.co/spaces/aisheets/sheets.
¿Dónde está el código para ejecutar localmente?

El repositorio está en https://github.com/huggingface/sheets.
¿Qué modelos admite AI Sheets?

AI Sheets puede usar miles de modelos del Hugging Face Hub vía Inference Providers o modelos locales; el anuncio menciona gpt-oss de OpenAI.
¿Las ediciones manuales afectan la generación?

Sí. Las celdas editadas o marcadas con like se incorporan como ejemplos few-shot al regenerar o expandir columnas.

Referencias

Demo: https://huggingface.co/spaces/aisheets/sheets
Código y despliegue local: https://github.com/huggingface/sheets
Ejemplo de dataset creado con AI Sheets: https://huggingface.co/datasets/dvilasuero/jsvibes-qwen-gpt-oss-judged
Anuncio original: https://huggingface.co/blog/aisheets

AI Sheets: herramienta no‑code para crear y enriquecer datasets con modelos abiertos

TL;DR

Contexto y antecedentes

Qué hay de nuevo

Por qué importa (impacto para desarrolladores y empresas)

Detalles técnicos o implementación

Puntos clave

FAQ

Referencias

More news

Scaleway se une a los Proveedores de Inferencia de Hugging Face para Inferencia Serverless y de Baja Latencia

Monitorear la inferencia por lotes de Bedrock de AWS con métricas de CloudWatch

Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore

Reduciendo la latencia en frío para la inferencia de LLM con NVIDIA Run:ai Model Streamer

Modelos Qwen3-Next MoE Híbridos de Código Abierto: Mayor Precisión y Inferencia Más Rápida en la Plataforma NVIDIA

Conectar Centros de Datos Distribuidos en Grandes Fábricas de IA con Scale-Across Networking