Skip to content
AI Sheets: herramienta no‑code para crear y enriquecer datasets con modelos abiertos
Source: huggingface.co

AI Sheets: herramienta no‑code para crear y enriquecer datasets con modelos abiertos

Sources: https://huggingface.co/blog/aisheets

TL;DR

  • AI Sheets es una herramienta open-source sin código, con interfaz tipo hoja de cálculo, para construir, transformar y enriquecer datasets con modelos de IA.
  • Se puede usar en el navegador vía una Space de Hugging Face o descargar y desplegar localmente desde GitHub.
  • Permite acceder a miles de modelos del Hub mediante Inference Providers o modelos locales (incluyendo gpt-oss de OpenAI) y usar ediciones manuales como ejemplos few-shot.

Contexto y antecedentes

Hugging Face presentó AI Sheets, una herramienta diseñada para permitir la creación y refinamiento interactivo de datasets usando modelos de IA sin escribir código. La interfaz simula una hoja de cálculo donde cada nueva columna se crea a partir de un prompt en lenguaje natural que puede referenciar columnas existentes. AI Sheets está integrada con el Hugging Face Hub y el ecosistema open-source, ofreciendo acceso a modelos mediante Inference Providers o ejecutándolos localmente. El flujo recomendado favorece la experimentación rápida: empezar con un conjunto pequeño de filas para perfeccionar prompts antes de ejecutar pipelines de generación largos o costosos. Se puede probar la herramienta en la Space alojada o instalar el código para ejecución local.

Qué hay de nuevo

AI Sheets introduce capacidades enfocadas en el trabajo con datos:

  • Generar datasets desde cero describiendo la estructura y el contenido en lenguaje natural (función de “auto-dataset” o “prompt-to-dataset”).
  • Importar datasets existentes y agregar columnas generadas por IA para transformación, clasificación, análisis, enriquecimiento (incluyendo búsqueda web cuando se habilita) y generación sintética.
  • Iteración directa: las ediciones manuales y las validaciones se incorporan como ejemplos few-shot para regenerar columnas.
  • Comparación de modelos y evaluación automática: añade una columna por modelo para comparar salidas y crea una columna juez que usa un LLM para evaluar o clasificar respuestas. Prueba la demo en https://huggingface.co/spaces/aisheets/sheets. Código fuente y despliegue local en https://github.com/huggingface/sheets.

Por qué importa (impacto para desarrolladores y empresas)

AI Sheets reduce la fricción para experimentos centrados en datos al combinar una interfaz familiar de hoja de cálculo con automatización por modelos. Impactos clave:

  • Iteración rápida en prompts y formatos: validar salidas en pocas filas antes de invertir en cómputo a gran escala.
  • Acceso flexible a modelos: usar miles de modelos del Hub vía Inference Providers o modelos locales permite evaluar modelos abiertos y usarlos en flujos propios; el anuncio menciona explícitamente gpt-oss de OpenAI.
  • Limpieza y enriquecimiento de datos: normalizar texto, extraer ideas principales, categorizar o completar campos faltantes (p. ej., código postal) mediante prompts sencillos.
  • Reproducibilidad y portabilidad: exportar al Hub genera un archivo de configuración reutilizable para generar más datos con jobs y para usar prompts en aplicaciones posteriores. Para equipos que construyen pipelines o preparan datos de entrenamiento, AI Sheets ofrece una forma rápida de prototipar transformaciones, comparar modelos con los mismos insumos y capturar correcciones humanas que mejoran las salidas automáticas.

Detalles técnicos o implementación

Interacción del usuario

  • Interfaz: AI Sheets muestra los datos como una hoja de cálculo editable. Las columnas nuevas se crean escribiendo prompts que referencian columnas existentes usando la sintaxis {{columna}}.
  • Bucle iterativo: tras generar una columna, se pueden editar celdas o marcarlas con “like”; estas acciones se usan como ejemplos few-shot cuando se regenera la columna o se añade más contenido.
  • Configuración de columna: se puede cambiar el prompt, alternar modelos o proveedores, activar “Search the web” para búsquedas externas y luego regenerar. Acceso a modelos y despliegue
  • Demo hospedada: prueba AI Sheets sin instalar en https://huggingface.co/spaces/aisheets/sheets.
  • Despliegue local: el código está en https://github.com/huggingface/sheets para quienes quieran ejecutar AI Sheets localmente. Para uso local, Hugging Face recomienda suscribirse a PRO para obtener 20x de uso mensual de inferencia si se desea mayor capacidad.
  • Modelos: AI Sheets puede invocar miles de modelos del Hugging Face Hub vía Inference Providers o usar modelos locales; el anuncio menciona gpt-oss de OpenAI como ejemplo. Exportación y escalado
  • Exportar al Hub: al exportar un dataset al Hub, AI Sheets genera un archivo de configuración que describe los prompts y los ejemplos few-shot derivados de las ediciones/validaciones. Ese config puede reutilizarse para generar datasets mayores mediante jobs automatizados y para reaplicar prompts en aplicaciones downstream. Ejemplos prácticos
  • Comparación de modelos: importa un dataset con preguntas y añade una columna por modelo con un prompt como: “Answer the following: {{prompt}}”; añade una columna juez que evalúe varias respuestas.
  • Limpieza/transformación: añade una columna con un prompt tipo “Remove extra punctuation marks from the following text: {{text}}” y regenera tras validar ejemplos.
  • Clasificación/Análisis: prompts como “Categorize the following text: {{text}}” o “Extract the most important ideas from the following: {{text}}”.
  • Enriquecimiento web: para encontrar códigos postales faltantes, activa “Search the web” y usa un prompt que haga referencia a la columna de dirección.
  • Generación sintética: crea una columna de biografía profesional y luego una columna con correos electrónicos realistas escritos por esa persona. | Tarea | Ejemplo de prompt de columna |--- |--- |Responder / comparar modelos | Answer the following: {{prompt}} |Limpiar texto | Remove extra punctuation marks from the following text: {{text}} |Clasificación | Categorize the following text: {{text}} |Extracción / análisis | Extract the most important ideas from the following: {{text}} |Enriquecimiento (web) | Find the zip code of the following address: {{address}} |

Puntos clave

  • AI Sheets ofrece una experiencia no‑code tipo hoja de cálculo para crear, transformar, enriquecer y comparar datasets con modelos abiertos o locales.
  • Las ediciones manuales y validaciones se usan como ejemplos few-shot para mejorar generaciones posteriores.
  • La herramienta está disponible en una Space para prueba inmediata y en GitHub para despliegue local; exportar al Hub crea configs reutilizables.

FAQ

  • ¿Cómo puedo probar AI Sheets sin instalar nada?

    Puedes probar la demo en https://huggingface.co/spaces/aisheets/sheets.

  • ¿Dónde está el código para ejecutar localmente?

    El repositorio está en https://github.com/huggingface/sheets.

  • ¿Qué modelos admite AI Sheets?

    AI Sheets puede usar miles de modelos del Hugging Face Hub vía Inference Providers o modelos locales; el anuncio menciona gpt-oss de OpenAI.

  • ¿Las ediciones manuales afectan la generación?

    Sí. Las celdas editadas o marcadas con like se incorporan como ejemplos few-shot al regenerar o expandir columnas.

Referencias

More news