Scaleway se une a los Proveedores de Inferencia de Hugging Face para Inferencia Serverless y de Baja Latencia

TL;DR

Scaleway es ahora un Proveedor de Inferencia soportado en Hugging Face Hub, ampliando el ecosistema para inferencia serverless.
Los Proveedores de Inferencia están integrados en los SDKs de cliente JS y Python de Hugging Face, facilitando el uso entre modelos.
Puedes acceder a modelos open-weight populares (p. ej., gpt-oss, Qwen3, DeepSeek R1, Gemma 3) directamente desde Hugging Face con Scaleway como proveedor.
Scaleway Generative APIs ofrece un servicio serverless totalmente gestionado, con precios desde €0,20 por millón de tokens, centros de datos europeos (París) y latencia inferior a 200 ms para el primer token.
Facturación transparente: uso directo con la clave del proveedor; las solicitudes enrutadas a través de Hugging Face se facturan a las tarifas estándar de la API del proveedor, sin markup.

Contexto y antecedentes

Hugging Face continúa ampliando el conjunto de opciones de inferencia compatibles añadiendo Proveedores de Inferencia a las páginas de modelos. Scaleway se une a la lista de socios, permitiendo la inferencia serverless directamente en el Hub y completando la oferta de proveedores disponibles. Esta integración facilita la adopción de modelos en entornos de producción y ofrece una vía sencilla para cargas de trabajo de IA que requieren baja latencia y escalabilidad. La integración también aprovecha las herramientas para desarrolladores: los Proveedores de Inferencia están integrados en los SDKs de cliente de Hugging Face para JS y Python, simplificando el uso de la infraestructura de Scaleway con pilas de desarrollo ya existentes. Los usuarios pueden explorar la organización Scaleway en el Hub y probar modelos en tendencia compatibles, fomentando la experimentación rápida e integración en flujos de trabajo de ML.

Novedades

Este anuncio formaliza a Scaleway como Proveedor de Inferencia soportado en Hugging Face Hub. Capacidades clave:

Acceso a modelos populares open-weight a través de Scaleway en Hugging Face, incluyendo gpt-oss, Qwen3, DeepSeek R1 y Gemma 3.
Integración directa en los SDKs JS y Python para un uso fluido entre proveedores.
Scaleway Generative APIs, servicio totalmente gestionado y serverless, con llamadas API simples para acceder a modelos de vanguardia.
Precios competitivos desde €0,20 por millón de tokens, con centros de datos europeos (París) para favorecer la soberanía de datos y la baja latencia.
Funcionalidades avanzadas: salidas estructuradas, llamadas de función y capacidades multimodales para texto e imagen.
Tiempos de respuesta inferiores a 200 ms para los primeros tokens, adecuado para aplicaciones interactivas y flujos de trabajo orientados a agentes; soporte para generación de texto y embeddings.
Modelo de facturación claro: solicitudes directas facturadas por el proveedor; solicitudes enrutadas a través de Hugging Face se facturan a tarifas estándar de API del proveedor, sin markup.
Reconocimiento de comentarios de desarrolladores y posibles acuerdos de reparto de ingresos en el futuro con socios del proveedor.

Por qué importa (impacto para desarrolladores/empresas)

La colaboración Scaleway–Hugging Face reduce las barreras para adoptar inferencia serverless escalable en el Hub. Para desarrolladores, la integración con los SDKs de JS y Python permite incorporar la inferencia respaldada por Scaleway directamente en aplicaciones, sin configuraciones complejas ni enrutamiento personalizado. El acceso a modelos de alto interés a través de un único canal de proveedor simplifica la experimentación y el despliegue de flujos de trabajo de IA, acelerando el desarrollo de características que dependen del lenguaje, embeddings o capacidades multimodales. Desde la perspectiva empresarial, los centros de datos europeosen ofrecen opciones de soberanía de datos adecuadas para despliegues que requieren cumplimiento. La arquitectura serverless reduce la carga operativa, mientras que la baja latencia ayuda a cumplir expectativas de experiencia de usuario para características de IA en tiempo real. La posibilidad de elegir entre facturación dirigida por el proveedor o facturación a través de Hugging Face ofrece flexibilidad de precios y gobernanza de costos. La transparencia de precios es otra ventaja: las solicitudes directas se facturan a nombre del proveedor; las solicitudes enrutadas a través de Hugging Face se facturan a tarifas estándar de la API del proveedor, sin markup. Esto facilita modelar costos y comparar con otros proveedores en el ecosistema.

Detalles técnicos o Implementación

La integración de Scaleway como Proveedor de Inferencia está diseñada para integrarse fácilmente en flujos existentes:

Acceso a modelos: puede navegar por la organización Scaleway en el Hub y probar modelos en tendencia compatibles (gpt-oss, Qwen3, DeepSeek R1, Gemma 3).
Cómo enrutar: puede usar un token de Hugging Face para enrutamiento automático o una clave API Scaleway; se requiere una versión reciente de huggingface_hub (>= 0.34.6).
Modelo de facturación: solicitudes directas son facturadas por Scaleway; solicitudes enrutadas a través de Hugging Face siguen las tarifas estándar de la API del proveedor, sin markup.
Disponibilidad y rendimiento: Scaleway Generative APIs se describe como servicio totalmente gestionado y serverless, con tiempos de respuesta

Scaleway se une a los Proveedores de Inferencia de Hugging Face para Inferencia Serverless y de Baja Latencia

TL;DR

Contexto y antecedentes

Novedades

Por qué importa (impacto para desarrolladores/empresas)

Detalles técnicos o Implementación

References

More news

Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore

Modelos Qwen3-Next MoE Híbridos de Código Abierto: Mayor Precisión y Inferencia Más Rápida en la Plataforma NVIDIA

Conectar Centros de Datos Distribuidos en Grandes Fábricas de IA con Scale-Across Networking

Acelera ZeroGPU Spaces con la compilación AoT de PyTorch

Haz que tus ZeroGPU Spaces vayan más rápido con la compilación AoT de PyTorch

Análisis de bases de datos basado en lenguaje natural con Amazon Nova