Acelera el trabajo de ML con Code Editor en SageMaker Unified Studio
TL;DR
- SageMaker Unified Studio incluye Code Editor (basado en Code-OSS/VS Code) para un IDE ligero y potente dentro de un entorno unificado de análisis e IA.
- Espacios múltiples por usuario por proyecto permiten flujos de trabajo paralelos con diferentes necesidades de cómputo; cada espacio tiene una relación 1:1 con una instancia de aplicación.
- Los espacios son entornos privados (se planea un espacio compartido en una versión futura) y Code Editor se integra con GitHub, GitLab o Bitbucket para control de versiones y colaboración.
- Las opciones de cómputo van desde ml.t3.medium hasta familias GPU G6, con apagado automático de espacios inactivos y almacenamiento EBS persistente entre sesiones.
- El flujo de ejemplo utiliza SageMaker Pipelines para construir, entrenar, evaluar y, opcionalmente, desplegar modelos ML; los prerequisitos incluyen IAM Identity Center y MFA. Para más detalles, vea el artículo original en el blog de AWS: https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/.
Contexto y antecedentes
SageMaker Unified Studio se describe como un entorno de desarrollo integrado (IDE) único que reúne herramientas para análisis y IA. Proporciona herramientas integradas para construir pipelines de datos, compartir conjuntos de datos, supervisar la gobernanza de datos, realizar análisis SQL y crear modelos ML y aplicaciones de IA generativa. AWS introdujo dos opciones para mejorar la experiencia de desarrollo para equipos de análisis, ML y IA generativa: Code Editor y espacios múltiples. Code Editor, basado en Code-OSS (Visual Studio Code – Open Source), ofrece un IDE ligero con acceso al terminal, depuración avanzada y herramientas de refactorización, y permite acceder a numerosas extensiones desde el Open VSX. source. En SageMaker Unified Studio, un espacio es un entorno de trabajo que ejecuta un IDE específico. Para aprovechar Code Editor junto a otras interfaces, SageMaker ahora admite múltiples espacios por usuario por proyecto, permitiendo gestionar flujos de trabajo paralelos con distintas necesidades de cómputo. Cada espacio mantiene una relación 1:1 con una instancia de aplicación, ayudando a organizar almacenamiento y recursos. Estos espacios son entornos privados aislados, con funcionalidad de espacio compartido planificada para una versión futura. source. Code Editor puede usarse junto a JupyterLab y otras interfaces dentro de SageMaker Unified Studio. Por cada espacio, se deben especificar tres elementos centrales: tamaño del volumen EBS, tipo de instancia y tipo de aplicación (Code Editor o JupyterLab). Al iniciar un espacio, SageMaker provisiona una instancia de cómputo y lanza la aplicación Code Editor usando la imagen de contenedor elegida. El almacenamiento persiste entre sesiones: el volumen EBS permanece adjunto incluso si se detiene el cómputo y se vuelve a adjuntar al reiniciarse. source. El artículo muestra cómo crear un proyecto de ML y un pipeline que orquesta un flujo típico: preprocessamiento de datos, entrenamiento, evaluación, creación de modelo, transformación y registro del modelo. Puedes subir notebooks al Code Editor arrastrándolos y soltándolos o usando Upload en el explorador de archivos; también puedes clonar notebooks desde un repositorio de GitHub. El Quick Pipeline funciona con permisos IAM por defecto; el Full Pipeline puede requerir permisos adicionales. source. Para preparar a las organizaciones para Code Editor y los espacios múltiples, el artículo describe prerequisitos como la autenticación mediante IAM Identity Center configurada en la misma región que el dominio de SageMaker y MFA en el primer inicio de sesión. También explica dónde encontrar la URL de SageMaker Unified Studio en la consola y cómo eliminar recursos para evitar cargos. source.
Por qué importa (impacto para desarrolladores/empresas)
Para equipos de ingeniería de ML, Code Editor ofrece un conjunto de características avanzadas de IDE que soportan pruebas, depuración y ejecución de pipelines dentro de SageMaker Unified Studio. La relación 1:1 entre espacios y instancias ayuda a organizar almacenamiento y recursos de cómputo, mientras que los espacios múltiples permiten flujos paralelos con requisitos distintos. El almacenamiento EBS persiste entre sesiones, facilitando el desarrollo iterativo y la gestión de costos. El AWS Toolkit para Visual Studio Code facilita la visualización de datos en S3, imágenes en ECR y registros en CloudWatch, optimizando el flujo de desarrollo y depuración. source. Adoptar Code Editor y espacios múltiples puede acelerar la entrega de cargas de ML al reducir el tiempo de cambio de contexto entre herramientas y permitir experimentación paralela. El pipeline de ejemplo ilustra la automatización de extremo a extremo—from preprocessamiento de datos hasta el registro del modelo—en un único entorno unificado, lo que favorece la colaboración entre equipos y acelera las iteraciones. source.
Detalles técnicos o Implementación
El texto explica cómo Code Editor se provisiona dentro de SageMaker Unified Studio. Al crear un espacio, se especifica: tres elementos centrales (tamaño del volumen EBS, tipo de instancia y tipo de aplicación); SageMaker provisiona una instancia de cómputo y lanza la aplicación Code Editor con la imagen de contenedor elegida. El volumen EBS persiste entre sesiones; si se detiene el cómputo, el espacio no se apaga, y el volumen se reatacha al reiniciar. Los tipos de instancia van desde ml.t3.medium hasta familias GPU G6. Los costos dependen del tipo de instancia y hay cargos de almacenamiento mínimos para el volumen EBS; las imágenes de distribución pueden ser 2.6 o 3.1 al lanzamiento, con actualizaciones futuras. Los prerequisitos incluyen IAM Identity Center configurado en la misma región que el dominio y MFA en la primera conexión. El AWS Toolkit para Visual Studio Code está incluido para facilitar la integración con servicios de AWS durante el proyecto. source. El flujo de ejemplo guía a través de la carga y ejecución de un notebook Jupyter que crea un pipeline de ML orquestado por SageMaker Pipelines, cubriendo preprocessamiento de datos, entrenamiento, evaluación, creación y registro del modelo. Puedes subir notebooks a Code Editor arrastrando y soltando o usando Upload, y también puedes clonar notebooks desde un repositorio de GitHub. El Quick Pipeline puede ejecutarse con permisos IAM por defecto; el Full Pipeline puede requerir permisos adicionales. source. Con el fin de evitar cargos, se indica cómo eliminar recursos: espacios Code Editor o JupyterLab a través del panel Spaces en el proyecto, o eliminar el proyecto desde la consola SageMaker Unified Studio. No hay cargo por el dominio SageMaker Unified Studio en sí, aunque se puede eliminar si se desea. source.
Tabla de configuraciones y recursos
| Elemento | Detalles |
|---|---|
| Elementos centrales del espacio | Tamaño del volumen EBS, tipo de instancia, tipo de aplicación (Code Editor o JupyterLab) |
| Rango de instancias | ml.t3.medium a familias GPU G6 |
| Notas de costo | Costo por instancia y cargos mínimos de almacenamiento; apagado inactivo para reducir costos |
| Imágenes de distribución | SageMaker Distribution 2.6 o 3.1 al lanzamiento |
| Regiones | Espacios Code Editor y espacios múltiples disponibles en regiones compatibles |
Conclusiones clave
- Code Editor en SageMaker Unified Studio ofrece una experiencia de IDE similar a VS Code dentro de un entorno de ML/IA unificado.
- Los espacios múltiples permiten flujos paralelos con entornos aislados y configuración por espacio.
- Los pipelines de SageMaker Pipelines permiten la orquestación de preprocessing, entrenamiento y registro de modelos.
- El almacenamiento EBS persiste entre sesiones, facilitando el desarrollo iterativo y la gestión de costos.
- Prerrequisitos incluyen MFA e IAM Identity Center; los recursos pueden eliminarse para evitar cargos continuos.
FAQ
-
¿Qué es SageMaker Unified Studio?
Es un entorno de desarrollo integrado que reúne herramientas para análisis, IA/ML y aplicaciones de IA generativa en SageMaker. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
-
¿Qué es Code Editor en este contexto?
Un IDE basado en Code-OSS/VS Code dentro de SageMaker Unified Studio, con acceso al terminal, depuración y extensiones. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
-
¿Para qué sirven los espacios múltiples?
Permiten flujos paralelos con configuraciones de cómputo distintas para el mismo proyecto. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
-
¿Cómo se gestionan los cargos?
Dependen del tipo de instancia y del almacenamiento; hay un apagado inactivo para reducir costos. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
-
¿Cómo eliminar recursos para evitar cargos continuos?
Elimina los espacios desde la pestaña Espacios o elimina el proyecto desde la consola SageMaker Unified Studio. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
Referencias
More news
NVIDIA HGX B200 reduce la intensidad de las emisiones de carbono incorporado
El HGX B200 de NVIDIA reduce la intensidad de carbono incorporado en un 24% frente al HGX H100, al tiempo que ofrece mayor rendimiento de IA y eficiencia energética. Este artículo resume los datos PCF y las novedades de hardware.
Llevar agentes de IA de concepto a producción con Amazon Bedrock AgentCore
Análisis detallado de cómo Amazon Bedrock AgentCore facilita la transición de aplicaciones de IA basadas en agentes desde un concepto de prueba hasta sistemas de producción empresariales, conservando memoria, seguridad, observabilidad y gestión escalable de herramientas.
Scaleway se une a los Proveedores de Inferencia de Hugging Face para Inferencia Serverless y de Baja Latencia
Scaleway es ahora un Proveedor de Inferencia soportado en Hugging Face Hub, lo que permite inferencia serverless directamente en las páginas de modelos con los SDK de JS y Python. Accede a modelos open-weight populares y disfruta de flujos de IA escalables y de baja latencia.
Cómo reducir cuellos de botella KV Cache con NVIDIA Dynamo
NVIDIA Dynamo offloads KV Cache desde la memoria de la GPU hacia almacenamiento económico, habilitando contextos más largos, mayor concurrencia y costos de inferencia más bajos para grandes modelos y cargas de IA generativa.
Microsoft transforma el sitio de Foxconn en el data center Fairwater AI, descrito como el más poderoso del mundo
Microsoft anuncia planes para un data center Fairwater AI de 1,2 millones de pies cuadrados en Wisconsin, con cientos de miles de GPU Nvidia GB200. El proyecto de 3.3 mil millones de dólares promete un entrenamiento de IA sin precedentes.
Manual de los Grandmasters de Kaggle: 7 Técnicas de Modelado para Datos Tabulares
Un análisis detallado de siete técnicas probadas por los Grandmasters de Kaggle para resolver rápidamente conjuntos de datos tabulares mediante aceleración por GPU, desde baselines variados hasta ensamblaje y pseudo-etiquetado.