Acelera el trabajo de ML con Code Editor en SageMaker Unified Studio

TL;DR

SageMaker Unified Studio incluye Code Editor (basado en Code-OSS/VS Code) para un IDE ligero y potente dentro de un entorno unificado de análisis e IA.
Espacios múltiples por usuario por proyecto permiten flujos de trabajo paralelos con diferentes necesidades de cómputo; cada espacio tiene una relación 1:1 con una instancia de aplicación.
Los espacios son entornos privados (se planea un espacio compartido en una versión futura) y Code Editor se integra con GitHub, GitLab o Bitbucket para control de versiones y colaboración.
Las opciones de cómputo van desde ml.t3.medium hasta familias GPU G6, con apagado automático de espacios inactivos y almacenamiento EBS persistente entre sesiones.
El flujo de ejemplo utiliza SageMaker Pipelines para construir, entrenar, evaluar y, opcionalmente, desplegar modelos ML; los prerequisitos incluyen IAM Identity Center y MFA. Para más detalles, vea el artículo original en el blog de AWS: https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/.

Contexto y antecedentes

SageMaker Unified Studio se describe como un entorno de desarrollo integrado (IDE) único que reúne herramientas para análisis y IA. Proporciona herramientas integradas para construir pipelines de datos, compartir conjuntos de datos, supervisar la gobernanza de datos, realizar análisis SQL y crear modelos ML y aplicaciones de IA generativa. AWS introdujo dos opciones para mejorar la experiencia de desarrollo para equipos de análisis, ML y IA generativa: Code Editor y espacios múltiples. Code Editor, basado en Code-OSS (Visual Studio Code – Open Source), ofrece un IDE ligero con acceso al terminal, depuración avanzada y herramientas de refactorización, y permite acceder a numerosas extensiones desde el Open VSX. source. En SageMaker Unified Studio, un espacio es un entorno de trabajo que ejecuta un IDE específico. Para aprovechar Code Editor junto a otras interfaces, SageMaker ahora admite múltiples espacios por usuario por proyecto, permitiendo gestionar flujos de trabajo paralelos con distintas necesidades de cómputo. Cada espacio mantiene una relación 1:1 con una instancia de aplicación, ayudando a organizar almacenamiento y recursos. Estos espacios son entornos privados aislados, con funcionalidad de espacio compartido planificada para una versión futura. source. Code Editor puede usarse junto a JupyterLab y otras interfaces dentro de SageMaker Unified Studio. Por cada espacio, se deben especificar tres elementos centrales: tamaño del volumen EBS, tipo de instancia y tipo de aplicación (Code Editor o JupyterLab). Al iniciar un espacio, SageMaker provisiona una instancia de cómputo y lanza la aplicación Code Editor usando la imagen de contenedor elegida. El almacenamiento persiste entre sesiones: el volumen EBS permanece adjunto incluso si se detiene el cómputo y se vuelve a adjuntar al reiniciarse. source. El artículo muestra cómo crear un proyecto de ML y un pipeline que orquesta un flujo típico: preprocessamiento de datos, entrenamiento, evaluación, creación de modelo, transformación y registro del modelo. Puedes subir notebooks al Code Editor arrastrándolos y soltándolos o usando Upload en el explorador de archivos; también puedes clonar notebooks desde un repositorio de GitHub. El Quick Pipeline funciona con permisos IAM por defecto; el Full Pipeline puede requerir permisos adicionales. source. Para preparar a las organizaciones para Code Editor y los espacios múltiples, el artículo describe prerequisitos como la autenticación mediante IAM Identity Center configurada en la misma región que el dominio de SageMaker y MFA en el primer inicio de sesión. También explica dónde encontrar la URL de SageMaker Unified Studio en la consola y cómo eliminar recursos para evitar cargos. source.

Por qué importa (impacto para desarrolladores/empresas)

Para equipos de ingeniería de ML, Code Editor ofrece un conjunto de características avanzadas de IDE que soportan pruebas, depuración y ejecución de pipelines dentro de SageMaker Unified Studio. La relación 1:1 entre espacios y instancias ayuda a organizar almacenamiento y recursos de cómputo, mientras que los espacios múltiples permiten flujos paralelos con requisitos distintos. El almacenamiento EBS persiste entre sesiones, facilitando el desarrollo iterativo y la gestión de costos. El AWS Toolkit para Visual Studio Code facilita la visualización de datos en S3, imágenes en ECR y registros en CloudWatch, optimizando el flujo de desarrollo y depuración. source. Adoptar Code Editor y espacios múltiples puede acelerar la entrega de cargas de ML al reducir el tiempo de cambio de contexto entre herramientas y permitir experimentación paralela. El pipeline de ejemplo ilustra la automatización de extremo a extremo—from preprocessamiento de datos hasta el registro del modelo—en un único entorno unificado, lo que favorece la colaboración entre equipos y acelera las iteraciones. source.

Detalles técnicos o Implementación

El texto explica cómo Code Editor se provisiona dentro de SageMaker Unified Studio. Al crear un espacio, se especifica: tres elementos centrales (tamaño del volumen EBS, tipo de instancia y tipo de aplicación); SageMaker provisiona una instancia de cómputo y lanza la aplicación Code Editor con la imagen de contenedor elegida. El volumen EBS persiste entre sesiones; si se detiene el cómputo, el espacio no se apaga, y el volumen se reatacha al reiniciar. Los tipos de instancia van desde ml.t3.medium hasta familias GPU G6. Los costos dependen del tipo de instancia y hay cargos de almacenamiento mínimos para el volumen EBS; las imágenes de distribución pueden ser 2.6 o 3.1 al lanzamiento, con actualizaciones futuras. Los prerequisitos incluyen IAM Identity Center configurado en la misma región que el dominio y MFA en la primera conexión. El AWS Toolkit para Visual Studio Code está incluido para facilitar la integración con servicios de AWS durante el proyecto. source. El flujo de ejemplo guía a través de la carga y ejecución de un notebook Jupyter que crea un pipeline de ML orquestado por SageMaker Pipelines, cubriendo preprocessamiento de datos, entrenamiento, evaluación, creación y registro del modelo. Puedes subir notebooks a Code Editor arrastrando y soltando o usando Upload, y también puedes clonar notebooks desde un repositorio de GitHub. El Quick Pipeline puede ejecutarse con permisos IAM por defecto; el Full Pipeline puede requerir permisos adicionales. source. Con el fin de evitar cargos, se indica cómo eliminar recursos: espacios Code Editor o JupyterLab a través del panel Spaces en el proyecto, o eliminar el proyecto desde la consola SageMaker Unified Studio. No hay cargo por el dominio SageMaker Unified Studio en sí, aunque se puede eliminar si se desea. source.

Tabla de configuraciones y recursos

Elemento	Detalles
Elementos centrales del espacio	Tamaño del volumen EBS, tipo de instancia, tipo de aplicación (Code Editor o JupyterLab)
Rango de instancias	ml.t3.medium a familias GPU G6
Notas de costo	Costo por instancia y cargos mínimos de almacenamiento; apagado inactivo para reducir costos
Imágenes de distribución	SageMaker Distribution 2.6 o 3.1 al lanzamiento
Regiones	Espacios Code Editor y espacios múltiples disponibles en regiones compatibles

Conclusiones clave

Code Editor en SageMaker Unified Studio ofrece una experiencia de IDE similar a VS Code dentro de un entorno de ML/IA unificado.
Los espacios múltiples permiten flujos paralelos con entornos aislados y configuración por espacio.
Los pipelines de SageMaker Pipelines permiten la orquestación de preprocessing, entrenamiento y registro de modelos.
El almacenamiento EBS persiste entre sesiones, facilitando el desarrollo iterativo y la gestión de costos.
Prerrequisitos incluyen MFA e IAM Identity Center; los recursos pueden eliminarse para evitar cargos continuos.

FAQ

¿Qué es SageMaker Unified Studio?

Es un entorno de desarrollo integrado que reúne herramientas para análisis, IA/ML y aplicaciones de IA generativa en SageMaker. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
¿Qué es Code Editor en este contexto?

Un IDE basado en Code-OSS/VS Code dentro de SageMaker Unified Studio, con acceso al terminal, depuración y extensiones. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
¿Para qué sirven los espacios múltiples?

Permiten flujos paralelos con configuraciones de cómputo distintas para el mismo proyecto. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
¿Cómo se gestionan los cargos?

Dependen del tipo de instancia y del almacenamiento; hay un apagado inactivo para reducir costos. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).
¿Cómo eliminar recursos para evitar cargos continuos?

Elimina los espacios desde la pestaña Espacios o elimina el proyecto desde la consola SageMaker Unified Studio. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).