Skip to content
Acelere o trabalho com ML usando Code Editor no SageMaker Unified Studio
Source: aws.amazon.com

Acelere o trabalho com ML usando Code Editor no SageMaker Unified Studio

Sources: https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio

TL;DR

  • O SageMaker Unified Studio inclui o Code Editor (baseado no Code-OSS/VS Code) para um IDE leve e poderoso dentro de um espaço único de analytics e IA.
  • Espaços múltiplos por usuário por projeto permitem fluxos de trabalho paralelos com necessidades de compute diferentes, cada espaço com 1:1 em relação a uma instância de aplicativo.
  • Espaços são ambientes privados (compartilhamento planejado para o futuro); o Code Editor se integra ao GitHub, GitLab ou Bitbucket para controle de versão e colaboração.
  • As opções de computação vão de ml.t3.medium a famílias GPU G6, com desligamento automático de espaço ocioso e armazenamento EBS persistente entre sessões.
  • O fluxo de exemplo usa SageMaker Pipelines para construir, treinar, avaliar e, opcionalmente, implantar modelos de ML; pré-requisitos incluem IAM Identity Center e MFA. Para detalhes completos, veja o post original no blog da AWS: https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/.

Contexto e antecedentes

O SageMaker Unified Studio é descrito como um ambiente de desenvolvimento integrado (IDE) único que consolida ferramentas para analytics e IA. Ele oferece ferramentas integradas para construção de pipelines de dados, compartilhamento de datasets, governança de dados, análises SQL, e para criar modelos de IA/ML e aplicações de IA generativa. A AWS introduziu duas opções novas para melhorar a experiência de desenvolvimento para equipes de analytics, ML e IA generativa: Code Editor e espaços múltiplos. O Code Editor, baseado no Code-OSS (Visual Studio Code – Open Source), oferece um IDE leve, poderoso, com atalhos familiares, acesso ao terminal, depuração avançada e ferramentas de refatoração, além de inúmeras extensões disponíveis no repositório Open VSX. O IDE VSCode, bem como variantes Code-OSS como Code Editor, permanece como uma das ferramentas de desenvolvimento mais populares. Equipes podem aumentar a produtividade acessando milhares de extensões compatíveis com Code Editor no Open VSX. source. No SageMaker Unified Studio, um espaço é um ambiente de trabalho que executa um IDE específico. Para maximizar os benefícios do Code Editor junto a outras interfaces de codificação no SageMaker Unified Studio, o suporte a múltiplos espaços por usuário por projeto foi expandido, permitindo gerenciar fluxos de trabalho paralelos com necessidades computacionais diferentes. Cada espaço mantém uma relação 1:1 com uma instância de aplicação, ajudando a organizar armazenamento e requisitos de recursos. Esses espaços são ambientes privados isolados, com funcionalidade de espaço compartilhado planejada para uma versão futura. source. O Code Editor, que se integra ao JupyterLab e a outras interfaces, vem configurado com três elementos centrais por espaço: o tamanho do volume EBS, o tipo de instância e o tipo de aplicação (Code Editor ou JupyterLab). Ao iniciar um espaço, a SageMaker Unified Studio provisiona uma instância de computação e inicia o aplicativo Code Editor usando a imagem de contêiner escolhida. O armazenamento persiste entre sessões: o volume EBS fica ligado mesmo que o compute seja interrompido, sendo reanexado na reinicialização para manter o trabalho. source. O post demonstra criar um projeto de ML e um pipeline usando SageMaker Pipelines para automatizar preprocessamento de dados, treinamento, avaliação, criação de modelo, transformação e registro do modelo. Você pode enviar notebooks para o Code Editor arrastando e soltando ou usando Upload no explorador de arquivos; notebooks também podem ser clonados de repositórios GitHub. O Quick Pipeline funciona com permissões IAM padrão, enquanto o Full Pipeline pode exigir permissões adicionais. source. Para preparar organizações para o Code Editor e espaços múltiplos, o post descreve pré-requisitos como autenticação via IAM Identity Center (em uma Região compatível com o domínio SageMaker) e MFA, além de indicar onde encontrar o URL do SageMaker Unified Studio no console. Também esclarece como excluir recursos para evitar cobranças. source.

Por que isso importa (impacto para desenvolvedores/empresas)

Para equipes de engenharia de ML, o Code Editor oferece recursos avançados de IDE que apoiam teste, depuração e execução de pipelines diretamente no SageMaker Unified Studio. A relação 1:1 entre espaços e instâncias ajuda a organizar recursos de armazenamento e computação, enquanto espaços múltiplos permitem fluxos paralelos com requisitos distintos. O armazenamento EBS persiste entre sessões, facilitando o desenvolvimento incremental e a gestão de custos. O AWS Toolkit para Visual Studio Code facilita o acesso a serviços AWS (S3, ECR, CloudWatch) e facilita o monitoramento e a depuração, integrando-se ao fluxo de desenvolvimento. source. Adotar Code Editor e espaços múltiplos reduz o tempo de entrega de workloads de ML ao diminuir a troca de contexto entre ferramentas e permitir experimentação paralela. O pipeline de exemplo demonstra automação fim-a-fim—from preprocessamento de dados até registro de modelos—em um único ambiente unificado, o que pode impulsionar a colaboração entre equipes e acelerar iterações. source.

Detalhes técnicos ou Implementação

O post descreve como o Code Editor é provisionado dentro do SageMaker Unified Studio. Ao criar um espaço, você especifica três elementos centrais: tamanho do volume EBS, tipo de instância e tipo de aplicação; a SageMaker Provisiona uma instância de computação e inicia o app Code Editor com a imagem de contêiner escolhida. O volume EBS permanece entre sessões; se você parar o compute, o espaço não é desligado, mas o volume continua ligado e é reanexado na reinicialização. Os tipos de instância vão de ml.t3.medium até as famílias GPU G6. Os custos estão vinculados ao tipo de instância escolhido, com custos mínimos de armazenamento para o volume EBS. As imagens de distribuição do SageMaker podem ser 2.6 ou 3.1 no lançamento, com novas versões adicionadas com o tempo. Pré-requisitos incluem IAM Identity Center configurado na mesma Região do domínio SageMaker e MFA na primeira autenticação. O AWS Toolkit para Visual Studio Code está incluído para facilitar a integração com serviços AWS durante o projeto. source. O fluxo de exemplo orienta a carregar e executar um notebook Jupyter que cria um pipeline de ML orquestrado pelo SageMaker Pipelines, cobrindo preprocessamento, treinamento, avaliação, criação e registro do modelo. Notebooks podem ser enviados via arrastar e soltar ou via Upload no explorador de arquivos, e notebooks podem ser clonados de repositórios GitHub. O Quick Pipeline funciona com permissões IAM padrão; o Full Pipeline pode exigir permissões adicionais. source. Custos e limpeza são explicitamente descritos: existe um custo principal associado ao tipo de instância escolhido, custos de armazenamento mínimos para o volume EBS e um tempo limite de inatividade para desligar espaços ociosos. Para evitar cobranças, exclua recursos criados, como espaços Code Editor ou JupyterLab, pelo painel Espaços na navegação de Compute do Projeto, ou exclua o projeto pelo console SageMaker Unified Studio. Não há cobrança pelo domínio SageMaker Unified Studio em si, embora seja possível excluir o domínio opcionalmente. source.

Tabela de configurações e recursos

ElementoDetalhes
Elementos centrais do espaçoTamanho do volume EBS, tipo de instância, tipo de aplicação (Code Editor ou JupyterLab)
Faixa de instânciasml.t3.medium até famílias GPU G6
Observações de cobrançaCustos por instância e cobranças mínimas de armazenamento; desligamento ocioso para economizar
Imagens de distribuiçãoSageMaker Distribution 2.6 ou 3.1 no lançamento
RegiõesEspaços Code Editor e espaços múltiplos disponíveis em regiões compatíveis

Principais conclusões

  • Code Editor em SageMaker Unified Studio oferece um IDE estilo VS Code dentro de um espaço unificado para ML/IA.
  • Espaços múltiplos por usuário por projeto permitem fluxos paralelos com ambientes isolados e configuração por espaço.
  • Fluxos de trabalho podem ser automatizados com SageMaker Pipelines, do preprocessamento à registro de modelos.
  • O armazenamento EBS persiste entre sessões, facilitando desenvolvimento incremental e gestão de custos.
  • Pré-requisitos incluem IAM Identity Center e MFA; recursos podem ser limpos para evitar cobranças.

FAQ

  • O que é SageMaker Unified Studio?

    É um ambiente de desenvolvimento integrado que combina ferramentas de analytics, IA/ML e IA generativa no SageMaker. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).

  • O que é Code Editor neste contexto?

    Um IDE baseado em Code-OSS/VS Code dentro do SageMaker Unified Studio, com acesso a terminal, depuração avançada e extensões. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).

  • Para que servem os espaços múltiplos por projeto?

    Permitem fluxos paralelos com configurações de computação distintas, mantendo ambientes isolados. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).

  • Como as cobranças são gerenciadas?

    Cobranças são por instância e armazenamento; há desligamento automático para espaços ociosos. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).

  • Como apagar recursos para evitar cobranças contínuas?

    Exclua espaços pelo painel Espaços ou remova o projeto pelo console SageMaker Unified Studio. [source](https://aws.amazon.com/blogs/machine-learning/speed-up-delivery-of-ml-workloads-using-code-editor-in-amazon-sagemaker-unified-studio/).

Referências

More news