Skip to content
STK095_Microsoft_04
Source: theverge.com

Microsoft AI lanza sus primeros modelos internos MAI-Voice-1 y MAI-1-preview

Sources: https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai, The Verge AI

TL;DR

  • La división de IA de Microsoft anunció sus primeros modelos internos: MAI-Voice-1 AI y MAI-1-preview. The Verge
  • MAI-Voice-1 puede generar un minuto de audio en menos de un segundo en una sola GPU y alimenta Copilot Daily y discusiones en formato de podcast. The Verge
  • MAI-1-preview fue entrenado en alrededor de 15,000 GPUs Nvidia H100 y busca seguir instrucciones para respuestas útiles ante consultas cotidianas, con despliegue planeado para casos de uso de texto en Copilot. The Verge
  • Esta iniciativa sitúa los modelos internos de Microsoft junto a su asociación con OpenAI, con el objetivo de ofrecer una gama de modelos especializados para diferentes intenciones y casos de uso. The Verge
  • El liderazgo enfatiza un enfoque centrado en el consumidor y la utilidad práctica, no solo en escenarios empresariales. The Verge

Contexto y antecedentes

La estrategia de IA de Microsoft equilibra el desarrollo interno con el uso de su asociación con OpenAI. Este anuncio presenta MAI-Voice-1 y MAI-1-preview como los primeros modelos desarrollados internamente. Estos modelos forman parte de un esfuerzo más amplio para brindar capacidades orientadas al consumidor que pueden operar junto a herramientas basadas en OpenAI en Copilot. La declaración destaca el deseo de crear modelos que funcionen extremadamente bien para el consumidor y que estén optimizados para la experiencia del usuario, como señaló Suleyman en declaraciones anteriores. The Verge MAI-Voice-1 se describe como un modelo de voz capaz de generar un minuto de audio en menos de un segundo en una única GPU. Microsoft ya utiliza MAI-Voice-1 internamente para alimentar características como Copilot Daily, donde un presentador IA lee las noticias principales del día, y para generar discusiones al estilo podcast para explicar temas. Los usuarios pueden probar MAI-Voice-1 a través de Copilot Labs, donde pueden indicar lo que la IA debe decir y ajustar la voz y el estilo de habla. The Verge Además de MAI-Voice-1, Microsoft presentó MAI-1-preview, diseñado para usuarios que necesitan un modelo de IA capaz de seguir instrucciones y proporcionar respuestas útiles. MAI-1-preview fue entrenado en alrededor de 15,000 GPUs Nvidia H100. Se planea desplegar MAI-1-preview para ciertos casos de uso de texto en Copilot y ya se están realizando pruebas públicas en LMArena. The Verge Mustafa Suleyman, jefe de IA en Microsoft, ha enfatizado que los modelos internos no se limitan a usos empresariales, sino que deben funcionar muy bien para el consumidor. La empresa describe una ambición de orquestar una gama de modelos especializados para diferentes intenciones y escenarios de uso, lo que podría desbloquear un valor significativo. The Verge

¿Qué hay de nuevo?

MAI-Voice-1 y MAI-1-preview marcan la entrada de Microsoft en el ámbito de modelos de IA desarrollados en casa, ampliando las capacidades disponibles dentro de Copilot y otros productos. MAI-Voice-1 admite contenido hablado y personalización de voz, permitiendo que Copilot Daily presente noticias en formato hablado y ofrezca discusiones al estilo de un podcast para explicar temas. MAI-1-preview se centra en seguir instrucciones y proporcionar respuestas útiles para tareas cotidianas, con entrenamiento en un conjunto grande de GPUs y con un despliegue planificado para usos textuales específicos en Copilot. El objetivo es que estos modelos completen las capacidades basadas en OpenAI y ofrezcan opciones especializadas para distintas tareas. The Verge La implementación prevista incluye pruebas y despliegues escalonados: MAI-1-preview se está probando en LMArena y se integrará a Copilot para usos textuales, con una fase de lanzamiento más amplia en el futuro. Este enfoque señala el interés de Microsoft en validar el rendimiento en tareas del mundo real y ofrecer experiencias de IA tangibles que puedan escalar a través de su ecosistema de software. The Verge

Por qué importa (impacto para desarrolladores/empresas)

Estos desarrollos reflejan una visión estratégica más amplia: ofrecer un portafolio de modelos especializados internos que pueden operar junto a las ofertas de OpenAI para ampliar las capacidades en Copilot y productos asociados. Al buscar capacidades centradas en el consumidor, Microsoft pretende complementar su asociación con OpenAI y garantizar que las tecnologías internas puedan abordar escenarios de usuario de forma rápida y eficiente — como generar contenido hablado de manera ágil y manejar consultas cotidianas de manera útil. La idea de orquestar múltiples modelos especializados sugiere que los desarrolladores y las empresas podrán acceder a un conjunto diversificado de herramientas IA adaptadas a tareas e intenciones específicas. The Verge Desde la perspectiva empresarial, la introducción de MAI-1-preview podría abrir rutas de costo y rendimiento al experimentar con modelos internos junto a LLMs externos. Las empresas que ya usan Copilot para tareas textuales podrían beneficiarse de nuevas opciones de flujo de IA, con posibles integraciones entre modelos internos y servicios externos. El énfasis en la utilidad para el consumidor sugiere que la primera ola de modelos internos se orienta a experiencias de consumo amplio. The Verge

Detalles técnicos o Implementación

  • MAI-Voice-1 AI: modelo de voz capaz de generar un minuto de audio en menos de un segundo usando una única GPU. Ya está integrado en características como Copilot Daily y se utiliza para generar discusiones en formato podcast. Acceso disponible mediante Copilot Labs, donde se puede indicar lo que la IA debe decir y ajustar la voz y el estilo de habla. The Verge
  • MAI-1-preview: diseñado para seguir instrucciones y brindar respuestas útiles; entrenado en alrededor de 15,000 GPUs Nvidia H100. Plan para desplegarlo en usos textuales de Copilot; pruebas públicas en LMArena. The Verge
  • Integración con Copilot: MAI-1-preview se desplegará para usos textuales en Copilot, que actualmente se basa en LLMs de OpenAI. Esto indica una pila de IA heterogénea donde modelos internos complementan LLMs externos para tareas específicas. The Verge
  • Gobernanza y ambición: el anuncio describe la idea de orquestar múltiples modelos especializados para diferentes intenciones y casos de uso, alineado con experiencias IA centradas en el consumidor. The Verge | Modelo | Capacidad notable | Entrenamiento/Recursos | Implementación/Pruebas actuales |--- |--- |--- |--- |MAI-Voice-1 AI | Genera un minuto de audio en menos de un segundo con una sola GPU | Modelo interno; utilizado en el ecosistema Copilot | Alimenta Copilot Daily; disponible vía Copilot Labs con controles de voz |MAI-1-preview | Sigue instrucciones; proporciona respuestas útiles | Entrenado en alrededor de 15,000 GPUs Nvidia H100 | Desplegado para usos textuales en Copilot; pruebas públicas en LMArena |

Puntos clave

  • Microsoft lanza sus primeros modelos IA desarrollados internamente, expandiendo capacidades internas junto a la asociación con OpenAI.
  • MAI-Voice-1 permite generación rápida de contenido hablado y está integrado a Copilot Daily y experiencias relacionadas.
  • MAI-1-preview se orienta a seguir instrucciones para tareas cotidianas y está sujeto a pruebas públicas y despliegue en Copilot.
  • La empresa busca orquestar una gama de modelos especializados para atender diferentes intenciones y casos de uso.
  • La dirección enfatiza resultados centrados en el consumidor y utilidades prácticas, no solo enfoques empresariales.

FAQ

  • ¿Qué son MAI-Voice-1 y MAI-1-preview?

    Son los primeros modelos IA desarrollados por Microsoft, destinados a soportar contenido hablado y tareas de seguimiento de instrucciones, respectivamente. MAI-Voice-1 alimenta Copilot Daily; MAI-1-preview apunta a usos textuales. [The Verge](https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai)

  • ¿Dónde se están usando estos modelos hoy en día?

    MAI-Voice-1 alimenta Copilot Daily y discusiones en formato podcast; MAI-1-preview está en despliegue para usos textuales en Copilot y se prueba públicamente en LMArena. [The Verge](https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai)

  • ¿Cuántos recursos se utilizaron para entrenar MAI-1-preview?

    lrededor de 15,000 GPUs Nvidia H100. [The Verge](https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai)

  • ¿Cuál es el objetivo estratégico detrás de estos modelos internos?

    Orquestar una gama de modelos especializados para distintas intenciones y casos de uso, complementando las ofertas de OpenAI y enfocándose en experiencias centradas en el consumidor. [The Verge](https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai)

Referencias

More news