Microsoft lanza tres modelos de inteligencia artificial internos, lo que señala un cambio en la asociación con OpenAI

Microsoft Launches Three In-House AI Models, Signaling Shift From OpenAI Partnership

Puntos clave

  • Microsoft lanzó tres modelos de inteligencia artificial internos - MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2 - en su plataforma Foundry.
  • MAI-Transcribe-1 logra una tasa de error de palabra del 3,8% en 25 idiomas, superando a OpenAI, Google y ElevenLabs en múltiples benchmarks.
  • MAI-Voice-1 genera 60 segundos de audio en menos de un segundo y admite la creación de voz personalizada a partir de muestras mínimas.
  • MAI-Image-2 se ubicó en el tercer lugar en el leaderboard de texto a imagen de Arena.ai, solo detrás de los modelos de Google y OpenAI.
  • Los modelos fueron construidos por un equipo de diez personas dentro de la unidad de superinteligencia MAI de Microsoft, liderada por el CEO Mustafa Suleyman.
  • Una renegociación de contrato con OpenAI en septiembre de 2025 dio a Microsoft la libertad de desarrollar modelos competitivos.
  • Foundry ahora sirve a más de 80.000 empresas, incluyendo aproximadamente el 80% de las empresas Fortune 500.
  • OpenAI sigue siendo el mayor socio de inteligencia artificial de Microsoft, pero ambas empresas ahora compiten en la misma plataforma.

Seis meses después de renegociar su contrato con OpenAI, Microsoft presentó MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2 en su plataforma Foundry. Los nuevos modelos, construidos por un equipo de diez personas, cuentan con tasas de error más bajas, velocidades más rápidas y precios competitivos, lo que da a la empresa de tecnología una pila de inteligencia artificial funcional e independiente de su antigua asociación. El lanzamiento subraya la nueva libertad de Microsoft para perseguir la "superinteligencia humanista" y podría redefinir el gasto en inteligencia artificial empresarial.

Microsoft anunció el lanzamiento público de tres modelos de inteligencia artificial de código abierto - MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2 - en su plataforma Foundry, lo que marca la primera producción tangible del equipo de superinteligencia MAI de la empresa. Los modelos llegan justo semanas después de cambios a nivel ejecutivo que liberaron al CEO Mustafa Suleyman de sus deberes diarios de producto, lo que le permite centrarse en construir una suite de herramientas de inteligencia artificial que operan enteramente en la infraestructura de Microsoft.

MAI-Transcribe-1, un sistema de habla a texto, afirma tener la tasa de error de palabra más baja en 25 idiomas en el benchmark FLEURS, con un promedio de 3,8 por ciento. Microsoft dice que supera a OpenAI’s Whisper-large-v3 en todos los idiomas, supera a Google’s Gemini 3.1 Flash en 22 de los 25 idiomas y supera a ElevenLabs’ Scribe v2 en 15. El modelo se ejecuta 2,5 veces más rápido que el servicio de transcripción Azure Fast anterior y tiene un precio de $0,36 por hora de audio. El equipo de desarrollo detrás de él estaba formado por solo diez personas.

MAI-Voice-1 completa la canalización de audio. El modelo de texto a habla puede generar un minuto de audio con sonido natural en menos de un segundo en una sola GPU y admite la creación de voz personalizada a partir de solo unos segundos de audio de muestra. Cuando se combina con MAI-Transcribe-1 y un modelo de lenguaje grande elegido por el cliente, la dupla ofrece una solución de voz completa que no depende de ninguna tecnología de OpenAI.

La tercera oferta, MAI-Image-2, entró en el leaderboard de texto a imagen de Arena.ai en marzo en el número tres, solo detrás de Google’s Gemini 3.1 Flash y OpenAI’s GPT Image 1.5. Desarrollado con la participación de fotógrafos, diseñadores y narradores visuales, el modelo ya se está utilizando a gran escala por WPP, uno de los grupos de marketing más grandes del mundo.

Los lanzamientos son más que hitos técnicos; reflejan un cambio estratégico habilitado por una renegociación de contrato con OpenAI en septiembre de 2025. El nuevo memorando de entendimiento otorgó a Microsoft los derechos de licencia para todos los resultados de OpenAI hasta 2032, aseguró $250 mil millones en compromisos adicionales de nube Azure y, crucialmente, eliminó la cláusula que prohibía a Microsoft construir sus propios modelos de inteligencia artificial de propósito general. Suleyman citó la renegociación como el catalizador que permitió a la empresa perseguir su agenda de "superinteligencia humanista".

La plataforma Foundry de Microsoft - anteriormente Azure AI Foundry y Azure AI Studio - ahora sirve a más de 80.000 empresas, incluyendo aproximadamente el 80 por ciento de las empresas Fortune 500. Esa ventaja de distribución significa que los modelos MAI no necesitan dominar todos los benchmarks para cambiar el gasto en inteligencia artificial empresarial hacia soluciones construidas por Microsoft. Simplemente tienen que ser lo suficientemente competitivos para que los clientes elijan una opción integrada en lugar de alternativas de terceros.

OpenAI se encuentra en una posición matizada. Si bien Microsoft sigue siendo su mayor inversor y proveedor de nube principal, ambas empresas ahora compartan una plataforma que alberga tanto modelos de OpenAI como de Microsoft. La ronda de recaudación de fondos de OpenAI en febrero, que recaudó $110 mil millones y valoró a la empresa de forma independiente de Microsoft, sugiere que la asociación está evolucionando hacia un mercado en el que ambas partes compiten lado a lado.

El panorama más amplio de la inteligencia artificial refleja esta fragmentación. La reciente recaudación de $30 mil millones de Anthropic y las rápidas iteraciones de Gemini de Google subrayan un mercado que ya no está dominado por un solo proveedor de inteligencia artificial de vanguardia. La nueva familia de modelos de Microsoft agrega un cuarto peso pesado a la mezcla, lo que da a las empresas más opciones y señala que la era de la canalización de inteligencia artificial exclusiva de OpenAI-Microsoft está terminando.

Suleyman advierte que los modelos actuales son fundamentales. Espera que el equipo de superinteligencia entregue modelos de lenguaje de clase frontera dentro de uno o dos años, pero por ahora la tríada proporciona a Microsoft su propia voz, oídos y ojos: una pila de inteligencia artificial independiente que podría redefinir la forma en que las empresas asignan el gasto en inteligencia artificial.

#Microsoft#inteligencia artificial#MAI-Transcribe-1#MAI-Voice-1#MAI-Image-2#OpenAI#Azure#Foundry#superinteligencia#inteligencia artificial empresarial#habla a texto#texto a habla#texto a imagen

También disponible en:

Microsoft lanza tres modelos de inteligencia artificial internos, lo que señala un cambio en la asociación con OpenAI | AI News