Mira Murati's Thinking Machines Presenta Modelos de Interacción en Tiempo Real para Colaboración de IA

Puntos clave
- Thinking Machines anuncia el desarrollo de "modelos de interacción" que procesan audio, video y texto en tiempo real.
- Los modelos de IA actuales operan de manera monohilo, pausando hasta que los usuarios terminen de ingresar datos.
- Los nuevos modelos tienen como objetivo eliminar la congelación de la percepción, permitiendo una colaboración multimodal y continua.
- Los videos de demostración muestran la detección en vivo de menciones de animales, la traducción de habla en tiempo real y las alertas de postura.
- Se planea una vista previa de investigación limitada para los próximos meses; una versión más amplia está programada para más tarde este año.
- La fundadora Mira Murati dejó OpenAI en febrero de 2025; la startup ha enfrentado notables salidas de personal.
- Las aplicaciones potenciales abarcan la educación, el trabajo remoto, la accesibilidad y más.
Thinking Machines, la startup de inteligencia artificial fundada por la ex directora de tecnología de OpenAI Mira Murati, anunció el lunes que está desarrollando "modelos de interacción"—sistemas que procesan audio, video y texto simultáneamente y responden en tiempo real. La empresa afirma que los modelos de IA actuales operan de manera monohilo, creando un cuello de botella que limita la colaboración natural entre humanos y IA.
Thinking Machines, la empresa de IA lanzada por la ex directora de tecnología de OpenAI Mira Murati, reveló el lunes que está construyendo lo que llama "modelos de interacción". La empresa describe estos modelos como capaces de ingerir flujos de audio, video y texto al mismo tiempo, y luego pensar, responder y actuar sin las pausas que caracterizan a los sistemas generativos actuales.
Los modelos actuales, según la empresa, esperan a que el usuario termine de hablar o escribir antes de generar una respuesta. Durante esa pausa, la percepción del modelo se congela, perdiendo cualquier nuevo indicio. "Eso crea un canal estrecho para la colaboración entre humanos y IA", escribió la empresa, comparándolo con intentar resolver un debate acalorado por correo electrónico en lugar de cara a cara.
Los modelos de interacción tienen como objetivo eliminar ese cuello de botella. Al mantenerse al tanto de una conversación en tiempo real, pueden adaptarse a cambios en el tono, el gesto o el contexto a medida que ocurren. El enfoque, según Murati, permite que la IA se encuentre con las personas donde están, en lugar de obligar a los usuarios a adaptarse a la interfaz limitada de la IA.
Demos en vivo ilustran la promesa
Thinking Machines compartió varios videos de demostración. En uno, el modelo escucha a un narrador y resalta cada mención de un animal, demostrando un procesamiento auditivo continuo. Otro clip muestra el sistema traduciendo el lenguaje hablado en tiempo real, mientras que un tercero alerta a un participante cuando comienza a encorvarse, utilizando señales visuales para proporcionar retroalimentación instantánea. Las demos subrayan la afirmación de la empresa de que la interacción multimodal en tiempo real puede hacer que la IA se sienta más como un socio colaborador.
Murati, quien fundó Thinking Machines en febrero de 2025 después de dejar OpenAI, reconoció que la startup ya ha superado un importante cambio de personal, con algunos ingenieros clave migrando a Meta e incluso regresando a OpenAI. "Hemos aprendido mucho sobre la construcción de equipos resilientes mientras empujamos la frontera de la IA", dijo.
La empresa no está ofreciendo la tecnología al público todavía. Planea una "vista previa de investigación limitada" en los próximos meses, dirigida a socios seleccionados que puedan ayudar a refinar los modelos. Una versión más amplia está programada para más tarde este año, aunque no se proporcionó un cronograma específico.
Los observadores de la industria señalan que la IA en tiempo real y multimodal podría abrir nuevas aplicaciones en educación, trabajo remoto y accesibilidad. Si tiene éxito, los modelos de interacción podrían presionar a los jugadores más grandes para acelerar capacidades similares, lo que podría cambiar la forma en que los desarrolladores integran la IA en herramientas cotidianas.
Por ahora, Thinking Machines invita a los investigadores interesados a registrarse para obtener actualizaciones en su sitio web. La empresa promete una documentación técnica más detallada en las próximas semanas, ofreciendo una visión del futuro en el que la IA responde con la misma fluidez que un socio humano.