Adobe Sube el Volumen con Inteligencia Artificial y Nuevas Formas de Generar Banda Sonora y Audio

Adobe presentó una suite de herramientas de audio impulsadas por inteligencia artificial dentro de su plataforma Firefly, que permite a los creadores generar música de fondo, voz y efectos de sonido directamente desde textos. Las nuevas características incluyen un motor de generación de voz con decenas de voces en múltiples idiomas, una herramienta de generación de banda sonora que produce música libre de regalías que coincide con el contenido de video y una expansión de las asociaciones con ElevenLabs y Topaz Labs. Adobe también introdujo una licencia que permite a los usuarios emplear música creada por inteligencia artificial de forma indefinida. Las actualizaciones tienen como objetivo dar a los creadores más control y flexibilidad mientras simplifican el flujo de trabajo para proyectos con contenido de audio.

Innovaciones de Audio con Inteligencia Artificial en Firefly

Adobe expandió su centro de inteligencia artificial Firefly con un conjunto de capacidades de audio diseñadas para creadores que necesitan música, voz y efectos de sonido sin salir de la plataforma. Basándose en herramientas de audio con inteligencia artificial anteriores que se centraban en efectos de sonido, la nueva suite permite a los usuarios generar bandas sonoras completas y voz sintética en forma beta. La función de generación de banda sonora analiza un video subido, sugiere un texto que describe el ambiente, estilo y propósito, y luego produce varias variaciones de música que coinciden con la longitud del video. La música generada lleva una licencia universal, lo que permite un uso comercial ilimitado.

Motor de Generación de Voz

El generador de voz ofrece una interfaz simple donde los usuarios pueden escribir o pegar un guión —hasta 7,500 caracteres, aproximadamente un video de 15 a 20 minutos— y elegir entre 50 voces distintas. Cada voz está etiquetada con una edad y género aproximados, incluyendo opciones no binarias, y admite 20 idiomas. Los usuarios pueden ajustar la salida agregando pausas, enfatizando secciones o corrigiendo la pronunciación con una herramienta de desglose fonético. Este nivel de control tiene como objetivo dar a los creadores narraciones realistas y expresivas que se sienten naturales.

Licencia y Derechos de Uso

Adobe enfatiza que cualquier música creada con la herramienta de generación de banda sonora viene con una licencia universal, lo que significa que los creadores pueden usar las pistas para cualquier propósito de forma indefinida. La empresa entrena sus modelos de inteligencia artificial con contenido para el que tiene permiso de uso, reduciendo el riesgo de reclamaciones de derechos de autor en plataformas como YouTube. El sistema incluso rechaza textos que hacen referencia a artistas protegidos, asegurando el cumplimiento de las pautas del usuario.

Asociaciones y Opciones de Modelo

Para ampliar su ecosistema de audio con inteligencia artificial, Adobe agregó asociaciones con ElevenLabs y Topaz Labs, integrando el modelo multilingüe V2 de ElevenLabs como una opción de voz adicional. Estas colaboraciones amplían la gama de voces y capacidades disponibles para los usuarios. Adobe también continúa lanzando nuevas versiones de su modelo de imagen Firefly e introduce un editor de video multitrack para ayudar a gestionar clips generados por inteligencia artificial.

Impacto en los Creadores

Según el jefe de audio con inteligencia artificial de Adobe, las herramientas están destinadas a una amplia audiencia —desde propietarios de pequeñas empresas hasta educadores— que pueden carecer de los recursos para producir audio de grado profesional por sí mismos. Al simplificar la creación de música y narración, Adobe espera reducir la confusión sobre la licencia y hacer que el audio generado por inteligencia artificial sea una parte confiable del flujo de trabajo creativo.