CEO da ElevenLabs Declara que a Voz é a Próxima Grande Interface de IA

ElevenLabs CEO Declares Voice the Next Major AI Interface

Pontos principais

  • CEO da ElevenLabs afirma que a voz se tornará a principal interface de IA.
  • Novos modelos de voz podem expressar emoção e trabalhar com grandes modelos de linguagem.
  • A empresa está desenvolvendo uma arquitetura de processamento híbrido de nuvem e dispositivo.
  • Parcerias com a Meta trazem tecnologia de voz para Instagram, Horizon Worlds e potencialmente óculos inteligentes.
  • Rodada recente de captação de recursos valorizou a ElevenLabs em onze bilhões de dólares.
  • Integração aumentada de voz levanta preocupações com privacidade e vigilância.

O co-fundador e CEO da ElevenLabs, Mati Staniszewski, afirmou que a voz está prestes a se tornar a principal forma como as pessoas interagem com sistemas de inteligência artificial. Ele destacou os recentes avanços que permitem que os modelos de voz transmitam emoção e trabalhem em conjunto com grandes modelos de linguagem, e esboçou a estratégia da empresa para processamento híbrido de nuvem e dispositivo para wearables e outros hardwares.

Voz como a Próxima Interface de IA

Na Web Summit, o co-fundador e CEO da ElevenLabs, Mati Staniszewski, afirmou que a voz está emergindo como a próxima grande interface para tecnologias de inteligência artificial. Ele explicou que os modelos de voz modernos não imitam mais apenas a fala humana; eles agora incorporam emoção, entonação e o poder de raciocínio de grandes modelos de linguagem. Essa evolução, ele argumentou, mudará a interação do usuário de tocar telas para falar, permitindo que as pessoas mantenham seus dispositivos nos bolsos enquanto interagem com o mundo ao seu redor.

Processamento Híbrido de Nuvem e Dispositivo

Staniszewski descreveu a estratégia da ElevenLabs para ir além da geração de áudio baseada apenas na nuvem em direção a uma abordagem híbrida que combina serviços de nuvem com processamento no dispositivo. Essa arquitetura é projetada para suportar hardware emergente, como fones de ouvido, óculos inteligentes e outros wearables, onde a voz pode atuar como um companheiro constante em vez de um recurso ocasional. Ao combinar a escalabilidade da nuvem com os benefícios de baixa latência da computação local, a empresa visa fornecer interações de voz de alta qualidade e em tempo real em uma gama mais ampla de dispositivos.

Parcerias e Impacto no Mercado

O CEO destacou uma parceria com a Meta que traz a tecnologia de voz da ElevenLabs para plataformas como Instagram e o ambiente de realidade virtual Horizon Worlds. Ele também expressou abertura para colaborar nos óculos inteligentes Ray-Ban da Meta, sinalizando um impulso para incorporar interfaces impulsionadas por voz em novos fatores de forma. Essas alianças, juntamente com a rodada recente de captação de recursos que valorizou a ElevenLabs em onze bilhões de dólares, sublinham o crescente interesse comercial na voz como uma capacidade central de IA.

Preocupações com Privacidade e Vigilância

Enquanto defendia a promessa de interação de voz onipresente, Staniszewski reconheceu que incorporar sistemas de voz mais profundamente na vida diária levanta sérias questões de privacidade e vigilância. A coleta contínua de dados de voz pode permitir a criação de perfis pessoais detalhados, e o CEO alertou que as empresas devem abordar quanto dados do usuário são armazenados e processados à medida que a voz se torna uma interface contínua e sempre ativada. A discussão referenciou a escrutínio mais amplo da indústria de tecnologias semelhantes, enfatizando a necessidade de salvaguardas robustas.

#inteligência artificial#interface de voz#ElevenLabs#grandes modelos de linguagem#Web Summit#parceria com a Meta#privacidade#tecnologia de wearables#síntese de fala#computação híbrida

Também disponível em: