A empresa Aug X apresentou Augie, um sistema de produção de vídeo que usa Inteligência Artificial e possui a capacidade de clonar a voz para ler texto de anúncios sem precisar se dirigir a um estúdio de gravação.
Graças à parceria com a ElevenLabs, a Aug X possibilita que os usuários registrem a voz de alguém e clonem-na para utilização em outros vídeos curtos. A plataforma Augie, direcionada principalmente para profissionais de marketing e equipes de mídia social, oferece aos usuários a oportunidade de incluir facilmente narração, fotos, texto e música em vídeos, sem precisar dominar edição de áudio e vídeo.
Jeremy Toeman, o criador do Aug X, anunciou que a empresa está trabalhando para adicionar uma função de clonagem de voz, depois de se dar conta de que algumas pessoas não desejam usar um microfone ou fazer voice-overs.
Você ficaria surpreso com o número de indivíduos que aproveitaram o nosso serviço de clonagem de voz e expressaram sua gratidão por não terem que gravar a narração, comentou-o.
Em uma demonstração para The Verge, Toeman destacou que usuários podem escrever ou baixar um script para Augie e, depois, optar por usar uma gravação de voz pré-existente (alguém precisa gravar um pequeno trecho de sua própria voz dizendo qualquer coisa) ou escolher uma da sua biblioteca. Esta voz então lerá o script com o tom desejado, seja sério, entusiasmado, assustador, etc., que pode ser ajustado de acordo com o humor do vídeo.
Os usuários também têm a opção de optar por uma coleção de imagens – a Aug X obteve fotografias da Getty – ou usar imagens geradas por Inteligência Artificial para serem adicionadas ao vídeo.
Tomar prevê que os times de marketing se concentrem em produzir vídeos curtos, dispensando a necessidade de reservar o horário do porta-voz da organização em um estúdio de gravação.
Em maio, Augie se tornou aberto ao público, permitindo que todos os usuários aproveitem as capacidades de clonagem de voz. Contudo, de acordo com Toeman, possivelmente se limitará a duração e a qualidade dos vídeos, além do número de vozes clonadas para usuários não pagantes, devido aos custos da execução dos servidores de clonagem de voz com seus parceiros.
A clonagem de voz não é uma novidade; a Samsung até possibilita que as pessoas utilizem uma voz de inteligência artificial para responder a ligações, e empresas como Aug X estão incorporando a tecnologia em serviços ainda mais completos. Desde que uma música do Drake com uma versão criada pela inteligência artificial da voz do rapper se tornou viral, isso ajudou a reavivar preocupações sobre direitos autorais e uso ilegal da semelhança de outra pessoa.
Pensamos com antecedência sobre o que poderia dar errado, assim, estamos tomando precauções para que somente as pessoas autorizadas possam usar a gravação para a clonagem, segundo Toeman.
Ele declarou que, diferente da biblioteca de vozes da Augie Maior, essas gravações só estarão acessíveis em contas individuais. Portanto, outra pessoa na mesma organização deve gravar a voz da sua figura de destaque em sua conta Augie para emular seu discurso. Os usuários não podem fazer upload de arquivos com vozes, e somente as gravações captadas diretamente com um microfone ao vivo são aceitas. Logo, não é possível usar a voz do seu ex no alto-falante para criar uma farsa de uma ligação com um amigo, pois isso não funciona com o Augie.
A empresa também se colabora com ElevenLabs, seu parceiro de clonagem de voz, para identificar vozes e conteúdos audiovisuais criados por meio da Inteligência Artificial.