O final de 2022 veio logo após as tecnologias de IA terem sido amplamente adotadas devido à popularidade impressionante de OpenAI e ChatGPT. Pela primeira vez, a IA alcançou o apelo do mercado de massa, provando sua utilidade e valor na criação de resultados de negócios bem-sucedidos.
Muitas tecnologias de IA que parecem uma revolução para as pessoas comuns em 2023 foram, na verdade, usadas ativamente por grandes empresas e mídia por vários anos. Junte-se a mim enquanto observo mais de perto a tecnologia que alimenta essas soluções, em particular, sistemas generativos de IA para clonagem de voz, seus benefícios comerciais e abordagens éticas para o uso de IA.
Como funciona a clonagem de voz?
Em suma, a clonagem de voz permite que uma pessoa fale usando a voz de outra pessoa.
Ele usa tecnologia de IA generativa para criar gravações da voz de uma pessoa e usá-las para gerar novo conteúdo de áudio com a voz dessa mesma pessoa. Essencialmente, permite que as pessoas ouçam o que alguém teria dito, mesmo que não tenham dito isso.
No lado técnico, as coisas não parecem muito complicadas. Mas se você mergulhar um pouco mais fundo, existem alguns requisitos mínimos para começar:
Você precisa de pelo menos 5 minutos de áudio gravado de alta qualidade da voz de origem para cloná-lo. Essas gravações devem ser claras e sem ruído de fundo ou outras distorções, pois quaisquer imperfeições podem afetar a precisão da saída do modelo. Depois disso, alimente essas gravações em um modelo de IA generativo para criar um”avatar de voz”. Em seguida, treine o modelo para reproduzir com precisão os padrões de fala em tom e tempo. Depois de concluído, esse modelo treinado pode gerar conteúdo ilimitado usando a voz de origem de qualquer outra pessoa, tornando-se uma ferramenta eficaz para criar réplicas de vozes com som realista.
Este é o ponto em que muitos levantam questões éticas. O que acontece quando podemos inserir qualquer texto na boca de outra pessoa e é impossível dizer se essas palavras são reais ou falsas?
Sim, essa possibilidade há muito tempo se tornou uma realidade. Como no caso de OpenAI e ChatGPT, atualmente enfrentamos uma série de questões éticas que não podem ser ignoradas.
Padrões éticos em IA
Tal como acontece com muitas outras novas tecnologias em sua fase inicial estágios de adoção, a principal ameaça é criar um estigma negativo em torno da tecnologia, em vez de reconhecer as ameaças como fonte de discussão e conhecimento valioso. O importante é expor os métodos que os malfeitores usam para abusar da tecnologia e de seus produtos, aplicar ferramentas de mitigação e continuar aprendendo.
Hoje temos três camadas de estruturas para padrões éticos relativos ao uso de IA generativa. As camadas regulatórias nacionais e supranacionais estão em estágio inicial de desenvolvimento. O mundo das políticas pode não acompanhar a velocidade do desenvolvimento da tecnologia emergente, mas já podemos observar a liderança da UE com o Proposta da UE sobre regulamentação de IA e O Código de Prática de Desinformação de 2022 que descreve as expectativas de grandes empresas de tecnologia para lidar com a disseminação de conteúdo malicioso manipulado por IA. Em níveis nacionais, vemos os primeiros passos regulatórios dos EUA e do Reino Unido para abordar o problema com Força-Tarefa Nacional de Proveniência Digital e Deepfake e Lei de Segurança Online do Reino Unido.
A camada da indústria de tecnologia está se movendo mais rapidamente à medida que empresas e tecnólogos estão aceitando essa nova realidade no que se refere às tecnologias emergentes e seu impacto na segurança e privacidade da sociedade. O diálogo sobre a ética da IA generativa é vibrante e abriu caminho para o desenvolvimento de iniciativas do setor para Códigos de Conduta em torno do uso de IA generativa (ou seja, Código de Conduta da Parceria em Mídia Sintética de IA) e declarações éticas divulgadas por diferentes empresas. A questão é: como tornar a conduta prática? E eles são capazes de afetar produtos, características específicas e os procedimentos das equipes?
Tendo trabalhado neste problema com várias comunidades diferentes de mídia e entretenimento, segurança cibernética e Ética em IA, formulei alguns princípios práticos para lidar com conteúdo e vozes de IA em particular:
IP os proprietários e a empresa que usa a voz clonada podem evitar muitas das possíveis complicações associadas ao uso de vozes originais assinando acordos legais. Os proprietários do projeto devem divulgar publicamente o uso de uma voz clonada para que os ouvintes não sejam enganados. Empresas que trabalham com tecnologia de IA para voz deve alocar uma porcentagem de recursos para desenvolver tecnologia capaz de detectar e identificar conteúdo gerado por IA. Rotular o conteúdo gerado por IA com marcas d’água permite a autenticação de voz. Cada provedor de serviços de IA deve revisar cada projeto de seu impacto (social, comercial e níveis de privacidade) antes de concordar em trabalhar nisso.
Claro, os princípios de ética em IA não afetarão a disseminação de deep fakes caseiros online. No entanto, eles colocarão qualquer projeto no cinza fora do alcance do mercado público.
Em 2021-22, as vozes da IA foram usadas em diferentes projetos convencionais que introduziram pesadas implicações para a ética e a sociedade. Isso incluiu clonar a voz do jovem Luke Skywalker para o Mandaloriano série, voz AI para God of War 2 e A voz de Richard Nixon para o histórico’In Event of Moon Disaster’.
A confiança na tecnologia está crescendo além da mídia e do entretenimento. Empresas tradicionais em muitos setores estão usando vozes clonadas em seus projetos. Aqui estão alguns dos casos de uso mais proeminentes.
Casos de uso na indústria
Em 2023, a clonagem de voz continuará crescendo ao lado de vários negócios preparados para colher seus inúmeros benefícios. Do setor de saúde e marketing ao atendimento ao cliente e ao setor de publicidade, a clonagem de voz está revolucionando a forma como as organizações constroem relacionamentos com seus clientes e otimizam seus fluxos de trabalho.
A clonagem de voz beneficia profissionais de saúde e assistentes sociais que trabalham em um ambiente online. Avatares digitais com a mesma voz de profissionais médicos promovem vínculos mais fortes entre eles e seus pacientes, aumentando a confiança e retendo clientes.
As aplicações potenciais da clonagem de voz na indústria cinematográfica e de entretenimento são vastas. A dublagem de conteúdo em vários idiomas, substituição de diálogo adicional (ADR) para crianças e adultos e uma variedade quase infinita de opções de personalização são possíveis com essa tecnologia.
Da mesma forma, no setor de operações, a voz orientada por IA a clonagem pode produzir excelentes resultados para marcas que precisam de soluções econômicas para sistemas interativos de resposta de voz ou vídeos de treinamento corporativo. Com a tecnologia de síntese de voz, os atores podem expandir seu alcance enquanto aumentam sua capacidade de ganhar resíduos com as gravações.
Finalmente, em estúdios de produção de publicidade, o surgimento da clonagem de voz ajudou a reduzir significativamente os custos e o número de horas associados com produção comercial. Contanto que haja uma gravação de alta qualidade disponível para clonagem (mesmo de atores indisponíveis), os anúncios podem ser produzidos rapidamente e de forma mais criativa do que nunca.
Curiosamente, empresas e pequenas e médias empresas podem aproveitar a clonagem de voz para criar algo único para suas marcas. Grandes projetos podem realizar seus planos mais ambiciosos, enquanto pequenas empresas podem acessar modelos de escala anteriormente proibitivos. Isso é o que significa verdadeira democratização.
Concluindo
A clonagem de voz AI oferece benefícios revolucionários às empresas, como a criação de experiências únicas para o cliente, a integração de recursos de processamento de linguagem natural em seus produtos e serviços e gerando imitações altamente precisas de vozes que soam completamente reais.
As empresas que desejam manter sua vantagem competitiva em 2023 devem considerar a clonagem de voz por IA. As empresas podem usar essa tecnologia para abrir uma variedade de novas possibilidades para ganhar participação de mercado e reter clientes, ao mesmo tempo em que o fazem de maneira eticamente responsável.