Acelerando a experiência digital dos veículos com o Azure Cognitive Services

Por Ali Dalloul, Vice-presidente de Estratégia e Comercialização de Azure AI Platform

 

A Microsoft está ajudando a remodelar a indústria automotiva na forma como atende seus motoristas com sistemas de entretenimento informativo nos veículos. Por exemplo, o Azure está fazendo parceria com o XPENG para habilitar experiências de voz com IA para marcas automotivas e clientes. A solução oferece ao setor uma nova abordagem de text-to-speech e expressões em voz, idiomas globais, fidelidade do locutor e personalização de autoatendimento. A XPENG se junta a uma tendência crescente de fabricantes de automóveis que repensam os investimentos em voz ambiental.

“Esta é uma pesquisa de ponta sobre a interação entre voz e veículo na indústria automotiva”, disse Hao Chao, especialista sênior em produtos IA automotivos da XPENG. “A experiência oferece um nível totalmente novo de fala natural. Com um profundo conhecimento da mobilidade urbana, estamos encontrando muitos mais cenários para alavancar a tecnologia de IA para um alto nível de intuição motorista-máquina.”

A XPENG aproveitou a tecnologia neural text-to-speech da Microsoft para criar sua experiência de usuário no carro. Ao usar o text-to-speech com estilos emocionais, a XPENG pode fornecer uma experiência de audição mais agradável para seus clientes e combater a fadiga auditiva. Essa tecnologia da Microsoft fornece uma fluência e naturalidade que é comparável a uma voz humana. Juntamente com vozes multiemocionais, o text-to-speech atua como um substituto refrescante para o som monótono que muitos assistentes de carro têm hoje.

“Estamos entusiasmados em reimaginar como a fala e a voz podem melhorar a vida dos motoristas”, disse Binggong Ding, líder do produto Azure AI Speech. “Do ponto de vista técnico, queremos fazer deste um modelo que possa atender a todas as marcas de automóveis e seus desenvolvedores. Como podemos otimizar o uso de voz sintética para permitir uma experiência de voz de alta fidelidade sem comprometer a qualidade do som? A XPENG está trabalhando neste desafio para criar o assistente de voz que os clientes estão procurando.”

O objetivo de longo prazo da Microsoft é tornar os recursos de voz multiemocionais no novo padrão para marcas de automóveis e consumidores globais. A tecnologia adotada pela XPENG adicionou dezenas de estilos de voz, controle de intensidade emocional e habilidades de dedução. Ela abrange 90 certificações em todo o mundo, incluindo políticas domésticas, requisitos regulatórios de data center e a GDPR da UE, lei de regulamentação de uso de dados, com os requisitos mais elevados de privacidade de dados. Juntamente com os fabricantes de automóveis, a Microsoft está criando novas experiências de direção com fala com base nos recursos de text-to-speech e speech-to-text com o Azure Cognitive Services.

 

Inovação acelerada de fala

Recursos de voz são a nova interface em tecnologia da computação ambiente. A qualidade do text-to-speech e do speech-to-text melhorou nos últimos anos devido às pesquisas e aos saltos tecnológicos possibilitados pelo desenvolvimento das redes neurais. Essas tecnologias atendem às necessidades dos fabricantes de automóveis para criar a experiência de fala moderna de última geração no carro. A speech-to-text da Microsoft oferece recursos de reconhecimento robustos que independem do alto-falante e são capazes de lidar com o ruído ambiente durante a condução. Já o text-to-speech também apresenta uma voz mais fluida e natural, que pode ser um diferencial para fabricantes de automóveis e clientes.

Ambas inovações aumentam o controle sem as mãos do sistema de infoentretenimento do carro. Elas possuem suporte a vários estilos de fala, incluindo bate-papo, noticiário e atendimento ao cliente. Esses avanços permitem que os motoristas tenham uma experiência de direção mais agradável. Para obter mais informações sobre os avanços recentes em speech-to-text e text-to-speech, confira os resultados da pesquisa, na qual foi alcançada alta semelhança com as habilidades humanas.

 

Oferecendo idiomas globais

A Microsoft ajuda os fabricantes de automóveis a atender seus negócios globais e recentemente atingiu um marco de 100 idiomas dominados, com suporte a outros 19 variantes e com 278 vozes prontas para uso. Isso está alinhado com a visão de nossa empresa de capacitar cada pessoa e organização no planeta para alcançar mais. “Cem idiomas é um bom marco para alcançarmos nossa ambição de que todos possam se comunicar, independentemente do idioma que falem”, disse Xuedong Huang, membro técnico da Microsoft e diretor de tecnologia do Azure AI. Com mais idiomas com suas variantes cobertas, estamos empolgados em fornecer experiências de voz naturais e intuitivas para os fabricantes de automóveis.

 

Diferenciação com personalização

A Microsoft capacita os fabricantes de automóveis a desenvolver uma voz de marca altamente realista para interfaces de conversação mais naturais usando o recurso de voz neural personalizado. Com base na tecnologia de conversão de text-to-speech e no modelo universal multilingue com vários alto-falantes, a voz neural personalizada permite criar vozes sintéticas que são ricas em estilos de fala ou linguagens cruzadas adaptáveis com apenas 30 minutos de áudio. A voz realista e natural da versão personalizada pode representar marcas e personas específicas e permitir que os usuários interajam com os aplicativos naturalmente em um estilo coloquial. Confira este texto do blog para obter um guia passo a passo sobre como criar uma voz neural personalizada.

 

Compliance e IA responsável

A Microsoft está empenhada em investir no cumprimento de padrões regulatórios em todo o mundo para atender aos requisitos de conformidade das montadoras. O serviço de fala, parte do Azure Cognitive Services, é certificado pelos órgãos SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO. Apoiado pela infraestrutura do Azure, o serviço de voz também oferece segurança, disponibilidade, conformidade e capacidade de gerenciamento a nível empresarial.

A Microsoft está comprometida em desenvolver a tecnologia IA de forma responsável. Usamos diferentes recursos técnicos e de política para nos proteger contra o uso indevido da tecnologia. Por exemplo, estamos projetando e lançando o Custom Neural Voice com a intenção de proteger os direitos dos indivíduos e da sociedade, promovendo a interação humano-computador transparente e neutralizando a proliferação de deepfakes prejudiciais e conteúdo enganoso. Isso se alinha ao compromisso da Microsoft com a IA responsável. Esse compromisso inclui Notas de Transparência, que comunicam a finalidade, as capacidades e as limitações de um sistema de IA.

 

Saiba mais

O Azure Cognitive Services traz a IA ao seu alcance. Aprenda como você acelera a inovação com pesquisas revolucionárias de IA.

Tags: , , ,

Posts Relacionados