Eric Boyd Vice Presidente Corporativo, Azure IA
À medida que o mundo se adapta a novas formas de trabalho e para permanecer conectado, continuamos comprometidos em fornecer soluções de Inteligência Artificial (AI) do Azure para ajudar as organizações a inventar com um propósito.
Com base em nossa visão de capacitar todos os desenvolvedores a usarem a IA para obter mais, hoje temos o prazer de anunciar recursos expandidos nos Serviços Cognitivos do Azure, incluindo:
- Análise de texto para visualização da saúde;
- Disponibilidade geral do reconhecimento de formulários;
- Disponibilidade geral dos comandos personalizados;
- Novas vozes de texto para fala em neural.
As empresas de assistência médica, seguros, agricultura sustentável e outros campos continuam escolhendo a IA do Azure para criar e implantar aplicativos de inteligência artificial para transformar seus negócios. De acordo com a IDC[1], até 2022, 75% das empresas implementarão soluções baseadas em IA para melhorar a eficiência operacional e oferecer experiências aprimoradas aos clientes.
Para atender a essa demanda crescente, as atualizações de produtos atuais expandem os recursos de idioma, visão e fala existentes nos Serviços Cognitivos do Azure para ajudar os desenvolvedores a criar aplicativos de IA de missão crítica que permitam insights mais ricos, economizem tempo, reduzam custos e melhorem o envolvimento do cliente.
Obtenha informações detalhadas com o poderoso processamento de idioma natural
Uma das maneiras que as organizações encontraram para se adaptar foi aumentar a capacidade de processar dados rapidamente e gerar novas ideias a partir deles. O COVID-19 acelerou a urgência, principalmente para o setor de saúde. Com a enorme quantidade de dados de saúde gerados a cada ano[2], é cada vez mais crítico para os provedores desbloquear rapidamente o acesso a essas informações para encontrar novas soluções que melhorem os resultados dos pacientes.
Estamos entusiasmados em apresentar o Text Analytics for health, um novo recurso do Text Analytics que permite que prestadores de serviços de saúde, pesquisadores e empresas extraiam insights e relacionamentos ricos a partir de dados médicos não estruturados. Treinado em uma gama diversificada de dados médicos – cobrindo vários formatos de anotações clínicas, protocolos de ensaios clínicos e muito mais – o recurso de saúde é capaz de processar uma ampla variedade de tipos e tarefas de dados, sem a necessidade de desenvolvimento manual e demorado de modelos personalizados para extrair informações dos dados.
Em resposta à pandemia do COVID-19, a Microsoft fez uma parceria com o Allen Institute of AI e os principais grupos de pesquisa para preparar o conjunto de dados de pesquisa aberta COVID-19. Com base no recurso de mais de 47,000 artigos acadêmicos, desenvolvemos um mecanismo de pesquisa COVID-19 usando o Text Analytics para saúde e pesquisa cognitiva, permitindo que os pesquisadores gerem novos insights em apoio à luta contra a doença.
Além disso, continuamos avançando no processamento de linguagem natural (PNL), para que os desenvolvedores possam criar aplicativos mais rapidamente que gerem insights sobre sentimentos em texto. O recurso de mineração de opinião no Text Analytics atribui sentimentos a recursos ou tópicos específicos para que os usuários possam entender melhor o feedback dos clientes de dados de mídia social, sites de revisão e muito mais.
Economize tempo e reduza custos transformando formulários em dados utilizáveis
Muitos dos dados não estruturados estão contidos em formulários que possuem tabelas, objetos e outros elementos. Esses tipos de documentos geralmente usam rotulagem manual por tipo ou codificação intensiva para extrair informações.
Estamos disponibilizando o Reconhecedor de formulários em geral para ajudar os desenvolvedores a extrair informações de milhões de documentos de maneira eficiente e precisa, sem a necessidade de conhecimento em ciência de dados.
Clientes como a Sogeti, parte do Grupo Capgemini, estão usando o Reconhecedor de formulários para ajudar seus clientes a processar mais rapidamente grandes volumes de documentos digitais.
“A Sogeti constantemente procura novas maneiras de ajudar os clientes em sua jornada de transformação digital, fornecendo soluções de ponta em IA e aprendizado de máquina. Nossa oferta de CDP (Cognitive Document Processing) permite aos clientes processar e classificar documentos não estruturados e extrair dados com alta precisão, resultando em custos operacionais e tempo de processamento reduzidos. O CDP utiliza os poderosos recursos cognitivos e de marcação do Reconhecedor de formulários para extrair facilmente dados emparelhados sem chave e outras informações relevantes de documentos não estruturados digitalizados/digitais, reduzindo ainda mais o tempo total do processo.” – Mark Oost – Diretor de Tecnologia da Sogeti, Inteligência Artificial e Aprendizado de Máquina
A Wilson Allen, fornecedora líder de soluções de consultoria e análise, está usando o Reconhecedor de formulários para ajudar a advocacia e outras empresas de serviços profissionais a processar e avaliar documentos (PDFs e imagens, incluindo formulários financeiros, pedidos de empréstimo e muito mais) e treinar modelos personalizados para precisão extrair valores de formas complexas.
“A adição do Reconhecedor de formulários ao nosso kit de ferramentas está nos ajudando a transformar grandes quantidades de dados não estruturados em informações valiosas, economizando mais de 400 horas de entrada manual de dados e liberando tempo para os funcionários trabalharem em tarefas mais estratégicas”. – Norm Mullock – vice-presidente de estratégia da Wilson Allen
Melhore o envolvimento do cliente com aplicativos ativados por voz
As pessoas e as organizações continuam procurando maneiras de enriquecer as experiências dos clientes, equilibrando a transição para operações digitais, sem toque. Os avanços na tecnologia de voz estão capacitando os desenvolvedores a criar experiências mais integradas, naturais e ativadas por voz para os clientes interagirem com as marcas.
Um desses avanços, Comandos Personalizados, um recurso de Fala nos Serviços Cognitivos, está agora disponível em geral. O recurso permite que os desenvolvedores criem aplicativos de voz orientados a tarefas com mais facilidade para cenários de comando e controle que possuem um conjunto bem definido de variáveis, como termostatos domésticos inteligentes controlados por voz. Ele reúne o Conversão de Fala em Texto para reconhecimento de voz, o Reconhecimento Vocal para capturar entidades faladas e a resposta de voz com a Conversão de Texto em Fala, para acelerar a adição de recursos de voz aos seus aplicativos com uma experiência de criação de código baixo.
Além disso, a Conversão de Texto neural em Fala está expandindo o suporte ao idioma com 15 novas vozes com som natural, baseadas em modelos de síntese de fala neural de última geração: Salma em árabe (Egito), Zariyah em árabe (Arábia Saudita) e Alba em catalão (Espanha), Christel em dinamarquês (Dinamarca), Neerja em inglês (Índia), Noora em finlandês (Finlândia), Swara em hindi (Índia), Colette em holandês (Holanda), Zofia em polonês (Polônia), Fernanda em português ( Portugal), Dariya em russo (Rússia), Hillevi em sueco (Suécia), Achara em tailandês (Tailândia), HiuGaai em chinês (cantonês, tradicional) e HsiaoYu em chinês (mandarim de Taiwan).
Os clientes já estão adicionando recursos de fala aos seus aplicativos para melhorar o engajamento. Com os Serviços Cognitivos e o Serviço de Bot, a BBC criou um assistente de voz habilitado para IA, o Beeb, que oferece uma experiência mais atraente e personalizada para seus diversos públicos.
Estamos entusiasmados por apresentar essas inovações de novos produtos que capacitam todos os desenvolvedores a criar aplicativos de IA de missão crítica. Para saber mais, confira nossos recursos abaixo.
Comece hoje
Saiba mais com os recursos abaixo e comece a usar o Azure Cognitive Service e uma conta gratuita do Azure.
- Análise de texto para saúde: Leia o blog técnico para obter mais informações. Veja a a demonstração do mecanismo de pesquisa COVID-19. Digite termos médicos como “ibuprofeno” na barra de pesquisa e tente explorar as relações gráficas.
- Reconhecimento de formulários: Leia o blog técnico para obter mais informações. Veja a demonstração do Reconhecimento de formulários, mostrando a capacidade de extrair informações de diferentes tipos de formulários. Acesse as amostras de código.
- Comandos personalizados: Leia o blog técnico para obter mais informações. Veja as demonstrações de inventário, hospitalidade e automotivas. Comece selecionando seu cenário e dizendo um comando em voz alta por prompt. Acesse as amostras de código.
- Texto neural em fala: Leia o blog técnico para obter mais informações. Veja a demo. Use o texto pré-preenchido ou adicione o seu próprio e tente ajustar a saída de áudio. Acesse as amostras de código.
[1] Worldwide Artificial Intelligence Predictions (IDC FutureScape 2020).
[2] Adapting customer experience in the time of coronavirus (McKinsey 2020).