Como eu faço uma pesquisa por voz?

A velocidade com que os avanços tecnológicos ocorrem dá a sensação a muitos de nós, de que não é possível manter-se atualizado com tudo que surge diariamente. A razão é que muitas inovações parece serem feitas para aquele seu sobrinho nerd e são incompreensíveis para a maioria. Porém há algumas bem simples e úteis. Uma delas, é algo que veio para facilitar a vida de todos nós - a pesquisa por voz! Ok, então como eu faço uma pesquisa por voz?

Como surgiu a pesquisa por voz?

Embora venha ganhando popularidade mais recentemente, o uso da voz como alternativa a outros meios de se fornecer informação a um sistema (computador, smartphone, etc), não é novidade. Em termos práticos, já na década de 90 alguns poucos aplicativos tentaram implantar, alguns comandos por voz, com o objetivo de facilitar seu uso.

Mas as iniciativas fracassaram por alguns fatores. Entre os principais, estavam o acesso à tecnologia presente nos PCs da época e a própria tecnologia, que não estava suficientemente desenvolvida para produzir os resultados desejados.

Na época não eram todos os computadores que tinham placa de som com microfone, que permitisse aos sistemas “ouvirem” os comandos falados. Somava-se a isso a baixa qualidade do áudio gerado para processamento, particularmente em equipamentos domésticos, que foi onde a tecnologia primeiramente apresentou-se.

Mas o maior entrave, era o próprio sistema, que para funcionar exigia que fosse “calibrado” através da leitura e fala de uma extensa lista de palavras, para que o sistema de reconhecimento vocal pudesse compreender o que era dito e atribuir os comandos correspondentes às palavras que eram lidas. Isso poderia levar até algumas horas e sendo assim, por razões óbvias a grande maioria dos usuários não teve sucesso no processo.

Desde então, muitas empresas vêm investindo no aperfeiçoamento da tecnologia, para que de fato ela pudesse ser usada de maneira simples e entregasse os benefícios que se espera, de forma que o que até pouco tempo atrás constituia apenas uma cena de filmes de ficção, ganhasse a vida real.

O tempo passou, novas tecnologias - como os smartphones - surgiram e, sobretudo, a acessibilidade a elas permitiu chegarmos onde estamos hoje, em um momento em que realizar uma série de ações usando apenas a voz, é uma realidade que só traz benefícios e que vem ganhando adeptos até entre os mais resistentes usuários.

Com funciona a pesquisa por voz?

Em termos práticos, é razoavelmente simples e há algumas diferenças de acordo com o dispositivo em que a tecnologia de reconhecimento vocal está presente, mas invariavelmente o primeiro objetivo é conseguir precisão na identificação dos termos falados.

Do ponto de vista técnico, naturalmente não se divulga muita informação a respeito, afinal a maior parte dos gigantes do setor de tecnologia estão envolvidos e investindo pesado no seu aprimoramento e dar detalhes de como fazem para entregar os melhores resultados, significa perder posições importantes nesta corrida, em que aparentemente o Google lidera com uma pequena margem em relação à Microsoft.

Basicamente a tecnologia é amparada em reconhecimento vocal, Inteligência Artificial, Machine Learning e Internet das Coisas (IoT). Em maior grau por parte do Google e Microsoft, participam também do processo as infraestruturas sofisticadas dos seus mecanismos de buscas.

O primeiro passo consiste em reconhecer com maior exatidão possível as palavras que são faladas pelo usuário e neste quesito, a margem de acerto já é superior a 95%, chegando a 98% nos mecanismos mais avançados. Ou seja, entre 100 palavras ditas, apenas algo entre duas e cinco palavras não são corretamente reconhecidas e esse índice vem melhorando.

A inteligência artificial entra no processo, para conferir significado ou semântica à busca, ou seja, busca-se melhorar a precisão dos resultados ao compreender o que o usuário de fato procura.

Para alcançar esta melhora, o sistema faz uso de outros dados como por exemplo, localização geográfica, outras pesquisas realizadas, sinônimos, entre uma lista extensa de informações, que devem ser cruzadas, analisadas e um resultado rapidamente produzido e entregue.

O refinamento dos resultados entregues, em parte vem do Machine Learning. Assim, se por exemplo, duas buscas são feitas sucessivamente, com pequenas diferenças nos termos usados, o sistema compara os resultados quanto às diferenças e que resultados foram utilizados pelo usuário em cada uma das buscas, para refinar a semântica.

Por fim, quando é pertinente, os dados relativos à Internet das Coisas (IoT), servem para alimentar o banco de dados de informações do usuário, enriquecendo assim o acervo de dados usados pelo sistema para entregar um resultado mais preciso.

Como exemplo de uso de IoT, o conteúdo das playlists que você tem no seu dispositivo de música conectado à Internet, podem influenciar que tipos de resultados quando fizer buscas que envolvam o tema música.

Ou seja, hoje no caso das maiores empresas, é difícil imaginar cada uma destas tecnologias funcionando como ilhas, ou seja, isoladas. O correto é imaginar que são em maior ou menor grau integradas com o objetivo de contar com o maior número de informações possíveis de cada usuário e a partir delas, realizar uma análise profunda e um aprendizado, tão rápido quanto possível, para entregar resultados cada vez mais corretos e úteis.

Porém mais do que simples ferramentas que são acionadas por voz, algumas delas cumprem um papel ainda mais amplo, como é o caso da Cortana da Microsoft, que além das tradicionais pesquisas de termos na Internet, efetua buscas no dispositivo instalado, abre programas, ajuda na organização da agenda pessoal, entre outras funções possíveis. Ou seja, cumpre verdadeiramente o papel de assistente virtual inteligente.

Como usar a pesquisa por voz?

A lista de recursos que podem ser usados vocalmente ao nosso alcance, já é suficientemente grande e vem crescendo rapidamente e por esta razão, vamos elencar apenas os mais populares e que estão ao alcance de um bom contingente de pessoas.

Há pesquisas por voz tão poderosas como as que veremos a seguir, porém com aplicações mais restritas a alguns públicos e situações que fogem do escopo deste artigo.

Google Chrome

  1. Abra qualquer navegador e vá até a página de pesquisa do Google (https://www.google.com);

  2. No campo de pesquisa, clique no ícone do microfone;

  3. Será exibido um ícone de um microfone vermelho e a palavra “ouvindo”. Pronto. Agora basta falar o que você quer pesquisar e ao final o Google ele entrega os resultados da pesquisa.

Google (Android)

  1. No smartphone ou tablet, abra o Google App;

  2. No canto inferior direito, toque na opção “… Menu”;

  3. Na tela seguinte toque em “Configurações”;

  4. A seguir toque em “Voz”;

  5. Na tela que é exibida, vá até “Ok Google” e toque em “Voice Match”

  6. Por fim, marque a opção “Acessar com o Voice Match”, que deverá ficar marcado em azul. Ao final deste processo, basta dizer “Ok Google” e esperar aparecer a tela para pesquisa por voz.

Observação: É possível também desbloquear o aparelho, quando o seu padrão de voz for reconhecido, dizendo “Ok Google”. Para isso, a opção seguinte ao passo 6, “Desbloquear com o Voice Match” deve ser marcada.

Cortana (Windows)

  1. Para abrir a Cortana, clique na opção “Digite aqui para pesquisar” da barra do Windows, também conhecida como caixa de pesquisa da Cortana;

  2. Em “Microfone” clique no link “Começar” para iniciar o assistente de configuração. Um assistente será iniciado e dará orientações de como prosseguir;

  3. Clique em Avançar e repita a frase solicitada, que deve ser lida pausadamente para o processo de configuração do microfone;

  4. Após avançar, se tudo tiver sido feito corretamente, aparecerá a informação de que o microfone está pronto para uso, devendo-se clicar em “Concluir” para encerrar o assistente;

Observação: Pode-se habilitar o recurso “Ei, Cortana” e para tanto, basta que o assistente esteja ativo pelo procedimento acima. Clique na caixa de pesquisa da Cortana e a seguir no ícone configurações. Na janela que é aberta, marque como “Ativado” a opção “Permitir que a Cortana responda a ‘Ei Cortana’”. Desta forma, sempre que se disser “Ei Cortana”, a janela de pesquisa será exibida para realizar qualquer tipo de busca no PC ou na Internet, bem como outras funções de que a Cortana é capaz.

Siri (iPhone, iPad e iPod touch)

  1. Basta dizer "E aí Siri", seguido do que você precisa, como por exemplo, “Ei Siri, qual a cotação do dólar?”;

  2. No iPhone X ou posterior, pressione o botão lateral por alguns instantes e diga a solicitação ou pesquisa em seguida;

  3. Alternativamente para pesquisas mais extensas, no iPhone X ou posterior, deve-se manter o botão lateral pressionado enquanto se fala o que desejar pesquisar ou solicitar. Ao soltar o botão, a Siri inicia o processamento da pesquisa ou da solicitação.

Siri (Macs)

  1. Nos Macs modelos 2018 e posteriores, basta que se diga: "E aí Siri", seguido do que você precisa, exatamente como se faz nos iPhones;

  2. Nos Macbook Pro com Touch Bar, há um ícone específico relativo ao assistente Siri, que você pode tocar ou manter pressionado para efetuar a pesquisa ou solicitação. Ao fim da fala, a Siri processa a requisição.

Bixby (Samsung)

  1. Abra o Hello Bixby e toque no botão de menu no canto superior direito;

  2. Acesse as configurações e marque a opção “Bixby Voice”. Toque na opção “Ativação por voz”;

  3. Feito isso, siga os passos para configurar o reconhecimento de voz da assistente por voz Bixby;

  4. Concluído o assistente, basta dizer “Hi Bixby”, seguido do comando em inglês, visto que a Bixby não está disponível em português

Conclusão

Os assistentes de voz, responsáveis por facilitar a pesquisa por voz, que anteriormente só poderia ser feita por meio de um teclado, na verdade são mais do que simples ferramentas capazes de compreender palavras e retornar um resultado de uma busca relacionada às palavras ditas. São compostas por uma série de tecnologias interligadas, para produzir resultados rápidos e precisos, bem como são parte de legítimos representantes de assistentes virtuais inteligentes.