sábado, 11 de junho de 2022

IOS VS Android no tabuleiro das vozes



Descrição da imagem, multidão ao fundo, a esquerda ícone verde do android, ao centro um microfone de rádio antigo e a direita o ícone da Apple, fim da descrição
Android, microfone e Apple, arte, Neimar Borges da Silva blog tts supremo





1 Introdução 


Como vocês todos já devem saber, o nosso querido Euloquence está habitando as terras das     Macieiras, aquele lugar que dizem que é muito bonito mas que só a turma do clube de golfe é que pode entrar.
Até eu já estava pensando em juntar uma grana, comprar uns tacos e uniformes mas enquanto O porquinho engorda, vou ter que me virar com o que eu tenho mesmo e foi pensando nisso que me peguei fazendo outros cálculos.
No artigo anterior que você pode ler aqui, tratei do aspecto  mais expecifico relacionado a ida da Nuance para a Apple, agora a ideia é abordar  o lance mais geral  das vozes propriamente dito.
Essa questão das vozes sempre foi muito importante para nós e é sempre bom frisar que essa iniciativa da Apple foi muito bacana mesmo, uma atitude que mudou para melhor a questão das opções de voz para quem está na plataforma.
Opções sempre foram um problema na Apple e nesse sentido eu mesmo cansei de apontar a falta de vozes como mais uma absurda demonstração da prisão luxuosa que a plataforma impõem aos usuários.
O fato das vozes da Nuance terem ido para a Apple, fez caras como eu morder a língua, e que bom que foi assim, contudo isso não diminui o fato de que essas vozes estão na maçã do jeito Apple, e isso vale tanto para o bem quanto para o mal.
Nesse sentido acho que cabe questionar esse cenário atual de vozes para termos uma ideia de como as coisas ficaram depois dessa mudança no tabuleiro.
Portanto, antes de seguirmos acho importante termos em mente alguns critérios, essa discussão vai ser levada sob o ponto de vista da quantidade, visto ser quantidade aqui, sinônimo de opções.
Acho bacana também não perdermos a qualidade de vista, porém, não se esqueçam de que muita gente que festeja hoje a ida do Euloquence, ontem considerava essa mesma voz como sendo de baixa qualidade.
Acho legal  lembrar aqui que o gosto pessoal também não está em foco, sei que é uma obviedade citar isso mas sabe como é, gosto é igual bunda, todo mundo tem a sua.
Outro ponto que não podemos perder de vista é o fato de que estou dando minha opinião pessoal, o que faz desse artigo uma tentativa íntima de questionar e de entender o universo a minha volta, e um último ponto que quero citar é que meu foco vai ser as vozes em português do Brasil, extraindo é claro, as vozes neurais.


2 IOS VS Android. 

Até dias atrás a Apple oferecia nativamente duas vozes na SIRI, e mais duas no sistema, já no Android, o Google oferecia duas vozes para o sistema e três vozes para o Google assistente e se expandimos nossos voos para a Samsung, adicione a essa conta a voz da Bixby e as outras duas vozes oferecidas no sistema.
Em suma, um dono de Samsung já pode largar com quatro vozes no sistema e dois assistentes com um total de quatro vozes entre Google assistente e bixby, dando nesse somatório um total de oito vozes, ao paço que na Apple, já com as novas vozes chegamos a seis.
Obviamente que no caso do Android, muitas dessas vozes vão ter que ser instaladas mas o ponto é que elas são oferecidas por suas respectivas fabricantes, tal qual a Apple faz, e essa observação me faz lembrar que o fato de você não precisar se preocupar em instalar essas vozes na Apple também não deixa de ser uma vantagem lá na plataforma.
No fim são características que podem sim influenciar na decisão de compra, vou para um sistema onde tenho o conforto de ter quase tudo já instalado ou vou para o outro onde tenho que instalar muita coisa?


3 Euloquence VS eSpeack.

Quando Jake Gross disse que agora o Euloquence estava no lugar certo, ele, talvez sem querer tenha acertado numa mosca que sequer estivesse mirando, senão vejamos, mas antes é igualmente importante para seguirmos, traçar um paralelo entre Euloquence e eSpeack, visto serem eles uma verdadeira síntese de igualdade e oposição.
Acompanhe comigo.

1 O Euloquence é proprietário.
O eSpeack é livre.
2 Ambos são tidos como perfeitos em suas pronuncias.
3 Ambos são incomparáveis na Super velocidade.
4 Ambos são ofensivos aos ouvidos mais sensíveis.
5 Ambos são robóticos.
6 Ambos são antigos.
7 Ambos são tidos como de baixa qualidade.
8 Ambos tem trocentos idiomas.
9 Ambos tem trocentos personagens.
10 Ambos tem comunidades apaixonadas.


E se esqueci de alguma coisa, mil perdões mas acho que já deu para ter uma ideia da similaridade e oposição entre ambos.
Vendo a coisa do ponto de vista proprietário, faz sentido o Euloquence no IOS e o eSpeack no Android, contudo, vamos combinar que as coisas assim, postas como estão, não são legais para o usuário.
Num mundo ideal, e extraindo as eventuais impossibilidades técnicas, eu deveria poder utilizar o eSpeack no IOS e continuar a poder estar comprando o Euloquence no Android, mas isso num mundo ideal onde o foco fosse o usuário, o cliente, o cara que banca a festa, mas sabe como é né.
O mundo ideal é uma luta diária.


4 Vozes pagas.


Se grita aos quatro ventos que o usuário de Apple gosta de comprar aplicativos e também se diz por aí que a plataforma da Apple é a mais rentável, um verdadeiro paraíso na terra para quem quer ganhar dinheiro com software, no entanto você não consegue comprar uma voz sequer para usar com o único leitor de telas que existe no sistema.
Bizarro né?
Já no Android a cena é outra, mas calma porque não tem tanto motivo assim para comemorar, até bem pouco tempo atrás existiam muitas empresas vendendo vozes mas esse número caiu muito.
Nem a Ivona está mais vendendo suas vozes na Play Store e se não me falha a memória, hoje só temos duas desenvolvedoras com vozes a venda por lá, a Vocalizer e a CereProc, a primeira vendendo três vozes e a segunda vendendo duas. 
Um estado de coisas que está muito ligado a rentabilidade desses produtos, um alerta sem dúvida alguma , ao fato de que esses projetos, ligados às suas licenças proprietárias, podem estar em risco.
No fim das contas, no Android se pode comprar algo em torno de cinco vozes e na Apple nenhuma.

5 Vozes livres 


Você pode pegar um fuzil e sair por aí caçando piratas, você pode erguer seu dedo em riste e sair por aí acusando seus colegas de ladrões, burros e idiotas por incentivarem a pirataria, usando e ou distribuindo software pirata, ou então você pode aprender um pouco sobre software livre e realmente começar a pensar a coisa sob o ponto de vista estreitamente técnico e ético.
A melhor resposta as licenças abusivas não é a pirataria, e sim, o software livre, a diferença entre um e outro e que a pirataria é mais fácil e o software livre requer mais conhecimento e postura.
Agora se a Apple, paraíso das licenças proprietárias e das assinaturas não possui vozes para compra, como será o caso das vozes livres?
Pois o caso das vozes livres é que elas simplesmente não existem na plataforma, uma característica que o Android também lida melhor, pois no sistema do Google você tem, não só o eSpeack e suas variações mas também o projeto RHVoice com a voz Letícia.
Ou seja, no Android temos no mínimo duas vozes livres ao passo que na Apple não temos nenhuma. 

  

6 Vozes piratas.

A Apple não tem vozes pagas e não tem vozes livres também, mas a Apple também não tem vozes piratas e eis aí uma outra coisinha que a Apple não tem.
E chegamos aqui em uma esquina escura, numa noite sem lua e de nevoeiro para o Android minha gente, pois, aquilo que a Apple não tem, o Android tem demais.
Um paradoxo que diz muito a respeito da liberdade que desfrutamos no Google, uma liberdade que nem sempre vem acompanhada de ética , parafraseando Peter Parker, "com grandes poderes vem grandes responsabilidades".
O curioso desse paradoxo das vozes piratas no Android, é que o pirata acaba fazendo, na clandestinidade, um trabalho que poderia estar sendo feito por uma comunidade livre e apaixonada.
Querem um exemplo?
A última vez que se pode utilizar a voz Raquel no IOS, foi no Iphone 3GS e no Android eu nem lembro se ela chegou a ser comercializada, pois bem, o apk pirata dela está aí até os dias de hoje e se você estiver no Android 13, é  só pegar e usar.
Android 13 cara, bem assim.
E foda-se se é trinta e dois bits.
Bacana né?
Com relação a licença, a detentora dos direitos abandonou a voz e não deixa seus fãs darem continuidade à vida dela, um típico gesto de dono da bola, saca?
Um típico comportamento abusivo de quem detém a licença, porém, não defeca e nem desocupa a moita.
 Nesse exemplo, o pirata que toca a voz Raquel pra frente faz um trabalho de uso e distribuição comparável ao de um ente pertencente a uma comunidade livre e apaixonada, quer dizer, na verdade ele pertence a uma comunidade  apaixonada, ela só não é uma comunidade livre.
 Saindo do campo das paixões e dos trabalhos por amor a camiseta, sobram para nós que usamos Android, o rombo que a pirataria truculenta gera na vida dos desenvolvedores.
São pessoas e empresas que só estão tentando levar suas vidas numa boa enquanto outros procuram obter vantagem tomando para si a criação e o ganha pão alheio.
Práticas que querendo ou não, estão levando desenvolvedores a não comercializarem suas vozes mais no Android, um fato que pode no futuro aumentar as vantagens de se usar um IOS.
Com tudo isso, sou capaz de contar algo em torno de dez vozes piratas disponíveis  para Android, ao passo que na Apple não se conta nenhuma.

7 Conclusão.

Como você já deve ter percebido, as vozes foram um bom ponto de partida para discutir vários temas que o autor desse humilde blog aprecia bastante, ética, TTS e software livre são uma constante por aqui mas desta vez acho que quem saio ganhando mesmo foram realmente os usuários de IOS, por mais estranho que isso possa parecer, afinal de contas, o mesmo passo que a Nuance deu ao se desviar dos seus clientes no Android,  a Apple deu em direção aos seus clientes com deficiência visual no IOS.
Quanto ao jeito proprietário de se resolver as coisas, não podemos saber muito visto o caráter sigiloso de muitas assoes,   pegue o caso da voz da Raquel, algo a mais deve ter ocorrido que parou o projeto, alguma coisa jurídica, técnica  ou qualquer outra coisa do gênero mas que nós não ficamos sabendo, simplesmente o projeto  parou e pronto.
 No fim nos resta aguardar para saber qual vai ser o destino das muitas soluções que hoje utilizamos mas cujo destino parece incerto, acho que pude demonstrar os pontos fracos e fortes de Apple, Google, desenvolvedores e afins mas espero que também tenha ficado bem claro o papel que nós ocupamos nesse tabuleiro, e espero que um dia nós usuários realmente sejamos os verdadeiros protagonistas dessas historias.   
 
  







 



Nenhum comentário:

Postar um comentário

Seeing AI e Be my eyes agora são inclusivos

Seeing AI, Be my eyes e o mito do sistema mais acessível    Sabe quando você pega um celular de entrada e consegue extrair do assistente de...