GoogleTranslate extended to 244 languages but introduced a controversial matter with Portuguese

In June 2024, GoogleTranslate have extended its capacity to detect and translate languages to 244 languages with some new 100 languages, which is obviously a great news.

Something however could arise a justified controversy: the separation between Portuguese from Brazil and Portuguese from Portugal. While in its oral form the accent differences are major between Portugal and Brazil for the listener, in its written form the differences between the two expressions are so minor that this create a dangerous precedent.

The written differences between Portuguese from Brazil are of the same order of magnitude that from French in France and French in Québec or Spanish in Spain and Spanish in a Latin American country, and probably not much that from the way French is used in certain region of France compared to Paris!

If such decision is then generalized it would lead to the balkanization of translation between countries and even within countries between regions…

We have tested the following:

  • Select typical expressions of Brazil and translate them with GoogleTranslate between the 2 forms of the language. Source : https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-idiomaticas-traduzidas/
  • Select typical expressions of Portugal and translate them with GoogleTranslate between the 2 forms of the language. Source : https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-tipicamente-portuguesas/
  • Test the differences of English texts translated into the 2 different forms.

The results are the following:

  • The translation of typical expressions is not performed, they remain identical.
  • The translation of the explanations of the meaning of those expressions showed extremely minor differences in less than 10% of the case.
  • The English texts translated showed extremely minor differences like in the previous case.

In conclusion, the difference made is not a good idea and have a high potential to create a precedent extremely toxic for many languages whose population of speakers is spread around many countries with the logical adaptations to local context (such as English, French, Spanish, German, Russian and many others).

PD: The other cases where such distinction is made have a solid justification for splitting; in most of the case because the alphabets are different, in some cases because the differences are important (Chinese Hakka and Batak); they are the following:

  • Batak Karo, Batak Simalungun, Batak Toba
  • Chinese (simplified), Chinese (traditional), Chinese Hakka
  • Kurdish (Kurmanyi), Kurdish (Sorani)
  • Malay, Malay (Jawi)
  • Punjabi (Gurmukhi), Punjabi (Shahmukhi)

This text translated into Portuguese (Brazil) by GoogleTranslate (the differences are shown with superscript)

O GoogleTranslate foi ampliado para 244 idiomas, mas introduziu uma questão polêmica com o português

Em junho de 2024, o GoogleTranslate estendeu sua capacidade de detectar e traduzir idiomas para 244 idiomas com cerca de 100 novos idiomas, o que é obviamente uma ótima notícia.

No entanto, algo pode gerar uma controvérsia justificada: a separação entre o português do Brasil e o português de Portugal. Enquanto na forma oral as diferenças de sotaque são maiores entre Portugal e o Brasil para o ouvinte, na forma escrita as diferenças entre as duas expressões são tão pequenas que isso cria um precedente perigoso.

As diferenças escritas entre o português do Brasil são da mesma ordem de magnitude que do francês na França e do francês em Québec ou do espanhol na Espanha e do espanhol em um país latino-americano, e provavelmente não muito do modo como o francês é usado em certas regiões da França em comparação com Paris!

Se tal decisão for generalizada, levaria à balcanização da tradução entre países e até mesmo dentro de países entre regiões…

Testamos o seguinte:

– Selecione expressões típicas do Brasil e traduza-as com o GoogleTranslate entre as 2 formas do idioma. Fonte: https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-idiomaticas-traduzidas/

– Selecione expressões típicas de Portugal e traduza-as com o GoogleTranslate entre as 2 formas da língua. Fonte: https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-tipicamente-portuguesas/

– Teste as diferenças de textos em inglês traduzidos para as 2 formas diferentes.

Os resultados são os seguintes:

– A tradução de expressões típicas não é realizada, elas permanecem idênticas.

– A tradução das explicações do significado dessas expressões mostrou diferenças extremamente pequenas em menos de 10% dos casos.

– Os textos em inglês traduzidos mostraram diferenças extremamente pequenas como no caso anterior.

Concluindo, a diferença feita não é uma boa ideia e tem um alto potencial para criar um precedente extremamente tóxico para muitas línguas cuja população de falantes está espalhada por muitos países com as adaptações lógicas ao contexto local (como inglês, francês, espanhol, alemão, russo e muitos outros).

This text translated into Portuguese (Portugal) by GoogleTranslate (differences are shown with superscript).

O GoogleTranslate foi alargado para 244 línguas, mas introduziu um assunto polémico com o português

Em junho de 2024, o GoogleTranslate alargou a sua capacidade de deteção e tradução de idiomas para 244 idiomas, com cerca de 100 novos idiomas, o que é obviamente uma ótima notícia.

Algo, porém, poderá suscitar uma justificada controvérsia: a separação entre portugueses do Brasil e portugueses de Portugal. Enquanto na sua forma oral as diferenças de sotaque entre Portugal e o Brasil são grandes para o ouvinte, na sua forma escrita as diferenças entre as duas expressões são tão pequenas que criam um precedente perigoso.

As diferenças escritas entre o português do Brasil são da mesma ordem de grandeza que as do francês em França e do francês no Québec ou do espanhol em Espanha e do espanhol num país latino-americano, e provavelmente não muito devido à forma como o francês é utilizado em certas regiões do país.

Se tal decisão for então generalizada, levaria à balcanização da tradução entre países e mesmo dentro dos países entre regiões…

Testámos o seguinte:

– Selecione expressões típicas do Brasil e traduza-as com o GoogleTranslate entre as 2 formas do idioma. Fonte: https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-idiomaticas-traduzidas/

– Selecione expressões típicas de Portugal e traduza-as com o GoogleTranslate entre as 2 formas da língua. Fonte: https://www.infopedia.pt/topicos/dominio-da-lingua/expressoes-tipicamente-portuguesas/

– Teste as diferenças dos textos em inglês traduzidos nas 2 formas diferentes.

Os resultados são os seguintes:

– A tradução de expressões típicas não é realizada, mantêm-se idênticas.

– A tradução das explicações do significado destas expressões apresentou diferenças extremamente pequenas em menos de 10% dos casos.

– Os textos em inglês traduzidos apresentaram diferenças extremamente pequenas como no caso anterior.

Concluindo, a diferença feita não é uma boa ideia e tem um elevado potencial para criar um precedente extremamente tóxico para muitas línguas cuja população de falantes está espalhada por muitos países com as adaptações lógicas ao contexto local (como o inglês, o francês, o espanhol, o alemão, russo e muitos outros).

Leave a Reply

Your email address will not be published. Required fields are marked *