A (quarta) dimensão digital do anuário 2024 do Instituto Cervantes “O Espanhol no Mundo”.

No contexto do formidável investimento do Estado espanhol nos temas transversais da inteligência artificial e da língua [1] aguardava-se com grande interesse o lançamento anual do anuário do Instituto Cervantes para conhecer o primeiro impacto destes planos na dimensão digital da língua espanhola.


[1] O PERTE “nova economia da língua” anunciou orçamentos de mais de 2 mil milhões de euros para iniciativas e foi seguido pela estratégia para a inteligência artificial com um claro enfoque na língua.

Um aperitivo, tanto digestivo como nutritivo, tinha sido consumido anteriormente, com o excelente livro Los futuros del español. Horizonte de una lengua internacional de José Antonio Alonso, Juan Carlos Jiménez e José Luis García Delgado. Esta obra propõe a aplicação da ferramenta intelectual da economia à língua espanhola, conduzindo à produção de dados originais, baseados em fontes fiáveis e num raciocínio claro, tendo em vista o futuro desta língua. Conclui com uma série de recomendações muito inspiradoras que poderiam servir para outras línguas, para além do espanhol.

O anúncio da edição de 2024 de “El español en el mundo“, sob o título da forte presença do espanhol na música mundial, poderia ter levado a suspeitar de uma orientação cultural e não digital, mas a deceção não poderia ter sido maior ao consultá-lo, ao descobrir o vazio da dimensão digital da obra. Numa obra de mais de 600 páginas, o subcapítulo “Dimensão digital” tem menos de 20 linhas, mais de metade das quais explicam a fonte utilizada para o único dado apresentado: “Percentagens de utilização das línguas nos sítios Web“.

A fonte que a Cervantes persiste em utilizar, anos após anos, a W3Techs, é seriamente enviesada (ver a demonstração) e a seguinte descrição do seu método é totalmente fantasiosa, passo a citar: “Os dados são recolhidos com base em sítios Web considerados relevantes. Um sítio Web é relevante se tiver um conteúdo ou funcionalidades significativas“. Que tautologia!

A realidade, muito fácil de verificar aqui, é que a W3Techs produz os seus dados fazendo um scan aos milhões de sítios Web mais visitados, usando esta fonte para os localizar. A relevância a que se refere a W3Techs é um simples filtro para sítios vazios e sítios duplicados.

A W3Techs é uma fonte comercial muito fiável para as mais de 20 tecnologias Web que explora, mas não o é para a língua, que é “uma tecnologia Web” que tem a particularidade de não ser necessariamente exclusiva em um sítio Web, ao contrário das outras. O principal vies destes dados é que, ao não ter em conta o potencial multilinguismo dos sítios Web, multiplica a proporção de inglês por um fator de 2 (ver o link para mais pormenores).

Quanto à IA, o livro oferece uma excelente contribuição pedagógica sobre IA e línguas, certamente muito interessante e informativa sobre as opções para o espanhol. No entanto, quando a Espanha investiu somas colossais nesta matéria, seria de esperar receber, neste anuário, dados sobre a evolução destes projectos e não um curso sobre IA e língua.

A extensa e intensa comunicação sobre esse trabalho centra-se na predominância da música em língua espanhola no mundo, o que é certamente relevante, mas a questão da linguagem e das tecnologias de IA pode ser, atualmente, uma ordem de grandeza mais relevante e crucial.

A sua ausência levanta questões sobre o objetivo deste anuário. O problema está claramente nas expectativas frustradas de obter um compêndio de dados estatísticos fiáveis sobre o espanhol em todas as suas vertentes, com uma forte incidência na vertente digital, que se tornou a mais estratégica para o futuro.

É, sem dúvida, um trabalho notável sobre a temática cultural associada à língua espanhola, mas não é a compilação de dados úteis para os investigadores que se esperaria. Neste sentido, não é comparável ao esforço realizado de quatro em quatro anos pela Francofonia, sob um título semelhante “Le français dans le monde” , que reúne uma quantidade impressionante de dados originais e úteis sobre todos os aspectos, com um esforço particular na dimensão digital.

Deixe um comentário