OBDILCI

WWW: O ESTADO DO MULTILINGUISMO

WWW: O ESTADO DO MULTILINGUISMO

Se juntarmos as três principais fontes de dados com as quais a OBDILCI tem vindo a trabalhar:

  1. O nosso modelo
  2. Our MECILDI program
  3. Os nossos estudos baseados no DataProvider.com

Já podemos apresentar dados sobre o estado da arte do multilinguismo na Web.

 WHOLE WEB (3)O MILHÕ DE SITES MAIS VISITADOS (TRANCO)
(2)
NOTES
Rate of multilingualism1.63Number of web linguistic versions divided by number of web sites
Percentage of multilingual web sites15%33,7%Huge variance depending on country, language or type of web.
Average number of languages per multilingual web site57

Nota 1: Os valores em negrito são valores medidos; os valores em itálico são estimados ou calculados a partir de um valor estimado.

Nota 2: O valor relativo ao multilinguismo na Internet deve ser comparado com o valor equivalente para a humanidade, calculado como o número de falantes da primeira e da segunda língua dividido pelo número de falantes da primeira língua, cujo valor é de 1,44, de acordo com os dados do Ethnologue para 2024. A Internet é, portanto, muito mais multilingue do que a humanidade…

Nota 3: É perfeitamente coerente que os um milhão de sites mais visitados sejam 2,3 vezes mais multilingues do que a média mundial.

PERCENTAGE OF WEBPAGES PER LANGUAGEWHOLE WEB (1)TRANCO (3)
English20,08%21,77%
Chinese19,04%2,77%
Spanish7,70%6,36%
Hindi3,77%0,75%
Russian3,75%3,86%
Arabic3,65%1,60%
French3,42%6,38%
Portuguese3,16%3,86%
Japanese2,23%2,93%
German2,15%6,93%
Indonesian2,02%1,79%
Bengali1,48%0,33%
Turkish1,14%1,76%
Italian0,99%4,13%
Vietnamese0,95%1,09%
Korean0,87%1,62%
Persian0,86%0,28%
Urdu0,83%0,20%
Tagalog0,76%0,22%
Thai0,67%1,03%
Marathi0,58%0,14%
Telugu0,57%0,12%
Polish0,56%2,57%

As grandes diferenças entre os dois valores devem-se ao facto de os sites mais visitados apresentarem um forte viés a favor das principais línguas europeias, tanto por natureza (viés natural do tráfego) como por estrutura (viés geográfico que conduz a um viés a favor das línguas europeias nas fontes de classificação — Majestic, QuantCast, Cisco Umbrella).

Se estiver interessado em conhecer todas as outras fontes existentes para os dados correspondentes, consulte este documento publicado para a UNESCO LT4ALL2025.

Projetos de OBDILCI

  • Indicadores da presença das línguas e multilinguismo na Internet
  • As línguas da França na Internet
  • Francês na Internet
  • Português na Internet
  • Espanhol na Internet
  • Multilinguismo en la Web
  • Cursos
  • IA e multilinguismo
  • gTLDs linguisticos
  • DILINET
  • Projetos pré-históricos
  • Projeto Digital Language Death