OBDILCI
WWW: O ESTADO DO MULTILINGUISMO

WWW: O ESTADO DO MULTILINGUISMO
Se juntarmos as três principais fontes de dados com as quais a OBDILCI tem vindo a trabalhar:
Já podemos apresentar dados sobre o estado da arte do multilinguismo na Web.
| WHOLE WEB (3) | O MILHÕ DE SITES MAIS VISITADOS (TRANCO) (2) | NOTES | |
| Rate of multilingualism | 1.6 | 3 | Number of web linguistic versions divided by number of web sites |
| Percentage of multilingual web sites | 15% | 33,7% | Huge variance depending on country, language or type of web. |
| Average number of languages per multilingual web site | 5 | 7 |
Nota 1: Os valores em negrito são valores medidos; os valores em itálico são estimados ou calculados a partir de um valor estimado.
Nota 2: O valor relativo ao multilinguismo na Internet deve ser comparado com o valor equivalente para a humanidade, calculado como o número de falantes da primeira e da segunda língua dividido pelo número de falantes da primeira língua, cujo valor é de 1,44, de acordo com os dados do Ethnologue para 2024. A Internet é, portanto, muito mais multilingue do que a humanidade…
Nota 3: É perfeitamente coerente que os um milhão de sites mais visitados sejam 2,3 vezes mais multilingues do que a média mundial.
| PERCENTAGE OF WEBPAGES PER LANGUAGE | WHOLE WEB (1) | TRANCO (3) |
| English | 20,08% | 21,77% |
| Chinese | 19,04% | 2,77% |
| Spanish | 7,70% | 6,36% |
| Hindi | 3,77% | 0,75% |
| Russian | 3,75% | 3,86% |
| Arabic | 3,65% | 1,60% |
| French | 3,42% | 6,38% |
| Portuguese | 3,16% | 3,86% |
| Japanese | 2,23% | 2,93% |
| German | 2,15% | 6,93% |
| Indonesian | 2,02% | 1,79% |
| Bengali | 1,48% | 0,33% |
| Turkish | 1,14% | 1,76% |
| Italian | 0,99% | 4,13% |
| Vietnamese | 0,95% | 1,09% |
| Korean | 0,87% | 1,62% |
| Persian | 0,86% | 0,28% |
| Urdu | 0,83% | 0,20% |
| Tagalog | 0,76% | 0,22% |
| Thai | 0,67% | 1,03% |
| Marathi | 0,58% | 0,14% |
| Telugu | 0,57% | 0,12% |
| Polish | 0,56% | 2,57% |
As grandes diferenças entre os dois valores devem-se ao facto de os sites mais visitados apresentarem um forte viés a favor das principais línguas europeias, tanto por natureza (viés natural do tráfego) como por estrutura (viés geográfico que conduz a um viés a favor das línguas europeias nas fontes de classificação — Majestic, QuantCast, Cisco Umbrella).
Se estiver interessado em conhecer todas as outras fontes existentes para os dados correspondentes, consulte este documento publicado para a UNESCO LT4ALL2025.


Projetos de OBDILCI
- Indicadores da presença das línguas e multilinguismo na Internet
- As línguas da França na Internet
- Francês na Internet
- Português na Internet
- Espanhol na Internet
- Multilinguismo en la Web
- Cursos
- IA e multilinguismo
- gTLDs linguisticos
- DILINET
- Projetos pré-históricos
- Projeto Digital Language Death
