OBDILCI

WWW: EL ESTADO DEL MULTILINGÜISMO

WWW: EL ESTADO DEL MULTILINGÜISMO

Si unimos las tres principales fuentes de datos en las que ha estado trabajando OBDILCI:

  1. Nuestro modelo
  2. Nuestro programa MECILDI
  3. Nuestros estudios basados en DataProvider.com

Ahora podemos ofrecer datos sobre el estado actual del multilingüismo en la web.

 TODO EL WEB (3)EL MILLON DE SITIOS MÁS VISITADOS (TRANCO)
(2)
COMENTARIOS
Rate of multilingualism1,63Number of web linguistic versions divided by number of web sites
Porcentaje de sitios web multilingües15%33,7%Huge variance depending on country, language or type of web.
Average number of languages per multilingual web site57

Nota 1: Las cifras que aparecen en negrita son medidas, mientras que las cifras en cursiva son estimadas o calculadas a partir de una cifra estimada.

Nota 2: La cifra relativa al multilingüismo en la web debe compararse con la cifra equivalente para la humanidad, calculada como el número de hablantes de la primera y la segunda lengua dividido por el número de hablantes de la primera lengua, cuyo valor es de 1,44 según los datos de Ethnologue para 2024. Por lo tanto, la World Wide Web es mucho más multilingüe que la humanidad…

Nota 3: Es totalmente lógico que el millón de sitios web más visitados sean 2,3 veces más multilingües que la media mundial.

PERCENTAGE OF WEBPAGES PER LANGUAGEWHOLE WEB (1)TRANCO (3)
English20,08%21,77%
Chinese19,04%2,77%
Spanish7,70%6,36%
Hindi3,77%0,75%
Russian3,75%3,86%
Arabic3,65%1,60%
French3,42%6,38%
Portuguese3,16%3,86%
Japanese2,23%2,93%
German2,15%6,93%
Indonesian2,02%1,79%
Bengali1,48%0,33%
Turkish1,14%1,76%
Italian0,99%4,13%
Vietnamese0,95%1,09%
Korean0,87%1,62%
Persian0,86%0,28%
Urdu0,83%0,20%
Tagalog0,76%0,22%
Thai0,67%1,03%
Marathi0,58%0,14%
Telugu0,57%0,12%
Polish0,56%2,57%

Las grandes diferencias entre ambas cifras se deben a que los sitios web más visitados presentan un sesgo marcado a favor de las principales lenguas europeas, tanto por su diseño (sesgo natural derivado del tráfico) como por su estructura (sesgo geográfico que da lugar a un sesgo hacia las lenguas europeas en las fuentes de clasificación: Majestic, QuantCast y Cisco Umbrella).

Si te interesa conocer todas las demás fuentes disponibles para las cifras correspondientes, consulta este documento publicado para el programa LT4ALL2025 de la UNESCO.

Proyectos OBDILCI

  • Indicadores de la presencia de lenguas en la Internet
  • Las lenguas de Francia en la Internet
  • El francés en la Internet
  • El portugués en la Internet
  • El español en la Internet
  • IA y multilinguismo
  • gTLDs lingüísticos
  • Proyectos pre-históricos
  • Muerte digital de las lenguas