OBDILCI

L’ÉTAT DU MULTILINGUISME DU WEB

L’ÉTAT DU MULTILINGUISME DU WEB

Si l’on rassemble les trois principales sources de données sur lesquelles OBDILCI a travaillé :

  1. Notre modèle
  2. Notre programme MECILDI
  3. Nos études basées sur DataProvider.com

Nous pouvons offrir des données sur l’état actuel du multilinguisme du Web. Chiffres mis à jour en avril 2026 après les dernières études.

 TOILE ENTIÈRE (1) LE MILLION DE SITES LES PLUS VISITÉS (TRANCO)
(2)
COMMENTAIRES
Taux de multilinguisme1,63Nombre de versions linguistiques des sites web divisé par le nombre de sites web
Pourcentage de sites web multilingues15%33,7%Il existe d’énormes différences selon le pays, la langue ou le type de site web.
Nombre moyen de langues par site web multilingue57

Note 1 : Les chiffres en gras sont des données mesurées, tandis que ceux en italique sont des estimations ou ont été calculés à partir d’une estimation.

Note 2 : Le chiffre relatif au multilinguisme du Web doit être comparé à celui correspondant à l’humanité, calculé en divisant le nombre de locuteurs de première et de deuxième langues par le nombre de locuteurs de première langue, dont la valeur est de 1,44 selon les données d’Ethnologue pour 2024. Le Web est donc bien plus multilingue que l’humanité…

Note 3 : Il est tout à fait logique que le million de sites web les plus visités soient 2,3 fois plus multilingues que la moyenne mondiale.

PERCENTAGE OF WEBPAGES PER LANGUAGEWHOLE WEB (1)TRANCO (3)
English20,08%21,77%
Chinois19,04%2,77%
Spanish7,70%6,36%
Hindi3,77%0,75%
Russe3,75%3,86%
Arabe3,65%1,60%
Français3,42%6,38%
Portugais3,16%3,86%
Japanese2,23%2,93%
Allemand2,15%6,93%
Indonésien2,02%1,79%
Bengali1,48%0,33%
Turc1,14%1,76%
Italien0,99%4,13%
Vietnamien0,95%1,09%
Coréen0,87%1,62%
Perse0,86%0,28%
Ourdou0,83%0,20%
Tagalog0,76%0,22%
Thaïlandais0,67%1,03%
Marathi0,58%0,14%
Télougou0,57%0,12%
Polonais0,56%2,57%

Les écarts importants entre ces deux chiffres s’expliquent par le fait que les sites web les plus visités sont, de par leur conception (biais naturel lié au trafic) et leur structure (biais géographique entraînant une prédominance des langues dominantes européennes dans les sources de classement – Majestic, QuantCast, Cisco Umbrella), fortement biaisés en faveur des principales langues européennes dominantes.

Si vous souhaitez connaître toutes les autres sources existantes pour ces chiffres, consultez ce document publié pour la réunion UNESCO LT4ALL2025.

Les projets d’OBDILCI

  • Indicateurs de la présence des langues et du multilinguisme dans l’Internet
  • Les langues de France dans l’Internet
  • Le français dans l’Internet
  • Le portugais dans l’Internet
  • L’espagnol dans l’Internet
  • Rapports sur le multilinguisme de la Toile
  • Cours
  • IA et multilinguisme
  • gTLDs linguistiques
  • DILINET
  • Projets pré-historiques
  • Mort numérique des langues