Résultats de la campagne 2022 V3.0

Results of the LC2022 (March 2022, V3.0) Study

Vous êtes invités à consulter la dernière étude de l’Observatoire de la diversité linguistique et culturelle dans l’Internet, sur la présence des langues dans l’Internet. La méthodologie, les sources de données, les produits et les biais de l’étude sont documentés en anglais, français, portugais et espagnol.

L’internationalisation de l’Internet est bien avancée et son centre de gravité s’éloigne des pays occidentaux. Le pourcentage du Web en anglais était de 50 % en 2007, de 30 % en 2017 et atteint aujourd’hui 25 %.

Cependant, les médias continuent de projeter des chiffres supérieurs à 50 % pour l’anglais, à partir des observations quotidiennes de W3Techs. Comment cette source peut-elle se tromper à ce point ? C’est le multilinguisme, idiot ! paraphrasant cette célèbre expression et avançant l’idée que le moteur économique du web est désormais le multilinguisme plutôt qu’une langue particulière…

L’absence de prise en compte du multilinguisme entraîne d’énormes erreurs lorsque l’on applique l’algorithme de reconnaissance des langues en se concentrant uniquement sur les pages d’accueil et que l’on calcule les pourcentages sur la population mondiale au lieu du nombre total de locuteurs L1+L2 (selon la source Ethnologue L1+L2/L1 = 1,43, voir la note ci-dessous).

Comment est-il possible que le pourcentage de pages Web en anglais soit resté stable à 50 % au cours des 14 dernières années, alors que l’Internet a radicalement changé sa démographie et que le nombre d’anglophones connectés (L1+L2) a connu une baisse relative, passant de 32 % du total des personnes connectées en 2007 à seulement 13 % aujourd’hui ? L’anglais était en effet mesuré autour de 50% des contenus Web entre 2007 et 2009 (voir ici), mais depuis la croissance exponentielle du chinois, de l’hindi, de l’arabe, du turc, du bengali, du vietnamien, de l’ourdou, du persan et du marathi, pour ne citer que les langues des 20 premiers rangs, pesant ensemble près de 28% des contenus, la situation a radicalement changé et l’anglais ne représente plus aujourd’hui qu’un quart des contenus, ce qui représente tout de même le double de sa population connectée et une performance spectaculaire.

L’anglais reste la première langue du web en termes de puissance, mais les proportions changent radicalement. Le chinois est désormais la langue qui compte le plus de locuteurs connectés. En termes de puissance, l’espagnol occupe une solide troisième place, suivi du français et de l’hindi. Suivent le portugais, le russe, l’arabe, l’allemand et le japonais.

En ce qui concerne les indicateurs indépendants du nombre de locuteurs (capacité et gradient), les langues des pays bien classés dans les paramètres de la société de l’information sont en tête : l’hébreu, le finnois, le suédois, le néerlandais, l’allemand et le danois.

Les langues les plus connectées sont le danois, le suédois, le japonais, le néerlandais, le suisse allemand et le finnois.


Cette étude a été rendue possible grâce au soutien du département culturel et éducatif du ministère brésilien des affaires étrangères, dans le cadre de l’Institut international de la langue portugaise et de la coordination de la chaire UNESCO sur les politiques linguistiques pour le multilinguisme, sous la direction de Gilvan Müller de Oliveira. Nous remercions Álvaro Blanco pour son soutien à la programmation ainsi que David Pimienta. L’idée de rassembler diverses sources pour mesurer les langues sur l’internet et de transformer les chiffres par pays en chiffres par langue a été lancée pour la première fois par Daniel Prado en 2012.

L’Observatoire, avec le soutien de Organisation Internationale de la Francophonie, proposera de nouveaux résultats avant la fin de l’année 2021, avec de nouvelles approches pour tenter d’éliminer les biais restants, et une extension de la couverture aux 328 langues ayant plus d’un million de locuteurs de L1 (par opposition à la couverture actuelle de 138 langues de L1…).


Ces informations sont ouvertes et publiques, n’hésitez pas à les faire circuler là où vous le jugez utile et n’hésitez pas à ouvrir le dialogue avec p i m i e n t a@funredes.org en cas de questions, de doutes ou de critiques documentées.

Notes :

L1 signifie langue maternelle (également appelée première langue).

L2 signifie deuxième langue.

Le rapport (L1+L2)/L1 montre l’importance mondiale du multilinguisme (en d’autres termes, 43 % de la population mondiale parle plus d’une langue).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *