Bienvenue au nouveau rapport Cervantes « L’espagnol dans le monde, 2025 » :
Nous avons été critiques sur l’édition 2024 de ce rapport. Nos considérations sur 2024 ont été pleinement surmontées; cette fois-ci, le rapport fournit des données originales et très intéressantes sur l’espagnol, tant sur le plan démographique qu’économique, et maintient l’accent sur l’aspect numérique et en particulier sur l’intelligence artificielle. Bien !
Une petite exception subsiste : malheureusement, Cervantes continue d’utiliser W3Techs, et ses données très biaisées, comme source de données linguistiques sur le Web. Cette fois, il nous mentionne dans une note qui semble justifier ce choix :
« Nous avons choisi de présenter les statistiques de W3Tech parce qu’elles sont obtenues automatiquement à partir de pages web considérées comme pertinentes pour leur contenu et leur fonctionnalité : les sites dupliqués, redirigés ou sous-domaines sont exclus, ainsi que les sites qui n’affichent qu’une seule page du serveur, par exemple. D’autres sources utilisent des critères différents pour quantifier le poids des langues sur l’internet. Ainsi, l’Observatoire de la diversité linguistique et culturelle sur Internet (OBDILCI), basé à Nice (France) et lié à l’Organisation internationale de la Francophonie et précédemment à l’Union latine, indique que 20 % des pages sur Internet sont en anglais, 19 % en chinois et 7,7 % en espagnol. Mais dans le même temps, l’OBDILCI a proposé un indice de cyberglobalisation (CGI) qui prend en compte le nombre de locuteurs des langues, le nombre de pays où elles sont parlées et le nombre de locuteurs connectés à l’internet. Cet indice complexe quantifie l’anglais avec 14,13 % de la cybermondialisation mondiale, le français avec 9,55 % et l’espagnol avec 2,09 % (OBDILCI, 2024). Les chiffres concernant les locuteurs sont tirés d’Ethnologue et d’autres sources, avec un intervalle de confiance de 20 %.
Certains éléments doivent être rectifiés ou clarifiés :
– W3techs ne propose pas de données pour les pages web mais pour les sites web, et la différence n’est pas un détail. Pour être précis, W3Techs identifie comme langue du site, la langue principale détectée sur la page d’accueil.
– Les critères de pertinence mentionnés sont techniques et implicites dans tout travail de ce type. La pertinence qui reste à mentionner et qui est précisément la plus pertinente est 1) que les données sont extraites du million de sites web les plus visités et 2) que W3Techs n’attribue qu’une seule langue par site web, et par défaut dans le cas de sites multilingues, l’anglais si présent.
Ces deux éléments, le second étant le plus impactant, expliquent les biais importants de ces données. En réalité, l’indicateur de W3Techs pour l’anglais est le pourcentage de sites web dont l’anglais est l’une des options linguistiques et, pour les autres langues, le pourcentage de sites web dans cette langue qui n’ont pas l’anglais comme option linguistique. Le lecteur intéressé par des données plus solides peut consulter le document présenté à la réunion LT4ALL2025 de l’UNESCO, qui recense toutes les études existantes et analyse leurs biais respectifs, pour arriver à la conclusion que le pourcentage de pages en anglais devrait se situer entre 20 % et 27 %, soit moins de la moitié du chiffre de W3Techs : Inventory and comparisons of all methods for the measure of languages online and implications on Internet’s lingua franca, LT4ALL2025, Paris-UNESCO, February 24-26, 2025 – Video (English -10mn), Vidéo (Français – 10mn), PPT
– L’OBDILCI n’est pas « lié à l’Organisation internationale de la Francophonie ». Il est vrai que la plupart de nos soutiens historiques sont venus du côté francophone, mais nous avons également reçu des soutiens importants du monde lusophone, et d’autres de l’UNESCO et de l’Organisation des États ibéro-américains (voir https://obdilci.org/apropos/soutiens/). Quoi qu’il en soit, nous sommes une organisation de la société civile indépendante des entités qui financent les projets.
– L’indice de cyber-mondialisation est un indicateur qui vise à mesurer les avantages à long terme des langues dans le monde numérique, contrairement au pourcentage de pages dans chaque langue, et il n’y a pas de contradiction entre les deux indicateurs.

