PROJET PRINCIPAL – CYBERGEOGRAPHIE

Cybergéographie des familles de langues

Cette page propose d’analyser l’évolution linguistique de l’internet d’un point de vue géographique.

Par perspective géographique, il faut entendre la localisation géographique de l’origine des langues.

A cet effet, les indicateurs Internet produits par le modèle OBDILCI pour les 343 langues ayant plus d’un million de locuteurs L1 sont regroupés par familles linguistiques.

Les langues européennes sont les langues originaires d’Europe (anglais, français, espagnol, hongrois…), indépendamment du fait que leurs locuteurs aient été disséminés dans d’autres régions géographiques. A noter que le modèle comprend actuellement 46 langues européennes.

Les langues africaines comprennent toutes les langues locales d’Afrique (telles que le swhaili, le fulfulde ou le shona). A noter que le modèle comprend actuellement 143 langues africaines.

Les langues asiatiques comprennent toutes les langues locales d’Asie (telles que le chinois, l’hindi ou le vietnamien). Notez que le modèle comprend actuellement 135 langues asiatiques.

Il y a actuellement 8 langues des Amériques (telles que l’aymara, le quechua ou le créole jamaïcain).

Les différentes langues arabes regroupées dans la macro-langue arabe forment une seule famille.

Il n’y a malheureusement pas de langues du Pacifique à ce stade, car aucune n’atteint le million de locuteurs.


Les indicateurs calculés par famille sont ceux produits par le modèle OBDLCI :

Internautes % : le pourcentage de personnes connectées à l’internet pour chaque famille de langues.

Contenus % : Le pourcentage de contenus Web pour chaque famille de langues.

Présence virtuelle : le rapport entre le % de contenus et le % de population pour chaque famille de langues

Production de contenu : le rapport entre le % de contenus et le % de locuteurs connectés pour chaque famille de langues.

Locuteurs L1+L2 % : le pourcentage mondial de locuteurs L1+L2 pour chaque famille linguistique.

Locuteurs connectés % : le pourcentage de locuteurs connectés de chaque famille linguistique parmi les locuteurs connectés L1+L2 dans le monde.

Il est à noter que tous les chiffres et pourcentages sont calculés sur la base de L1+L2 (langue première plus langues secondes).

V5.1, avril 2024 – Mise à jour des données démo-linguistiques et UIT

LANGUES DE >AfriqueAmériquesMonde arabeAsie Europe Pacifique Non inclus TOTAL
Internautes %36,5%68,2%67,8%60,1%88,0%62,1%49,11%63,41%
Contenus4,25%0,29%3,65%44,11%45,94%0,03%1,74%100%
Présence virtuelle0,360,830,890,911,430,520,511
Productivité des contenus0,630,810,840,931,190,730,661
Locuteurs L1+L2 %11,68%0,35%4,08%48,37%32,06%0,05%3,42%100%
% Locuteurs connectés6,77%0,36%4,37%47,28%38,55%0,04%2,65%100%
Nombre de langues15281147512 361

Commentaires pour V5.1 : Peu de changements. Premières langues du Pacifique.

V4, mai 2023 – Mise à jour des données démo-linguistiques

Langues de >AfriqueAmériquesMonde arabeAsieEuropeNon inclusTOTAL
Internautes %36,4%65,8%68,4%56,3%84,9%47,92%61,63%
Contenus %4,38%0,29%3,91%43,76%45,66%2,00%100%
Présence virtuelle0,400,830,920,901,440,501
Productivité des contenus0,610,810,830,941,190,651
Locuteurs L1+L2 %11,00%0,35%4,23%48,75%31,71%3,96%100%
Locuteurs connectés L1+L2 %7,17%0,36%4,70%46,44%38,26%3,08%100%
Nombre de langues1438114347342

Commentaire pour la V4 : Le début de la croissance de la famille africaine constaté dans la V3.2. est confirmé et amplifié.

La différence de % de contenus entre les langues asiatiques et européennes disparaîtra probablement dans un avenir proche, car les taux de connectivité continuent d’augmenter en Asie.

On peut être surpris de voir le taux mondial de connectivité diminuer légèrement à 61,63% : c’est la conséquence de corrections dans les données d’Ethnologue et/ou de l’UIT qui augmenteraient le nombre de locuteurs dans des pays à très faible connectivité. Par exemple : le nombre d’anglophones au Pakistan, pays dont le taux de connectivité a été corrigé à la baisse par l’UIT, a augmenté de 79 millions et celui des francophones en République démocratique du Congo de 31 millions.
Les taux de connectivité pour l’anglais et le français ont donc diminué entre les versions 3.2 et 4, de même que le taux mondial.


V3.2, mars 2023 – Mise à jour du nombre de personnes connectées par pays

Langues de >AfriqueAmériquesMonde arabeAsieEuropeNon inclusTOTAL
Internautes %36,2%65,7%65,0%56,0%85,1%53,65%62,05%
Contenus %3,38%0,25%3,00%43,33%46,11%3,92%100%
Présence virtuelle0,370,800,850,901,490,511
Productivité des contenus0,580,750,810,951,220,591
Locuteurs L1+L2 %9,21%0,31%3,53%48,39%30,87%7,69%100%
Locuteurs connectés %5,83%0,33%3,70%45,81%37,67%6,65%100%
Nombre de langues1398113546329


Commentaire pour V3.2: Il y a enfin un début de croissance pour la famille des langues africaines, principalement une conséquence de la croissance des taux de connexion à l’Internet dans plusieurs pays africains.


V3.1, août 2022 – Mise à jour du nombre de personnes connectées par pays

Langues de >AfriqueAmériquesMonde arabeAsieEuropeNon inclusTOTAL
Internautes %31,1%61,4%65,1%51,9%82,6%49,07%58,69%
Contenus%3,07%0,24%3,14%43,29%46,45%3,81%100%
Présence virtuelle0,330,790,890,891,500,501
Productivité des contenus0,590,750,800,941,210,591
Locuteurs L1+L2 %9,21%0,31%3,53%48,39%30,87%7,69%100%
Locuteurs connectés %5,21%0,32%3,92%45,82%38,30%6,43%100%
Nombre de langues1398113546329

V3.c, Mars 2022

Langues de >AfriqueAmériquesMonde arabeAsieEuropeNon inclusTOTAL
Internautes %29,8%56,7%64,0%49,3%82,6%47,06%56,91%
Contenus %3,03%0,24%3,16%43,32%46,49%3,77%100%
Présence virtuelle0,330,770,890,901,510,491
Productivité des contenus0,590,750,790,951,210,591
Locuteurs L1+L2 %9,21%0,31%3,53%48,39%30,87%7,69%100%
Locuteurs connectés %5,16%0,32%3,97%45,62%38,57%6,36%100%
Nombre de langues1398113546329

Commentaire pour V3.c: C’est le début du calcul des indicateurs par famille de langue.

Il est à noter que les contenus des langues asiatiques se rapprochent des langues européennes malgré l’énorme différence de taux de connectivité.

Les deux cartes ci-dessous offrent la perspective à moyen terme pour l’évolution de la cyber-géographie des langues.

Les projets d’OBDILCI

  • Indicateurs de la présence des langues dans l’Internet
  • Les langues de France dans l’Internet
  • Le français dans l’Internet
  • Le portugais dans l’Internet
  • L’espagnol dans l’Internet
  • IA et multilinguisme
  • DILINET
  • Projets pré-historiques