Jalons 2023

OBDILCI

L’Observatoire de la diversité linguistique et culturelle dans l’Internet est heureux d’annoncer plusieurs étapes importantes dans ses efforts pour mesurer la diversité linguistique et culturelle dans l’Internet.

1. Nouveau nom de domaine

Nous avons maintenant un nom de domaine et un logo conçus pour exprimer notre mission.

2. Méthodologie publiée dans une revue à comité de lecture

La description détaillée de la méthodologie qui soutient notre modèle de création d’indicateurs de présence sur Internet pour 342 langues, a été publiée dans un journal à comité de lecture, à données ouvertes et de bonne réputation : Frontiers Research Metrics and Analytics : The method behind the unprecedented production of indicators of the presence of languages in the Internet. La référence est Front. Res. Metr. Anal. Sec. Research Methods Volume 8 – 2023.  doi: 10.3389/frma.2023.1149347. (version française)

Il s’agit d’une étape clé pour ce projet.

3. Publication de la version 4 de l’étude

Le modèle, qui produit des indicateurs innovants depuis 2017, est arrivé à la version 4, avec la mise à jour de ses données démolinguistiques, à partir de la base de données Ethnologue #26 de mars 2023, et avec une amélioration supplémentaire dans notre quête de réduction des biais (voir ici).

Les premiers progrès détectés pour les langues africaines, dans la version 3.2, avec la mise à jour des chiffres de l’UIT pour les personnes connectées par pays, sont confirmés dans la version 4 et peuvent marquer le début de l’inclusion des langues africaines dans la nouvelle ère de multilinguisme dans laquelle l’internet est imbriqué (voir l’évolution de la cyber-géographie des familles de langues à travers les versions).

4. L’accès à la base de données est maintenant disponible

Une base de données d’accès aux résultats produits par le modèle a passé les tests et est en ligne à https://obdilci.org/Base.

5. Prépublication d’un nouvel article

Nous aimerions également partager la version préliminaire d’un nouvel article qui sera bientôt examiné par des pairs : « Is it true that more than half the web contents are in English?« , doi : 10.13140/RG.2.2.20798.70724. Espérons que cette démonstration simple mais efficace contribuera à s’opposer aux chiffres biaisés qui nient la croissance extraordinaire du multilinguisme sur le Web au cours de la dernière décennie.


Il est temps de remercier à nouveau les organisations qui ont rendu possible ce projet et les progrès ultérieurs.

Remerciements

Le projet a été mené par OBDILCI, avec la collaboration, à partir de la version 2, en avril 2021, de la Chaire UNESCO sur les politiques linguistiques pour le multilinguisme, de laquelle l’OBDILCI est membre. Le projet a été financé par l’Organisation de la Francophonie, pour les pré-études, la version 1 et la version 3 et par le ministère brésilien des Affaires étrangères via Instituto da Lingua Portuguesa pour la version 2. La réalisation de l’accès à la base de données et l’ouverture de la publication dans Frontiers Research Metrics and Analytics, ont été financées par la Délégation générale à la langue française et aux langues de France, du ministère français de la Culture, ainsi que par le Délégué permanent du Brésil auprès de l’UNESCO.

Sources

Les indicateurs de la présence des langues sur Internet sont produits par un modèle développé par l’OBDILCI qui utilise les sources suivantes :

Pour les données démo-linguistiques, Ethnologue, une source propriétaire, mise à jour une fois par an.

Pour le pourcentage de personnes connectées à l’internet, UIT et Banque Mondiale, deux sources publiques mises à jour une fois par an.

Pour les données sur les langues et pays dans l’Internet, une grande variété de sources publique directes (tels que Imminent T-Index ou legacy.socialprogress.org) ou des sources indirectes (tel que similarweb.com appliqué à une série de sites web), qui sont toutes présentées à https://www.frontiersin.org/articles/10.3389/frma.2023.1149347/full#supplementary-material.

Produits

Les indicateurs produits par l’OBDILCI sont accessibles sous licence CC-BY-SA 4.0, dans des fichiers Excel, téléchargeables ou sous forme de requête à la base de données https://obdilci.org/Base. Les résultats de la version 3.0 sont décrits en détail dans l’article en données ouvertes et évalué par des pairs Ressource : Indicateurs de la présence des langues dans l’Internet, présenté en 2022 lors de l’événement biannuel organisé par l’Association européenne des ressources linguistiques, SIGUL2022/LREC2022 (version française). Les indicateurs suivants sont produits pour chacune des 341 langues comptant plus d’un million de locuteurs L1 et triés :

a : Pourcentage de locuteurs par rapport à la population mondiale L1+L2

b : Pourcentage de locuteurs connectés par rapport à la population mondiale connectée L1+L2

c : Pourcentage de locuteurs L1+L2 connectés à l’internet

d : Pourcentage de contenus web

e : Présence virtuelle (d divisé par a)

f : Productivité des contenus (d divisé par b)




Dans la version 4, les valeurs mondiales suivantes ont été atteintes :

Population L1+L2 : 10 598 681 424

Population L1 : 7 403 726 853

Taux de multilinguisme dans le monde : 1,43

Couverture de la population mondiale L1+L2 par les 341 langues de l’étude : 96.04%

Couverture en termes de contenus par les 341 langues de l’étude : 98.00%

L1+L2 pourcentage mondial de personnes connectées : 66.66%

Pour plus d’informations :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *