PROYECTO PRINCIPAL – V1.0 (2017)

Indicadores de la presencia de lenguas en la Internet

NOTA: Esta es una versión archivada del estudio. Haga clic aquí para ver la versión más reciente.

Resumen del proyecto – V1.0 (2017)

Este observatorio midió el lugar de las lenguas latinas, el inglés y el alemán en la Internet entre 1997 y 2007. Tras 10 años de eclipse, debido a la evolución de los motores de búsqueda, volvemos, gracias al apoyo de la Organización Internacional de la Francofonía y MAAYA, con un nuevo método de elaboración de indicadores para las 140 lenguas con más de 5 millones de hablantes.

El método, los resultados y un debate sobre los sesgos en la medición de las lenguas en la Internet pueden leerse en: Un enfoque alternativo para producir indicadores de la presencia de las lenguas en la Internet, junio de 2017. Los resultados completos de las 140 lenguas pueden consultarse a continuación.

Una versión breve e introductoria de 5 páginas en inglés se presentó en LT4ALL Conferencia Internacional Tecnologías lingüísticas para todos: posibilitar la diversidad lingüística y el multilingüismo en todo el mundo, UNESCO, París, noviembre de 2019: Indicators of languages in Internet.

También puedes ver las 2 presentaciones:


Seis indicadores

  • Internautas (personas conectadas a la Internet), es decir, hablantes de cada lengua con acceso a la Internet. Un único microindicador (ofrecido por la UIT) responde a esta necesidad y servirá de fuente fundamental para el resto del trabajo.
  • Uso: Se refiere a las suscripciones a aplicaciones o medios de conexión a la Internet. Once microindicadores intervienen en la construcción de este indicador.
  • Tráfico: Indicación del tráfico generado por los usuarios hacia las aplicaciones. Para construir este indicador se utilizan 316 microindicadores.
  • Índice: Se refiere a la clasificación de los países en diversos aspectos de la sociedad de la información. Actualmente se utilizan cinco microindicadores para construir este indicador.
  • Contenido: Se refiere al contenido en la web para cada lengua y que, por el momento, recoge principalmente datos de la galaxia Wikimedia. Trece microindicadores proporcionan datos para este indicador.
  • Interfaces y traducción de lenguas: se refiere a la presencia de lenguas en las interfaces de las aplicaciones o como lengua de traducción. Veintitrés microindicadores componen este indicador.

Tres macroindicadores

  • Potencia de las lenguas en la Internet, que mide la cuota global de lenguas en Internet, media de los seis indicadores anteriores;
  • Capacidad de la lengua en la Internet, medida por la relación entre la potencia y el porcentaje global de hablantes de esa lengua.
  • Gradiente, medido por la relación entre la potencia y el porcentaje de hablantes conectados a la Internet.
  • Productividad de la lengua en términos de creación de contenidos, que se mide por la relación entre el porcentaje de contenidos en esa lengua y el porcentaje de internautas en la misma lengua.

Resultados del estudio de 2017 (V1.0)

LENGUAINTERNAUTASCONTENIDOPRODUCTIVIDAD
Inglés22.2%32.0%1.44
Chino20.5%18.0%0.88
Español9.1%8.0%0.88
Francés5.6%6.5%1.17
Alemán3.1%3.8%1.21
Ruso5.0%3.5%0.71
Portugués4.0%3.5%0.88
Japonés3.4%3.5%1.04
Arabe4.2%3.0%0.72
Hindi3.9%3.0%0.77
Malés2.6%2.5%0.96
Polaco1.7%1.8%1.09
Coreano1.4%1.4%1.01
Bengali1.5%1.3%0.86
Italiano0.9%1.1%1.23
Urdu0.8%0.7%0.84
RESTO35.3%31.4%0.89
TOTAL125.0%125.0% 1

Hay que señalar que los totales son superiores al 100% para tener en cuenta el multilingüismo (el 25% correspondería a la población con una segunda lengua).

Les projets d’OBDILCI

  • Indicateurs de la présence des langues dans l’Internet
  • Les langues de France dans l’Internet
  • Le français dans l’Internet
  • Le portugais dans l’Internet
  • L’espagnol dans l’Internet
  • IA et multilinguisme
  • DILINET
  • Projets pré-historiques