PROYECTO PRINCIPAL – V1.0 (2017)
Indicadores de la presencia de lenguas en la Internet

NOTA: Esta es una versión archivada del estudio. Haga clic aquí para ver la versión más reciente.
Resumen del proyecto – V1.0 (2017)
Este observatorio midió el lugar de las lenguas latinas, el inglés y el alemán en la Internet entre 1997 y 2007. Tras 10 años de eclipse, debido a la evolución de los motores de búsqueda, volvemos, gracias al apoyo de la Organización Internacional de la Francofonía y MAAYA, con un nuevo método de elaboración de indicadores para las 140 lenguas con más de 5 millones de hablantes.
El método, los resultados y un debate sobre los sesgos en la medición de las lenguas en la Internet pueden leerse en: Un enfoque alternativo para producir indicadores de la presencia de las lenguas en la Internet, junio de 2017. Los resultados completos de las 140 lenguas pueden consultarse a continuación.
Una versión breve e introductoria de 5 páginas en inglés se presentó en LT4ALL Conferencia Internacional Tecnologías lingüísticas para todos: posibilitar la diversidad lingüística y el multilingüismo en todo el mundo, UNESCO, París, noviembre de 2019: Indicators of languages in Internet.
También puedes ver las 2 presentaciones:
- A new alternative approach for linguistic indicators in the Internet : Presentación detallada del método y de sus propios sesgos y limitaciones.
- Linguistic Indicators in cyberspace: the biases is all! : Un debate general sobre los sesgos que rodean la medición de las lenguas en la Red.
Seis indicadores
- Internautas (personas conectadas a la Internet), es decir, hablantes de cada lengua con acceso a la Internet. Un único microindicador (ofrecido por la UIT) responde a esta necesidad y servirá de fuente fundamental para el resto del trabajo.
- Uso: Se refiere a las suscripciones a aplicaciones o medios de conexión a la Internet. Once microindicadores intervienen en la construcción de este indicador.
- Tráfico: Indicación del tráfico generado por los usuarios hacia las aplicaciones. Para construir este indicador se utilizan 316 microindicadores.
- Índice: Se refiere a la clasificación de los países en diversos aspectos de la sociedad de la información. Actualmente se utilizan cinco microindicadores para construir este indicador.
- Contenido: Se refiere al contenido en la web para cada lengua y que, por el momento, recoge principalmente datos de la galaxia Wikimedia. Trece microindicadores proporcionan datos para este indicador.
- Interfaces y traducción de lenguas: se refiere a la presencia de lenguas en las interfaces de las aplicaciones o como lengua de traducción. Veintitrés microindicadores componen este indicador.
Tres macroindicadores
- Potencia de las lenguas en la Internet, que mide la cuota global de lenguas en Internet, media de los seis indicadores anteriores;
- Capacidad de la lengua en la Internet, medida por la relación entre la potencia y el porcentaje global de hablantes de esa lengua.
- Gradiente, medido por la relación entre la potencia y el porcentaje de hablantes conectados a la Internet.
- Productividad de la lengua en términos de creación de contenidos, que se mide por la relación entre el porcentaje de contenidos en esa lengua y el porcentaje de internautas en la misma lengua.
Resultados del estudio de 2017 (V1.0)
LENGUA | INTERNAUTAS | CONTENIDO | PRODUCTIVIDAD |
---|---|---|---|
Inglés | 22.2% | 32.0% | 1.44 |
Chino | 20.5% | 18.0% | 0.88 |
Español | 9.1% | 8.0% | 0.88 |
Francés | 5.6% | 6.5% | 1.17 |
Alemán | 3.1% | 3.8% | 1.21 |
Ruso | 5.0% | 3.5% | 0.71 |
Portugués | 4.0% | 3.5% | 0.88 |
Japonés | 3.4% | 3.5% | 1.04 |
Arabe | 4.2% | 3.0% | 0.72 |
Hindi | 3.9% | 3.0% | 0.77 |
Malés | 2.6% | 2.5% | 0.96 |
Polaco | 1.7% | 1.8% | 1.09 |
Coreano | 1.4% | 1.4% | 1.01 |
Bengali | 1.5% | 1.3% | 0.86 |
Italiano | 0.9% | 1.1% | 1.23 |
Urdu | 0.8% | 0.7% | 0.84 |
RESTO | 35.3% | 31.4% | 0.89 |
TOTAL | 125.0% | 125.0% | 1 |
Hay que señalar que los totales son superiores al 100% para tener en cuenta el multilingüismo (el 25% correspondería a la población con una segunda lengua).


Les projets d’OBDILCI
- Indicateurs de la présence des langues dans l’Internet
- Les langues de France dans l’Internet
- Le français dans l’Internet
- Le portugais dans l’Internet
- L’espagnol dans l’Internet
- IA et multilinguisme
- DILINET
- Projets pré-historiques
- Mort numérique des langues