PROYECTO PRINCIPAL – V3.0 (marzo de 2022)
Indicadores de la presencia de las lenguas en la Internet

NOTA: Esta es una versión archivada del estudio. Haga clic aquí para ver la versión más actualizada.
Introducción – V3.0 (marzo de 2022)
Versión 1 : 2017, con 130 lenguas con L1 > 5 millones de hablantes
Versión 2 : 2021, con 329 lenguas con L1 > 1 millón de hablantes e importante reducción de sesgos
Versión 3 : 3/2022, con reducción exhaustiva de sesgos y redefinición de algunos resultados.
Más que una nueva versión, se trata de la llegada a madurez del método, ya que ahora todos los sesgos están controlados hasta un umbral aceptable y los indicadores producidos son fiables dentro de un intervalo de confianza de ±20%.
El Observatorio se complace en compartir los resultados de la versión 3 de su modelo de cálculo de indicadores de presencia de lenguas en Internet, que, al igual que la versión 2, anunciada en 2021, procesa las 329 lenguas con más de un millón de hablantes nativos.
Un intervalo de confianza de -20% +20%, puede parecer amplio si aplicamos los criterios de otros trabajos estadísticos, pero para los datos sobre el lugar que ocupan las lenguas en la Internet, un tema al que siempre ha sido muy difícil llegar, y propenso a la desinformación crónica, es toda una proeza.
Todos los resultados están disponibles bajo licencia CC-BY-SA 4.0.
¿Qué nos dicen los resultados? El ganador es el multilingüismo.
La transición de la Internet entre el dominio de las lenguas europeas, el inglés a la cabeza, hacia las lenguas asiáticas y el árabe, el chino a la cabeza, está muy avanzada y el ganador es el multilingüismo, pero las lenguas africanas tardan en ocupar su lugar.
Resumen del proyecto
Lea un breve artículo en contenidos abiertos y revisado por pares que presenta los resultados de la V3 en términos de indicadores y una síntesis del método:
Recursos: Indicadores sobre la presencia de lenguas en Internet, Actas de la 1ª Reunión Anual del Grupo de Interés Especial ELRA/ISCA sobre Lenguas con Recursos Insuficientes, un taller de LREC2022 (version en español).
Nota metodológica
Se trata de una aproximación indirecta al espacio de las lenguas en la red utilizando diferentes fuentes de datos y técnicas estadísticas. Todos los cálculos y resultados se basan en L1+L2, donde L1 es la lengua materna y L2 la(s) segunda(s) lengua(s).
Siguiendo nuestra principal fuente demolingüística (Ethnologue nº 24), la población mundial (L1) y la población de hablantes de L1+L2 son:
L1 = 7 231 699 136 L2 = 10 361 716 756 L1+L2/L1 = 1.4328
Se estima que el intervalo de confianza de todas las cifras producidas está dentro de la ventana ±20%.
La metodología detallada se ha publicado en inglés en un Journal abierto revisado por pares : The method behind the unprecedented production of indicators of the presence of languages in the Internet. Frontiers Research Metrics & Analytics, volumen 8 – 2023. doi: 10.3389/frma.2023.1149347
Resultados del estudio de marzo de 2022 (V3.0)

Todos los indicadores de las 30 lenguas con mayor porcentaje de contenido
| RANGO CONTENIDO L1+L2 | CODIGO ISO | LENGUAS | % INTERNAUTAS L1+L2 | % HABLANTES L1+L2 | % HABLANTES CONECTADOS | % CONTENIDOS L1+L2 | % PRESENCIA VIRTUAL L1+L2 | % PRODUCTIVIDAD DE CONTENIDOS L1+L2 |
|---|---|---|---|---|---|---|---|---|
| 1 | zho | Macro chino | 18,46% | 14,72% | 71,38% | 21,60% | 1,47 | 1,17 |
| 2 | eng | Inglés | 14,83% | 13,01% | 64,86% | 19,60% | 1,51 | 1,32 |
| 3 | spa | Español | 6,79% | 5,24% | 73,72% | 7,85% | 1,50 | 1,16 |
| 4 | hin | Hindi | 4,19% | 5,80% | 41,16% | 3,76% | 0,65 | 0,90 |
| 5 | rus | Ruso | 3,51% | 2,49% | 80,32% | 3,76% | 1,51 | 1,07 |
| 6 | fra | Francés | 2,98% | 2,58% | 65,80% | 3,33% | 1,29 | 1,12 |
| 7 | por | Portugués | 2,99% | 2,49% | 68,43% | 3,13% | 1,26 | 1,05 |
| 8 | ara | Macro árabe | 3,97% | 3,53% | 63,99% | 3,09% | 0,87 | 0,78 |
| 9 | jpn | Japonés | 1,99% | 1,22% | 92,63% | 2,66% | 2,18 | 1,34 |
| 10 | deu | Alemán, Estándar | 2,04% | 1,30% | 89,17% | 2,37% | 1,82 | 1,16 |
| 11 | msa | Macro malayo | 2,36% | 2,36% | 56,93% | 1,96% | 0,83 | 0,83 |
| 12 | tur | Turco | 1,17% | 0,85% | 78,05% | 1,14% | 1,35 | 0,98 |
| 13 | ita | Italiano | 0,87% | 0,66% | 75,83% | 1,00% | 1,53 | 1,14 |
| 14 | kor | Coreano | 0,90% | 0,79% | 65,16% | 0,98% | 1,24 | 1,09 |
| 15 | fas | Macro persa | 1,08% | 0,81% | 75,91% | 0,88% | 1,09 | 0,82 |
| 16 | ben | Bengalí | 1,11% | 2,58% | 24,55% | 0,88% | 0,34 | 0,79 |
| 17 | vie | Vietnamita | 0,92% | 0,74% | 70,96% | 0,85% | 1,15 | 0,92 |
| 18 | urd | Urdu | 0,95% | 2,22% | 24,38% | 0,66% | 0,30 | 0,70 |
| 19 | tha | Tailandés | 0,80% | 0,59% | 77,95% | 0,65% | 1,12 | 0,82 |
| 20 | pol | Polaco | 0,60% | 0,39% | 87,09% | 0,63% | 1,59 | 1,04 |
| 21 | mar | Marathi | 0,69% | 0,96% | 41,06% | 0,58% | 0,60 | 0,83 |
| 22 | tel | Telugu | 0,68% | 0,92% | 41,69% | 0,56% | 0,60 | 0,82 |
| 23 | tam | Tamil | 0,61% | 0,82% | 42,15% | 0,51% | 0,62 | 0,83 |
| 24 | jav | Javanés | 0,62% | 0,66% | 53,76% | 0,44% | 0,66 | 0,70 |
| 25 | nld | Holandés | 0,38% | 0,24% | 91,14% | 0,41% | 1,73 | 1,08 |
| 26 | guj | Gujarati | 0,44% | 0,60% | 41,47% | 0,36% | 0,61 | 0,83 |
| 27 | ukr | Ucraniano | 0,40% | 0,32% | 71,02% | 0,35% | 1,09 | 0,88 |
| 28 | kan | Kannada | 0,41% | 0,57% | 41,11% | 0,33% | 0,59 | 0,82 |
| 29 | ron | Rumano | 0,32% | 0,23% | 79,57% | 0,30% | 1,29 | 0,93 |
| 30 | aze | Macro Azerbaiyán | 0,33% | 0,23% | 81,54% | 0,28% | 1,21 | 0,85 |
| RESTANTE | 22,60% | 30,10% | 15,13% | |||||
| TOTAL | 100,00% | 100,00 % | 100,00 % |
LEYENDA
Resultados completos
Comparación de resultados con otros proveedores
Descargar los resultados completos de las 329 lenguas
Vídeos
Créditos


Los proyectos de OBDILCI
- Indicadores de la presencia de las lenguas en la Internet
- Las lenguas de Francia en la Internet
- El francés en la Internet
- El portugués en la Internet
- El español en la Internet
- IA e multilinguismo
- DILINET
- Proyectos pre-históricos





