PROYECTO PRINCIPAL – V2.0 (2021)

Indicadores de la presencia de lenguas en la Internet

NOTA: Esta es una versión archivada del estudio. Haga clic aquí para ver la versión más reciente.

Versión mejorada y segunda versión de un enfoque alternativo para elaborar indicadores de lenguas en Internet

Resumen del proyecto – V2.0 (2021)

Como se demostró en 2017, el loable esfuerzo de W3Techs por ofrecer cifras actualizadas diariamente sobre contenidos está sesgado a muchos niveles (el más fuerte, pero no el único, es no tener en cuenta el multilingüismo y el hecho de que la mayoría de los sitios web multilingües que incluyen el inglés probablemente se calculen como solo en inglés). Esta fuente proyecta valores extremadamente exagerados para el contenido en inglés en la web (más del 50% cuando la realidad es probablemente menos del 25% hoy en día).

La falta de fuentes alimenta el mito propagado por los medios de comunicación de que más de la mitad de los sitios web están en inglés. Así fue entre 2007 y 2009, pero desde entonces el crecimiento exponencial del chino, el hindi, el árabe, el turco, el bengalí, el vietnamita, el urdu, el persa y el marathi, por citar los nuevos idiomas que figuran entre los 20 primeros y que juntos representan casi el 28% de los contenidos, ha cambiado radicalmente la situación, y ahora el inglés sólo representa una cuarta parte de los contenidos. Entre 2000 y 2007, el mito de que el inglés ocupaba el 80% de la Web desapareció definitivamente tras la publicación de la UNESCO en 2009 y una presencia del inglés en la Web en torno al 50% fue el valor aceptado.

Cómo puede ser que el inglés se haya mantenido estable en un 50% durante los últimos 14 años cuando Internet ha cambiado radicalmente su demografía y el número de angloparlantes conectados (L1+L2) ha caído de 32% del total de conectados en 2007 a sólo un 13% en la actualidad?

El inglés sigue siendo el idioma líder de la web en términos de potencia, pero las proporciones están cambiando radicalmente. El chino es ahora el idioma con mayor número de hablantes conectados. En términos de potencia, el español ocupa un sólido tercer puesto, seguido del francés y el hindi, y un grupo de cinco idiomas comparten una posición cercana en la secuencia: portugués, ruso, árabe, alemán y japonés.

En cuanto a los indicadores independientes del número de hablantes (capacidad y gradiente), las lenguas de los países mejor clasificados en los parámetros de la sociedad de la información están a la cabeza: hebreo, finlandés, sueco, neerlandés, alemán y danés.

Las lenguas con más hablantes conectados son el danés, el sueco, el japonés, el neerlandés, el suizo-alemán y el finlandés.

Todos los resultados para las 132 lenguas del estudio y una descripción completa de la metodología pueden leerse en los documentos que figuran a continuación en inglés, francés, español o portugués.


Resultados del estudio de 2021 (V2.0)

Más información

Percentage of English Pages in the Web

Cibergeografía de las lenguas

Atención: Las estadísticas sólo se refieren a las 133 lenguas con L1>5 millones.

%L1 + L2%CON.W%CONN.PUISSANCECAPACITÉGRADIENTE
Lenguas africanas7.03%31.11%4.00%2.00%0.2840.519
Lenguas americanas0.21%53.80%0.21%0.13%0.5950.623
Lenguas asiáticas45.86%50.85%42.63%34.39%0.7500.783
Lenguas árabes3.53%60.14%3.89%3.09%0.8750.796
Lenguas europeas30.26%69.64%38.53%53.90%1.7811.415
Resto13.10%44.84%10.74%6.50%
  • W.Conn. : pourcentage de locuteurs de cette langue connectés à l’Internet par rapport au nombre total de locuteurs connectés à l’Internet.
  • W. Pop. : pourcentage de locuteurs de cette langue par rapport à la population mondiale totale L1+L2
  • L. Conn. : pourcentage de locuteurs L1+L2 de cette langue qui sont connectés à l’internet
  • TOUS LES POURCENTAGES CONCERNENT LES POPULATIONS L1+L2

Resumen de los resultados

  • Les langues européennes ont dominé l’Internet au début et en sont les langues historiques.
  • Le centre de gravité se déplace rapidement vers les langues asiatiques/arabes
  • Les langues africaines sont en retard mais associées à une forte croissance démographique

Créditos

Esta versión ha sido posible gracias al apoyo del Departamento de Cultura e Educação do Ministério das Relações Exteriores do Brasil como parte del Instituto Internacional da Língua Portuguesa y bajo la coordinación de la Cátedra UNESCO em Políticas Linguísticas para el Multilinguismo. También hay que reconocer el mérito de Daniel Prado, a quien se le ocurrió por primera vez la idea de recopilar múltiples fuentes para medir la presencia de las lenguas en Internet, así como transformar los datos de los países en datos lingüísticos.

Muchas gracias a todos: Al profesor Gilvan Müller de Oliveira por su apoyo con las cuestiones lingüísticas y la coordinación con los financiadores; a Álvaro Blanco por escribir las complicadas macros de Excel que cambiaron radicalmente el manejo de tantas fuentes y grafías de lenguas y países, y a David Pimienta, que escribió las macros de Excel necesarias para transformar el formato de Ethnologue al formato requerido para este estudio, así como para el manejo de las macrolenguas.

Descargo de responsabilidad: Este estudio es esencialmente un trabajo estadístico basado en una amplia variedad de fuentes. La adopción de una fuente importante en este tipo de trabajos implica también, lógicamente, la adopción de las normas que sustentan los datos de dicha fuente. El autor no se hace responsable de la lista de países y territorios considerados, elaborada por la UIT, organismo de las Naciones Unidas, ni de la lista de lenguas con más de cinco millones de hablantes L1, según Ethnologue, ni de la agrupación en macrolenguas, adoptada por Ethnologue, de acuerdo con la norma ISO 693.3.

Les projets d’OBDILCI

  • Indicateurs de la présence des langues dans l’Internet
  • Les langues de France dans l’Internet
  • Le français dans l’Internet
  • Le portugais dans l’Internet
  • L’espagnol dans l’Internet
  • IA et multilinguisme
  • DILINET
  • etc…