Bienvenido sea el nuevo informe del Instituto Cervantes «El español en el mundo, 2025» :
Hemos sido criticos acerca de la edición 2024 de ese informe. Nuestras consideraciones sobre el informe del 2024 han sido plenamente superadas; esta vez el informe aporte datos originales y muy interesantes sobre el español, tanto a nivel demográfico como económico, manteniendo un enfoque hacia el aspecto digital y especialmente en torno a la inteligencia artificial. Enhorabuena!
Solo una excepción de carácter menor quedaría por mencionar: lamentablemente, el Instituto Cervantes persiste usando W3Techs, une fuente muy sesgada, para datos de lenguas en la Web. Esta vez, aclara en una nota las razones de esa elección:
«Optamos por presentar las estadísticas de W3Tech por ser datos obtenidos automáticamente de páginas web que se consideran relevantes por su contenido y funcionalidad: se excluyen los sitios duplicados, redirigidos o subdominios, así como los que solo muestran una página del servidor, por ejemplo. Otras fuentes utilizan criterios diferentes para cuantificar el peso de las lenguas en internet. Así, el Observatorio de la Diversidad Lingüística y Cultural en Internet (OBDILCI), con sede en Niza (Francia) y ligado a la Organización Internacional de la Francofonía y previamente a Unión Latina, afirma que el 20 % de las páginas en internet están en inglés, el 19 % en chino y el 7,7 % en español. Pero, al mismo tiempo, el OBDILCI ha propuesto un Índice de Ciberglobalización (CGI) que incluye como factores el número de hablantes de las lenguas, el número de países donde se hablan y el número de hablantes conectados a internet. Este índice complejo cuantifica el inglés con un 14,13 % de la ciberglobalización mundial, el francés con un 9,55 % y el español con un 2,09 % (OBDILCI, 2024). Las cifras de hablantes se toman de Ethnologue y otras fuentes, con un intervalo de confianza del 20 %.
En ese sentido, resulta de interés plantear algunas consideraciones y precisar algunos puntos:
– W3techs no ofrece datos de paginas web sino de sitios web, y la diferencia no es un detalle. Para ser preciso, W3Techs identifica como lengua del sitio, la lengua principal detectada en la pagina de entrada.
– Los criterios de relevancia mencionados son técnicos e implícitos de cualquier trabajo de ese estilo. La relevancia que falta mencionar, y que es mas relevante justamente, es 1) que los datos son extraídos del millón de sitios web los mas visitados y 2) que W3Techs atribuye una sola lengua por sitio web, y por defecto en caso de sitios multilingües, el inglés cuando está presente.
Esos dos elementos, el segundo siendo el mas impactante, explican los sesgos importantes de esos datos. En realidad, la cifra de W3Techs para el inglés es el porcentaje de sitios web teniendo el inglés como una de las opciones lingüísticas. Para las otras lenguas, es el porcentaje de sitios web en esa lengua que no tenga el inglés como opción lingüística. El lector interesado en datos mas sólidos puede consultar ese trabajo presentado en la reunión de la UNESCO LT4ALL2025, este estudio elaboró el inventario de todos los estudios existentes y analizó los respectivos sesgos, llegando a la evidencia que el porcentaje de paginas en inglés debe estar en la horquilla de entre 20% y 27%, menos de la mitad de la cifra de W3Techs: Inventory and comparisons of all methods for the measure of languages online and implications on Internet’s lingua franca, LT4ALL2025, Paris-UNESCO, February 24-26, 2025 – Video (English -10mn), Vidéo (Français – 10mn), PPT
– OBDILCI no esta «ligado a la Organización Internacional de la Francofonía». Es cierto que la mayoría de nuestros apoyos históricos han provenido del lado francófono, pero también hemos recibido apoyo importante desde el mundo lusófono, y otros de la UNESCO y la Organización de Estados Iberoamericanos para la Educación, la Ciencia y la Cultura (OEI) (ver https://obdilci.org/sobre/apoyos/). En cualquier caso, OBDILCI es una organización de la sociedad civil independiente de las entidades que aportan fondos para sus proyectos.
– El indice de ciber-globalizacion es un indicador que pretende medir las ventajas a largo plazo de las lenguas en el mundo digital, distinto del porcentaje de paginas web en cada lengua, no existiendo contradicciones entre los dos indicadores.

