OTHER PROJECTS

Informes sobre multilingüismo en la WWW

Informes sobre multilingüismo en la WWW

OBDILCI se complace en anunciar una nueva serie de estudios sobre el estado del multilingüismo de la Internet, sustentados en datos de https://Dataprovider.com.

Su base de datos reúne más de 200 parámetros sobre sitios web y abarca casi todo el ecosistema de la WWW (más de 800 millones de registros, incluidos 167 millones de sitios web activos y 91 millones con información lingüística relevante disponible). Entre estos parámetros, algunos pertenecen a lenguas y otros pueden cruzarse con datos lingüísticos.

PRIMER INFORME

Este primer informe actualiza el estudio realizado por la Universidad Ionan en 2009 sobre la prevalencia del inglés en los sitios web ccTLD de la Unión Europea, mostrando una notable evolución (el inglés desciende del 28% al 20%). Permite una primera estimación de la tasa global de multilingüismo de la WWW y arroja interesantes correlaciones entre el idioma principal de los sitios y el comercio electrónico, el tipo de TLD, la actividad económica y otros factores.

Algunas ideas intuitivas, y algunas sorpresas, están ahora respaldadas por datos sólidos:

  • Más de la mitad de los sitios web ucranianos, estonios, catalanes o griegos son multilingües;
  • La correlación entre los sitios de gran huella económica y el multilingüismo es impresionante;
  • El chino, el coreano y el japonés podrían hacerlo mejor en cuanto a porcentaje de sitios multilingües;
  • Lo mismo ocurre con el portugués, que está justo por debajo de la media, a diferencia del italiano, el francés y el español;;
  • .org no es tan multilingüe como cabría esperar…

Con nuestro multilingüe thank you a Dataprovider.com por el acceso de cortesía a esta riqueza de datos.https://www.obdilci.org/wp-content/uploads/2025/02/WebMultilingualismReport1.pdf

SEGUNDO INFORME

Segundo informe de la serie WebMultilingualism: Explorando la presencia web y el multilingüismo de las lenguas minoritarias europeas con gTLD asociados.

Las conclusiones del estudio son:

  • Dos gTLD muestran excelentes prestaciones lingüísticas, tanto en términos de presencia de la lengua minoritaria como en términos de multilingüismo: .cat y .eus; ambos, especialmente .eus, tienen margen para aumentar su presencia.
  • Dos gTLD, .cymru y .gal, muestran un rendimiento lingüístico aceptable, junto con .lu. El caso de .lu, el ccTLD de Luxemburgo, se tratará por separado, ya que el estudio destaca la baja presencia de la lengua nacional en un contexto de fuerte multilingüismo.
  • Tres gTLD muestran resultados medianos con promesas en algunos de los factores y dificultades en otros: .gal, .gales y .bzh.
  • Dos gTLD, .corsica y .frl, no han llegado al punto de beneficiar al idioma local ni al multilingüismo y parecen permanecer en una etapa de TLD geográfico.
  • Por último, .alsace, .irish y .scot no muestran un rendimiento lingüístico y siguen siendo dominios geográficos con una penetración y un impacto lingüístico limitados en esta etapa.

TERCERO ESTUDIO

Nos complace anunciar el tercer estudio sobre multilingüismo realizado utilizando la base de datos DataProvider.com. Esta vez el estudio es en francés y el tema es: Una caracterización de la Web francófona a partir de una serie de parámetros, en comparación con otras lenguas dominantes en la Web.

El foco está en el francés, pero el estudio también proporciona datos para otros idiomas, y puedes ver los datos del idioma que elijas, entre los 19 tratados específicamente.

El descubrimiento fundamental es que cada lengua tiene su propia «firma temática«, que refleja la cultura que lleva consigo, e incluso se pueden ver las proximidades y distancias entre las redes lingüísticas.

De este modo, la web en francés está cerca de la web en italiano y extremadamente lejos de la web en hindi. Además del análisis temático, se cubren los siguientes parámetros: impacto económico, confianza en el comercio electrónico, tamaño promedio del sitio, número promedio de enlaces entrantes, orientación comercial y B2B vs. B2C.

El informe presenta el método, los sesgos y los resultados y permite comprender mejor la naturaleza de cada red lingüística, tomando como ejemplo la red francófona.

De paso, se realiza una comparación entre las proporciones respectivas de idiomas en la base de datos DataProvider.com y los datos del modelo OBDILCI, lo que permite establecer sesgos favorables o desfavorables hacia determinados idiomas.

CUARTO INFORME

El cuarto estudio sobre multilingüismo de la Web trata el tema de «Una evaluación de la reciprocidad en el uso mutuo del español y del portugués en las Web lusófona e hispanófona«.

Los principales hallazgos del estudio son:

  • La tasa de multilingüismo de los sitios web en portugués está por debajo de la media mundial.
  • Hay tres veces más sitios web en español en los países de habla portuguesa que en portugués en los de habla hispana. En cualquier caso, los porcentajes son muy bajos, inferiores al 1% de media.
  • Brasil es el país con el mayor porcentaje de sitios web con versión en español.
  • Los países de habla hispana del Mercosur y el Caribe son los que tienen el mayor porcentaje de sitios web con versión en portugués.
  • La prevalencia de sitios web con versión en portugués en EE. UU. es 15 veces mayor que la de en español, en proporción a la población hablante.

Recomendaciones:

  • Los sitios web en portugués deberían aumentar su multilingüismo.
  • Los sitios web en España deberían aumentar el porcentaje de versiones en portugués.
  • Los hispanohablantes en EE. UU. deberían aumentar su presencia virtual.

QUINTO INFORME

Este informe en inglés analiza: Multilinguismo dela Web, por ccTLD, lenguas, gTLDs y mucho mas: ganadores y perdedores

Sintesis de los resultados:

SEXTO INFORME

El multilingüismo de Wikimedia. Este informe utiliza las excelentes estadísticas por lengua de Wikimedia para explorar la aplicación más multilingüe de la web y destaca las lenguas con mejor rendimiento por artículo y en general. El informe también destaca las numerosas enciclopedias en línea existentes.

Proyectos OBDILCI

  • Indicadores de la presencia de lenguas en la Internet
  • Las lenguas de Francia en la Internet
  • El francés en la Internet
  • El portugués en la Internet
  • El español en la Internet
  • IA y multilinguismo
  • Proyectos pre-históricos
  • Muerte digital de las lenguas