MECILDI

MECILDI

Se ha añadido una nueva sección bajo el título PROYECTO PRINCIPAL 2: MECILDI. MECILDI son las siglas de medición dirigida de lenguas en la Internet, según sus siglas en francés.

Se trata de un nuevo y ambicioso proyecto basado en la creación de un programa capaz de extraer parámetros de distribución lingüística y multilingüismo de cualquier conjunto de sitios web, teniendo debidamente en cuenta que un sitio web puede contener más de un idioma.

Esta consideración del multilingüismo web en el proceso constituye tanto un problema complejo como un hito histórico. Su aplicación a TRANCO —la serie de los un millón de sitios web más visitados— permitirá corregir las cifras extremadamente sesgadas de W3Techs (véase este artículo) y ofrecer la primera medición, corregida de sesgos, de la distribución lingüística en las páginas web de los sitios más visitados.

La versión 1 de MECILDI se encuentra en la fase final de pruebas y pronto compartiremos los resultados. ¡Estad atentos!

La primera versión de este proyecto ha sido financiada por la Delegación General para la Lengua Francesa y las Lenguas de Francia del Ministerio de Cultura de Francia y se aplicará próximamente para obtener características de multilingüismo y el desglose porcentual de idiomas para una serie de gTLD de las lenguas de Francia (.alsace, .bzh, .corsica, .gp, .mq, .yt, .nc, .eus, .pf y .wf).