MECILDI
Foi adicionada uma nova secção com o título PROJETO PRINCIPAL 2: MECILDI. MECILDI significa medição direcionada das línguas na Internet, a partir das suas iniciais em francês.
Trata-se de um projeto novo e ambicioso baseado na criação de um programa capaz de extrair parâmetros relativos à repartição linguística e ao multilinguismo a partir de qualquer conjunto de sites, tendo em conta que um site pode ter mais do que um idioma.
Esta abordagem do multilinguismo na Web neste processo constitui simultaneamente um problema complexo e um avanço histórico. Quando aplicada ao TRANCO — a lista dos um milhão de sites mais visitados —, permitirá corrigir os dados extremamente tendenciosos da W3Techs (ver este artigo) e oferecer a primeira medição de sempre, corrigida de enviesamento, da repartição linguística nas páginas web dos sites mais visitados.
A versão 1 do MECILDI está na fase final de testes e em breve partilharemos os resultados. Fiquem atentos!
A primeira versão deste projeto foi financiada pela Delegação Geral para a Língua Francesa e as Línguas de França do Ministério da Cultura da França e será posteriormente aplicado para obter características de multilinguismo e repartição percentual de línguas para uma série de gTLDs das línguas da França (.alsace, .bzh, .corsica, .gp, .mq, .yt, .nc, .eus, .pf e .wf).

