O Observatório da Diversidade Linguística e Cultural na Internet tem o prazer de anunciar vários marcos importantes nos seus esforços para medir a diversidade linguística e cultural na Internet.
1. novo nome de domínio
Dispomos agora de um nome de domínio e de um logótipo concebidos para exprimir a nossa missão.
2. metodologia publicada num jornal com revisão por pares
A descrição pormenorizada da metodologia subjacente ao nosso modelo de criação de indicadores de presença na Internet para 342 línguas foi publicada numa revista revista revista, Frontiers Research Metrics and Analytics: O método por detrás da produção sem precedentes de indicadores da presença de línguas na Internet. A referência é Front. Res. Metr. Anal. Sec. Research Methods Volume 8 – 2023. doi: 10.3389/frma.2023.1149347.
Trata-se de um marco fundamental para este projeto.
3. Lanzamiento de la versión 4 del estudio
O modelo, que tem vindo a produzir indicadores inovadores desde 2017, chegou agora à versão 4, com números demo-linguísticos actualizados, começando com o conjunto de dados Ethnologue #26 de março de 2023, e com uma nova melhoria na nossa procura de redução de preconceitos (ver aqui).
O progresso inicial detectado para as línguas africanas na versão 3.2, com a atualização dos dados da UIT sobre o número de pessoas ligadas por país, é confirmado na versão 4 e pode marcar o início da inclusão das línguas africanas na nova era de multilinguismo em que a Internet está imersa (ver a evolução da cybergeografia das famílias de línguas ao longo das versões).
4. o acesso à base de dados já está disponível.
Uma base de dados de acesso aos resultados produzidos pelo modelo passou nos testes e está online em https://obdilci.org/Base.
.
5. Pré-impressão de um novo artigo
Gostaríamos também de partilhar a pré-impressão de um novo artigo que também será brevemente revisto por pares: “É verdade que mais de metade dos conteúdos da Web estão em inglês? Se o multilinguismo na Web for devidamente tido em conta, então não!“, doi: 10.13140/RG.2.2.20798.70724. Esperemos que esta demonstração simples mas eficaz ajude a contrariar os números tendenciosos que negam o extraordinário crescimento do multilinguismo que se tem verificado na Web durante a última década.
Chegou o momento de agradecer novamente às organizações que tornaram possível este projeto e os desenvolvimentos dele resultantes.
Agradecimentos
O projeto foi realizado por OBDILCI, com a colaboração, a partir da versão 2, em abril de 2021, da Cadeira da UNESCO em Políticas Linguísticas para o Multilinguismo, da qual OBDILCI é membro. O projeto foi financiado pela Organisation de la Francophonie, para os estudos anteriores, versão 1 e versão 3, e pelo Ministério das Relações Exteriores do Brasil através do Instituto da Língua Portuguesa para a versão 2. A implementação do acesso à base de dados e a abertura da publicação em Frontiers Research Metrics and Analytics, foi financiada pela Délégation générale à la langue française et aux langues de France, do Ministério da Cultura francês, juntamente com o Delegado Permanente do Brasil junto à UNESCO.
.
Fontes
Os indicadores da presença das línguas na Internet são elaborados através de um modelo desenvolvido pelo OBDILCI, utilizando as seguintes fontes:
Para os dados demo-linguísticos, Ethnologue, uma fonte não pública, actualizada uma vez por ano.
Para a percentagem de pessoas ligadas à Internet, ITU e Banco Mundial, ambas fontes públicas actualizadas uma vez por ano.
Para os números relativos às línguas ou aos países na Internet, é utilizada uma grande variedade de fontes públicas directas (como Imminent T-Index ou legacy.socialprogress.org) ou indirectas (como similarweb.com aplicada a vários sítios Web), todas reunidas em https://www.frontiersin.org/articles/10.3389/frma.2023.1149347/full#supplementary-material.
Produtos
Os indicadores produzidos pelo OBDILCI estão acessíveis sob licença CC-BY-SA 4.0, em ficheiros Excel, que podem ser descarregados a partir de aqui ou como consulta da base de dados https://obdilci.org/Base. Os resultados da versão 3.0 são descritos na íntegra no artigo de dados abertos e revisto por pares Resource: Indicators on Language Presence on the Internet, apresentado em 2022 no evento bianual organizado pela Associação Europeia de Recursos Linguísticos, SIGUL2022/LREC2022 (Versão em inglês). Os indicadores seguintes são desenvolvidos para cada uma das 341 línguas com mais de um milhão de falantes L1 e ordenados:
a: Percentagem de falantes em relação à população mundialón L1+L2
b: Percentagem de falantes ligados em relação à população mundial ligada L1+L2
c: Percentagem de falantes de L1+L2 ligados à Internet
d: Percentagem de conteúdos Web
e: Presença virtual (d dividido por a)
f: Produtividade do conteúdo (d dividido por b)
Na versão 4, foram atingidos os seguintes valores globais:
População L1+L2: 10 598 681 424
População L1.: 7 403 726 853
Taxa mundial de multilinguismo: 1,43
Cobertura da população mundial L1+L2 pelas 341 línguas do inquérito: 96,04%.
Cobertura dos conteúdos nas 341 línguas do estudo: 98.00%
L1+L2 percentagem global de pessoas ligadas: 66.66%