PROJETO PRINCIPAL – V1.0 (2017)

Indicadores da presença das línguas na Internet

NOTA: Esta é uma versão arquivada do estudo. Clique aqui para ver a versão mais recente.

Resumo do projeto – V1.0 (2017)

Este observatório mediu o lugar das línguas latinas, do inglês e do alemão na Internet entre 1997 e 2007. Após 10 anos de eclipse, devido à evolução dos motores de busca, estamos de volta, graças ao apoio da Organização Internacional da Francofonia e do MAAYA, com um novo método de elaboração de indicadores para as 140 línguas com mais de 5 milhões de falantes.

O método, os resultados e uma discussão sobre os vieses na medição das línguas na Internet podem ser lidos em: Uma abordagem alternativa para a produção de indicadores de presença linguística na Internet, junho de 2017. Os resultados completos para as 140 línguas podem ser consultados em baixo.

Uma versão curta e introdutória de 5 páginas em inglês foi apresentada na LT4ALL Conferência Internacional Tecnologias Linguísticas para Todos: Possibilitando a Diversidade Linguística e o Multilinguismo em todo o mundo, UNESCO, Paris, novembro de 2019: Indicadores de línguas na Internet.

Você também pode ver as 2 apresentações:


Seis indicadores

  • Internautas (pessoas ligadas à Internet), ou seja, falantes de cada língua com acesso à Internet. Um único micro-indicador (fornecido pela UIT) responde a esta necessidade e servirá de fonte fundamental para o resto do trabalho.
  • Utilização: Refere-se a subscrições de aplicações ou meios de ligação à Internet. Onze micro-indicadores estão envolvidos na construção deste indicador.
  • Tráfego: Indicação do tráfego gerado pelos utilizadores para as aplicações. São utilizados 316 micro-indicadores para construir este indicador.
  • Índice: refere-se à classificação dos países em vários aspectos da sociedade da informação. Atualmente, são utilizados cinco micro-indicadores para construir este indicador.
  • Conteúdo: refere-se ao conteúdo da Web para cada língua e, de momento, recolhe principalmente dados da galáxia Wikimedia. Treze micro-indicadores fornecem dados para este indicador.
  • Interfaces e tradução de línguas: refere-se à presença de línguas em interfaces de aplicações ou como língua de tradução. Este indicador é constituído por vinte e três micro-indicadores.

Três indicadores macro

  • Poder das línguas na Internet, que mede a quota global de línguas na Internet, média dos seis indicadores anteriores;
  • Capacidade da língua na Internet, medida pelo rácio entre o poder e a percentagem global de falantes dessa língua.
  • Gradiente, medido pela relação entre a potência e a percentagem de altifalantes ligados à Internet.
  • Produtividade da língua em termos de criação de conteúdos, que é medida pela relação entre a percentagem de conteúdos nessa língua e a percentagem de utilizadores da Internet nessa mesma língua.

Resultados do inquérito de 2017 (V1.0)

LÍNGUAINTERNAUTASCONTEUDOPRODUTIVIDADE
Inglês22.2%32.0%1.44
Chino20.5%18.0%0.88
Inglês9.1%8.0%0.88
Francês5.6%6.5%1.17
Alemão3.1%3.8%1.21
Russo5.0%3.5%0.71
Português4.0%3.5%0.88
Japonês3.4%3.5%1.04
Árabe4.2%3.0%0.72
Hindi3.9%3.0%0.77
Malês2.6%2.5%0.96
Polaco1.7%1.8%1.09
Coreano1.4%1.4%1.01
Bengali1.5%1.3%0.86
Italiano0.9%1.1%1.23
Urdu0.8%0.7%0.84
REST35.3%31.4%0.89
TOTAL125.0%125.0% 1

Note-se que os totais são superiores a 100% para ter em conta o multilinguismo (25% corresponderia à população com uma segunda língua).

Projetos de OBDILCI

  • Indicadores da presença das línguas na Internet
  • As línguas da França na Internet
  • Francês na Internet
  • Português na Internet
  • Espanhol na Internet
  • IA e multilinguismo
  • DILINET
  • Projetos pré-históricos
  • Projeto Digital Language Death