PROJETO PRINCIPAL – V1.0 (2017)
Indicadores da presença das línguas na Internet
NOTA: Esta é uma versão arquivada do estudo. Clique aqui para ver a versão mais recente.
Resumo do projeto – V1.0 (2017)
Este observatório mediu o lugar das línguas latinas, do inglês e do alemão na Internet entre 1997 e 2007. Após 10 anos de eclipse, devido à evolução dos motores de busca, estamos de volta, graças ao apoio da Organização Internacional da Francofonia e do MAAYA, com um novo método de elaboração de indicadores para as 140 línguas com mais de 5 milhões de falantes.
O método, os resultados e uma discussão sobre os vieses na medição das línguas na Internet podem ser lidos em: Uma abordagem alternativa para a produção de indicadores de presença linguística na Internet, junho de 2017. Os resultados completos para as 140 línguas podem ser consultados em baixo.
Uma versão curta e introdutória de 5 páginas em inglês foi apresentada na LT4ALL Conferência Internacional Tecnologias Linguísticas para Todos: Possibilitando a Diversidade Linguística e o Multilinguismo em todo o mundo, UNESCO, Paris, novembro de 2019: Indicadores de línguas na Internet.
Você também pode ver as 2 apresentações:
- Uma nova abordagem alternativa para indicadores linguísticos na Internet (em inglês): Apresentação pormenorizada do método e dos seus próprios preconceitos e limitações.
- Indicadores linguísticos no ciberespaço: os vieses são tudo! (em inglês): Uma discussão geral sobre os preconceitos que rodeiam a medição das línguas na Web.
Seis indicadores
- Internautas (pessoas ligadas à Internet), ou seja, falantes de cada língua com acesso à Internet. Um único micro-indicador (fornecido pela UIT) responde a esta necessidade e servirá de fonte fundamental para o resto do trabalho.
- Utilização: Refere-se a subscrições de aplicações ou meios de ligação à Internet. Onze micro-indicadores estão envolvidos na construção deste indicador.
- Tráfego: Indicação do tráfego gerado pelos utilizadores para as aplicações. São utilizados 316 micro-indicadores para construir este indicador.
- Índice: refere-se à classificação dos países em vários aspectos da sociedade da informação. Atualmente, são utilizados cinco micro-indicadores para construir este indicador.
- Conteúdo: refere-se ao conteúdo da Web para cada língua e, de momento, recolhe principalmente dados da galáxia Wikimedia. Treze micro-indicadores fornecem dados para este indicador.
- Interfaces e tradução de línguas: refere-se à presença de línguas em interfaces de aplicações ou como língua de tradução. Este indicador é constituído por vinte e três micro-indicadores.
Três indicadores macro
- Poder das línguas na Internet, que mede a quota global de línguas na Internet, média dos seis indicadores anteriores;
- Capacidade da língua na Internet, medida pelo rácio entre o poder e a percentagem global de falantes dessa língua.
- Gradiente, medido pela relação entre a potência e a percentagem de altifalantes ligados à Internet.
- Produtividade da língua em termos de criação de conteúdos, que é medida pela relação entre a percentagem de conteúdos nessa língua e a percentagem de utilizadores da Internet nessa mesma língua.
Resultados do inquérito de 2017 (V1.0)
LÍNGUA | INTERNAUTAS | CONTEUDO | PRODUTIVIDADE |
---|---|---|---|
Inglês | 22.2% | 32.0% | 1.44 |
Chino | 20.5% | 18.0% | 0.88 |
Inglês | 9.1% | 8.0% | 0.88 |
Francês | 5.6% | 6.5% | 1.17 |
Alemão | 3.1% | 3.8% | 1.21 |
Russo | 5.0% | 3.5% | 0.71 |
Português | 4.0% | 3.5% | 0.88 |
Japonês | 3.4% | 3.5% | 1.04 |
Árabe | 4.2% | 3.0% | 0.72 |
Hindi | 3.9% | 3.0% | 0.77 |
Malês | 2.6% | 2.5% | 0.96 |
Polaco | 1.7% | 1.8% | 1.09 |
Coreano | 1.4% | 1.4% | 1.01 |
Bengali | 1.5% | 1.3% | 0.86 |
Italiano | 0.9% | 1.1% | 1.23 |
Urdu | 0.8% | 0.7% | 0.84 |
REST | 35.3% | 31.4% | 0.89 |
TOTAL | 125.0% | 125.0% | 1 |
Note-se que os totais são superiores a 100% para ter em conta o multilinguismo (25% corresponderia à população com uma segunda língua).
Projetos de OBDILCI
- Indicadores da presença das línguas na Internet
- As línguas da França na Internet
- Francês na Internet
- Português na Internet
- Espanhol na Internet
- IA e multilinguismo
- DILINET
- Projetos pré-históricos
- Projeto Digital Language Death