PROJETO PRINCIPAL – V2.0 (2021)

Indicadores da presença das línguas na Internet

NOTA: Esta é uma versão arquivada do estudo. Clique aqui para ver a versão mais recente.

Versão melhorada e segunda versão de uma abordagem alternativa para o desenvolvimento de indicadores linguísticos da Internet

Resumo do projeto – V2.0 (2021)

Tal como demonstrado em 2017, W3Techs esforço louvável para fornecer números actualizados diariamente sobre o conteúdo é tendencioso a muitos níveis (o mais forte, mas não o único, é não ter em conta o multilinguismo e o facto de a maioria dos sítios multilingues que incluem o inglês serem provavelmente calculados como apenas em inglês). Esta fonte projecta valores extremamente exagerados para o conteúdo em inglês na Web (mais de 50%, quando a realidade é provavelmente inferior a 25% atualmente).

A falta de fontes alimenta o mito propagado pelos meios de comunicação social de que mais de metade de todos os sítios Web são em inglês. Foi o que aconteceu entre 2007 e 2009, mas desde então o crescimento exponencial do chinês, hindi, árabe, turco, bengali, vietnamita, urdu, persa e marati, para citar as novas línguas no top 20, que juntas representam quase 28% do conteúdo, mudou radicalmente a situação, com o inglês a representar agora apenas um quarto do conteúdo. Entre 2000 e 2007, o mito de que o inglês representava 80% da Web desapareceu definitivamente após a publicação da UNESCO em 2009, e uma presença na Web em inglês de cerca de 50% passou a ser o valor aceite.

Como é possível que o inglês se tenha mantido estável nos 50% durante os últimos 14 anos, quando a Internet mudou radicalmente a sua demografia e o número de falantes de inglês em linha (L1+L2) diminuiu de 32% do total em linha em 2007 para apenas 13% atualmente?

O inglês continua a ser a principal língua da Web em termos de poder, mas as proporções estão a mudar drasticamente. O chinês é agora a língua com o maior número de falantes em linha. Em termos de poder, o espanhol ocupa um forte terceiro lugar, seguido do francês e do hindi, e um grupo de cinco línguas partilha uma posição próxima na sequência: português, russo, árabe, alemão e japonês.

Em termos de indicadores independentes do número de falantes (capacidade e gradiente), as línguas dos países que ocupam os primeiros lugares nos parâmetros da sociedade da informação estão na vanguarda: hebraico, finlandês, sueco, neerlandês, alemão e dinamarquês.

As línguas com mais falantes ligados são o dinamarquês, o sueco, o japonês, o neerlandês, o suíço-alemão e o finlandês.

Todos os resultados para as 132 línguas do estudo e uma descrição completa da metodologia podem ser lidos nos documentos abaixo em inglês, francês, espanhol ou português.


Resultados do estudo de 2021 (V2.0)

Mais informações

Percentage of English Pages in the Web

Cibergeografia das línguas

Atención: Las estadísticas sólo se refieren a las 133 lenguas con L1>5 millones.

%L1 + L2%CON.W%CONN.PODERCAPACITÉGRADIENTE
Línguas africanas7.03%31.11%4.00%2.00%0.2840.519
Lenguas americanas0.21%53.80%0.21%0.13%0.5950.623
Lenguas asiáticas45.86%50.85%42.63%34.39%0.7500.783
Línguas árabes3.53%60.14%3.89%3.09%0.8750.796
Línguas europeias30.26%69.64%38.53%53.90%1.7811.415
Resto13.10%44.84%10.74%6.50%
  • W.Conn. Percentagem de falantes desta língua ligados à Internet em relação ao número total de falantes ligados à Internet.
  • W. Pop. : percentagem de falantes desta língua em relação ao total da população mundial L1+L2
  • L. Conn. Percentagem de falantes de L1+L2 desta língua que estão ligados à Internet
  • TODAS AS PERCENTAGENS REFEREM-SE ÀS POPULAÇÕES L1+L2

Resumo dos resultados

  • As línguas europeias dominaram a Internet nos primeiros tempos e são as suas línguas históricas.
  • O centro de gravidade está a deslocar-se rapidamente para as línguas asiáticas/árabes
  • As línguas africanas estão atrasadas mas associadas a um forte crescimento demográfico

Créditos

Esta versão foi possível graças ao apoio do Departamento de Cultura e Educação do Ministério das Relações Exteriores do Brasil como parte do Instituto Internacional da Língua Portuguesa e sob a coordenação da Cadeira da UNESCO em Políticas Linguísticas para o Multilinguismo. O crédito também deve ser atribuído a Daniel Prado, que teve a ideia de compilar múltiplas fontes para medir a presença de línguas na Internet, bem como de transformar os dados dos países em dados linguísticos.

Muito obrigado a todos: ao Professor Gilvan Müller de Oliveira pelo seu apoio nas questões linguísticas e na coordenação com os financiadores; a Álvaro Blanco por ter escrito as complicadas macros Excel que mudaram radicalmente o tratamento de tantas fontes e grafias de línguas e países; e a David Pimienta, que escreveu as macros Excel necessárias para transformar o formato do Ethnologue para o formato necessário para este estudo, bem como para o tratamento das macro-línguas.

Descargo de responsabilidad: Este estudio es esencialmente un trabajo estadístico basado en una amplia variedad de fuentes. La adopción de una fuente importante en este tipo de trabajos implica también, lógicamente, la adopción de las normas que sustentan los datos de dicha fuente. El autor no se hace responsable de la lista de países y territorios considerados, elaborada por la UIT, organismo de las Naciones Unidas, ni de la lista de lenguas con más de cinco millones de hablantes L1, según Ethnologue, ni de la agrupación en macrolenguas, adoptada por Ethnologue, de acuerdo con la norma ISO 693.3.

Projetos de OBDILCI

  • Indicadores da presença das línguas na Internet
  • As línguas da França na Internet
  • Francês na Internet
  • Português na Internet
  • Espanhol na Internet
  • IA e multilinguismo
  • DILINET
  • Projetos pré-históricos
  • Projeto Digital Language Death