OUTROS PROJECTOS

Relatórios sobre o multilinguismo na WWW

Relatórios sobre o multilinguismo na WWW

O OBDILCI tem o prazer de anunciar uma nova série de estudos sobre o estado do multilinguismo da Internet, sustentados pelos dados do https://Dataprovider.com.

A sua base de dados reúne mais de 200 parâmetros sobre sítios Web, abrangendo quase todo o ecossistema da WWW (mais de 800 milhões de registos, incluindo 167 milhões de sítios Web activos e 91 milhões com informações linguísticas relevantes disponíveis). Entre estes parâmetros, alguns dizem respeito a línguas e outros podem ser cruzados com dados linguísticos.

PRIMEIRO RELATÓRIO

Este primeiro relatório actualiza o estudo realizado pela Universidade Ionan em 2009 sobre a prevalência do inglês nos sítios Web ccTLD da União Europeia, mostrando uma evolução notável (o inglês desce de 28% para 20%). Permite uma primeira estimativa da taxa global de multilinguismo da WWW e produz correlações interessantes entre a língua principal dos sítios e o comércio eletrónico, o tipo de TLD, a atividade económica, etc.

Algumas percepções intuitivas, e algumas surpresas, são agora apoiadas por dados sólidos:

  • mais de metade dos sítios Web ucranianos, estónios, catalães ou gregos são multilingues;
  • A correlação entre sítios com elevada pegada económica e o multilinguismo é impressionante;
  • O chinês, o coreano e o japonês poderiam fazer melhor em termos de percentagem de sítios multilingues;
  • O mesmo se aplica ao português, que está ligeiramente abaixo da média a diferencia de italiano, francês o espanhol;
  • .org não é tão multilingue como seria de esperar…

Com os nossos thank you multilingues a Dataprovider.com pelo acesso de cortesia a esta riqueza de dados.

SEGUNDO RELATORIO

Segundo relatório da série WebMultilingualism: Explorando a presença na web e o multilinguismo de línguas minoritárias europeias com gTLDs associados.

As conclusões do estudo são:

  • Dois gTLDs apresentam excelentes desempenhos linguísticos, tanto em termos de presença da língua minoritária quanto em termos de multilinguismo: .cat e .eus; ambos, especialmente .eus, têm espaço para aumentar sua presença.
  • Dois gTLDs, .cymru e .gal, mostram desempenho linguístico razoável, juntamente com .lu. O caso de .lu, o ccTLD de Luxemburgo, deve ser tratado separadamente, com o estudo destacando a baixa presença da língua nacional em um contexto de forte multilinguismo.
  • Três gTLDs mostram resultados médios com promessas em alguns fatores e dificuldades em outros: .gal, .gales e .bzh.
  • Dois gTLDs, .corsica e .frl, não atingiram o ponto de beneficiar o idioma local nem o multilinguismo, e parecem permanecer em um estágio de TLD geográfico.
  • Por fim, .alsace, .irish e .scot não apresentam desempenho linguístico e permanecem como domínios geográficos com penetração e impacto linguístico muito limitados neste estágio.

TERCEIRO ESTUDO

Temos o prazer de anunciar o terceiro estudo sobre multilinguismo realizado usando o banco de dados DataProvider.com. Desta vez o estudo é em francês e o tema é: Uma caracterização da Web francófona com base em uma série de parâmetros, em comparação com outras línguas dominantes na Web.

O foco é o francês, mas o estudo também fornece dados para outros idiomas, e você pode visualizar dados para o idioma de sua escolha, entre os 19 especificamente abordados.

A descoberta fundamental é que cada idioma tem sua própria “assinatura temática“, que reflete a cultura que ele carrega consigo, e é possível até mesmo ver as proximidades e distâncias entre redes linguísticas.

Portanto, o site francês está próximo do site italiano e extremamente distante do site hindi. Além da análise temática, os seguintes parâmetros são abordados: impacto econômico, confiança no comércio eletrônico, tamanho médio do site, número médio de links de entrada, orientação comercial e B2B vs. B2C.

O relatório apresenta o método, os vieses e os resultados, e fornece uma melhor compreensão da natureza de cada rede linguística, usando a rede francófona como exemplo.

Além disso, é feita uma comparação entre as respectivas proporções de idiomas no banco de dados DataProvider.com e os dados do modelo OBDILCI, permitindo o estabelecimento de vieses favoráveis ​​ou desfavoráveis ​​em relação a determinados idiomas.

CUARTO ESTUDO

Temos o prazer de anunciar o cuarto estudo sobre multilinguismo en la Web realizado usando o banco de dados DataProvider.com. Desta vez o estudo é em espanhol e o tema é: Una evaluación de la reciprocidad en el uso mutuo del español y del portugués en las Web lusófona e hispanófona.

As principais conclusões do estudo são:

  • A taxa de multilinguismo de websites em português está abaixo da média mundial.
  • Há três vezes mais websites em espanhol em países de língua portuguesa do que em português em países de língua espanhola. De qualquier forma, as porcentagens são muito baixas, abaixo de 1% em média.
  • O Brasil é o país com maior porcentagem de websites com versão em espanhol.
  • Os países do Mercosul e do Caribe são os países de língua espanhola com maior porcentagem de websites com versão em português.
  • A prevalência de websites com versão em português nos EUA é 15 vezes maior do que em espanhol em proporção à população de falantes.

  • Recomendações:
  • Os websites em português devem aumentar seu multilinguismo.
  • Os websites espanhóis devem aumentar a porcentagem de versões em português.
  • Os falantes de espanhol nos EUA devem aumentar sua presença virtual.

ESTUDO #5

Este relatório em inglês aborda: Multilinguismo na Web analisado por ccTLD, idiomas, gTLDs e muito mais: vencedores e perdedores

Resumo das conclusões:

ESTUDO #6

Multilinguismo da Wikimedia. Este relatório utiliza as notáveis ​​estatísticas por idioma da Wikimedia para explorar a aplicação mais multilíngue da web e destaca os idiomas com melhor desempenho, tanto individualmente quanto em geral. O relatório também destaca as muitas enciclopédias online existentes.

.

Projetos de OBDILCI

  • Indicadores da presença das línguas na Internet
  • As línguas da França na Internet
  • Francês na Internet
  • Português na Internet
  • Espanhol na Internet
  • IA e multilinguismo
  • DILINET
  • Projetos pré-históricos
  • Projeto Digital Language Death