OUTROS PROJECTOS
Relatórios sobre o multilinguismo na WWW

Relatórios sobre o multilinguismo na WWW
O OBDILCI tem o prazer de anunciar uma nova série de estudos sobre o estado do multilinguismo da Internet, sustentados pelos dados do https://Dataprovider.com.
A sua base de dados reúne mais de 200 parâmetros sobre sítios Web, abrangendo quase todo o ecossistema da WWW (mais de 800 milhões de registos, incluindo 167 milhões de sítios Web activos e 91 milhões com informações linguísticas relevantes disponíveis). Entre estes parâmetros, alguns dizem respeito a línguas e outros podem ser cruzados com dados linguísticos.
PRIMEIRO RELATÓRIO
Este primeiro relatório actualiza o estudo realizado pela Universidade Ionan em 2009 sobre a prevalência do inglês nos sítios Web ccTLD da União Europeia, mostrando uma evolução notável (o inglês desce de 28% para 20%). Permite uma primeira estimativa da taxa global de multilinguismo da WWW e produz correlações interessantes entre a língua principal dos sítios e o comércio eletrónico, o tipo de TLD, a atividade económica, etc.
Algumas percepções intuitivas, e algumas surpresas, são agora apoiadas por dados sólidos:
- mais de metade dos sítios Web ucranianos, estónios, catalães ou gregos são multilingues;
- A correlação entre sítios com elevada pegada económica e o multilinguismo é impressionante;
- O chinês, o coreano e o japonês poderiam fazer melhor em termos de percentagem de sítios multilingues;
- O mesmo se aplica ao português, que está ligeiramente abaixo da média a diferencia de italiano, francês o espanhol;
- .org não é tão multilingue como seria de esperar…
Com os nossos thank you multilingues a Dataprovider.com pelo acesso de cortesia a esta riqueza de dados.
SEGUNDO RELATORIO
Segundo relatório da série WebMultilingualism: Explorando a presença na web e o multilinguismo de línguas minoritárias europeias com gTLDs associados.
As conclusões do estudo são:
- Dois gTLDs apresentam excelentes desempenhos linguísticos, tanto em termos de presença da língua minoritária quanto em termos de multilinguismo: .cat e .eus; ambos, especialmente .eus, têm espaço para aumentar sua presença.
- Dois gTLDs, .cymru e .gal, mostram desempenho linguístico razoável, juntamente com .lu. O caso de .lu, o ccTLD de Luxemburgo, deve ser tratado separadamente, com o estudo destacando a baixa presença da língua nacional em um contexto de forte multilinguismo.
- Três gTLDs mostram resultados médios com promessas em alguns fatores e dificuldades em outros: .gal, .gales e .bzh.
- Dois gTLDs, .corsica e .frl, não atingiram o ponto de beneficiar o idioma local nem o multilinguismo, e parecem permanecer em um estágio de TLD geográfico.
- Por fim, .alsace, .irish e .scot não apresentam desempenho linguístico e permanecem como domínios geográficos com penetração e impacto linguístico muito limitados neste estágio.
TERCEIRO ESTUDO
Temos o prazer de anunciar o terceiro estudo sobre multilinguismo realizado usando o banco de dados DataProvider.com. Desta vez o estudo é em francês e o tema é: Uma caracterização da Web francófona com base em uma série de parâmetros, em comparação com outras línguas dominantes na Web.
O foco é o francês, mas o estudo também fornece dados para outros idiomas, e você pode visualizar dados para o idioma de sua escolha, entre os 19 especificamente abordados.
A descoberta fundamental é que cada idioma tem sua própria “assinatura temática“, que reflete a cultura que ele carrega consigo, e é possível até mesmo ver as proximidades e distâncias entre redes linguísticas.
Portanto, o site francês está próximo do site italiano e extremamente distante do site hindi. Além da análise temática, os seguintes parâmetros são abordados: impacto econômico, confiança no comércio eletrônico, tamanho médio do site, número médio de links de entrada, orientação comercial e B2B vs. B2C.
O relatório apresenta o método, os vieses e os resultados, e fornece uma melhor compreensão da natureza de cada rede linguística, usando a rede francófona como exemplo.
Além disso, é feita uma comparação entre as respectivas proporções de idiomas no banco de dados DataProvider.com e os dados do modelo OBDILCI, permitindo o estabelecimento de vieses favoráveis ou desfavoráveis em relação a determinados idiomas.
CUARTO ESTUDO
Temos o prazer de anunciar o cuarto estudo sobre multilinguismo en la Web realizado usando o banco de dados DataProvider.com. Desta vez o estudo é em espanhol e o tema é: Una evaluación de la reciprocidad en el uso mutuo del español y del portugués en las Web lusófona e hispanófona.
As principais conclusões do estudo são:
- A taxa de multilinguismo de websites em português está abaixo da média mundial.
- Há três vezes mais websites em espanhol em países de língua portuguesa do que em português em países de língua espanhola. De qualquier forma, as porcentagens são muito baixas, abaixo de 1% em média.
- O Brasil é o país com maior porcentagem de websites com versão em espanhol.
- Os países do Mercosul e do Caribe são os países de língua espanhola com maior porcentagem de websites com versão em português.
- A prevalência de websites com versão em português nos EUA é 15 vezes maior do que em espanhol em proporção à população de falantes.
Recomendações:- Os websites em português devem aumentar seu multilinguismo.
- Os websites espanhóis devem aumentar a porcentagem de versões em português.
- Os falantes de espanhol nos EUA devem aumentar sua presença virtual.
ESTUDO #5
Este relatório em inglês aborda: Multilinguismo na Web analisado por ccTLD, idiomas, gTLDs e muito mais: vencedores e perdedores
Resumo das conclusões:

ESTUDO #6
Multilinguismo da Wikimedia. Este relatório utiliza as notáveis estatísticas por idioma da Wikimedia para explorar a aplicação mais multilíngue da web e destaca os idiomas com melhor desempenho, tanto individualmente quanto em geral. O relatório também destaca as muitas enciclopédias online existentes.
.


Projetos de OBDILCI
- Indicadores da presença das línguas na Internet
- As línguas da França na Internet
- Francês na Internet
- Português na Internet
- Espanhol na Internet
- IA e multilinguismo
- DILINET
- Projetos pré-históricos
- Projeto Digital Language Death