Corpora de Espanhol

BwanaNet: programa desenvolvido pelo Instituto Universitário de Linguística Aplicada (IULA), Universidade Pompeu Fabra, que permite a extração de informação linguística do corpus técnico do IULA. As áreas contempladas no corpus são: economia, direito, genoma, informática, meio ambiente, medicina. Podem ser feitas buscas em espanhol, catalão e inglês.

Corpus de Referencia del Español Actual (CREA): corpus dedicado à coleta do uso do espanhol nos últimos anos e suas variantes em todos os países que falam essa língua. 

Corpus Del Español: corpus diacrônico (de 1200 até o fim do século XX) com 100 milhões de palavras, de linguagem escrita e oral. Foi idealizado por Mark Davies e apresenta as linhas de concordância em formato KWIC, ou seja, a palavra é centralizada e realçada em negrito. Permite pesquisas complexas por categoria gramatical e tipo de texto.

Corpus Diacrónico del Español (CORDE): parte do Banco de Dados do espanhol da Real Academia Española, é o maior recurso léxico – mais de 200 milhões de palavras – disponível para o idioma espanhol. Pretende ser uma amostra representativa da língua espanhola ao longo de sua história.

 

Para mais Corpora de Espanhol, visite os seguintes sites: Internet corporaTERMISULWebCorp e TextQuim. Mais informações sobre eles na seção Corpora Multilíngue.