O que é

logo do cortec

O que é Lista de corpora Pesquisar  

O que é 

Corpus Técnico-Científico (CorTec)

CorTec - Corpus Técnico-Científico - é um corpus comparável de textos técnicos e/ou científicos originalmente escritos em português brasileiro e em inglês. Este corpus, a princípio, privilegiaria quatro áreas: Direito Comercial, Informática, Ortodontia e Meio Ambiente, a serem ampliadas sistematicamente até cada uma atingir a meta de um milhão de palavras. No entanto, outros corpora produzidos pelos alunos do Curso de Especialização em Tradução e por pós-graduandos do programa de Estudos Linguísticos e Literários em Inglês foram disponibilizados também para consulta.

A primeira versão do CorTec, lançada em setembro de 2005, teve o apoio financeiro do CNPq, processo no. 403120-03-9 e foi construída e implementada junto ao projeto COMET em parceria com o NILC (Núcleo Interinstitucional de Lingüística Computacional), localizado no ICMC da USP de São Carlos, e o Projeto Lácio-Web.

A interface e todas as ferramentas de pesquisa foram desenvolvidas e adaptadas para o Cortec por Marcos Felipe Tonelli de Carvalho, sob a coordenação da Profa. Dra. Sandra Maria Aluísio, que também coordenou o trabalho de inserção do Corpus paralelo de textos da Revista Fapesp junto ao corpus Par-C do Projeto Lácio-Web, trabalho realizado por Leandro Henrique Mendonça de Oliveira, do NILC.

Esses primeiros corpora incluídos foram compilados, sob a coordenação da Profa. Dra. Stella E. O. Tagnin, por Josimeire Martins (Meio Ambiente - Ecoturismo), Guilherme Fromm (Informática - Geral), Rosa Maria Caporrino Castanho (Cardiologia - Hipertensão, revisado por Luciana Latarini Ginezi), Luciana Carvalho Fonseca (Direito - Instrumentos contratuais) e Elisa Duarte Teixeira (Culinária - Receitas); o corpus paralelo (Revista Fapesp) foi coletado por Alvamar H. C. A. Lamparelli, com a ajuda de Priscilla Izuhara.

Na segunda etapa do projeto outros corpora foram incluídos e estão disponíveis para consulta. Para saber quais são, clique em Lista de corpora