Recuperação de Informação em Teses e Dissertações por meio de Sintagmas Nominais

Recuperação de Informação em Teses e Dissertações por meio de Sintagmas Nominais

Esse projeto teve como objetivo desenvolver referenciais teóricos, métodos e ferramentas que permitam: a extração de sintagmas nominais de resumos de teses e dissertações; a pontuação, o ranqueamento e seleção de sintagmas nominais descritivos dos assuntos para cada documento; a criação de índices invertidos tendo os sintagmas nominais como ponto de acesso aos documentos; a busca, a ordenação e a apresentação da lista de documentos resultante através de interfaces amigáveis e consulta a um índice invertido orientado a sintagmas nominais.
Um subprojeto desse projeto de pesquisa, foi o Mapeador Temático de Teses e Dissertações (MTTD-UFPE).
A principal motivação para aplicar a extração de sintagmas nominais foram as limitações em se trabalhar com palavras isoladas na recuperação de informação, observadas na análise dos resultados de um projeto de pesquisa anterior, cuja descrição se encontra na página MTD-UFPE.
Em particular, o efeito do uso de palavras isoladas pelos SRIs de teses e dissertações das BDTDs (Bibliotecas Digitais de Teses e Dissertações) tem agravado o problema de sobrecarga de informação sobre os usuários e tornado a tarefa de busca uma atividade cansativa, devido principalmente ao volume da ordem de milhares de documentos, os diferentes domínios do conhecimento em que são elaborados os documentos e os diferentes significados que uma palavra isolada pode apresentar em cada um desses domínios.
Os sintagmas nominais constituem estruturas gramaticais frasais que possuem substativos como núcleo e são considerados melhores descritores de assunto ou temas presentes no conteúdo de documentos que as palavras isoladas, isto porque os sintagmas nominas sofrem menos dos problemas de sinonímia, polissemia e ambiguidade das palavras.
Entretanto, a utilização dos sintagmas nominais ao invés de palavras isoladas nos Sistemas de Recuperação de Informação (SRI) ainda é uma prática pouco estabelecida na literatura de Ciência da Informação e Ciência da Computação, devido a problemas de ordem teórica e prática. 

PALAVRAS-CHAVE: BDTD-UFPE. Recuperação de Informação. Sintagmas Nominais. Teses e dissertações.

KEYWORDS: BDTD-UFPE. Information Retrieval. Noun phrases. Theses and dissertations.

VIGÊNCIA: Este projeto teve início em janeiro de 2011 e teve término em 2015.

Orientações: Graduação: 2 (Antônio Santos; Thiago Silva) / Mestrado acadêmico: 3 (Thiago Silva; Remi Lapa; Gustavo Nascimento).

Nenhum comentário: