Biblioteca Digital da UEM: Sistema Nou-Rau

Consultar: Programa de Pós-Graduação em Ciência da Computação

Início > Dissertações e Teses > Ciências Exatas e da Terra > Ciência da Computação > Programa de Pós-Graduação em Ciência da Computação

Título [PT]: Análise automática de coerência semântica em recursos acadêmicos escritos em português
Autor(es): Vinícius Mourão Alves de Souza
Palavras-chave [PT]:

Resumo acadêmico. Ciência da computação. Coerência semântica. Análise automática. Análise de semântica Latente. Latent Semantic Analysis. SciPo (Scientific Portuguese). Ambiente de auxílio à escrita. Natural Language Processing.

Palavras-chave [EN]:

Academic abstract. Semantic coherece. Automatic analysis of coherence. Latent Semantic Analysis.

Titulação: Mestre em Ciência da Computação
Banca:

Valéria Delisandra Feltrim [Orientador] - UEM
Sérgio Roberto Pereira da Silva - UEM
Thiago Alexandre Salgueiro Pardo - UCMC/USP

Resumo:

Resumo: O resumo pode ser considerado uma das seções mais importantes de um trabalho acadêmico, dado que, em conjunto com o título, é utilizado por pesquisadores na divulgação de suas pesquisas no meio científico. Nesse sentido, com o objetivo de auxiliar o processo de escrita das seções Resumo e Introdução de teses e dissertações da área de Ciência da Computação em português, Feltrim (2004) propôs um ambiente de auxílio à escrita denominado SciPo. O auxílio fornecido pelo SciPo é dado por meio de críticas e sugestões apresentadas ao usuário em relação ao uso da estrutura retórica (ou esquemática) identificada no texto submetido a análise. Embora o ambiente forneça feedback indicando quais pontos do texto devem ser melhorados, não analisa características relacionadas à semântica do texto, como a coerência, fundamental para a legibilidade e interpretabilidade do texto. Dessa maneira, o principal objetivo deste trabalho foi desenvolver recursos computacionais para a detecção automática de aspectos semânticos da seção Resumo de trabalhos acadêmicos escritos em português, de modo que eles possam ser utilizados pelo SciPo para o retorno de sugestões relacionadas à coerência. Mais especificamente, foram desenvolvidos classificadores que, com base em um certo conjunto de características extraídas automaticamente da superfície do texto e a partir da técnica LSA - Latent Semantic Analysis e de algoritmos de aprendizagem de máquina supervisionados, apresentam indicações sobre aspectos semânticos que contribuem para que o resumo seja considerado coerente. Tanto as avaliações intrínsecas dos classificadores quanto a avaliação do protótipo em um contexto de uso com usuários reais demonstraram o potencial dos classificadores no auxílio à escrita de resumos acadêmicos com um nível maior de coerência por meio da apresentação das novas sugestões.

Abstract: The abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions.

Data da defesa: 27/07/2011
Código: vtls000188287
Informações adicionais:

Idioma: Português
Data de Publicação: 2011
Local de Publicação: Maringá, PR
Orientador: Prof.ª Dr.ª Valéria Delisandra Feltrim
Instituição: Universidade Estadual de Maringá. Centro de Tecnologia. Programa de Pós-Graduação em Ciência da Computação
Nível: Dissertação (Mestrado em Ciência da Computação)/
UEM: Departamento de Informática

Responsavel: inez
Categoria: Aplicação
Formato: Documento PDF
Arquivo: DISSERTACAO.pdf
Tamanho: 7933 Kb (8123735 bytes)
Criado: 20-09-2011 08:57
Atualizado: 20-09-2011 09:15
Visitas: 2080
Downloads: 24

[Visualizar] [Download]

Todo material disponível neste sistema é de propriedade e responsabilidade de seus autores.

Voltar