Resumo: O resumo pode ser considerado uma das seções mais importantes de um trabalho acadêmico, dado que, em conjunto com o título, é utilizado por pesquisadores na divulgação de suas pesquisas no meio científico. Nesse sentido, com o objetivo de auxiliar o processo de escrita das seções Resumo e Introdução de teses e dissertações da área de Ciência da Computação em português, Feltrim (2004) propôs um ambiente de auxílio à escrita denominado SciPo. O auxílio fornecido pelo SciPo é dado por meio de críticas e sugestões apresentadas ao usuário em relação ao uso da estrutura retórica (ou esquemática) identificada no texto submetido a análise. Embora o ambiente forneça feedback indicando quais pontos do texto devem ser melhorados, não analisa características relacionadas à semântica do texto, como a coerência, fundamental para a legibilidade e interpretabilidade do texto. Dessa maneira, o principal objetivo deste trabalho foi desenvolver recursos computacionais para a detecção automática de aspectos semânticos da seção Resumo de trabalhos acadêmicos escritos em português, de modo que eles possam ser utilizados pelo SciPo para o retorno de sugestões relacionadas à coerência. Mais especificamente, foram desenvolvidos classificadores que, com base em um certo conjunto de características extraídas automaticamente da superfície do texto e a partir da técnica LSA - Latent Semantic Analysis e de algoritmos de aprendizagem de máquina supervisionados, apresentam indicações sobre aspectos semânticos que contribuem para que o resumo seja considerado coerente. Tanto as avaliações intrínsecas dos classificadores quanto a avaliação do protótipo em um contexto de uso com usuários reais demonstraram o potencial dos classificadores no auxílio à escrita de resumos acadêmicos com um nível maior de coerência por meio da apresentação das novas sugestões.
Abstract: The abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions. |