Biblioteca Digital da UEM: Sistema Nou-Rau
Pgina Principal  Portugus   English  Español   Aumentar Texto  Texto Normal  Diminuir Texto
  Principal | Apresentao | Objetivos | Instrues Autores | Estatsticas | Outras Bibliotecas Digitais
  Sistema Integrado de Bibliotecas - SIB / UEM
Entrar | acessos | verso 1.1  
ndice
Pgina principal
Documentos
Novidades
Usurios

Aes
Consultar
Procurar
Exibir estatsticas

Procurar por:
Procura avanada

Dvidas e sugestes


Consultar: Programa de Ps-Graduao em Cincia da Computao

Incio > Dissertaes e Teses > Cincias Exatas e da Terra > Cincia da Computao > Programa de Ps-Graduao em Cincia da Computao

Ttulo [PT]: Anlise automtica de coerncia usando o modelo grade de entidades para o portugus
Ttulo [EN]: Automatic coherence analysis using the entity-grid model in portuguese
Autor(es): Alison Rafael Polpeta Freitas
Palavras-chave [PT]:

Coerncia semntica. Anlise automtica de coerncia. Modelo de grade de entidades. Brasil.
Palavras-chave [EN]:
Semantic coherence. Automatic analysis of coherence. Entity-grid model. Brazil.
Titulao: Mestre em Cincia da Computao
Banca:
Valria Delisandra Feltrim [Orientador] - UEM
Srgio Roberto Pereira da Silva - UEM
Sandra Maria Alusio - ICMC/USP
Resumo:
Resumo: Um texto bem escrito deve ser coerente de forma que cada novo trecho de informao possa ser interpretado de acordo com o contexto precedente, um fator fundamental para a inteligibilidade e interpretabilidade do texto. A coerncia normalmente refletida pela estrutura do discurso e suas relaes, as quais podem ser analisadas por meios de teorias como a RST (Rethorical Structure Theory), Centering e o modelo LSA (Latent Semantic Analysis), sendo essas as principais fontes de estudos para o esenvolvimento de ferramentas que possam distinguir textos coerentes e incoerentes, seja na gerao, sumarizao ou avaliao automtica de textos. Para a lngua portuguesa, o SciPo (Scientific Portuguese) um exemplo de ferramenta de auxlio escrita que possui um mdulo de anlise de coerncia para a deteco de potenciais problemas de coerncia semntica em resumos. Baseado em LSA, esse mdulo analisa os relacionamentos semnticos entre as sentenas de um resumo, de acordo com um conjunto pr-estabelecido de dimenses. Para uma das dimenses propostas para o mdulo de anlise de coerncia,chamada Quebra de Linearidade, os resultados obtidos por meio de LSA foram pouco satisfatrios, sugerindo a utilizao de outros modelos de coerncia. Nesse contexto, este trabalho teve por objetivo investigar a aplicabilidade do modelo grade de entidades (do ingls Entity-Grid), um modelo estatstico baseado na teoria de Centering, na avaliao de coerncia de resumos cientficos escritos em portugus. Mais especificamente, se buscou avaliar se tal modelo poderia ser empregado na implementao de um classificador capaz de detectar problemas locais de coerncia, semelhantes aos descritos na dimenso Quebra de Linearidade, visando a futura incluso de tal classificador no mdulo de anlise de coerncia. Os resultados obtidos nos experimentos se mostraram prximos aos resultados do modelo grade de entidades original para a lngua inglesa e semelhantes aos resultados relatados por trabalhos relacionados para outras lnguas. Os resultados tambm foram prximos ao obtido em experimento com juzes humanos, mostrando que o modelo grade de entidades tem potencial para ser usado no contexto do sistema SciPo.

Abstract: A well-written text should be coherent, it means that each new piece of information can be interpreted as the preceding context, a key factor for the readability and interpretability the text. Coherence is usually reflected by the structure of discourse and its relations, which can be analyzed by theories such as RST (Rhetorical Structure Theory), Centering, and models like LSA (Latent Semantic Analysis), which are the main sources of studies for developing tools that can distinguish coherent texts of incoherent in the generation, automatic summarization and evaluation of texts. For the Portuguese language, SciPo (Scientific Portuguese) is an example of a writing tool which has a coherence analysis module that detects potential problems of semantic coherence in abstracts. Based on LSA, this module analyzes different semantic relationships among sentences, according to a pre-established set of dimensions. For one of these dimensions, named Linearity-break, evaluation results were not satisfactory, suggesting the use of other coherence models. In this context, our purpose was to investigate the applicability of the Entity-Grid model, a statistical model based on the Centering theory, in the evaluation of coherence in scientific abstracts written in Portuguese. More specifically, we aimed at assessing whether such model could be employed in the implementation of a classifier capable of detecting local coherence problems, similar to those assessed by the dimension Linearity-break, aiming at future inclusion of such classifier as part of coherence analysis module. Our experimental results are close to those of the original entity-grid model for English language and very similar to the results reported by related works for other languages. Results are also close to those obtained by human judges in an annotation experiment, showing that the entity-grid model can be applied in the context of SciPo system.
Data da defesa: 01/03/2013
Cdigo: vtls000204107
Informaes adicionais:
Idioma: Portugus
Data de Publicao: 2013
Local de Publicao: Maring, PR
Orientador: Prof. Dr. Valria Delisandra Feltrim
Instituio: Universidade Estadual de Maring. Centro de Tecnologia. Programa de Ps-Graduao em Cincia da Computao
Nvel: Dissertao (mestrado em Cincia da Computao)/
UEM: Departamento de Informtica

Responsavel: beth
Categoria: Aplicao
Formato: Documento PDF
Arquivo: Dissertacao_Mestrado_Alison_Rafael_Polpeta_Freitas.pdf
Tamanho: 3524 Kb (3608757 bytes)
Criado: 02-04-2016 09:12
Atualizado: 02-04-2016 09:16
Visitas: 306
Downloads: 7

[Visualizar]  [Download]

Todo material disponvel neste sistema de propriedade e responsabilidade de seus autores.