Dúvidas e sugestões
|
Consultar: Programa de Pós-Graduação em Ciência da Computação
Início > Dissertações e Teses > Ciências Exatas e da Terra > Ciência da Computação > Programa de Pós-Graduação em Ciência da Computação
Título [PT]: Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
Título [EN]: An approach to semantic tag recommendation for tagging-based systems.
Autor(es): Marcelo Rafael Borth
Palavras-chave [PT]:
Tags. Recomendação. Tagging. Identificação de semântica. Recuperação da informação. Recurso Web. Ontologia. Organização da informação. Sistemas de informação. Brasil. |
Palavras-chave [EN]:
Tag recommendation. Ontology. Information retrieval. Tagging-Based System. Brazil. |
Área de concentração: Ciência da Computação
Titulação: Mestre em Ciência da Computação
Banca:
a: Sérgio Roberto Pereira da Silva [Orientador] - UEM
Luciana Andréia Fondazzi Martimiano - UEM
Vânia Paula de Almeida Neris - UFSCar |
Resumo:
Resumo: Devido à popularização da Web grandes quantidades de conteúdos tornaram-se disponíveis, principalmente em função da atual facilidade de publicação de conteúdo por usuários leigos. Essa facilidade promove um incontrolável crescimento do total de informação acessível, criando, assim, a necessidade de mecanismos para indexação de conteúdos para auxiliar o usuário na recuperação da informação. Por causa dessa sobrecarga de informação, torna-se inviável que um usuário organize suas informações sem utilizar ferramentas que facilitem o processo de recuperação. Uma forma para efetuar essa organização é por meio de categorizações a partir de um sistema baseado em tagging, o qual auxilia o processo de atribuição de significado a qualquer objeto acessível na Web. Entretanto, uma vez que as tags utilizadas nas categorizações são selecionadas livremente pelo usuário, sem nenhum controle ou esquema rígido a ser seguido, a utilização desse tipo de sistema pode sofrer várias limitações, principalmente quando os usuários precisam recuperar um objeto categorizado. Esse problema se agrava na medida em que o usuário utiliza o sistema, pois seu vocabulário pode tornar-se inconsistente devido a erros de digitação, a criação de termos sinônimos e polissêmicos, a introdução de formas léxicas de escrita distintas para uma mesma representação conceitual, etc., e, por conseqüência, muitos recursos relevantes poderão ser excluídos dos resultados das buscas. Por essa razão, nesta dissertação é proposta uma abordagem de recomendação de tags semânticas que visa melhorar a qualidade das categorizações realizadas pelos usuários para facilitar a recuperação de informação e, também, resolver o problema de "cold-start". A proposta combina três fontes de informação distintas para gerar a recomendação: (i) os elementos textuais da página Web, (ii) as tags da folksonomia relativas à página em questão, e (iii) a personomia do usuário. Deste modo, a abordagem proposta tenta personalizar as recomendações com base nas características e interesses do usuário, bem como reduzir os problemas relacionados ao processo de tagging. Os resultados obtidos sobre a aceitação das tags recomendadas, a partir da execução de alguns experimentos com usuários reais, mostraram-se favoráveis para a tarefa de categorização, o que tende a reduzir os esforços empregados na fase de recuperação dos objetos categorizados.
Abstract: Due to the popularization of the Web large amounts of content became available, mainly due to the current ease of content publishing by nontechnical users. This easiness promotes an uncontrollable growth of the total available information, thus creating the need for mechanisms for indexing content to assist users when retrieving information. Because of this information overload, it is infeasible for a user to organize their information without using tools that facilitate the recovery process. One way to accomplish this organization is by a categorization system based on tagging, which helps the process of assigning meaning to any object accessible over the Web. However, since the tags used in the categorizations are freely selected by the user, without any strict control to follow, using this type of system can have various limitations, especially when users need to retrieve an object categorized. This problem gets harder as the users make use of the system, because their vocabulary can become inconsistent due to typing errors, the creation of synonyms and polysemic terms, the introduction of different lexical forms of writing for the same conceptual representation, etc., and, consequently, many relevant resources may be excluded from the search results. Therefore, in this thesis it is proposed an approach for the recommendation of semantic tags that aim to improve the quality of the categorizations made by users looking forward to facilitate the information retrieval, and also to solve the of cold-start problem. The proposal combines three different information sources to generate the recommendation: (i) the textual elements of the Web page, (ii) the folksonomy tags of the page in question, and (iii) the user personomy. Thus, the proposed approach tries to personalize the recommendations based on the user characteristics and interests, as well as to reduce the problems related to the process of tagging. The results for the acceptance of the recommended tags from the execution of some experiments with real users were favorable for the categorization task, which tends to reduce the efforts necessary in the recovery phase of the objects categorized. |
Data da defesa: 23/02/2011
Código: vtls000184810
Informações adicionais:
Idioma: Português
Data de Publicação: 2011
Local de Publicação: Maringá, PR
Orientador: Prof. Dr. Sérgio Roberto Pereira da Silva
Co-Orientador: Prof.ª Dr.ª Valéria Delisandra Felfrim
Instituição: Universidade Estadual de Maringá. Departamento de Informática
Nível: Dissertação (mestrado em Ciência da Computação)/
UEM: Programa de Pós-Graduação em Ciência da Computação |
Responsavel: beth
Categoria: Aplicação
Formato: Documento PDF
Arquivo: Dissertação FINAL - Marcelo Rafael Borth.pdf
Tamanho: 2789 Kb (2855494 bytes)
Criado: 13-06-2011 13:28
Atualizado: 13-06-2011 13:47
Visitas: 1396
Downloads: 21
[Visualizar] [Download]
Todo material disponível neste sistema é de propriedade e responsabilidade de seus autores.
|