Resumo: Com a sobrecarga de informação existente no ambiente da Web 2.0, a tarefa de se recuperar informação de qualidade e de relevância tornou-se bastante árdua, uma vez que os usuários não são capazes de examinar e interpretar uma parte significativa da informação disponível. Vários autores relacionam a qualidade e a relevância das informações disponíveis na Web com o conceito de autoridade cognitiva, armando que as entidades possuidoras de conhecimento em determinado assunto tendem a publicar informação contendo essas duas características. Assim sendo, este trabalho considera a hipótese de que a utilização de um esquema de ranking que leve em conta a autoridade cognitiva das fontes de informação produz um Sistema de Recuperação de Informação que apresenta resultados de busca contendo informação de maior qualidade e relevância aos usuários. Para verificar essa hipótese foi adotada a abordagem denominada de Folkauthority {um arcabouço no qual as fontes de informação de um sistema são categorizadas por meio de tags de acordo com suas autoridades cognitivas { e proposta uma arquitetura para recuperação de informação cujo esquema de ranking, denominado de AuthorityRank, baseia-se na categorização das autoridades. As concessões de autoridade cognitivas entre os usuários foram simuladas com base em dados de uma rede social real, sendo implementado um Sistema de Recuperação de Informação cujo esquema de ranking considera o arcabouço estabelecido pela abordagem de Folkauthority. Esse esquema foi então comparado com outros esquemas utilizando-se a métrica de NDCG, sendo possível verificar a partir de uma análise dos dados resultantes uma melhoria estatisticamente significativa na qualidade e na relevância das informações recuperadas por meio do esquema AuthorityRank quando comparado com o esquema tf-idf, confirmando, assim, a validade da hipótese com relação a abordagem proposta.
Abstract: The information overload in the Web 2.0 environment makes the task of retrieving information with quality and relevance quite dicult, since users are not able to examine and interpret a significant part of the information available. Several authors relate the quality and relevance of information available on the Web with the concept of cognitive authority stating that entities possessing expertise in particular subject tend to publish information containing these two features. Therefore, this dissertation considers the hypothesis that the use of a ranking scheme that takes into account the cognitive authority of information sources produces an Information Retrieval System that presents search results containing information of higher quality and relevance to users. Was adopted an approach called Folkauthority to verify this hypothesis { a framework in which the sources of information in the system are categorized with tags according to their cognitive authority { and proposed an architecture for information retrieval whose ranking scheme, called AuthorityRank, is based on the categorization of authorities. The concessions of authority among users were simulated based on data from a real social network and an Information Retrieval System whose ranking scheme considers the framework established by the Folkauthority approach was implemented. This scheme was then compared with other schemes using the metric of NDCG, by which was possible to verify a statistically significant improvement in the quality and relevance of information retrieved through the AuthorityRank scheme when compared with the tf-idf scheme, thus, conforming the validity of the hypothesis with respect to the proposed approach. |