HITS算法是基于查询主题的重要的链接分析方法之一,但它对链接不加区分,容易产生主题漂移现象。
本文在分析HITS算法的基础上,提出了基于主题相关度和网页流行度的改进HITS算法,利用相关度和流行度来区分链接的重要性。通过与HITS算法的对比实验,结果表明:改进的HITS算法(I-HITS)比原始的HITS算法、ARC算法、SALSA算法能找到更多的相关网页,相关度比例提高30%-50%,从而极大地减少了主题漂移现象,提高了查询效率和质量。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。