网络上许多关于HITS算法的文章,包括百度百科HITS算法中,都是偏向开发人员对HITS算法原理及代码实现的讲解,对于不太懂代码的SEO人员来说,很难理解到HITS链接分析算法对网站优化有什么作用。下面小风SEO用通俗易懂的文字,来给大家简单介绍一下HITS算法原理及特点。
HITS算法原理
在HITS链接分析算法当中,被提到最多的两个点就是Hub页面(枢纽页面:hao123、360导航网站等)与Authority页面(权威页面:腾讯、网易、政府网站等)。
一般都是利用HUB页(网页中很多链接,并且都是指向权威的页面,一般都是导航或者目录网页)和Authority(就是被大量链接指向的网页,也就是权威型的网页)页面之间指向链接的互相加强关系来对网页给予分值计算,也就是说该算法的实施过程中是将搜索引擎从互联网上抓去到全部网页分为HUB页面和Authority页面,在搜索引擎看来,好的Hub网页应该是指向很多的权威型的网页,而权威值高的网页应该是拥有很多指向Hub网页的链接
由于得出:HITS算法是通过强调页面与页面之间的关于形成的一个有效的SEO排序算法,更多的是强调枢纽页面与权威页面之间的关系,从而提升网页与网页之间的信任度,然后达到提升页面质量排名的目的。
HITS算法特点
每个搜索引擎算法都有自己的优势和缺陷,HITS也不例外,在HITS算法当中,有4个最常见的缺陷,其中包含了计算效率低、主题漂移、容易作弊和结构不稳定。
由于HITS算法是与之查询相关的算法,所以不能先计算,而必须是用户请求了某一个搜索词以后才能去计算该词的一些站点文档匹配度(链接评分板块),加上HITS算法的计算属性需要通过多次的计算迭代才能最终计算出检索结果的文档链接的推荐度投票,所以导致计算效率比较低下。
而主题漂移问题则是大家常常可以看到了一些现象,即使我交换的链接和我站点主题没有一条相关,但是也会促进我的页面关键词排名提升。而这种现象正是因为HITS的特殊算法结构才出现了给与这些无关网页很高的排名。最终导致了搜索结果发生了主题漂移,而这种现象也称为“紧密链接社区现象”。
之所以容易用来作弊是因为HITS强调的比较多的还是枢纽页面和权威页面之间的一种相互增强关系。作弊者可以通过建立新页面的形式,并且在新建立的网页中加入了很多高质量的权威页面链接,自身页面就会形成了一个很好的枢纽页面,然后作弊者可以通过该页面的一个权威枢纽性,再指向作弊网页链接,从而给与作弊网页增加权威页面得分。如下图所示:
上图所示的页面文档集合里面包含了4个导出链接,假设该页面是阐述视频网站排行榜的相关内容信息,而4个导出链接均包含了不同的4个独立的视频站点,其中三个为已知的权威站点,第二个站点为我们作弊的站点。而此方式可以用来增加链接的投票推荐度。
最后一个HITS的缺陷在于它的结构不稳定,何为结构不稳定?简单来说就是在原来的网页文档集合里面,如果新增或删除网页链接,那么就会对HITS算法排名有着非常大的改变。比如大家都知道交换的链接除了相关性还需要讲究稳定性,却不知道稳定性这个概念正是因为HITS的缺陷而导致的,如果链接一旦不稳定,包括链接位置变动、链接被删除等都会影响算法结构的重新计算。从而影响了自身站点的关键词排名。
相信大家在看完了之后,应该对使用HITS算法做SEO优化有一个大致的了解。关于HITS更多的实战运用方法,大家可以通过如何利用HITS算法来做SEO优化详细实战运用学习,来提升网站关键词排名。