搜索引擎的HITS算法原理是什么?我们应该如何优化?

HITS是一个网页重要性的分析的算法,其目的是为了让用户能快速找到与查询主题相关的高质量页面,那他的算法原理和工作原理是什么?

HITS一个网页重要性的分析的算法,其目的是为了让用户能快速找到与查询主题相关的高质量页面,那他的算法原理和工作原理是什么?
 

HITS算法工作原理

2a0440f8-7a8c-46f5-8d48-867bdc99d2e3
如图所示,我们在实践中不难发现,单纯依靠PageRank算法返回排序的网页其相关性无法保证,这样便会导致搜索环境差的结果,HITS算法其本质就是兼顾领域高质量入链(Hub)的同时兼顾入链页面的相关性(Autbority)导入。

Hub & Autbority

概念

Hub:包含很多Autbority页面指向的页面;
Autbority:某个领域、某个话题相关的高质量页面;

公式

Hub:H(1)=A(5)+A(6)+A(7)
Autbority:A(1)=A(1)+A(2)+A(3)
dc7ca00d-d6c7-42aa-9756-adf7dd960662

互相增强关系

42d03be0-18d1-4ff8-9be6-dfe3969cc7a4
假设1:一个好的Autbority页面会被很多好的Hub页面指向;
假设2:一个好的Hub页面会被很多好的Autbority页面指向;
Hub & Autbority是HITS算法中最核心的一环,以此拓展并层层迭代计算排序出更相关更高质量的搜索结果。

HITS算法存在的问题

e71fc0fa-f6a7-45dc-84cf-95be3f60e7a5
我们从上图不难看出吗,SEO可优化的点基本上可以从易作弊下手,但风险也同时存在,如果资源站中有触发惩罚导致k站的现象便会出现结构不稳定的问题,大量消失的指向链接会给站点带来不小的危害,一天一个SEO知识点,让我们从0开始重新认识搜索引擎。

本文来自投稿,不代表SEOwiki立场,如若转载,请注明出处:https://seowki.com/archives/2172.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注