PageRank算法原理是什么?具体如何计算?

PageRank算法是网页排名的要素之一,早在PageRank算法提出之前,已经有研究者提出利用网页的入链数量来评估页面重要程度,PageRank算法的核心也正是基于这种“让链接来“投票”的核心思想出现,也就是一个页面的重要程度是由给它投票的网页数量+质量来进行链接得分分析。

PageRank算法核心

PageRank算法原理是什么?具体如何计算?

1、数量假设

如果一个网页收到其他网页的指向入链数量越多,那么这个页面也就越重要。

2、质量假设

在众多的入链指向中,质量越高的页面指向也会传递更多权重,所以越高质量的页面指向该页面,那么该页面的质量就越高。PageRank的算法核心便是综合以上两个假设给出每个页面相同的初始页面分值,通过迭代递归计算来更新每个页面的得分,直至稳定。

PageRank计算公式

PageRank算法原理是什么?具体如何计算?
  • Mpi是有出链到pi的所有网页集合
  • L(pj)是有网页pj的出链总数
  • N是网页总数
  • α一般取值为0.85,又称为阻尼系数

假设每个页面的初始得分随着每一轮的计算更新新的得分,那么合理的增加高质量入链便是提升页面质量的有效方法。

阻尼系数&远程跳转

1、阻尼系数

2005年初,Google为网页链接推出一项新属性nofollow,使得网站管理员和网站作者可以做出一些Google不计票的链接,也就是说这些链接不算作”投票”。nofollow的设置可以抵制评论垃圾。假设一个由4个页面组成的小团体:A,B,C和D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

PageRank算法原理是什么?具体如何计算?

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

PageRank算法原理是什么?具体如何计算?

换句话说,根据链出总数平分一个页面的PR值。

PageRank算法原理是什么?具体如何计算?

最后,所有这些被换算为一个百分比再乘上一个系数。由于“没有向外链接的页面”传递出去的PageRank会是0,所以,Google通过数学系统给了每个页面一个最小值:

PageRank算法原理是什么?具体如何计算?

2、远程跳转在部分参考资料及文献中,为阻止单页面链接关系形成闭环无限增大的问题,提出传递过程中不限于向出链传递,也可以一定概率向任意其他网页传递的方式来规避这个问题,当然这一方式仅仅只是在部分文献中提到过,我们逻辑上也可能存在问题,可以暂做了解不必深入。

PageRank算法原理是什么?具体如何计算?

当然搜索引擎关于排名计算的方式不单单只依靠一个PageRank算法或者其他,我们也不能一味的通过一项算法寻求高效突破,只有全面了解综合考虑实施策略才是比较好的方式,一天一个SEO知识点,让我们从0开始重新认识搜索引擎。

发布者:超威蓝猫,转转请注明出处:https://seowki.com/seo/baiduseo/4127.html

(2)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-11 21:58
下一篇 2022-04-12 13:15

相关推荐

  • 常见的搜索引擎优化作弊手法有哪些?如何避免被误判?

    从普通的关键词密度重复作弊,或者钻搜索排序算法漏洞的黑帽操作手法,作为seo肯定都有一定的了解,本质上seo是没有黑帽以及白帽的分别,从往期我们文章内容不难看出,搜索引擎是希望可以将更符合用户体验的优质内容呈现给用户,对应我们做搜索引擎优化便是将自身的网页优化成符合用户体验的优质内容也是我们的初心,但机器毕竟是机器,算法毕竟是算法,总归还是可以找到可钻的漏洞…

    2022-04-12
    23300
  • 搜索引擎如何进行相似性分析?

    提到相似性计算就不得不先从搜索引擎检索和排序说起了,注意这里说到的是检索而不是我们之前提到的索引,SEO在优化过程中不仅仅只是要做好前期的收录和索引优化,排序方面的算法和原理也是我们需要关注的重点。 相似性分析 简单来讲,搜索引擎相似性分析是基于向量空间模型的一种算法,其中环节有:1、文档表示;2、相似性计算;特征权重计算,相似性计算在其中也是非常重要的一环…

    2022-04-12
    21700
  • 为什么抓取和收录都正常,但却没有排名?

    为什么抓取和收录都正常,但却没有排名?这个问题在SEO项目实操的时候很常见,而导致这种情况出现的原因也有很多,下面我们就把这些原因盘点一下: 发现问题本质 从搜索引擎工作原理来说,通常可以看作为三个体系,也就是我们常说的:抓取、排序;我们通过问题可以发现,收录以及抓取并没有问题,所以问题也就出现在了排序阶段。 影响排序的几种情况 内容质量 对于内容质量问题来…

    2022-06-14
    5700
  • 通过竞争度分析进行阶段关键词布局——拓词实验室

    在SEO的核心工作中,关键词拓展和对应落地页规划工作占据了大量的精力,通常我们在安排关键词与对应落地页基本上都是依托于关键词搜索量、指数和经验判断,既然如此那我们是否能将这些再数据化一点。 关于竞争度 一般来说我们对竞争度的评估有: 关键词本身的搜索量; 关键词本身的竞争对手数量; 竞争对手的页面类型; 竞争对手的对应页链接支持及增加频次; 竞争对手主域的权…

    2022-06-11
    7100
  • 什么是倒排索引,正向索引和倒排索引的区别是什么?

    SEO对倒排索引这个词并不陌生,但倒排索引的原理和索引结构具体是什么?索引的本质是在解决什么问题?为什么要用倒排索引?这一系列问题你会在阅读完本篇文章后有比较清楚的答案。 索引是什么? 如脑图所示,索引的存在便是为了解决将互联网海量信息进行分类,以一种合理的方式形成索引结构,让用户快速找到有价值的信息,索引结构在我们生活中也非常常见,比如一本书的目录、浏览器…

    2022-04-11
    25710

发表评论

您的电子邮箱地址不会被公开。

评论列表(1条)

联系我

186-1297-5547

在线咨询: QQ交谈

邮件:1205221407@qq.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信