深度了解搜索引擎抓取及更新策略后,我们能做的还有很多!

seo经常会遇到收录、页面更新频率的一些问题,但是往往我们对这些问题解决的方式大多数都停留在:提交url、固有页面内调整抓取入口、发布外链以及投诉快照等操作上,这些操作与搜索引擎的抓取策略和更新策略都是息息相关的,我们对这些操作的本质了解多少?如果以上这些操作我们做完之后还是不收录还能做什么?

一、搜索引擎的抓取策略

深度了解搜索引擎抓取及更新策略后,我们能做的还有很多!

搜索引擎抓取策略大致分为以下四种:

宽度优先遍历策略

这种策略出现在搜索引擎搜索引擎二代初期,通过蜘蛛抓取到的页面进行URL提取直接追加到待抓取URL的队列末端等待抓取,该项策略的最大问题在于无法对重要网页进行及时抓取,但我们可以反过来思考下这个问题,如果我们该项页面在互联网上拥有大量推荐,那么该URL被发现的几率会大大提升,便可以提前进入待抓取URL队列,但这种操作基本上不常见,投入巨大但效果在当下来看并不是特别理想。

非完全PageRank策略这种策略

基于PageRank算法对页面抓取优先级进行排序,但由于搜索引擎抓取覆盖局限问题(大量未抓取页面和暗网页面)导致该项策略无法全局性计算,所以命名为“非完全PageRank策略”。

OCIP策略

OCIP策略也成为“在线页面重要性计算”,当搜索引擎抓取到一个网页时会将当前网页所拥有的权重值平均分给其页面上提取出的其余链接,并将当前页面权重值清空,以此达到待抓取网页权重值累加排序优先级的目的,此项策略与PageRank算法相似,但区别在于该项策略为即时计算无需迭代,但非完全PageRank策略需要将页面累积到一定量后重新计算各待抓取页面的权重值,需要迭代。


大站优先策略

顾名思义拥有大量数据并且页面质量达标的站点就是所谓的“大站”,达到大站以后搜索引擎便会以网站为单位进行抓取策略制定,我们结合上面的三种策略可以得出:如果想拥有大量的权重值就需要大量的链接指向,但当下搜索引擎降低外链质量分,我们只能通过制造大量符合标准的站内页面加上质量较好的友情链接才能将以上策略充分在自身站点发挥。

二、搜索引擎的更新策略

深度了解搜索引擎抓取及更新策略后,我们能做的还有很多!

搜索引擎抓取更新大致分为以下三种:
历史参考策略该项策略就是通过对以往站的更新频率以及更新量综合参考得出符合该站点的最佳更新频率,属于比较可控的操作方式,我们可以通过抓取策略中的大战优先策略将我们自身站点提升至大站水平,从而使历史参考策略发挥价值。用户体验策略用户体验策略主要是建立在用户搜索行为之上的更新策略,假设用户在搜索一个词时看完前3页的搜索结果还没有找到自己想要的内容依旧翻页,那就说明该搜索关键词所涉及到的索引库需要更新,搜索引擎便是由此利用该项策略对更新频率做了触发设置,翻页行为越强对更新影响越大。


聚类抽样策略对于互联网上所有站点搜索引擎都会将其做一个分类属性归属,以确保新站无法参与历史参考策略和用户体验策略,再通过对聚类中的站点抽样分析得出该分类属性站点的更新值,所以我们要注重新站上线后的站点属性设置问题,也是促进页面更新一种手段。

深度了解搜索引擎抓取及更新策略后,我们能做的还有很多!

通过以上的了解详细大家对抓取及更新都有了较为全面的认知,针对网页收录和更新操作也有了深入理解。

发布者:超威蓝猫,转转请注明出处:https://seowki.com/seo/baiduseo/4109.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-11 18:02
下一篇 2022-04-11 21:58

相关推荐

  • 为什么抓取和收录都正常,但却没有排名?

    为什么抓取和收录都正常,但却没有排名?这个问题在SEO项目实操的时候很常见,而导致这种情况出现的原因也有很多,下面我们就把这些原因盘点一下: 发现问题本质 从搜索引擎工作原理来说,通常可以看作为三个体系,也就是我们常说的:抓取、排序;我们通过问题可以发现,收录以及抓取并没有问题,所以问题也就出现在了排序阶段。 影响排序的几种情况 内容质量 对于内容质量问题来…

    2022-06-14
    22200
  • SEO如何把握垂直搜索中图片搜索的巨大流量?

    搜索引擎在没有进行通用搜索合并之前,垂直搜索优化也是seoer的优化重点,其策略上主要是通过自身产品的优化曝光以及其其他垂直性平台转载进行宣传,时至今日SEO发展到现在图片、视频等垂直搜索仍能为SEO带来巨大流量。 产品特性是否适合垂直优化 由于现在大多数seo所负责项目都是以商业化盈利为主,所以我们必须从产品的角度先去考虑是否可以支持我们去拿这一部分流量,…

    2022-06-02
    19600
  • 什么是长尾关键词?长尾关键词有哪些特征?

    什么是长尾关键词? 长尾关键词(Long Tail Keyword)是指网站上的非目标关键词但与目标关键词相关的也可以带来搜索流量的组合型关键词。这是百度百科对长尾词的解释,通俗的来讲我们将持续不断有搜索量但搜索量不大的词定义为长尾关键词。 长尾关键词的特点是什么? 关键词长度较长 搜索意图明确 搜索次数较少 累计搜索总量较大 我们来举一个案例,例如搜索:“…

    2022-04-20
    37300
  • 怎么形成有效的外链建设策略?都需要关注哪些点?

    使用外链建设的方式来提升网站权重促进排名获取,在这个过程中,由于有很多seoer由于对链接建设理解太过表面,导致对链接策略忽冷忽热、无计划的进行,最终导致效果一般或者没有效果,那如何才能形成有效的外链建设策略呢? 外链建设的重要性 我们曾经SEO有效策略一文中提到过链接流行度的重要性,而衡量链接流行度与PageRank算法由是网页排序算法中的核心算法策略,这…

    2022-06-01
    22500
  • 网站不收录的原因有哪些?该如何分析解决?

    说到网站不收录的原因,就不得不提到搜索引擎对海量内容抓取的工作流程,而搜索引擎对内容的抓取其实可以简单理解为:发现——爬取——评估最后收录等步骤,当我们遇到不收录的情况就应该对应进行排查,这里也就用到了结构化思维。 一、排查发现问题 SEO促进搜索引擎抓取的途径基本上可以分为三个方面: 1、站长平台绑定主动提交; 2、内外链建设; 3、URL层级太深; 第一…

    2022-06-09
    25000

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(1条)

联系我

186-1297-5547

在线咨询: QQ交谈

邮件:1205221407@qq.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信