如何建立一个简单的相关搜索模型?

相关搜索是什么?

以百度为例,相关搜索就是对当前搜索结果页的一种相关推荐,如图是我对【视频压缩】关键词的搜索结果及相关搜索词展现。

如何建立一个简单的相关搜索模型?

相关搜索有什么作用?

场景一般为:用户对当前页面展示内容不满足。
当你通过一个关键词无法找到你想要的东西的时候,相关搜索很可能能帮到你,和搜索提示不同,搜索提示主要用的前缀匹配的模式,关注的是你还没有点击搜索键的时候猜测你想搜什么,而相关搜索是你点击搜索键以后猜测你可能还想搜什么,所以相关搜索更加类似于一个相关推荐机制。

如何建立一个简单的相关搜索模型?

如何进行简单的相关搜索推荐?

本质上相关搜索是一个搜索输入和推荐输出的过程?

  • 从用户角度考虑,当我在搜索一个词时结果没有满足我的需求有可能存在的问题是:①、我输入的查询词有问题;②、数据库确实没有相关内容;
  • 从运营角度考虑,当用户在搜索一个词的时候,我要解决的问题:①、解决用户查询不标准问题;②、同时反馈高质量的相关搜索给客户;

从以上粗略分析我们可以得出:相关搜索的核心就是找到与输入内容相似或者相关的高质量内容,那么这个相似和相关的高质量内容如何衡量呢?

1、根据分词+TF-IDF向量模型

通过对当前搜索词进行分词的方式,将查询词切成单词的形式结合向量模型进行计算,分词在网上有大把的工具可以使用,可以满足对近义词和相似词的需求。

2、根据用户搜索轨迹推荐(非一次性搜索)

为什么是非一次性搜索,这个是因为如果是一个正常的用户,他在第一次输入搜索词与第二次搜索词相隔时间很久,那这两个词大概率下是没有太大关系的,如何定义一次性搜索这个问题我们用一个简单的规则:第一次输入搜索词与第二次输入搜索词间隔大于5分钟,我们就把他定义为一次性搜索。

①、记录:用户id+关键词 [ A1,A2….. ]  [ B1,B2….. ]  [C1,C2…..]将所有用户的非一次性搜索轨迹都记录下来。

②、加入统计规则:提取与当前用户搜索词相似的用户,对其下一步搜索词进行统计计算,得分高者优先推荐。

3、根据其他用户搜索词记录补充推荐

这个与下拉搜索有逻辑一样,比如用户搜索:“苹果电脑”,这个时候我们就可以把与“苹果电脑”相似的搜索词进行统计计算,得分高者优先推荐;比如最后“apple笔记本电脑”得分较高,那就推荐这个词。

4、根据搜索结果进行推荐

根据搜索结果进行推荐,也就是将搜索结果一样的页面进行关键词归类。如:搜索词A:结果12345    搜索词B:结果12345   那么搜索词A与搜索词B就可以建立同类关系。

5、结合当前相关热点推荐

一般适用于热点事件相关的场景,如:用户搜索:“正新鸡排”,恰好最近正新鸡排被315曝光热门,那么这个时候就可以推荐:“正新鸡排315曝光”这个词。

如何建立一个简单的相关搜索模型?

通过以上算法进行计算就可以建立一个简单的相关搜索模型,当然除了这些肯定还会有更高级的相关搜索推荐算法,别看是一个小小的推荐算法,也是需要考虑很多东西才能更贴近用户需求,解决用户问题!

发布者:超威蓝猫,转转请注明出处:https://seowki.com/seo/baiduseo/4173.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-12 13:33
下一篇 2022-04-14 21:43

相关推荐

  • 正确培养蜘蛛爬行习惯,提升蜘蛛抓取效率

    搜索引擎蜘蛛在对网站进行抓取的过程中会对网站更新频率进行监控参考,从而对下次抓取时间进行合理安排,这样的策略可以有效提升搜索引擎Spider爬行效率,避免不必要的资源浪费; 而对SEO来说,培养蜘蛛良好的抓取习惯更是能够帮助模块获取稳定排名维护的重要策略,那如何才能培养蜘蛛正确的抓取习惯? 1、页面时间因子添加 众所周知,搜索引擎在没有任何辅助条件的情况下来…

    2022-06-08
    26800
  • 搜索引擎如何进行相似性分析?

    提到相似性计算就不得不先从搜索引擎检索和排序说起了,注意这里说到的是检索而不是我们之前提到的索引,SEO在优化过程中不仅仅只是要做好前期的收录和索引优化,排序方面的算法和原理也是我们需要关注的重点。 相似性分析 简单来讲,搜索引擎相似性分析是基于向量空间模型的一种算法,其中环节有:1、文档表示;2、相似性计算;特征权重计算,相似性计算在其中也是非常重要的一环…

    2022-04-12
    36200
  • 如何结合搜索引擎原理优化自身站内搜索?

    搜索引擎的原理在我们之前的文章中也提到过,本质上搜索引擎实质上就是抓取、索引、排序的过程,那如何用简单的方法对站内搜索进行优化呢? 抓取 爬虫抓取这一步基本上可以省略,因为我们站内数据已经存放在我们自身的数据库中了,那这一步还需要做什么? 去除杂质:这一操作主要是为搜索结果环境做初步筛选,对内容进行清洗,最终以统一的格式提交给索引程序来执行创建索引。 1、去…

    2022-04-14
    41900
  • 搜索引擎的HITS算法原理是什么?我们应该如何优化?

    HITS是一个网页重要性的分析的算法,其目的是为了让用户能快速找到与查询主题相关的高质量页面,那他的算法原理和工作原理是什么? HITS算法工作原理 如图所示,我们在实践中不难发现,单纯依靠PageRank算法返回排序的网页其相关性无法保证,这样便会导致搜索环境差的结果,HITS算法其本质就是兼顾领域高质量入链(Hub)的同时兼顾入链页面的相关性(Autbo…

    2022-04-12
    47100
  • 什么是长尾关键词?长尾关键词有哪些特征?

    什么是长尾关键词? 长尾关键词(Long Tail Keyword)是指网站上的非目标关键词但与目标关键词相关的也可以带来搜索流量的组合型关键词。这是百度百科对长尾词的解释,通俗的来讲我们将持续不断有搜索量但搜索量不大的词定义为长尾关键词。 长尾关键词的特点是什么? 关键词长度较长 搜索意图明确 搜索次数较少 累计搜索总量较大 我们来举一个案例,例如搜索:“…

    2022-04-20
    37300

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我

186-1297-5547

在线咨询: QQ交谈

邮件:1205221407@qq.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信