搜索引擎如何进行相似性分析?

提到相似性计算就不得不先从搜索引擎检索和排序说起了,注意这里说到的是检索而不是我们之前提到的索引,SEO在优化过程中不仅仅只是要做好前期的收录和索引优化,排序方面的算法和原理也是我们需要关注的重点。

提到相似性计算就不得不先从搜索引擎检索和排序说起了,注意这里说到的是检索而不是我们之前提到的索引,SEO在优化过程中不仅仅只是要做好前期的收录和索引优化,排序方面的算法和原理也是我们需要关注的重点。

相似性分析

简单来讲,搜索引擎相似性分析是基于向量空间模型的一种算法,其中环节有:1、文档表示;2、相似性计算;特征权重计算,相似性计算在其中也是非常重要的一环,如图所示便是相似性相似性分析的工作原理及算法公式:
1cffedd2-e050-48a1-882e-883dbe4e07ae
Cosine相似度计算便是将搜索词形成向量空间,索引库内的文档也形成向量空间,对相似性得分进行计算,以相似性代替相关性,按照相似性得分进行网页排序,接着我们举一个案例。

案例

d3fbdc93-6457-4fb5-9645-05b311534bf1
除此之外,在检索的过程中,相似性计算也会同时伴随着特征权重计算,也就是我们通常所说的TF(词频)以及IDF(逆文档频率);关注我,一天一个SEO知识点,让我们从0开始认识搜索引擎。
6ec294b25a479f1523722208dfe96c58

本文来自投稿,不代表SEOwiki立场,如若转载,请注明出处:https://seowki.com/archives/2178.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注