提到相似性计算就不得不先从搜索引擎检索和排序说起了,注意这里说到的是检索而不是我们之前提到的索引,SEO在优化过程中不仅仅只是要做好前期的收录和索引优化,排序方面的算法和原理也是我们需要关注的重点。
相似性分析
简单来讲,搜索引擎相似性分析是基于向量空间模型的一种算法,其中环节有:1、文档表示;2、相似性计算;特征权重计算,相似性计算在其中也是非常重要的一环,如图所示便是相似性相似性分析的工作原理及算法公式:
Cosine相似度计算便是将搜索词形成向量空间,索引库内的文档也形成向量空间,对相似性得分进行计算,以相似性代替相关性,按照相似性得分进行网页排序,接着我们举一个案例。
案例
除此之外,在检索的过程中,相似性计算也会同时伴随着特征权重计算,也就是我们通常所说的TF(词频)以及IDF(逆文档频率)。
发布者:超威蓝猫,转转请注明出处:https://seowki.com/seo/baiduseo/4147.html