文件匹配与初始子集的选择时搜索引擎在排名的过程中非常重要的两个方面,今天就这两个方面给大家做一些基础性的总结。虽然这些看似和我们没有关系,但是大家多了解一些基础性的原理,对以后网站的建设和优化都有一定的指导意义,当然,这些只是自己的一些总结,如果有不对的地方,还希望大家做指正。
当搜索引擎经过预处理的前几个阶段之后,搜索引擎得到的是以词为单位的关键词集合。在这个之前,搜索引擎首先得到的是一个文件对应多个关键词,但这样的查询效率太低也不现实,所以搜索引擎会把这些文件进行反向映射,得到的是一个关键词对应多个文件。这样在用户搜索某个关键词的时候,就在这个关键词对应的所有文件中进行计算和匹配,并返回给用户最佳的搜索结果。了解了这个大体的过程,下边就开始分享今天的两个主要方面。