当用户在搜索栏中输入搜索查询时,搜索引擎的“大脑”内发生了什么?
大多数搜索引擎会分析查询,然后将其转发到索引服务器进行处理。
一些搜索引擎可能会使用拼写检查或查询建议来“预处理”查询(询问搜索者“您的意思是……?”)。
它与搜索引擎索引中权重相关的网页进行匹配,并使用各种规则和参数。
然后根据最佳相关性确定搜索引擎结果页面 (SERP)上的列表顺序。
可视化机制有助于理解搜索引擎如何准备要搜索的信息索引。
首先,索引是存储数据的地方。大多数搜索引擎都以结构化的方式(称为倒排列表)将数据存储在索引中。
对于自发信息检索,引擎会反转逻辑并以倒置 贝宁电子邮件列表 流程构建索引。因此,它不是扫描文档寻找单词,而是匹配单词来定位文档。
您可能已经观察到,当您键入 a 时,您将获得以 a 开头的每个单词(并且排除所有其它字母列)如果您继续在查询中添加字母(aa 到 aar),则每次添加都会缩小搜索匹配范围。
请记住,由于不同的搜索引擎利用各自的专有算法,因此它们的操作和对相关查询的排名都略有不同。
识别搜索者意图
对于每个搜索引擎来说,关键在于解读搜索者想要查找的内容。他们只是想了解澳大利亚的地理吗?
他们是因为汽车过热而困在一条偏僻的路中间,所以才想了解发动机检查灯的情况,还是因为他们只是好奇如果忘记安排推荐的调校会发生什么问题?用户意图是什么?
因此,搜索引擎有点像一个试图读懂用户想法的通灵者,只不过它更像一个按照严格排序的清单进行检查的科学家。
当搜索引擎比较注释和记录并计算排名时,它会问自己这样的问题:
#1. 查询中是否有拼写错误?如果有,有多少个?
#2. 拼写错误的数量和排名有什么关系?拼写错误越少,显示的结果越好。
如果查询中没有拼写错误,则页面内容的匹配排名会高于存在拼写错误的情况
包含一个拼写错误的查询生成的内容排名高于包含两个拼写错误的查询生成的内容
#3. 如果用户是一个粗心大意的查询输入者,并且有三个拼写错误怎么办?那么,他们就没那么幸运了,不会得到任何结果,因为简单的文本匹配无法纠正拼写。
搜索查询是否与首字母匹配?是否与整个单词匹配,还是仅部分匹配?
在前缀搜索中,搜索引擎将整个查询与索引中记录属性的起始字符进行比较。
相关结果以片段形式生成,显示查询如何匹配内容中出现的短语。
记录按相关性强弱进行排序,这决定了从第一页开始的搜索结果的顺序。
查询上下文也起着重要作用。为了评估上下文,搜索引擎会问自己以下问题:
#1. 搜索查询中的单词是否与同义词匹配?
如果符合,搜索引擎会在排名过程中将同义词记录视为同等重要。例如,如果可用内容包含紧身裤,但搜索者要求的是裤子,他们会看到两者的搜索结果。
#2. 搜索查询是否与记录的标题或其描述相匹配?
通过可搜索属性,标题与查询匹配的项目的排名高于与描述匹配的项目。
#3. 一个商品比另一个更受欢迎吗?
如果您有三条记录完全匹配,那么搜索引擎将利用自定义排名来添加业务指标,例如优先考虑销量最高的记录、搜索次数最多的记录或搜索次数最多的记录。如果两条记录的匹配程度不同,则将使用其他标准来确定排名。
当一个合适的搜索引擎完成了其索引大脑的运转并有条不紊地响应所有这些类型的查询时,它就会给出相关的搜索结果列表。
SERP 的工作方式就像一位通灵科学家。更重要的是,搜索引擎发挥着关键作用,引导搜索者到达网络目的地,为他们提供紧迫问题的答案,或指引他们购买产品以解决痛点。
搜索查询的工作原理