Thursday, November 28, 2013

谷歌是怎么搜索的


  这两天正在学习Google上线的“玩转谷歌搜索”( Power Searching with Google)小课程,发现了许多以前不知道的好技巧,以飨众人。
  理解搜索是怎么实现的,会帮助我们理解搜索的结果,改进搜索的方式。所以首先是关于Google搜索的一些基础知识。Google的搜索方式是从Google的服务器中抓取所有包含关键词的网页,关键词出现的地方包括了网络链接地址(URL)、网页标题、网页内的内容等等。比如我输入 猪头 两个字,Google会提取服务器里所有包含 “猪” 和 “头” 字的网页。Google是怎么决定网页的排序呢?首先如果“猪” 和 “头” 两个字是紧连的(作为一个词,phrase),那么包含“猪头”的结果更接近我们想要的,而不是任意一个包含“猪”或者“头”单个字的网页,因为我们输入时并没有把这两个字分开。精彩的地方来了,接下来谷歌又是怎么排序的呢?Google搜索的精髓在于它借用了类似学术论文排名的方式来对网页进行排名,有兴趣的话可以戳这儿看看Google创始人 拉里·佩吉 和 谢尔盖·布林 最早的论文。 简单的说,就是根据一个网页被其他网页引用的次数来判断这个网页的排名(现如今还有另外两百多项指标来对网页进行排名)。回到我们的例子上,谷歌显示的第一个结果,就是它认为包含“猪头”这个词中排名最高的网页。
 

No comments:

Post a Comment