搜索引擎的工作原理是什么?

搜索引擎的工作原理是什么?

搜索引擎的工作原理是利用网络爬虫抓取数十亿个网页。爬虫也被称为蜘蛛或机器人,它们浏览网络并跟踪链接以查找新网页。然后将这些网页添加到索引中,供搜索引擎从中提取结果。如果要进行搜索引擎优化,了解搜索引擎的运作方式至关重要。毕竟,如果不了解搜索引擎的工作原理,就很难对其进行优化。这就是本指南将向您介绍的内容。 

1.搜索引擎基础知识

让我们先来了解一下搜索引擎是什么、为什么存在以及如何赚钱。

 什么是搜索引擎?

搜索引擎是网络内容的可搜索数据库。它们主要由两部分组成:

  1. 搜索索引。网页信息数字图书馆。
  2. 搜索算法。负责匹配搜索索引结果的计算机程序。

搜索引擎的目的是什么?

每个搜索引擎的目标都是为用户提供最好、最相关的搜索结果。这也是它们获得市场份额的部分原因。

搜索引擎如何赚钱?

搜索引擎有两种搜索结果:

  1. 来自搜索索引的有机结果。你不能花钱在这里。
  2. 来自广告商的付费结果。您可以付费访问这里。

每次有人点击付费搜索结果,广告商就会向搜索引擎付费。这就是所谓的按点击付费(PPC)广告,也是市场份额重要的原因。更多的用户意味着更多的广告点击和更多的收入。

How search engines make money

搜索引擎的工作原理是利用网络爬虫抓取数十亿个网页。爬虫也被称为蜘蛛或机器人,它们浏览网络并跟踪链接以查找新网页。然后将这些网页添加到索引中,供搜索引擎从中提取结果。如果要进行搜索引擎优化,了解搜索引擎的运作方式至关重要。毕竟,如果不了解搜索引擎的工作原理,就很难对其进行优化。这就是本指南将向您介绍的内容。

2.搜索引擎如何建立索引

每个搜索引擎都有自己建立搜索索引的流程。以下是谷歌使用的简化版流程。

How Google builds its search index

 让我们来分析一下。

 网址

一切都要从已知的 URL 列表开始。谷歌发现这些网址的方式有很多,但最常见的有三种:

  • 反向链接。Google 拥有一个包含数千亿网页的索引。如果有人从已知网页链接到一个新页面,Google 就能从那里找到它。
  • 从网站地图。 网站地图会告诉 Google 你认为网站上哪些页面和文件是重要的。
  • 从提交 URL 开始。Google 允许网站所有者在Google Search Console 中请求抓取单个 URL。

 爬行

爬行是指一个名为蜘蛛的计算机机器人访问并下载已知的 URL。谷歌的爬虫就是Googlebot

 处理和渲染

处理是 Google 从抓取的网页中理解和提取关键信息的工作。为此,谷歌必须渲染页面,也就是运行页面代码,以了解页面对用户而言的外观。

在谷歌之外,没有人知道这个过程的每一个细节。但这并不重要。我们真正需要知道的是,它涉及提取链接和存储内容以便索引。

 索引

索引是将从抓取的网页中处理过的信息添加到搜索索引中。

搜索索引是您在使用搜索引擎时进行搜索的内容。这就是为什么被谷歌和必应等主要搜索引擎收录如此重要的原因。如果你不在索引中,用户就无法找到你。

你知道吗?
Google谷歌拥有 91.43% 的搜索引擎市场份额。与其他搜索引擎相比,谷歌能为你带来更多流量,因为大多数人都使用谷歌搜索引擎

3.搜索引擎如何对网页进行排名

发现、抓取和索引内容只是难题的第一部分。当用户执行搜索时,搜索引擎还需要对匹配结果进行排序。这就是搜索算法的工作。

什么是搜索算法?

搜索算法是从索引中对相关结果进行匹配和排序的公式。谷歌在其算法中使用了许多因素。

关键谷歌排名因素

没有人知道谷歌的每一个排名因素,因为谷歌没有公开它们。但我们确实知道一些关键因素。让我们来看看其中几个。

 反向链接

反向链接是从一个网站的一个页面到另一个网站的链接。它们是谷歌最重要的排名因素之一。这也许就是为什么我们在对超过 10 亿个网页的研究中发现,链接域与有机流量之间存在着很强的相关性。

The correlation between referring domains and search traffic

不过,这并不全是数量的问题。质量也很重要。拥有少量高质量反向链接的页面通常会超过拥有大量低质量反向链接的页面。

相关性

相关性是指特定结果对搜索者的有用性。Google 有很多方法来确定这一点。最基本的方法是查找包含与搜索查询相同关键词的页面。它还会查看互动数据,以了解其他人是否认为该结果有用。

 新鲜度

新鲜度是一个取决于查询的排名因素。这就是为什么你会看到最近发布的 “new netflix 系列 “的热门结果,而看不到 “如何解鲁比克方块 “的原因。

 页面速度

页面速度是台式机和移动设备上的一个排名因素。但它与其说是一个积极因素,不如说是一个消极的排名因素。这是因为它对最慢的网页有负面影响,而对快如闪电的网页没有正面影响。

 方便移动

自2019年谷歌转向移动优先索引以来,移动友好性一直是移动和桌面的一个排名因素。

搜索引擎如何个性化搜索结果

谷歌为每位用户量身定制搜索结果。让我们仔细看看这些信息。

 地点

Google 使用您的位置来个性化具有本地意图的搜索结果。这就是为什么 “意大利餐厅 “的所有搜索结果都来自本地餐厅或与本地餐厅有关。谷歌知道,你不可能飞越半个地球去吃午餐。

 语言

谷歌知道,向西班牙语用户显示英文结果毫无意义。这就是为什么它会向使用不同语言的用户展示本地化版本的内容(如果有的话)。

Google ranks different versions of pages for different languages

 搜索历史

谷歌会保存你做过的事情和去过的地方,以便为你提供更加个性化的搜索体验。

评论

发表回复