how-does-google-work

搜尋引擎在 2021 年如何運作?

 

搜索引擎使用他們開發的機器人工作,稱為蜘蛛網絡爬蟲,每天抓取數十億個頁面。這些機器人跟踪頁面之間的鏈接,在此過程中將新內容添加到搜索引擎的索引中。每次您使用搜索引擎時,它都會使用一種算法使用其索引中的信息來查找和排名結果。

 

如果你撓頭,我們理解。搜索引擎很複雜。

但是,如果您希望您的網站提升排名並獲得更多流量,您需要了解它們的運作方式。下面我們將介紹您需要了解的有關搜索引擎如何工作的所有信息。

 

什麼是搜引擎?

搜索引擎查找和排名互聯網內容以回答用戶的查詢。

每個搜索引擎都有兩個主要部分:

  1. 搜索索引
  2. 算法

將索引視為一個充滿網絡內容的數字圖書館。該算法是一種計算機程序,它根據與用戶搜索查詢的相關性對庫中的內容進行排名。

以下是世界上一些最受歡迎的搜索引擎:

搜索引擎通過爬行索引排名來工作

網絡爬蟲或蜘蛛抓取網站所有者提供給搜索引擎的站點地圖。當蜘蛛抓取頁面時,它們會發現它們所遵循的指向新頁面和新站點的鏈接。

每次他們找到一個新頁面時,他們都會將其添加到搜索引擎的索引中。然後,搜索算法根據關鍵字和網站新鮮度等信號對內容進行排名。我們將在下面更詳細地討論搜索過程的每個部分。

爬行

在爬行過程中,蜘蛛會在互聯網上搜索信息。他們通過使用鏈接從頁面跳轉到頁面來做到這一點。它們根據 HREF 和 SRC 等標籤確定要關注的鏈接。

當它們移動時,它們確定站點不同頁面之間的關係,這有助於搜索引擎索引並隨後對各個頁面進行排名。這就是為什麼在每個頁面上都有一個邏輯站點層次結構和內部鏈接至關重要的原因。

索引

一旦蜘蛛抓取頁面,機器人就會按照瀏覽器顯示頁面的方式呈現頁面。您可以將其視為機器人“看到”頁面。它將對圖像、文本和關鍵字進行排序以了解頁面的全部內容。

搜索引擎將排序後的信息存儲在索引中。每個索引都包含來自每個爬過網頁的每個詞的目錄條目!

排行

最後,搜索引擎使用搜索算法對索引進行排序,為用戶的搜索查詢提供相關結果。

該算法實際上是一個規則列表,根據搜索引擎指定的眾多質量因素確定最佳結果。這些包括反向鏈接質量和移動友好性等內容,我們將在稍後詳細討論。

搜索引擎想要什麼?/ 搜索引擎的目的是什麼?

在我們進一步深入研究搜索引擎機制的細節之前,記住搜索引擎的目標很重要。每個搜索引擎都希望滿足其受眾的需求。

對於 Google,這意味著提供準確的答案,幫助用戶解決問題或獲取信息。其他搜索引擎,例如亞馬遜內部的搜索引擎,希望向用戶展示他們可以購買什麼。

牢記搜索引擎的目標有助於您優化內容。

您可以提供搜索引擎用戶希望找到的答案或產品。

爬蟲如何工作?

上面,我們簡要概述了爬蟲的作用,但它究竟是如何工作的?

爬蟲也被稱為蜘蛛,因為它們爬行萬維網。然而,與物理世界不同的是,互聯網上的蜘蛛不會紡絲。相反,它們從一個鏈接到另一個鏈接,從而顯示不同頁面之間的關係。

每次他們找到一個新頁面時,他們都會閱讀內容的代碼。谷歌和其他搜索引擎上排名最高的內容都有蜘蛛可以輕鬆閱讀的代碼。內容創建者通過關注搜索引擎優化或 SEO 來做到這一點。

重要的是要記住,人類不會運行爬蟲或蜘蛛。它們是自主程序,使用給定的規則來決定哪些內容屬於搜索引擎的索引,哪些不屬於。例如,銷售非法物質的網站永遠不會被添加到索引中。

什麼是索引?

如果爬蟲確定他們應該將站點添加到索引中,搜索引擎會對該網頁進行分類並為其提供識別標籤。

這就像一個圖書館。當圖書管理員收到一本書的新副本時,他們會確定它屬於哪裡,無論是小說、非小說還是其他部分。以同樣的方式,搜索引擎標記網絡內容,以便他們可以輕鬆訪問它。

當您輸入搜索查詢時,例如“什麼是 SEO?” 搜索引擎可以在幾秒鐘內提取最相關的內容。

當然,對於這樣的問題,可能有多個合法鏈接。各種網站都列出了 SEO 的初學者指南。因此,谷歌和其他搜索引擎也必須對內容進行排名,我們將在下面更詳細地討論這一點。

搜索引擎如何建立索引?

不過,在我們討論排名之前,讓我們進一步探討一下索引。根據 Google 的說法,一切都始於已知 URL 列表。這些 URL 接收處理和呈現網頁的爬蟲。然後,索引發生。

那麼,URL 最初來自哪裡?

好吧,Google 使用三種技術來查找要抓取的 URL:

  1. 反向鏈接
  2. 站點地圖
  3. 網址提交

我們將在下面更深入地介紹每一個。

谷歌和其他搜索引擎已經擁有大量網站索引。每當這些站點之一添加指向新站點的鏈接時,爬蟲都會跟踪它。這些鏈接稱為反向鏈接。

從站點地圖

站點地圖正是它們聽起來的樣子,即網站地圖。它們按層次順序列出站點上的所有基本頁面。網站所有者可以向 Google 提交站點地圖,這可能有助於他們的網站更快地吸引爬蟲。

從 URL 提交

Google 也允許網站所有者提交單獨的 URL。一旦網站所有者通過 Google 的 Search Console 發送網址,他們就會向該網站發送一個抓取工具。

為什麼有些頁面顯示的比其他頁面高?

現在我們對爬行和索引有了很好的了解,是時候談談排名了。排名決定了為什麼某些頁面在搜索結果中顯示的比其他頁面高。

搜索引擎使用算法對內容進行排名,每種算法都不同。不過,谷歌的算法是迄今為止最具影響力的,所以我們將重點關注它。

沒有人確切知道 Google 的算法如何對內容進行排名。它們以擁有 200 多個排名因素而聞名,而且沒有一個專家可以將它們全部命名。但是,有一些我們可以肯定的關鍵因素。我們將在下面詳細討論每一個。

根據谷歌搜索質量高級策略師Andrey Lipattzev 的說法,排名的兩個最大因素是內容和指向您網站的鏈接。每個人都知道內容為王;從第一天起,這就是內容營銷的規則。

很少有人關注李帕采夫聲明的後半部分。反向鏈接也很重要。Google 的算法根據指向該頁面的反向鏈接的質量和數量對頁面進行排名。

鏈接回您網站作為信息來源的網站越多,您的網站在 Google 搜索結果中的排名就越高。但這不僅僅是數量問題;質量也很重要。

如果像紐約時報這樣的權威網站發布了一篇鏈接到您博客的文章,即使您沒有很多其他反向鏈接,您的博客在搜索結果中的排名也會更高。

顯然,並非所有反向鏈接都是平等的。鏈接權限和鏈接相關性很重要。讓我們放大這些因素中的每一個。

正如我們在紐約時報的例子中,來自權威頁面的反向鏈接比來自鮮為人知的網站的反向鏈接更重要。但是什麼決定了鏈接權限?

權威頁面擁有最多的反向鏈接。如果您將反向鏈接視為投票,這是有道理的。內容創建者鏈接回他們認為可信的來源,基本上是為他們投票。

因此,具有最多反向鏈接或投票的頁面獲得權威並排名更高。而且,如果權威頁面反向鏈接您的網站,您的排名也會上升。

鏈接相關性也很重要。如果您有一個銷售豪華床單的網站,您需要來自評論床單的網站的反向鏈接。牙醫博客或餐廳網站的反向鏈接不會以同樣的方式幫助排名。

關聯

來自相關權威網站的反向鏈接至關重要,但這並不是 Google 排名的唯一關鍵因素。谷歌還確定頁面相關性。

例如,假設您在 Google 中搜索“apple price usa”。

與顯示同名水果的結果不同,谷歌明白顯示與蘋果公司相關的結果更相關。

圖片來自 谷歌

為了確定相關性,Google 使用關鍵字以及有關用戶交互的匿名數據。這就是幫助他們確定用戶想要查找的內容的原因。

谷歌使用知識圖來管理這一點,它映射用戶交互以幫助確定搜索意圖。所以,如果你寫一篇關於亞馬遜雨林砍伐森林的博客文章,當有人輸入“植物食品亞馬遜”時,谷歌知道不會顯示它。

但是,即使您的文章沒有直接匹配用戶查詢的關鍵字,當有人輸入“森林砍伐和叢林棲息地”時,您的文章也可能會顯示。

新鮮

新鮮度是查詢相關排名因素的一個示例。這意味著它對某些查詢很重要,而對其他查詢不重要。

對於“加拿大移民最新消息”這樣的查詢,谷歌會將新發布或最近更新的內容排名更高。

圖片來自谷歌

但是,對於“雞湯食譜”這樣的查詢,新鮮度並不重要。

谷歌可能仍會首先顯示最近更新的網站,但它知道雞湯食譜不會快速變化。因此,像這樣的查詢的新鮮度對排名沒有太大影響。

專題權威

顯示其對某個主題的權威的網站將在圍繞該主題的搜索查詢中排名更高。

假設用戶搜索“ixora care”。如果您有一個專門用於園藝的網站,您的網站排名會更高,因為您具有主題權威和相關性。

圖片來自谷歌

另一個通用網站,即使是具有很多權威的網站,其排名也會低於您的網站,因為您已經表明您的網站是該主題的權威。

對於小型的利基網站,使用主題權威是在谷歌排名中擊敗一些更大、更權威的網站的好策略。

頁面速度

沒有人喜歡等待頁面加載。事實上,如果頁面滯後,大多數用戶會關閉它並嘗試下一個搜索結果。谷歌知道這一點,所以他們在2010 年增加了頁面速度作為排名因素。

並不是說一個網站需要閃電般的速度才能在 Google 上排名,但它不能特別慢。如果頁面加載速度慢到足以妨礙用戶體驗,排名就會直線下降。然而,從一個相當快的頁面上減少一毫秒的加載時間,不會把它推到搜索結果的頂部。

您可以使用PageSpeedInsights來檢查您網站的速度。它會告訴您是否有延遲以及它來自哪裡,這應該可以幫助您解決任何問題。

以下是他們在報告中提供的一些建議的示例:

圖片來自Google Developers

移動友好

好了一半以上所有的搜索來自移動設備。這可能就是谷歌在 2015 年將移動友好性添加到其排名因素的原因。

2019 年,谷歌擴大了移動友好性排名因素,也適用於桌面搜索。他們稱之為移動優先索引。從本質上講,Google 使用您網站的移動版本對桌面版本進行索引和排名。

Google 提供了移動友好測試工具,因此您可以了解任何網站對移動設備的友好程度。

這是我們網站的樣本報告:

圖片來自谷歌

或者,您可以使用 Google Search Console 中的移動可用性報告。它還將幫助您確定您的網頁是否適合移動設備。

執行搜索時會發生什麼?

此時,您應該對抓取、索引和排名有一個很好的了解。但是,這並不能告訴我們執行搜索時會發生什麼。該算法實際上是如何工作的?

讓我們看看我們是否可以解釋。

每次用戶輸入搜索時,搜索引擎必須做三件事:

  1. 確定意圖
  2. 將相關頁面與該意圖匹配
  3. 應用本地化因素

為了確定意圖,搜索引擎使用高級語言模型,可以將查詢分解為關鍵字塊並識別同義詞。

這樣,如果用戶輸入“blue shirts on sale”,搜索引擎也會顯示標記為“light blue”、“navy blue”甚至“cobalt blue”的待售襯衫,因為所有這些都是同義詞與藍色。

圖片來自谷歌

然後,Google 會使用我們上面討論的排名因素來提供最相關的內容。最後,Google 會將本地化因素應用於搜索。它將使用用戶的位置、搜索歷史甚至他們的搜索設置來確保提供最相關的結果。

搜索算法的工作原理

以上所有工作都由算法完成。沒有人為您的每個查詢提取相關頁面;這是一個計算機程序。實際上,它是一系列計算機程序,著眼於多個因素,例如新鮮度和相關性。然後他們根據搜索者的意圖對這些因素進行排名。

因此,如果有人在搜索最新消息,那麼新鮮度將佔很大比重。但是,如果一個人搜索雞湯食譜,新鮮度並不重要。主題權威和相關性可能是更重要的因素。

下面,我們深入研究了決定用戶進行查詢時會生成哪些結果的每個因素。

您查詢的含義

Google 非常擅長確定搜索意圖或查詢的含義。他們先進的語言模型甚至可以找出糟糕的拼寫。除此之外,谷歌使用最新的自然語言理解來確定用戶的意圖。

如果您輸入“instant pot duo mini”,Google 會嘗試確定您想要做什麼。您是否正在嘗試購買該產品?或者您正在尋找附近商店有售的產品?也許,您正在尋找展示如何使用它的文章。

正如您在下面的屏幕截圖中看到的那樣,如果您鍵入通用查詢,它會給出兩者的結果。

圖片來自谷歌

谷歌的算法使用用戶提供的線索來解決這個問題。他們尋找諸如“評論”或“價格”之類的關鍵字來確定用戶想要看到的內容。他們還使用搜索者的位置和搜索歷史。

網頁的相關性

根據用戶的意圖,Google 可以確定哪些頁面最相關。如果搜索者輸入諸如“我附近最好的墨西哥食物”之類的內容,Google 將顯示搜索者所在地理位置附近提供墨西哥食物的商家。

內容質量

谷歌還關注內容的質量。它嘗試首先列出最可靠的網站,這就是反向鏈接發揮作用的地方。

如果您搜索“紐約要做的事”,第一個結果來自康泰納仕集團,這是一家值得信賴的、權威的旅遊相關內容來源。

圖片來自谷歌

Google 還使用垃圾郵件算法來確保使用欺騙或操縱策略的網站不會排名。這就是為什麼任何內容創建者都必須遵循Google 的網站管理員指南的原因。

網頁的可用性

如果您輸入“前往拉斯維加斯的路線”,您可能需要一張從您當前位置到拉斯維加斯大道的地圖。谷歌知道這一點,並將嘗試提供它。他們的目標是為用戶提供有用的內容,而不是簡單匹配關鍵字的內容。

圖片來自谷歌

因此,如果您撰寫關於“拉斯維加斯最佳風景路線”的博客,它可能不會出現在我們示例查詢的搜索結果中。但是,如果有人搜索“拉斯維加斯公路旅行計劃”,它可能會出現。

搜索引擎如何個性化搜索結果

正如我們提到的,搜索引擎使用本地化因素來提供相關結果。這就是為什麼如果您在手機和朋友的桌面上搜索相同的查詢,您可能會看到不同的結果。

讓我們來看看 Google 用於個性化搜索結果的主要因素。

地點

某些搜索顯然與位置有關,例如“我附近的墨西哥美食”。但即使在不依賴位置的搜索的情況下,用戶的地理位置也會改變填充的結果。

如果您在洛杉磯並輸入“棒球”,Google 將填充與道奇隊相關的結果,但如果您在聖地亞哥,您將看到有關教士隊的信息。

如果用戶用法語或葡萄牙語輸入查詢,Google 不會顯示用英語編寫的頁面。它將始終以查詢語言提供結果。

搜索歷史記錄

谷歌顯然使用搜索歷史來確定排名結果。如果用戶輸入“最佳貓砂盒”並點擊第三個鏈接,下次他們搜索相同的內容時,該鏈接可能會出現在第一個或第二個。

以有用的方式呈現結果

Google 的目標以及所有搜索引擎的目標都是提供有用的結果。他們使用不斷發展的算法來做到這一點。某一天出現在首位的內容可能會在下一天升至第六或第七。這一切都取決於我們上面討論的因素,例如新鮮度、相關性和內容質量。

在處理您的內容時記住 Google 的目標很重要。如果您幫助他們為客戶服務,您最終會獲得更多網站流量。