從互聯網抓取頁面:查找引擎發送一個程序,能夠找到新的網頁和抓取文件。咱們叫它蜘蛛或機器人。查找引擎的蜘蛛從數據庫的已知網頁開端,仿照人類閱讀和拜訪這些網頁。
當查找引擎鏈接一個網頁并拜訪更多的網頁時,咱們稱之為匍匐。當一個匍匐器經過銜接找到一個新的URL時,它將等候一個新的URL記載數據庫,盯梢一個web鏈接是查找一個匍匐器找到一個新的web站點的最根本的辦法,因而反向鏈坐落反向鏈中。拜訪是查找引擎優化中最根本的要素之一。
數據庫索引:剖析搜集的網頁剖析和指標體系程序,提取網頁信息(包含URL編碼類型、關鍵詞方位,生成時刻,與其他web頁面的鏈接,等等),然后進行很多的雜亂操作算法,依據必定程度的相關性,得到的方針網頁。然后,關鍵字的相關性被用來構建Web索引數據庫。
當用戶在查找引擎界面中輸入關鍵字時,查找引擎程序在查找后處理輸入詞,如分詞、關鍵詞、刪去中止詞、判別是否開端查找和過錯詞等。
查找成果進行處理和排序:用戶輸入關鍵詞后,查找體系程序從web索引數據庫中查找契合關鍵詞的相關網頁。相關程度越高,排名越高。最終,頁面生成體系將查找成果的鏈接地址和頁面內容安排回用戶。

當查找引擎鏈接一個網頁并拜訪更多的網頁時,咱們稱之為匍匐。當一個匍匐器經過銜接找到一個新的URL時,它將等候一個新的URL記載數據庫,盯梢一個web鏈接是查找一個匍匐器找到一個新的web站點的最根本的辦法,因而反向鏈坐落反向鏈中。拜訪是查找引擎優化中最根本的要素之一。
數據庫索引:剖析搜集的網頁剖析和指標體系程序,提取網頁信息(包含URL編碼類型、關鍵詞方位,生成時刻,與其他web頁面的鏈接,等等),然后進行很多的雜亂操作算法,依據必定程度的相關性,得到的方針網頁。然后,關鍵字的相關性被用來構建Web索引數據庫。
當用戶在查找引擎界面中輸入關鍵字時,查找引擎程序在查找后處理輸入詞,如分詞、關鍵詞、刪去中止詞、判別是否開端查找和過錯詞等。
查找成果進行處理和排序:用戶輸入關鍵詞后,查找體系程序從web索引數據庫中查找契合關鍵詞的相關網頁。相關程度越高,排名越高。最終,頁面生成體系將查找成果的鏈接地址和頁面內容安排回用戶。