- N +

網站優化-搜索引擎原理

    搜索引擎主動抓取網頁,并進行內容處理、索引部分的流程和機制一般如下。

    步驟01、派出Spider,按照一定策略把網頁抓回到搜索引擎服務器;

    步驟02、對抓回的網頁進行鏈接抽離、內容處理,消除噪聲、提取該頁主題文本內容等;

    步驟03、對網頁的文本內容進行中文分詞、去除停止詞等;

    步驟04、對網頁內容進行分詞后判斷該頁面內容與已索引網頁是否有重復,剔除重復頁,對剩余網頁進行倒排索引,然后等待用戶的檢索。

    當有用戶進行查詢后,搜索引擎工作的流程機制一般如下。

    步驟01、先對用戶所查詢的關鍵詞進行分詞處理,并根據用戶的地理位置和歷史檢索特征進行用戶需求分析,以便使用地域性搜索結果和個性化搜索結果展示用戶最需要的內容;

    步驟02、查找緩存中是否有該關鍵詞的查詢結果,如果有,為了最快地呈現查詢結果,搜索引擎會根據當下用戶的各種信息判斷其真正需求,對緩存中的結果進行微調或直接呈現給用戶;

    步驟03、如果用戶所查詢的關鍵詞在緩存中不存在,那么就在索引庫中的網頁進行調取排名呈現,并將該關鍵詞和對應的搜索結果加入到緩存中;

    步驟04、網頁排名是根據用戶的搜索詞和搜索需求,對索引庫中的網頁進行相關性、重要性(鏈接權重分析)和用戶體驗的高低進行分析所得出的。用戶在搜索結果中的點擊和重復搜索行為,也可以告訴搜索引擎,用戶對搜索結果頁的使用體驗。這塊兒是近來作弊最多的部分,所以這部分會伴隨著搜索引擎的反作弊算法干預,有時甚至可能會進行人工干預。

    按照上述搜索引擎的架構,在整個搜索引擎工作流程中大概會涉及Spider、內容處理、分詞、去重、索引、內容相關性、鏈接分析、判斷頁面用戶體驗、反作弊、人工干預、緩存機制、用戶需求分析等模塊。

返回列表
上一篇:北京SEO優化 www.8464016.com
下一篇:影響外部鏈接價值的因素有哪些?
網站SEO優化|網站定制留言