搜索引擎的工作原理,看起來好像很技術(shù),不容易理解。其實這個搜索引擎的工作原理與超市開張有些相似。
如果你要看一家超市,而且現(xiàn)在地點,內(nèi)部裝修都已經(jīng)好了,但是還沒有貨物,如果要開張你還需要做什么呢?一切都準備就緒,就差貨物了,那第一步肯定是去采購,到各個地方去采購物品,如食品、生活用品、文具等等,只要是超市中要售出的產(chǎn)品都采購回來;第二步當(dāng)然是理貨了,貨物已經(jīng)采購回來了就需要將物品進行分類整理,放到相應(yīng)的貨架上;第三步就可以售貨了,你要購買東西時只需要根據(jù)物品的特征去進行檢索就可以了。
一共就三步,很簡單吧,搜索引擎的工作原理就和超市售貨十分相似,我們按照超市售貨的步驟一起來看看。
“采購”―抓取網(wǎng)頁
搜索引擎從它的服務(wù)器中出發(fā)進行抓取,抓取到一個鏈接之后就打開這個鏈接頁面,從頁面中爬行抓取到其它的鏈接,抓到之后將這個鏈接保存到搜索引擎的臨時庫中,然后繼續(xù)去進行抓取,打開鏈接頁面,然后將新抓取到的鏈接保存到臨時庫中,這樣一直循環(huán)往復(fù)。
“理貨”―數(shù)據(jù)分析
蜘蛛已經(jīng)將網(wǎng)頁下載到臨時庫中,數(shù)據(jù)分析系統(tǒng)就對它進行分析,分析之后不符合要求的就將它清除掉,符合要求的則放到搜索引擎的主索引區(qū)中。數(shù)據(jù)分析部分會進行網(wǎng)頁結(jié)構(gòu)化、消噪、查重、分詞和鏈接分析等。
符合要求的放到主索引區(qū)之后搜索引擎會根據(jù)一定的算法對其進行排序、歸類、整理,將所有的URL加上編號。
“售貨”―結(jié)果顯示
用戶在搜索引擎前臺搜索一些關(guān)鍵詞的時候就能夠展示給我們主索引區(qū)中的排序內(nèi)容。
以上講解內(nèi)容都比較理論化,最后附上一張圖幫助大家理解。
新聞熱點
疑難解答
圖片精選