国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

什么是垂直搜索?

2024-05-04 23:04:05
字體:
來源:轉載
供稿:網友


  垂直搜索是針對某一個行業的專業搜索引擎,是搜索引擎的細分和延伸,是對網頁庫中的某類專門的信息進行一次整合,定向分字段抽取出需要的數據進行處理后再以某種形式返回給用戶。

  垂直搜索引擎和普通的網頁搜索引擎的最大區別是對網頁信息進行了結構化信息抽取,也就是將網頁的非結構化數據抽取成特定的結構化信息數據,好比網頁搜索是以網頁為最小單位,基于視覺的網頁塊分析是以網頁塊為最小單位,而垂直搜索是以結構化數據為最小單位。然后將這些數據存儲到數據庫,進行進一步的加工處理,如:去重、分類等,最后分詞、索引再以搜索的方式滿足用戶的需求。

  整個過程中,數據由非結構化數據抽取成結構化數據,經過深度加工處理后以非結構化的方式和結構化的方式返回給用戶。

  垂直搜索引擎的應用方向很多,比如企業庫搜索、供求信息搜索引擎、購物搜索、房產搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索……幾乎各行各業各類信息都可以進一步細化成各類的垂直搜索引擎。

  舉個例子來說明會更容易理解,比如購物搜索引擎,整體流程大致如下:抓取網頁后,對網頁商品信息進行抽取,抽取出商品名稱、價格、簡介……甚至可以進一步將筆記本簡介細分成“品牌、型號、cpu、內存、硬盤、顯示屏、……”然后對信息進行清洗、去重、分類、分析比較、數據挖掘,最后通過分詞索引提供用戶搜索、通過分析挖掘提供市場行情報告。

  垂直搜索引擎大體上需要以下技術

  1.spider

  2.網頁結構化信息抽取技術或元數據采集技術

  3.分詞、索引

  4.其他信息處理技術

  垂直搜索引擎的技術評估應從以下幾點來判斷

  1.全面性

  2.更新性

  3.準確性

  4.功能性

  垂直搜索的進入門檻很低,但是競爭的門檻很高。沒有專注的精神和精湛的技術是不行的。行業門戶網站具備行業優勢但他們又是沒有技術優勢的,絕對不要想像著招幾個人就可以搞定垂直搜索的全部技術,作為一個需要持續改進可運營的產品而不是一個項目來說對技術的把握控制程度又是垂直搜索成功的重要因素之一。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 土默特左旗| 沙河市| 乐清市| 西平县| 郎溪县| 渭南市| 河东区| 镇江市| 周口市| 乐亭县| 乌鲁木齐市| 济源市| 长兴县| 五原县| 南陵县| 包头市| 大埔区| 吉安市| 噶尔县| 梨树县| 德格县| 寿宁县| 榆中县| 扎鲁特旗| 淮北市| 连城县| 淳安县| 黑龙江省| 读书| 青州市| 收藏| 全州县| 化隆| 剑河县| 潍坊市| 德江县| 宽甸| 固镇县| 张家口市| 杂多县| 思茅市|