国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > 綜合 > 正文

數據挖掘概述(又)

2024-07-21 02:09:16
字體:
來源:轉載
供稿:網友

數據挖掘工具是怎樣準確地告訴你那些隱藏在數據庫深處的重要信息的呢?它們又是如何作出預測的?答案就是建模。建
模實際上就是在你知道結果的情況下建立起一種模型,并且把這種模型應用到你所不知道的那種情況中。比如說,如果你
想要在大海上去尋找一艘古老的西班牙沉船,也許你首先想到的就是去找找過去發(fā)現這些寶藏的時間和地點有哪些。那
么,經過調查你發(fā)現這些沉船大部分都是在百慕大海區(qū)被發(fā)現,并且那個海區(qū)有著某種特征的洋流,以及那個時代的航線
也有一定的特征可尋。在這眾多的類似特征中,你將它們抽象并概括為一個普適的模型。利用這個模型,你就很有希望在
具有大量相同特征的另外一個地點發(fā)現一件不為人知的寶藏。

    當然,在數據挖掘技術甚至計算機出現以前,這種建模抽象的方法就已經廣泛地被人們所使用。在計算機中的建模和
以前的建模方法并無很大不同,主要的差異在于計算機能處理的信息量比起以前來更加龐大。計算機中能夠存儲已知了結
果的大量不同情況,然后由數據挖掘工具從這些大量的信息里面披沙揀金,將能夠產生模型的信息提取出來。一當模型建
立好了之后,就可以應用在那些情形相似但結果尚未知的判斷中了。比如,現在假設你是一個電信公司的營銷主任,公司
想發(fā)展一些新的長途電話用戶,那么你是不是會漫無目的地到街上去散發(fā)廣告呢?——就象漫無目的地在海上去尋寶一
樣。其實,比起漫無目的地去進行宣傳來,利用你以前的商業(yè)經驗來有目的地去拉攏客戶會產生高得多的效率。

    作為一個營銷主任,你對客戶的很多信息都可以了解得一清二楚:年齡、性別、信用記錄以及長途電話使用狀況。從
好的一方面來看,掌握了這些客戶的信息其實就是掌握了很多潛在的用戶的同樣的信息。問題在于你還不一定了解他們的
長途電話使用情況(因為他們的長途電話也許是通過的另一個電信公司)。現在你的主要精力就集中在用戶中誰有比較多
的長途電話上。通過下面這個表格,我們可以從數據庫里面抽象某些變量,建立起一個可以對此進行分類營銷的模型。
  客戶 潛力
一般信息
(e.g. demographic data) 已知 已知
私有信息
(e.g. customer transactions) 已知 待定

表二、數據挖掘應用于分類營銷

    根據我們創(chuàng)建的從一般信息到私有信息的計算模型,我們可以得出表二右下方表格中的信息。比如,一個電信公司的
簡化模型可以是:年薪6萬美圓以上的98%的客戶,每個月長話費80美圓以上。根據這個模型,我們就能應用這些數據來推
斷出公司現在尚不能明確的私有信息,這樣,新客戶群體就可以大體確定出來了。小型市場的試銷數據對于這樣的模型來
說顯得極為有用。因為小范圍內試銷數據的挖掘,能夠為全部市場的分類銷售打下一個良好的基礎。表三則描述了另外一
樣數據挖掘的普遍應用:預測。
  過去 現在 將來
靜態(tài)信息和當前計劃 已知 已知 已知
動態(tài)信息 已知 已知 待定

表三、數據挖掘應用于預測

數據挖掘的體系結構

    現有很多數據挖掘工具是獨立于數據倉庫以外的,它們需要獨立地輸入輸出數據,以及進行相對獨立的數據分析。為
了最大限度地發(fā)揮數據挖掘工具的潛力,它們必須象很多商業(yè)分析軟件一樣,緊密地和數據倉庫集成起來。這樣,在人們
對參數和分析深度進行變化的時候,高集成度就能大大地簡化數據挖掘過程。下圖顯示了一個大型數據庫中的高級分析過
程。

 


集成后的數據挖掘體系

    應用數據挖掘技術,較為理想的起點就是從一個數據倉庫開始,這個數據倉庫里面應保存著所有客戶的合同信息,并
且還應有相應的市場競爭對手的相關數據。這樣的數據庫可以是各種市場上的數據庫:sybase、oracle、redbrick、和其
他等等,并且可以針對其中的數據進行速度上和靈活性上的優(yōu)化。

    聯(lián)機分析系統(tǒng)olap服務器可以使一個十分復雜的最終用戶商業(yè)模型應用于數據倉庫中。數據庫的多維結構可以讓用戶
從不同角度,——比如產品分類,地域分類,或者其他關鍵角度——來分析和觀察他們的生意運營狀況。數據挖掘服務器
在這種情況下必須和聯(lián)機分析服務器,以及數據倉庫緊密地集成起來,這樣就可以直接跟蹤數據和并輔助用戶快速作出商
業(yè)決策,并且用戶還可以在更新數據的時候不斷發(fā)現更好的行為模式,并將其運用于未來的決策當中。

    數據挖掘系統(tǒng)的出現代表著常規(guī)決策支持系統(tǒng)的基礎結構的轉變。不象查詢和報表語言僅僅是將數據查詢結果反饋給
最終用戶那樣,數據挖掘高級分析服務器把用戶的商業(yè)模型直接應用于其數據倉庫之上,并且反饋給用戶一個相關信息的
分析結果。這個結果是一個經過分析和抽象的動態(tài)視圖層,通常會根據用戶的不同需求而變化。基于這個視圖,各種報表
工具和可視化工具就可以將分析結果展現在用戶面前,以幫助用戶計劃將采取怎樣的行動。

產生利潤的工具

    有很多公司都成功地安裝了數據挖掘工具。早先采用了這種技術的公司大部分都是信息密集型公司,比如金融服務和
郵件營銷系統(tǒng),但是現在這種技術已經準備好應用于各個公司中,只要公司具有大型數據庫,并且有強烈的通過軟件技術
改善公司管理的愿望。但是采用數據挖掘技術,公司必須兩個關鍵的因素,一個就是大型的,集成化的數據庫;另一個就
是定義完善的商業(yè)處理程序,這樣數據挖掘才好緊密地應用于公司數據之上。

    采用數據挖掘技術的一些成功應用,例如一個藥品公司,通過對它最近的營銷強度和銷售結果的分析,來決定哪一種
營銷活動在最近幾個月內對高附加值的醫(yī)生群體影響最大,這樣的分析建立在競爭對手的銷售活動信息和當地健康狀況的
數據系統(tǒng)之上。然后這個藥品公司可以通過其辦公網絡,將分析結果傳達到各地的銷售代表處,銷售代表們則可以根據公
司傳遞的關鍵信息來作出相應的銷售抉擇,這樣,在快速變化的、動態(tài)的市場上,銷售代表們都可以根據各種特殊情況的
分析作出最優(yōu)的選擇。

結語
    全面集成了客戶、供應者以及市場信息的大型數據倉庫導致公司內的信息呈爆炸性增長,企業(yè)在市場競爭中,需要及
時而準確地對這些信息作復雜的分析。為了更加及時地,更加準確地作出利于企業(yè)的抉擇,建立在關系數據庫和聯(lián)機分析
技術上的數據挖掘工具為我們帶來了一個新的轉機。目前,數據挖掘工具正以前所未有的速度發(fā)展,并且擴大著用戶群
體,在未來越加激烈的市場競爭中,擁有數據挖掘技術必將比別人獲得更快速的反應,贏得更多的商業(yè)機會。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 甘孜| 阜平县| 余江县| 根河市| 商城县| 确山县| 抚州市| 邯郸市| 阳信县| 武陟县| 子洲县| 兖州市| 托里县| 铁力市| 金坛市| 高青县| 郯城县| 东至县| 蒙自县| 西峡县| 蒲城县| 疏勒县| 北辰区| 邮箱| 财经| 普兰县| 安西县| 千阳县| 塔城市| 全州县| 唐河县| 哈尔滨市| 曲水县| 榆林市| 镶黄旗| 和林格尔县| 桃江县| 共和县| 沅陵县| 敦化市| 禄丰县|