国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > 綜合 > 正文

數(shù)據(jù)挖掘概述(二)

2024-07-21 02:38:43
字體:
供稿:網(wǎng)友

  數(shù)據(jù)挖掘工具是怎樣準(zhǔn)確地告訴你那些隱藏在數(shù)據(jù)庫深處的重要信息的呢?它們又是如何作出猜測的?答案就是建模。建模實際上就是在你知道結(jié)果的情況下建立起一種模型,并且把這種模型應(yīng)用到你所不知道的那種情況中。 比如說,假如你想要在大海上去尋找一艘古老的西班牙沉船,也許你首先想到的就是去找找過去發(fā)現(xiàn)這些寶藏的時間和地點(diǎn)有哪些。那么,經(jīng)過調(diào)查你發(fā)現(xiàn)這些沉船大部分都是在百慕大海區(qū)被發(fā)現(xiàn),并且那個海區(qū)有著某種特征的洋流,以及那個時代的航線也有一定的特征可尋。在這眾多的類似特征中,你將它們抽象并概括為一個普適的模型。利用這個模型,你就很有希望在具有大量相同特征的另外一個地點(diǎn)發(fā)現(xiàn)一件不為人知的寶藏。
   當(dāng)然,在數(shù)據(jù)挖掘技術(shù)甚至計算機(jī)出現(xiàn)以前,這種建模抽象的方法就已經(jīng)廣泛地被人們所使用。在計算機(jī)中的建模和以前的建模方法并無很大不同,主要的差異在于計算機(jī)能處理的信息量比起以前來更加龐大。計算機(jī)中能夠存儲已知了結(jié)果的大量不同情況,然后由數(shù)據(jù)挖掘工具從這些大量的信息里面披沙揀金,將能夠產(chǎn)生模型的信息提取出來。一當(dāng)模型建立好了之后,就可以應(yīng)用在那些情形相似但結(jié)果尚未知的判定中了。比如,現(xiàn)在假設(shè)你是一個電信公司的營銷主任,公司想發(fā)展一些新的長途電話用戶,那么你是不是會漫無目的地到街上去散發(fā)廣告呢?——就象漫無目的地在海上去尋寶一樣。其實,比起漫無目的地去進(jìn)行宣傳來,利用你以前的商業(yè)經(jīng)驗來有目的地去拉攏客戶會產(chǎn)生高得多的效率。
   作為一個營銷主任,你對客戶的很多信息都可以了解得一清二楚:年齡、性別、信用記錄以及長途電話使用狀況。從好的一方面來看,把握了這些客戶的信息其實就是把握了很多潛在的用戶的同樣的信息。問題在于你還不一定了解他們的長途電話使用情況(因為他們的長途電話也許是通過的另一個電信公司)。現(xiàn)在你的主要精力就集中在用戶中誰有比較多的長途電話上。通過下面這個表格,我們可以從數(shù)據(jù)庫里面抽象某些變量,建立起一個可以對此進(jìn)行分類營銷的模型。
    客戶 潛力
  一般信息
  (e.g. demographic data) 已知 已知
  私有信息
  (e.g. customer transactions) 已知 待定
  數(shù)據(jù)挖掘應(yīng)用于分類營銷
   根據(jù)我們創(chuàng)建的從一般信息到私有信息的計算模型,我們可以得出表二右下方表格中的信息。比如,一個電信公司的簡化模型可以是:年薪6萬美圓以上的98%的客戶,每個月長話費(fèi)80美圓以上。根據(jù)這個模型,我們就能應(yīng)用這些數(shù)據(jù)來推斷出公司現(xiàn)在尚不能明確的私有信息,這樣,新客戶群體就可以大體確定出來了。小型市場的試銷數(shù)據(jù)對于這樣的模型來說顯得極為有用。因為小范圍內(nèi)試銷數(shù)據(jù)的挖掘,能夠為全部市場的分類銷售打下一個良好的基礎(chǔ)。表三則描述了另外一樣數(shù)據(jù)挖掘的普遍應(yīng)用:猜測。 
   過去 現(xiàn)在 將來
  靜態(tài)信息和當(dāng)前計劃 已知 已知 已知
  動態(tài)信息 已知 已知 待定
  數(shù)據(jù)挖掘應(yīng)用于猜測
  數(shù)據(jù)挖掘的體系結(jié)構(gòu)
   現(xiàn)有很多數(shù)據(jù)挖掘工具是獨(dú)立于數(shù)據(jù)倉庫以外的,它們需要獨(dú)立地輸入輸出數(shù)據(jù),以及進(jìn)行相對獨(dú)立的數(shù)據(jù)分析。為
  了最大限度地發(fā)揮數(shù)據(jù)挖掘工具的潛力,它們必須象很多商業(yè)分析軟件一樣,緊密地和數(shù)據(jù)倉庫集成起來。這樣,在人們
  對參數(shù)和分析深度進(jìn)行變化的時候,高集成度就能大大地簡化數(shù)據(jù)挖掘過程。
  集成后的數(shù)據(jù)挖掘體系
   應(yīng)用數(shù)據(jù)挖掘技術(shù),較為理想的起點(diǎn)就是從一個數(shù)據(jù)倉庫開始,這個數(shù)據(jù)倉庫里面應(yīng)保存著所有客戶的合同信息,并且還應(yīng)有相應(yīng)的市場競爭對手的相關(guān)數(shù)據(jù)。這樣的數(shù)據(jù)庫可以是各種市場上的數(shù)據(jù)庫:Sybase、Oracle、Redbrick、和其他等等,并且可以針對其中的數(shù)據(jù)進(jìn)行速度上和靈活性上的優(yōu)化。
   聯(lián)機(jī)分析系統(tǒng)OLAP服務(wù)器可以使一個十分復(fù)雜的最終用戶商業(yè)模型應(yīng)用于數(shù)據(jù)倉庫中。數(shù)據(jù)庫的多維結(jié)構(gòu)可以讓用戶從不同角度,——比如產(chǎn)品分類,地域分類,或者其他要害角度——來分析和觀察他們的生意運(yùn)營狀況。數(shù)據(jù)挖掘服務(wù)器在這種情況下必須和聯(lián)機(jī)分析服務(wù)器,以及數(shù)據(jù)倉庫緊密地集成起來,這樣就可以直接跟蹤數(shù)據(jù)和并輔助用戶快速作出商業(yè)決策,并且用戶還可以在更新數(shù)據(jù)的時候不斷發(fā)現(xiàn)更好的行為模式,并將其運(yùn)用于未來的決策當(dāng)中。
   數(shù)據(jù)挖掘系統(tǒng)的出現(xiàn)代表著常規(guī)決策支持系統(tǒng)的基礎(chǔ)結(jié)構(gòu)的轉(zhuǎn)變。不象查詢和報表語言僅僅是將數(shù)據(jù)查詢結(jié)果反饋給最終用戶那樣,數(shù)據(jù)挖掘高級分析服務(wù)器把用戶的商業(yè)模型直接應(yīng)用于其數(shù)據(jù)倉庫之上,并且反饋給用戶一個相關(guān)信息的分析結(jié)果。這個結(jié)果是一個經(jīng)過分析和抽象的動態(tài)視圖層,通常會根據(jù)用戶的不同需求而變化。基于這個視圖,各種報表工具和可視化工具就可以將分析結(jié)果展現(xiàn)在用戶面前,以幫助用戶計劃將采取怎樣的行動。
  產(chǎn)生利潤的工具
   有很多公司都成功地安裝了數(shù)據(jù)挖掘工具。早先采用了這種技術(shù)的公司大部分都是信息密集型公司,比如金融服務(wù)和郵件營銷系統(tǒng),但是現(xiàn)在這種技術(shù)已經(jīng)預(yù)備好應(yīng)用于各個公司中,只要公司具有大型數(shù)據(jù)庫,并且有強(qiáng)烈的通過軟件技術(shù)改善公司治理的愿望。
但是采用數(shù)據(jù)挖掘技術(shù),公司必須兩個要害的因素,一個就是大型的,集成化的數(shù)據(jù)庫;另一個就是定義完善的商業(yè)處理程序,這樣數(shù)據(jù)挖掘才好緊密地應(yīng)用于公司數(shù)據(jù)之上。
   采用數(shù)據(jù)挖掘技術(shù)的一些成功應(yīng)用,例如一個藥品公司,通過對它最近的營銷強(qiáng)度和銷售結(jié)果的分析,來決定哪一種營銷活動在最近幾個月內(nèi)對高附加值的醫(yī)生群體影響最大,這樣的分析建立在競爭對手的銷售活動信息和當(dāng)?shù)亟】禒顩r的數(shù)據(jù)系統(tǒng)之上。然后這個藥品公司可以通過其辦公網(wǎng)絡(luò),將分析結(jié)果傳達(dá)到各地的銷售代表處,銷售代表們則可以根據(jù)公司傳遞的要害信息來作出相應(yīng)的銷售抉擇,這樣,在快速變化的、動態(tài)的市場上,銷售代表們都可以根據(jù)各種非凡情況的分析作出最優(yōu)的選擇。
  結(jié)語
   全面集成了客戶、供給者以及市場信息的大型數(shù)據(jù)倉庫導(dǎo)致公司內(nèi)的信息呈爆炸性增長,企業(yè)在市場競爭中,需要及時而準(zhǔn)確地對這些信息作復(fù)雜的分析。為了更加及時地,更加準(zhǔn)確地作出利于企業(yè)的抉擇,建立在關(guān)系數(shù)據(jù)庫和聯(lián)機(jī)分析技術(shù)上的數(shù)據(jù)挖掘工具為我們帶來了一個新的轉(zhuǎn)機(jī)。目前,數(shù)據(jù)挖掘工具正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越加激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 定兴县| 凤山县| 饶阳县| 沽源县| 玉门市| 东乡族自治县| 滨海县| 丹寨县| 泰来县| 遵义县| 鹰潭市| 巢湖市| 五莲县| 望谟县| 九寨沟县| 延长县| 瓮安县| 区。| 永安市| 赤城县| 铜鼓县| 博客| 渑池县| 阿克苏市| 台州市| 日土县| 桐城市| 从化市| 石门县| 孙吴县| 固始县| 凤山县| 台前县| 宜黄县| 游戏| 锦屏县| 区。| 碌曲县| 伽师县| 奎屯市| 兴海县|