国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > SQL Server > 正文

SQL Server 2008在商務智能上的三個優化

2024-08-31 00:53:11
字體:
來源:轉載
供稿:網友
 【IT專家網獨家稿件】在SQL Server 2008數據庫中,對這商務智能方面的功能做了很大的優化。筆者結合相關的案例來談談這些優化,希望對各位數據庫工程師有所幫助。



  優化一:支持多個挖掘模型的交叉驗證。

  在數據挖掘中有一個基礎兩個核心。基礎就是數據,而核心則是挖掘模型與數據挖掘算法。在商務智能中,只有通過這三方面的共同作用,才能夠得出正確的結果。在以前的版本中,由于采用的挖掘模型不同,最后產生的結果會相差很大,有時候甚至風馬牛不相及。如在SQL Server 數據中,提供了聚類分析模型、決策樹模型、邏輯回歸模型、順序分析和聚類分析模型等等數據挖掘模型。即使這些模型采用的數據與計算方法相同,最后得出的結果很有可能都是不同的。為了提高數據挖掘的準確性,在2008中對此進行了優化。主要是提供了多個數據挖掘模型交叉驗證的方法,來提高結果與決策的準確性。

  多個數據挖掘模型之間的交叉驗證是用于評估數據挖掘模型準確性的常用方法之一。在這交叉驗證中,數據庫工程師可以將挖掘結果分為若干個子集。然后利用這些子集的數據生成對應的子集模型。最后通過衡量每個分區的模型的準確性來判斷某個數據挖掘模型是否準確。通過對最后返回的統計信息的分析,可以判斷這個挖掘模型的可靠程度,或者說用戶所采用的數據挖掘模型是否適用。而且在交叉驗證中,用戶還可以選擇幾個相同結構的模型進行對比,以發現相同結構不同模型之間結果的差異。有時候最終的結果可能沒有多大的價值,但是中間的分析過程或者結果之間的差異往往會給企業帶來意外的收獲。如在實際工作中,可以查找差異的原因,從而找到影響某個結果或者決策的關鍵因素。

  在SQL Server 2008數據庫版本中,用戶可以在兩個地方調用這個交叉驗證。一是在數據挖掘設計器向導中,可以在“挖掘準確性圖表”視圖中調用交叉驗證;二是通過數據分析存儲過程來對挖掘結構分區,調用交叉驗證。最后數據庫可以根據用戶的需要,生成相關的交叉驗證報表。在這個報表中,會反映各種可能性以及對應的均方根誤差。如果采用聚合模型的話,還會有聚合模型的所有度量值的平均偏差和標準偏差等相關的統計信息。

  不過這里需要注意的是,即使采用再復雜的交叉驗證模型,也不能夠保證最后結構與事實相符。這也是到目前為止商務智能的一個局限性。最后通過數據挖掘所得到的結果,還是要跟用戶的相關工作經驗進行結合進行判斷、甄別決策的準確性。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 合山市| 宜黄县| 昌黎县| 页游| 鄂托克前旗| 驻马店市| 洛南县| 会同县| 昭平县| 平罗县| 仁化县| 昔阳县| 濮阳市| 吉木乃县| 莱州市| 芦山县| 罗甸县| 黄龙县| 紫阳县| 襄城县| 吉林市| 清流县| 道真| 延边| 大城县| 通海县| 莱阳市| 五常市| 武穴市| 土默特右旗| 宜章县| 兴城市| 孙吴县| 高州市| 金沙县| 施秉县| 铁力市| 库伦旗| 巴马| 西充县| 长兴县|