前言
本篇我們將總結(jié)的算法為Microsoft時(shí)序算法的結(jié)果預(yù)測(cè)值,是上一篇文章Microsoft時(shí)序算法的一個(gè)總結(jié),上一篇我們已經(jīng)基于微軟案例數(shù)據(jù)庫(kù)的銷售歷史信息表,利用Microsoft時(shí)序算法對(duì)其結(jié)果進(jìn)行了預(yù)測(cè),并且相應(yīng)形成了折線預(yù)測(cè)圖和模型依賴屬性,有興趣的同學(xué)可以點(diǎn)擊查看,但是上篇文章的能給出的只是一個(gè)描述趨勢(shì)的折線圖,從圖中我們能分析出的知識(shí)也只能通過(guò)語(yǔ)言描述,而這里面缺少更確切的數(shù)據(jù)支撐,作為一個(gè)凡事以數(shù)據(jù)說(shuō)話的年代顯然這是不夠的,本篇我們將根據(jù)上一篇的預(yù)測(cè)過(guò)程詳細(xì)的給出預(yù)測(cè)結(jié)果值,形成一份可供具體參考的數(shù)據(jù)明細(xì)表。
應(yīng)用場(chǎng)景介紹
作為Microsoft時(shí)序算法的應(yīng)用場(chǎng)景,在上一篇我們已經(jīng)詳細(xì)介紹了,本篇就不再贅述,總結(jié)一下就是凡事要應(yīng)用時(shí)間總線為依據(jù),根據(jù)以往歷史事例記錄推測(cè)以后將要發(fā)生的結(jié)果值,此種場(chǎng)景我們都會(huì)應(yīng)用到時(shí)序算法。
比如:預(yù)測(cè)銷售記錄、預(yù)測(cè)營(yíng)業(yè)額度、預(yù)測(cè)明年公司員工人數(shù)、預(yù)測(cè)下個(gè)月房?jī)r(jià)、預(yù)測(cè)明年.....
但其實(shí)凡此種種我們要挖掘的其實(shí)是一種規(guī)律,一種事態(tài)進(jìn)展中的導(dǎo)向,而這些可能不基于數(shù)據(jù)僅憑經(jīng)驗(yàn)值是做不到的或者說(shuō)不準(zhǔn)確的,凡事有因必有果,很多事情冥冥中已經(jīng)注定,汗...有點(diǎn)佛家寓言的味道!時(shí)序算法更重要的是展現(xiàn)這注定的過(guò)程,然后推算出將要發(fā)生的結(jié)果。對(duì)于本來(lái)的事例就無(wú)規(guī)律可循,這種事情是用Microsoft時(shí)序算法無(wú)法預(yù)測(cè)的,或者預(yù)測(cè)結(jié)果是不準(zhǔn)的,比如:大師,您幫我算算我下期彩票買什么號(hào)能中一等獎(jiǎng)???我那個(gè)去!....汗......也能算..只是不準(zhǔn)!...
技術(shù)準(zhǔn)備
(1)參照上一篇文章,我們利用微軟提供的案例數(shù)據(jù)倉(cāng)庫(kù)(AdventureWorksDW2008R2),這這里我們只需要用到一張表,確切的說(shuō)是一張視圖vTimeSeries,其實(shí)這里面就是記錄的往年不同月份的銷售匯總值,稍后我們將詳細(xì)分析這部分?jǐn)?shù)據(jù)。
(2)VS2008、SQL Server、 Analysis Services
操作步驟
(1)這里我們應(yīng)用上期中時(shí)序算法的解決方案,我們打開:
這里上篇文章我們已經(jīng)分析的很詳細(xì),有興趣的童鞋可以參照上一篇文章,到此我們來(lái)可以驗(yàn)證下該模型的準(zhǔn)確度怎么樣,我們來(lái)查看“挖掘準(zhǔn)確性圖表”
可以看到此處為灰色顯示,也就是說(shuō)對(duì)于Microsoft時(shí)序算法模型,準(zhǔn)確度模型是沒(méi)法預(yù)測(cè)的,這也是在Microsoft所有的挖掘算法中唯一一個(gè)不能利用準(zhǔn)確度性圖表進(jìn)行驗(yàn)證的,原因很簡(jiǎn)單:事情還沒(méi)發(fā)生,你驗(yàn)證個(gè)P...
以往的挖掘模型可以通過(guò)歷史遺留的部分事例進(jìn)行驗(yàn)證模型的準(zhǔn)確度,而時(shí)序算法不行,因?yàn)槟愕臅r(shí)間維度還沒(méi)演變到此,所有的所有的都還未發(fā)生,沒(méi)法驗(yàn)證。當(dāng)然我們可以采用交叉驗(yàn)證根據(jù)以往的事例來(lái)驗(yàn)證當(dāng)前時(shí)間以前發(fā)生的事是否準(zhǔn)確。咱們后期進(jìn)行....
(2)基于現(xiàn)有Microsoft時(shí)序算法來(lái)推測(cè)未來(lái)發(fā)生結(jié)果值
這個(gè)步驟沒(méi)啥復(fù)雜的,就是根據(jù)上篇我們的時(shí)序挖掘模型來(lái)推測(cè)出未來(lái)將要產(chǎn)生的銷售額和銷售量,我們會(huì)推測(cè)出詳細(xì)的結(jié)果值表
我們進(jìn)入“挖掘模型預(yù)測(cè)”面板
我們選擇源為“預(yù)測(cè)函數(shù)”,將Amount、Quantity兩個(gè)預(yù)測(cè)值拖到條件/參數(shù)窗口,然后輸入預(yù)測(cè)步驟為5,并且將主鍵列加入或者我們直接填寫查詢語(yǔ)句:
點(diǎn)擊運(yùn)行按鈕,我們來(lái)查看結(jié)果:
結(jié)果出現(xiàn)了,M200這款自行車在歐洲在2008年的銷售額和銷售量我們已經(jīng)確切的預(yù)測(cè)出來(lái)了,因?yàn)槲覀冎皇穷A(yù)測(cè)了5個(gè)月,其它時(shí)間段的也可以推測(cè)出,當(dāng)然其它的產(chǎn)品可以查看,此處我們就不展開了,剩下的工作我們將它們保存到數(shù)據(jù)庫(kù):
我們來(lái)查看數(shù)據(jù)庫(kù)明細(xì):
嘿嘿...剩下的事情就是拿著這份數(shù)據(jù)去找BOSS了....然后...就然后了......
-------------------------------------------------------霸氣的分割線------------------------------------------------------------------
到此貌似本篇文章也應(yīng)該結(jié)束了,但是我估計(jì)到此結(jié)束會(huì)有很多朋友罵我是標(biāo)題黨,你丫的不是說(shuō)要玩彩票預(yù)測(cè)嘛,丫不是說(shuō)時(shí)序算法可以預(yù)測(cè)未來(lái)的事情嘛....咋認(rèn)慫了呢....
上面的應(yīng)用場(chǎng)景中也提到了此問(wèn)題...鑒于此,我懷揣著成為“大濕”的夢(mèng)想,小心翼翼的打開了百度,然后輸入了:彩票,希望從中找到點(diǎn)數(shù)據(jù)來(lái)瞅瞅:
看到了這霸氣的百度樂(lè)彩,而且是頭條顯示,我弱弱的點(diǎn)開了它,然后很仔細(xì)的看了一圈,終于在一個(gè)小角落里找到了一個(gè)比較簡(jiǎn)單的東西,“排列三”,嗯...就三個(gè)數(shù)是不是還好弄點(diǎn),要不推測(cè)的數(shù)太多了會(huì)不會(huì)把自己搞死,嘿嘿...我打開了它,有圖有真相:
在中間一個(gè)猥瑣的地方找到了“歷史數(shù)據(jù)”,我點(diǎn)開了它,找的就是它:
嘿,就是它,我找到了部分歷史數(shù)據(jù),而且里面數(shù)據(jù)都很標(biāo)準(zhǔn),完全符合我們時(shí)序預(yù)測(cè)的算法,期號(hào)我們做主鍵,日期列也有..開獎(jiǎng)號(hào)碼為預(yù)測(cè)列,嘿嘿..百度做的還是蠻可愛的!
別高興的太早,丫找到數(shù)據(jù)就牛了,這些數(shù)據(jù)隨便找個(gè)網(wǎng)站一大堆大堆的!
好吧,我們低調(diào)的打開了Office的Excel軟件,然后把這些數(shù)據(jù)搞到Excel中來(lái):
點(diǎn)擊導(dǎo)入按鈕,新建一個(gè)Sheet來(lái)存儲(chǔ)數(shù)據(jù),清理掉不需要的冗余數(shù)據(jù),得到標(biāo)準(zhǔn)的規(guī)范數(shù)據(jù):
然后通過(guò)SQL Server自帶的導(dǎo)入工具,順利的導(dǎo)入到數(shù)據(jù)庫(kù)中,為了研究好這三個(gè)數(shù),單個(gè)數(shù)字之間有沒(méi)有關(guān)聯(lián)性,為此我單獨(dú)創(chuàng)建了一張表,將這三個(gè)數(shù)字拆分開來(lái)研究,希望這樣得到的數(shù)據(jù)會(huì)準(zhǔn)確一點(diǎn)點(diǎn)...以防被拍磚的風(fēng)險(xiǎn),我們來(lái)看下建庫(kù)腳本:
SET QUOTED_IDENTIFIER ONGOCREATE TABLE [dbo].[TicketResult]( [開獎(jiǎng)日期] [datetime] NULL, [期號(hào)] [float] PRimary key not NULL, [開獎(jiǎng)號(hào)碼] [nvarchar](255) NULL, [本期銷量] [float] NULL, [FirstNo] [int] NULL, [TwoNo] [int] NULL, [ThirdNo] [int] NULL) ON [PRIMARY]GO
這個(gè)腳本很土,很多地方不標(biāo)準(zhǔn),玩過(guò)多年數(shù)據(jù)庫(kù)的銀們不要噴我,中文字段名、沒(méi)建索引等等吧,為了演示方便我就先湊著用著。我們將Excel導(dǎo)入到庫(kù)中通過(guò)語(yǔ)句插入到這張表中,這過(guò)程簡(jiǎn)單的很,我們就不貼圖了。有問(wèn)題的可以私信我,我們直接看結(jié)果:
數(shù)據(jù)有了,剩下的步驟就是打開我們的解決方案,然后新建數(shù)據(jù)源,然后新建數(shù)據(jù)源視圖,然后新建數(shù)據(jù)挖掘結(jié)構(gòu),具體的詳細(xì)步驟不清楚的可以參考我之前文章或者私信我,這里我們只看一下新建挖掘結(jié)構(gòu)的過(guò)程中的輸入、輸出和鍵的設(shè)置:
然后完成該模型的建立,我們來(lái)看看此模型方案:
到此我們的數(shù)挖掘模型已經(jīng)建立完畢,然后部署下,然后處理下,我們就可以瀏覽結(jié)果了!
懷著沉重的心情,我悄悄的打開了“挖掘模型查看器”,結(jié)果,你懂得...
你妹呀,這是神馬?一堆亂碼...一片混沌嘛...
但是、但是我不能對(duì)不起“大濕”的稱號(hào),我要從中找到點(diǎn)神馬...哪怕是一點(diǎn)點(diǎn)蛛絲馬跡..我小心翼翼的選擇了第一個(gè)數(shù)字的預(yù)測(cè):FirstNO:
從選擇第一個(gè)數(shù)字的預(yù)測(cè)圖我們可以看到,歷史結(jié)果值集中在中間值,以4為最佳值,并且以此值作為分割點(diǎn)向兩側(cè)逐漸減少出現(xiàn)次數(shù),然后我通過(guò)點(diǎn)擊順利的預(yù)測(cè)出來(lái)明天也就是2014年10月15號(hào)的第一個(gè)數(shù)字應(yīng)該是4!...我去...好數(shù)字...這個(gè)數(shù)字出現(xiàn)概率最高,為了給自己挽回顏面,可愛的VS也將它作為明天最佳的預(yù)測(cè)值。
然后..然后我又看了其它數(shù)字的預(yù)測(cè),通過(guò)上面的方法將明天的結(jié)果預(yù)測(cè)結(jié)果值保存到了數(shù)據(jù)庫(kù),我們來(lái)看:
我們點(diǎn)擊來(lái)看運(yùn)行結(jié)果:
哈哈...明天的彩票值我已經(jīng)順利的預(yù)測(cè)出來(lái)了:看看...4、7、5!嘿嘿...就是這個(gè)值了..有興趣的童鞋可以去買了,中了算你的,不中也算你的...明天不中我還會(huì)贈(zèng)送后天...大后天!。。。
其實(shí)經(jīng)過(guò)上面的分析已經(jīng)得到對(duì)于排列三這種彩票他是有規(guī)律就是出現(xiàn)的概率集中于中間值,也就是4,如果從長(zhǎng)期來(lái)看買這塊數(shù)據(jù)肯定能賺。
然后我們將這部分值保存到數(shù)據(jù)庫(kù),然后拿著這部分勝利的數(shù)據(jù),去到彩票網(wǎng)站買彩票去!
嘿嘿...接下來(lái)的事我就等著:升職、加薪、出任CEO、贏取白富美、走上人生巔峰.....哈哈...
我果斷的掏出了手機(jī),進(jìn)入到了彩票網(wǎng)站,選擇排列三這種彩票,準(zhǔn)備購(gòu)買:
4+7+5=16...哈哈,我利用“求和”這種方案就買16這個(gè)數(shù)字了!
但是我詳細(xì)看了看...
尼瑪!...選擇的數(shù)字得到的回報(bào)率是不一樣的!也就是說(shuō)越選擇接近4的中獎(jiǎng)概率高,但是得到的獎(jiǎng)金回報(bào)率也少,選擇離4遠(yuǎn)的數(shù)值中獎(jiǎng)概率低,但是得到的獎(jiǎng)金回報(bào)率也高!...
我那個(gè)去...
我的高富帥夢(mèng)、我的大濕夢(mèng)!.....
結(jié)語(yǔ)
呵呵...通過(guò)上面的分析基本上我們能看到時(shí)序算法的好處,從上面的結(jié)果預(yù)測(cè)值來(lái)看..其實(shí)和他們官網(wǎng)給出的獎(jiǎng)金方案還是有出入的,比如我預(yù)測(cè)求和值的大部分是16、14、17...這些值全部大于11...而根據(jù)它上面的圖片可以看到他們推薦的最高中獎(jiǎng)數(shù)應(yīng)該是10和11...返回金額都是9塊錢!
有興趣的可以繼續(xù)分析這塊..可能對(duì)于彩票這種概率事件的預(yù)測(cè)沒(méi)有規(guī)律可循,但是生活中大部分事件都有規(guī)律可循的,而這些是我們所要挖掘和分析的。
文章的最后我們給出前幾篇算法的文章連接:
Microsoft決策樹分析算法總結(jié)
Microsoft聚類分析算法總結(jié)
Microsoft Naive Bayes 分析算法
Microsoft算法結(jié)果預(yù)測(cè)篇
Microsoft時(shí)序算法總結(jié)
如果您看了本篇博客,覺得對(duì)您有所收獲,尊重別人的勞動(dòng)成果,請(qǐng)不要吝嗇您的“推薦”。
新聞熱點(diǎn)
疑難解答
圖片精選