久久综合久久鬼色,国产AV一区二区三区传媒,无码日韩精品一区二区免费暖暖

網站建設 網絡推廣 網站營銷 軟件開發 案例展示 新聞資訊 關于我們 聯系我們
合肥拓野網絡公司新聞資訊
機器學習預測世界杯:巴西奪冠
來源:合肥拓野網絡公司 | 發布日期:2018-06-14 次 | 人氣:2213
 合肥拓野網絡公司

2018年俄羅斯世界杯開打,首場比賽是東道主俄羅斯對陣沙特阿拉伯,將于6月14日拉開序幕。


每屆世界杯最受關注的當屬決賽,上屆2014年巴西世界杯,東道主巴西隊意外爆冷,只獲得第四名,無緣決賽。今年的世界杯,不少機構/研究人員給出預測:德國將和巴西爭奪冠軍,并且,巴西隊奪冠的概率更大些。


綜合各種預測和民意調查,冠軍幾乎肯定在巴西、德國和阿根廷之間展開,雖然強強爭鋒喜聞樂見,但似乎也少了些驚喜。


機器學習和大數據的方法正越來越多地被用在比賽結果預測上,不僅是世界杯,也不僅是結果,球隊組成、戰術選擇和球員訓練都已經開始見到機器學習的身影。對于球迷和觀眾而言,人工智能也將展開一種全新的參與/觀看體育賽事的體驗。


機器學習預測結果:巴西獲得冠軍


肯尼亞的投資銀行Genghis Capital Investment Bank的投資銀行分析師Gerald Muriuki,日前在Medium上公布了他使用機器學習預測FIFA 2018的結果——巴西將贏得冠軍。


這一結果跟微軟的AI和數據科學專家Sorin Peste的預測結果一致。


實際上,預測世界杯冠軍是一個典型的機器學習問題,你首先預測每場比賽的獲勝者,接著再預測小組賽、半決賽和決賽的冠軍。在這個過程中,你需要進行數據整合、特征建模和結果預測。因此,很多機器學習或數據科學家,都做過類似的項目。


Muriuki和Peste兩個人都是根據足球比賽的歷史數據,建立機器學習模型,模擬比賽,并預測這些比賽的結果。下面我們分別來看看。


使用邏輯回歸進行預測


Muriuki使用了兩個來自Kaggle的數據集,包含了從1872年到2017年國際足球比賽的結果。他先分析了兩個數據集,做了一些特征工程,選擇跟2018年世界杯最相關的特征進行預測,再足控了一些數據增強。


在模型的選擇上,Muriuki用的是邏輯回歸,一種分類器算法。邏輯回歸通過使用邏輯函數預估概率,從而衡量分類因變量和一個或多個自變量之間的關系。簡單說,給定一組相關的數據后,邏輯回歸能夠預測結果(在世界杯的情況下,就是預測是輸還是贏)。


這是他的模型預測最初幾場比賽的結果:俄羅斯vs沙特,俄羅斯勝利;烏拉圭vs埃及,烏拉圭勝利;伊朗vs摩洛哥,平局。4天以后就可以驗證這個結果是對還是錯了。




16強的結果是這樣的:




四分之一決賽將在葡萄牙vs巴西,以及德國vs阿根廷之間展開。




最終巴西vs德國,巴西獲勝。




使用隨機森林進行預測


另一方面,微軟的AI和數據科學專家Sorin Peste的預測過程則更加完善。在數據的選擇上,除了歷年世界杯結果,Peste還使用了歐洲杯、奧運會等大型比賽的數據,以及這些比賽的勝率分布。




此外,Peste還考慮了比賽的地址,也即是在主場、客場還是在雙方都無關的中立場所,以及比賽是否“friendly”,在踢friendly比賽時,目的不是為了贏球,而是為了觀察對手的球員和策略。


在模型的選擇上,Peste用的是隨機森林(深度500),一種根據呈現給它的特征生成多個決策樹的算法,并且每個單獨的樹對每個新輸入向量的結果“投票”。隨機森林的速度快,相當準確,可以對泛化誤差進行無偏估計,因此不需要交叉驗證。


下圖展示了迭代1000次后的結果,巴西獲勝,阿根廷第二。




統計的方法:德國戰車險勝巴西


當然,除了機器學習,還有更多預測是使用大數據方法。KDnuggets上一位狂熱球迷用統計的方法,預測德國隊會奪冠。他的操作步驟如下:


收集信息:


國際足聯世界排名:這是所有211支國家足球隊的排名系統。使用積分系統,積分是基于所有FIFA認可的國際比賽的結果。然而,這并不是最好的系統,而且有很多缺點。


Elo評級:該系統最初是為國際象棋聯合會FIDE開發的,目的是給棋手打分。它的復雜矩陣根據比賽的類型分配點數,并考慮到雙方的凈勝球差異。它和國際足聯的主要不同之處在于,它也統計了友誼賽的數量。


TransferMarkt team value:這個總部位于德國的網站提供了關于足球各個方面的信息,包括每個知名球員的估計市值。他們列出了參與國的名單和他們的團隊價值。


投注賠率:使用投注比較網站OddsChecker,采用每個國家最慷慨的賠率。


TransferMarkt的數字是歐元,而FIFA和Elo有他們自己的評級系統,投注賠率是分數。作者將每一個系統都標準化,使它們具有可比性。在統計中,標準分數(也稱為z分數/值,正常分數或標準化值)是數值與平均值不同的標準偏差數。




2018年世界杯,四個流行的預測來源




KDnuggets預測的z分數


如果KDnuggets的預測是正確的,那么世界杯小組賽的結果會是下面這樣的:




研究結果引出了一些有趣的結論:


德國排名第一,但僅略高于巴西。緊隨其后的是西班牙和法國。


Elo排名系統和投注幾率看起來最相似,都列出了相同的前五名(上面提到的四個球隊和阿根廷)。


在整個體系中有一些鮮明的對比,其中最引人注目的是秘魯在國際足聯(FIFA)和Elo排名中z分數都排在第10位,而在TrasferMarkt的球隊價值排名卻在第30位。


民意調查:德國、巴西、阿根廷最受歡迎


除了KDnuggets上的預測,還有諸多世界杯賽前的其他預測:


《每日電訊報》對每支球隊進行了廣泛的分析,最后進行了一項投票,讓讀者預測冠軍,投票結果如下:




此外,據中新網報道,俄羅斯彼爾姆國立研究大學學生維克多 扎科派洛建立了一個能預測2018年世界杯冠軍的神經網絡,神經網絡綜合各項參數進行分析計算后得出結論稱,世界杯前三名將是德國隊、巴西隊和阿根廷隊。


四年前,巴西在家門口以1:7輸給了德國隊,創下了自1920年0:6輸給烏拉圭以來最大的世界杯輸球記錄,震驚全國人民。最終,德國隊奪得了當年的世界杯冠軍。


今年的俄羅斯世界杯,諸多機構預測巴西和德國將上演冠軍大戰。巴西能否一雪前恥,德國能否成功衛冕?我們拭目以待。

上一篇:廣電總局:互聯網電視不許直播2018世界杯!
下一篇:山東多地遭遇冰雹 西瓜被砸“開花”
熱門資訊
(2020-06-24)2020端午節放假通知 (2018-12-21)移動端seo優化和排名技術怎么實現? (2019-01-11)網站站內優化是非常重要的一個環節,站內SEO優化中如何利用好... (2013-09-09)番茄花園作者被判三年半微軟警告win7盜版 (2019-01-21)網頁設計需要注意的七個問題
推薦資訊
(2013-11-08)IBM宣布推開放Linux套裝軟件挑戰Windows 7 (2014-06-12)阿里巴巴信用支付業務是否會沖擊銀行消費信貸? (2014-05-09)報告稱六成IT家電企業使用CN域名 (2013-03-29)拓野網絡指出錯誤的堆積關鍵詞有哪些 (2013-03-26)“2009中國互聯網市場年會”3月召開
電商解決方案-專業網絡營銷部署咨詢-成功案例分享-個性定制服務咨詢
網站建設
營銷套餐 PC端 移動端 域名空間郵箱
網絡推廣
搜狗競價 網站優化
網站營銷
微信公眾號 小程序 朋友圈推廣
軟件開發
定制軟件 手機APP
案例展示
精品案例
網絡快訊
公司新聞 行業資訊 媒體報道 網絡知識
關于我們
公司簡介 企業文化 團隊風采 發展歷程
聯系我們
聯系方式 人才招聘 問題反饋 付款方式
Copyright  ©  2008 - 2018  合肥拓野網絡科技有限公司, All Rights Reserved 皖ICP備06009261號-4