【牛华网讯】6月13日消息,利用轻博客Tumblr的数据,雅虎研究团队称东道主巴西将获得本届世界杯足球赛的冠军。
雅虎表示,该团队从Tumblr网站获取数据,然后评估球队在比赛中的实力,最后得出更可能获胜的球队。雅虎团队表示,Tumblr用户有关世界杯的讨论数据非常具有价值。
雅虎研究团队称:“足球迷是喧闹的,但他们不仅仅是在体育场喧闹,他们的呼声还响彻社交网络。尽管你可能认为这些球迷只是一群喧嚣嘈杂的用户,但如果你仔细倾听,你会发现这些数据的价值,数据可以为最重要的问题提供答案:谁会赢得冠军?”
雅虎团队表示,团队从831亿条Tumblr信息中筛选了1.889亿条。为了研究冠军归属队,2月至5月间,雅虎团队研究了其中2730万条“相关Tumblr信息”。
该团队称:“为了区分国家队之间的实力,我们需要为每支队伍设定一个实力值。实力值来自队伍的比赛历史记录和具有代表性的赛事比分。”
对于每场比赛,雅虎团队还利用泊松分布理论估算每支队伍的进球数。雅虎的分析参数多种多样,其中包括与 #WorldCup相关标签提到的队伍,以及 与#soccer相关提到的队伍。
例如,雅虎预测德国将击败葡萄牙,西班牙将击败荷兰。