玩一下kmeans,调戏以下国足,顺便预测一下18世界杯冠军,18-7-15 23:00世界杯
物以类聚,人以群分,选亚洲15支球队
1 | data = {"zhongguo":[50,50,50,40], |
依次选2006年,2010年,2014年,2018年世界杯的数据作为聚类样本,打进世界杯的得分用排名衡量,预选赛小组未出线的给50,预选赛十强的给40,澳大利亚没统计,18年的排名是估计的,虽然11点是冠亚军决赛,理论上其他队伍排名已经定了,但是我不会,这样算,得分越多的越low。
k选3,初始中心选中国,日本,沙特,先计算每一条数据到三个中心点的欧氏距离,并将其归为最近点那一类,处理完所有数据后,计算每个类的中心点,更新聚类中心,重新以上步骤,知道聚类中心不再变化,代码:
1 | import numpy as np |
结果:
1 | classv0 include ['zhongguo', 'yilake', 'kataer', 'alianqiu', 'wuzibiekesitan', 'taiguo', 'yuenan', 'aman', 'balin', 'chaoxian', 'yinni'] |
这样算,中国队在亚洲只能算3流球队
预测克罗地亚冠军,虽然实力比法国弱一些,但是不要低估对冠军渴望的心