数据集是UCI上的MHEALTH数据集
虽然不是第一次用ML跑出结果,但还没有做过很多的我不得不让我感叹神奇的ML,用了一个最简单的XGboost分类,13个动作类,啥参数都没改,啥模型都没有,9个去预测一个类 ,竟然有这个准确率。
再记录一个诡异的问题,就是完全一样的超参数
param = {'max_depth': 6, 'eta': 1, 'silent': 1, 'tree_method': 'gpu_hist', 'seed': RANDOMSEED,
'objective': 'multi:softmax', 'num_class': 13}
区别只是这里的'tree_method': 'gpu_hist'
,即是否使用GPU就造成了这样的准确率差距,'seed': RANDOMSEED
也把随机数设置成一样的了,还tm会出问题,真神奇了啊。
看到有网友说是同样的随机数种子在CPU和GPU上产生的随机数也并不一致造成的,感觉没这么简单,但也还是先mark一下。