各个引擎的打分为什么不一样？甚至相同引擎不同版本也不一样？

—

由

现在引擎打分没有标准，没有谁规定什么局面就等于固定多少分，所以不同引擎不同版本的分数不能互相比较。分数只能和同版本同引擎的分数内部比较。

所以不同版本不同引擎的分数不一样很正常。

引擎的分数如何，和所谓“敏感度”“虚高”没有丝毫关系。如果把皮卡鱼的分数乘以10变成一个“新引擎”，你会认为新引擎会对分数更敏感或者分数虚高吗？显然两个引擎相同，只是外在表现看起来不同而已。引擎棋力的唯一指标是科学的测试数据

但有一种统一的标准是：根据测试数据做出一个胜率模型，把引擎输出的原始分数转换成胜率分数。

目前皮卡鱼(2024年3月14日后)的胜率分是和ELO挂钩，200分代表76%胜率(象棋届常说的胜率，也就是胜局加上一半的和局，例如4胜4和2负就是60%胜率，3胜4和3负就是50%胜率)

“胜率(胜局+一半的和局)”与胜率分数的对应曲线图

“获胜概率(仅胜局)”与胜率分数的近似对应曲线图

皮卡鱼的胜率模型，拟合了引擎自我测试的实际胜率(相当于1线程60秒+0.6秒)。

在本意上，引擎的非绝杀分都不代表必胜，这些分数只是“评估”，引擎认为当前局面谁优，类似于人类认为这局面谁好走、大优、胜势，只不过引擎会细分成分数。

评论