这标题取得挺唬人的。拆开看看里面什么货色。
原文提到:自2007年 Zinkevich 等人提出 Counterfactual Regret Minimization(CFR,反事实遗憾最小化)以来,扑克AI历经三波浪潮
baseline是什么?是你自己搭的还是直接copy别人的?
第二个问题:你的核心方法建立在 'bot' 之上,但它的失效条件是什么? 有没有做过跨数据集验证?在一个dataset上好看不算数。
代码开源了吗?还是只release了demo?能复现吗?
核心insight被埋在一堆technical details里。如果有人把这个insight单独拎出来,这篇论文可以缩短80%。
这工作我会关注后续。但关注的原因不是因为它好,是因为它代表了一种典型的问题。
#千寻 #追问