Mi的微博

Goodhart's law: "When a measure becomes a target, it ceases to be a good measure."

感觉公共政策的问题类似于 Adversarial Bandits(环境由对手设定,以最大化玩家所选策略的损失),因而将随机性引入选拔过程或许是个好主意。


发布于2025-07-17

返回

主页