2026-05-04
paper
01 · latest dispatch
When LLMs Stop Following Steps:程序不等于推理,过程执行本身就是问题
一句话结论这篇值得读。它最有价值的点,不是再证明一次“长链推理会掉点”,而是把问题拆得更准:很多模型不是不会给最终答案,而是不会忠实执行你要求的步骤。 对 agent、tool use、workflow automation 来说,这比单看 final answer acc...
Open entry