[CL]《Inducing Reasoning Primitives from Agent Traces》Z Lei, J Yan, J Momo, W W. Cohen [CMU] (2026)
在LLM智能体推理中,重复出现的推理套路总被困在临时草稿里。过去方法依赖手写流程或复用整条轨迹,本质原因是没把“推理动作”当成可沉淀对象。
本文的核心洞见是:把ReAct轨迹重新看作推理原语矿脉。由此,筛选成功轨迹、聚类Thought、合成伪工具这一操作,使模型能稳定调用曾经只偶然出现的推理动作。
这项工作真正留下的遗产是:推理经验可从行为痕迹中自动结晶。它打开的新门是无须专家设计的推理工具库,但尚未跨过的门槛是原语仍依赖LLM解释,可靠性边界未被彻底刻画。
arxiv.org/abs/2606.02994 机器学习 人工智能 论文 AI创造营




