FaceMind 和港中文大学的发的一篇论文结论可能对写Prompt很有帮助：在

FaceMind 和港中文大学的发的一篇论文结论可能对写Prompt很有帮助：在语义相同的前提下，大模型更容易处理“更常见、更高频”的表达；同一个问题换成更常见的说法，回答质量可能显著提升。论文把这个规律称为 Textual Frequency Law，简称 TFL。论文地址：arxiv.org/abs/2604.02176

论文里的实验覆盖数学推理、机器翻译、常识推理和工具调用。数学推理里，高频表达让 DeepSeek-V3 从 63.55% 提到 71.54%，GPT-4o-mini 从 60.70% 提到 68.70%，Llama-3.3-70B-Instruct 从 80.49% 提到 88.75%。机器翻译里，高频表达在 BLEU、chrF、COMET 三类指标上大多数语言对都提升。常识推理里，高频版本也在 GPT-4o-mini、DeepSeek-V3、Llama-3.3-70B-Instruct 上全面高于低频版本。

但你也看到了，它用的模型版本都比较老了，也没有用推理模型。不知道现代推理模型会不会结论一致。（猜测仍然有用但没那么明显）

How I AIAI创造营

铭鸿体育资讯网

FaceMind 和港中文大学的发的一篇论文结论可能对写Prompt很有帮助：在

热门分类