铭鸿体育资讯网

FaceMind 和港中文大学的发的一篇论文结论可能对写Prompt很有帮助:在

FaceMind 和港中文大学的发的一篇论文结论可能对写Prompt很有帮助:在语义相同的前提下,大模型更容易处理“更常见、更高频”的表达;同一个问题换成更常见的说法,回答质量可能显著提升。论文把这个规律称为 Textual Frequency Law,简称 TFL。论文地址:arxiv.org/abs/2604.02176

论文里的实验覆盖数学推理、机器翻译、常识推理和工具调用。数学推理里,高频表达让 DeepSeek-V3 从 63.55% 提到 71.54%,GPT-4o-mini 从 60.70% 提到 68.70%,Llama-3.3-70B-Instruct 从 80.49% 提到 88.75%。机器翻译里,高频表达在 BLEU、chrF、COMET 三类指标上大多数语言对都提升。常识推理里,高频版本也在 GPT-4o-mini、DeepSeek-V3、Llama-3.3-70B-Instruct 上全面高于低频版本。

但你也看到了,它用的模型版本都比较老了,也没有用推理模型。不知道现代推理模型会不会结论一致。(猜测仍然有用但没那么明显)

How I AIAI创造营