Anthropic发布的研究揭示了AI系统正以前所未有的速度参与自身开发进程。从

Anthropic发布的研究揭示了AI系统正以前所未有的速度参与自身开发进程。从2021年工程师手写代码，到2026年超过80%的合并代码由Claude生成，工程师日均代码产出量较2024年增长8倍。

外部基准同样印证这一趋势：METR评估显示AI可靠完成任务时长从2024年的4分钟扩展至2026年的12小时，SWE-bench与CORE-Bench等测试在两年内相继饱和。

内部实验中，Claude Mythos Preview在代码优化任务上实现52倍加速，远超人类研究者的4倍水平；在开放研究项目中，AI智能体自主提出假设、验证迭代，已能覆盖97%的人类-理想性能差距。

技术演进正重塑人类角色边界。当前人类优势集中于研究品味与方向判断——选择值得投入的问题、识别可信结果、规避无效路径。然而AI在实验执行、代码生成等"汗水"环节已实现超人类效率，且其判断能力正快速提升：在129个研究偏离时刻的测试中，最优模型选择更优下一步的概率从51%升至64%。

Anthropic员工描述工作模式已从"人类执行"转向"人类监督"，甚至有工程师近五个月未亲自编写代码。

铭鸿体育资讯网

Anthropic发布的研究揭示了AI系统正以前所未有的速度参与自身开发进程。从

热门分类