转自X,作者WquGuruGEMINI预训练团队负责人在五月份写了一篇《如何进入头部AI团队/实验室》,非常值得一读,总结10条经验:
前沿实验室的招聘卷得厉害,能进去的大多出自顶尖本科或博士项目,身上普遍有三样东西:方向打得准、数学功底硬、拼劲十足。 对大多数普通人来说,硬挤正面没胜算,更务实的打法是绕到 LLM 栈的两头——要么沉下去做底层(kernel 优化、推理加速、量化),要么浮上来做上层(agent 系统、用 LLM 搞算法实验),靠开源项目和实打实的成果说话,比什么都有说服力。
1. 找准方向,切忌空谈
别张嘴就是“我对 AI 感兴趣”。得盯准实验室真正缺人的地方:底层就死磕 FlashAttention、量化推理、kernel 编程;上层就做 agent 循环、LLM 辅助的实验设计。这些方向门槛不高,自学能上手,实验室又天天用得着。
2. 数学底子绕不过去
这里没有捷径,只能靠大量证明题和理论课程硬磨。优化理论、scaling laws、模型演化逻辑,得吃到骨子里去。数学成熟度是分水岭,过了就是研究者,没过就是操作工。
3. 拼劲得够,别怕苦
大学那几年,周末泡图书馆是常态,社交能砍就砍。作者当年和朋友靠浓咖啡硬扛一整天,就这么熬过来的。想和那拨尖子生掰手腕,没有这点强度打底,基本没戏。
4. 用开源项目破局,别指望简历
把代码挂到 GitHub 上,做复现、提改进、跑 benchmark。能力这东西,摆出来给人看,比写在纸上管用得多。
5. 从边角料干起,别一上来就冲大模型
先搞定 kernel 编程(CuTe、LLM.int8() 量化这些)、推理优化、agent 工具链。这些活实验室最缺人,也最容易自己闷头学出来。
6. 论文 + 动手复现,两手都要硬
精读 FlashAttention、SnapKV 这些经典,把 LLM 的脉络理清楚。建议从 Reiner Pope 的访谈和 Gemini Flash 的预训练讲座入手,再慢慢啃 scaling laws。
7. AI 工具用来提速,别用来代替学习
AI 能让你已经会的东西干得更快,但绝不能拿它来学新东西或跳过思考。一依赖就废,数学和拼劲都养不出来了。
8. 每隔半年复盘一次方向
别嫌活脏、别嫌活基础——只要那条路通到金矿,就值得挖。关键是想清楚自己在往哪走。
9. 拿具体练习证明自己 - 用 JAX/Flax 从零写一个 1000 万参数左右的 Transformer,在 Colab TPU 上跑通加法任务; - 手推 Chinchilla scaling laws,对比稠密模型和 MoE; - 写一个 Pallas kernel 做算子融合,实测前向加速并说清原因。
10. 最终就一条路:本事 + 作品 + 死磕,缺一不可
名校背景当然管用,但对出身一般的选手,最靠谱的就是在 kernel 或 agent 领域做出能拿出来秀的东西,然后做好打 5–10 年持久战的准备。

