百进配资厉害！天才博士刚毕业，就被前OpenAI CTO抢走！年薪或300万起步

MIT天才博士一毕业百进配资，火速加盟OpenAI前CTO初创！

最近，肖光烜（Guangxuan Xiao）在社交媒体官宣，刚刚完成了MIT博士学位。

下一步，他将加入Thinking Machines，专注于大模型预训练的工作。

评论区下方，科学家、xAI研究员、UCSD等一众大佬，为他本人送上了祝贺。

清华双学位学霸，MIT博士开挂人生

打开他的个人主页，多元而充实的经历便映入眼帘。

肖光烜本科毕业于清华大学，拿到了双学位，主修的是计算机科学，金融学是第二学位。

在此期间，他获得了清华大学综合优秀奖学金（2019）、全国大学生数学建模竞赛（CUMCM）一等奖（2020）、国家奖学金（2020）、清华大学「未来学者」奖学金（2021）等多项奖项。

他曾于2020–2021年作为访问生（Visiting Student），前往斯坦福大学计算机系开展科研工作。

2022年，肖光烜加入MIT攻读博士学位，导师为韩松（Song Han）教授。

个人研究方向聚焦于：深度学习的高效算法与系统，尤其是大规模基础模型（Foundation Model）。

他于2022年9月至2026年1月，在MIT EECS担任全职研究助理（Research Assistant）。

读博期间，肖光烜曾多次进入全球顶级科技大厂从事前沿研究实习，具备了丰富的一线工业研发的经验。

论文地址：https://arxiv.org/pdf/2309.17453

2024年2-5月期间，他作为英伟达实习生，研究方向是为长上下文大语言模型推理加速。

他和团队提出了DuoAttention，结合检索与流式注意力头，实现高效推理。

论文地址：https://research.nvidia.com/labs/eai/publication/duoattention/

随后，他又参与了多项核心研究项目，其中包括：

XAttention：基于反对角评分的块稀疏注意力机制

StreamingVLM：面向无限视频流的实时理解模型

FlashMoBA：混合块注意力（Mixture of Block Attention）的高效优化

值得一提的是，肖光烜在研究之外，还有丰富的兴趣爱好，比如足球、乒乓球、围棋、钢琴。

他曾担任所在院系足球队的队长兼先锋，贝多芬的作品是个人最爱。

一篇博士论文，破解LLM三大难题

比起耀眼的履历，肖光烜的博士论文本身更值得深入研析与拆解。

不得不承认，如今大模型已经无所不能，但它们依然太贵了。

显存爆炸、推理太慢、长上下文直接OOM（内存溢出），这是几乎所有LLM工程团队每天都在面对的现实。

Efficient Algorithms and Systems for Large Language Models这篇论文百进配资，给出了一个罕见的、从工程到理论、从算法到架构的完整答案。

论文中，他们提出了SmoothQuant，解决了一个长期困扰工业界的问题——激活值异常（activation outliers）。

SmoothQuant通过一个巧妙的数学等价变换，把量化难点从「激活」转移到「权重」。

结果，它实现了首个在十亿级模型上W8A8无损量化，无需重新训练，显存更小、推理更快。

针对超长序列的处理，作者在StreamingLLM中发现了「注意力汇点」（attention sink）现象——

即使没有任何语义，初始token会被后续token持续关注。这些token的作用不是「理解」，而是数值稳定。

结果，实现了常数内存的流式推理，模型上下文长度从数千token扩展到百万级。

更进一步，他们又把这一思想推广到多模态，StreamingVLM可以在保持时间一致性的同时处理长达数小时的视频内容。

对于超长上下文场景，团队又提出一个互补方案，分别针对不同的性能瓶颈。

KVCache太大，采用DuoAttention

注意力头本身就有分工：少数负责「全局检索」，多数只看「最近上下文」。

DuoAttention用混合策略，大幅降低显存，却几乎不掉性能。

预填充（Prefill）太慢，采用XAttention

利用反对角线评分机制，仅识别、计算必要的注意力块，从而实现显著的加速效果。

论文的最后，并没有止步于「优化现有模型」，通过对MoBA（块混合注意力）的信噪比分析，作者证明了：

理论上，block越小越好。

但现实是，GPU不答应，于是有了FlashMoBA，一种定制化的CUDA内核，使小块架构在实践中可行，并实现了最高可达9倍的速度提升。

这篇论文的价值在于，构建了一整套高效大模型的完整框架，既回应了当下的现实挑战，也为下一代计算高效、普惠可及的AGI奠定了基础。

平均350万年薪，碾压OpenAI

最后来到一个大家比较感兴趣的话题——薪资。

去年，硅谷人才争夺战激烈，BI一篇独家挖到了Thinking Machines（TML）给员工们开出的薪资——

基础年薪高达50万美元（约350万元）。

据BI获取的招聘数据，TML向两名技术员工支付了45万美元的基础年薪，另一名员工的年薪则高达50万美元。

第四名员工被列为「联合创始人/机器学习专家」，其年薪同样为45万美元。

这些薪酬数据，来自2025年第一季度，早于Murati以100亿美元的估值，成功完成20亿美元的种子轮融资。

总体来看，TML为这四名技术员工提供的平均年薪达到462,500美元。

相较之下，TML明显高于业内更为成熟LLM公司——

OpenAI在相关申报文件中列出的29名技术员工，平均年薪为292,115美元。

其中最高薪资为53万美元，最低为20万美元。

Anthropic向14名技术员工支付的平均年薪为387,500美元，薪资区间在30万至69万美元之间。

虽然比起Meta疯狂的超1亿美元薪酬还差得远，但这一水平也在硅谷数一数二。

果然，21世纪最贵的还是人才。

本文来源：新智元编辑：桃子

参考资料：

https://x.com/Guangxuan_Xiao/status/2008779396497502337

https://guangxuanx.com/

https://scholar.google.com/citations?user=sRGO-EcAAAAJ

https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

数学好物

最后再来关注一下

超模君精心研发的数学文化T恤！

原创版权设计

穿在身上的

不仅仅是信仰！

原价 269 元

超模君特惠价 139元！

加5元换购限量版公式之美钥匙扣

大家好，这是【超模君】项目的主理人中大数学博士【大Lee】的个人Vlog视频号，欢迎大家关注我的视频号。

喜欢《数学有什么用系列》记得关注超模君Vlog，点赞和点小爱心哦，

一路坚持，靠的是大家！

在这里我会争取日更（大家可以监督），一天一个主题。

在视频号，分享知识，见解，生活碎片，以及家庭生活的日常花絮。

最近在做【优质国货赋能】和【安全产品溯源】。也欢迎大家一起做云股东和云监工。

也希望大家可以一起留言互相讨论分享进步。

点击长按关注

简介：超模君，数学与交叉科学教育自媒体博主，中大数学博士，有俩崽崽和一洁癖的太太。爱分享有用的数学建模知识，爱深挖有趣的交叉科学人物故事，爱为靠谱的现代教育、提升幸福感的产品打call。著有《芥子须弥·大科学家的小故事》、《数学之旅：闪耀人类的54个数学家》、《漫画数学：闪耀人类的54个数学家》、《一份钟数学》（已售罄）、《薛定谔的猫：漫画大科学家的小萌宠》（已售罄）、超模君幽灵魔方、超模君丙烯马克笔等广受大人与孩子们喜爱的作品。

在这里，超模君不定期会有脑洞大开，和你分享一些新研发出来的，小而美的，有故事的，有知识的理工创意产品，期待与您分享。

熊猫配资提示：文章来自网络，不代表本站观点。

百进配资厉害！天才博士刚毕业，就被前OpenAI CTO抢走！年薪或300万起步

易宝配资药明康德跌0.32%, 成交额27.56亿元, 近5日主力净流入-1483.49万

宏源证券我国传染病疫情总体平稳，大部分地区流感降至中低流行水平

芝麻配资油画《毛主席去安源》：印刷了9亿多张，让我的家乡闻名全国

宝货配资景德镇凯悦酒店4.01亿元ABS项目更新至“已反馈”

安全配资今年前4个月新发ETF数量微增，但份额腰斩！这家机构狂揽近40亿元，怎么做到的？

财富策略梦幻西游【如梦似幻】25日开服，这三个福利信息你了解了么？_活动_礼包_新区

盈易点龙虎榜中榜岩山科技作手新一35亿入场，大盘缩量调整！

融期策略从来不害怕失败，反而成功常来的三个星座

美林配资 2025年5月27日全国主要批发市场荠菜价格行情

1亚新T+0配资财政部、证监会联合发布事关审计规范

2星星配资央行最新定调：加力支持科创、提振消费、小微企业、稳定外贸

3美林配资 2025年5月27日全国主要批发市场荠菜价格行情

4容新策略国家统计局：优化调整产能结构，促进工业品价格回归合理区间

5通弘网 A股三大指数收涨：创业板指涨1.59% 贵金属板块爆发

易宝配资 药明康德跌0.32%, 成交额27.56亿元, 近5日主力净流入-1483.49万

宏源证券 我国传染病疫情总体平稳，大部分地区流感降至中低流行水平

芝麻配资 油画《毛主席去安源》：印刷了9亿多张，让我的家乡闻名全国

宝货配资 景德镇凯悦酒店4.01亿元ABS项目更新至“已反馈”

安全配资 今年前4个月新发ETF数量微增，但份额腰斩！这家机构狂揽近40亿元，怎么做到的？

财富策略 梦幻西游【如梦似幻】25日开服，这三个福利信息你了解了么？_活动_礼包_新区

盈易点 龙虎榜中榜岩山科技作手新一35亿入场，大盘缩量调整！

融期策略 从来不害怕失败，反而成功常来的三个星座