梁文锋的DeepSeek让AI界惊艳,40岁的他引领中国科技发展

座谈会上,这位年轻AI创始人,用不到竞争对手十分之一的成本,打造出了性能比肩全球顶尖水平的大模型,改变了全球AI竞争的规则。。

他就是国产大模型企业深度求索(DeepSeek)创始人梁文锋,这个向来低调的科技创业者,名字首次出现。

他的另一个身份是头部量化私募幻方的创始人,创业范畴横跨金融和人工智能领域。

这位出生于1985年的广东湛江人,17岁考入浙江大学,30岁创办幻方量化,他的职业生涯起步于金融领域,在2015年市场波动中,幻方依靠高频量化策略取得了瞩目成绩。

2016年,他带领公司推出了首个基于深度学习的交易模型,随着业务扩张,算力瓶颈逐渐显现,梁文锋投入近2亿元自主研发“萤火一号”训练平台,搭载了1100块GPU。

到了2021年,幻方资产管理规模突破千亿,36岁的梁文锋成为私募界的一颗明星,就在外界以为他将专注于金融领域时,他却转身投入了通用人工智能的赛道。

2023年7月,梁文锋成立了深度求索(DeepSeek),这是他真正的激情所在。

2024年底,DeepSeek-V3模型火爆全球,这个模型最令人震惊的特点是它的训练成本仅为557.6万美元。

相比之下,OpenAI训练ChatGPT-4o所花费的成本高达7800万到1亿美元,相差超过10倍。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面却超过了ChatGPT-4o。

更令人惊讶的是,这个成绩是由一个仅有139名研发人员的团队创造的。对比拥有1200名研究人员的OpenAI团队,DeepSeek的员工规模连对手的九分之一都不到。

梁文锋曾说:“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”

这句看似谦虚的话,背后是他对AI技术路径的根本性革新。与传统“大水漫灌式”的训练方法不同,DeepSeek先利用算法对数据进行总结和分类,然后才输送给大模型。

雷军作为中国科技企业家的代表人物,对技术创新有着敏锐嗅觉。2025年3月,他在全国两会代表通道上表示,过去5年小米研发投入约1050亿元,全球用户越来越认可中国科技创新的价值。

他当时还宣布,未来5年小米计划再投入2000亿元研发资金。这些数字展示了中国科技企业追赶世界前沿的决心,但也凸显了技术创新的高成本门槛。

而梁文锋所做的,恰恰是打破了“高投入才能有高产出”的行业迷思。他的成功让包括雷军在内的整个科技圈开始重新思考技术创新的路径。

一个有趣的插曲是,雷军曾以千万年薪试图挖走DeepSeek团队的一位95后AI天才少女。

这位年轻研发人员选择留在DeepSeek,或许正是看中了梁文锋打造的这种纯粹追求技术理想的环境。

如果说DeepSeek-V3让世界注意到了这家中国AI公司,那么DeepSeek-R1则真正让全球科学界为之震动。2025年1月发布的这个模型,在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。

但真正具有里程碑意义的事件发生在2025年9月,梁文锋及其团队在《自然》杂志上发表了关于DeepSeek-R1训练方法的封面论文。

这是全球首个经过同行评审的主流大语言模型,打破了这一领域的空白。《自然》杂志评价道:“目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白‘终于被DeepSeek打破’。”

更令人惊讶的是论文中披露的训练成本:构建基础LLM投入600万美元,而R1模型的训练成本仅29.4万美元。这个数字让全球AI研究者重新审视效率与创新的关系。

与大多数科技公司不同,DeepSeek选择了一条开源的道路。梁文锋不仅将R1模型训练技术全部公开,还蒸馏了6个小模型开源给社区。他的团队在论文中明确表示,希望“促进技术社区的充分交流与创新协作”。

这种开放姿态在商业上看似冒险,却赢得了全球开发者的尊重。截至2025年9月,DeepSeek-R1在开源社区HuggingFace上的下载量已超过1090万次,是同类模型中最受欢迎的。

梁文锋曾经对商业模式保持清醒:“如果一定要找一个商业上的理由,它可能是找不到的,因为划不来。”对他而言,推动整个生态发展比短期商业回报更重要。

梁文锋的横空出世,恰逢中国科技从“模仿者”向“创新者”转变的关键时期。2025年,他入选美国《时代》周刊“2025年全球最具影响力100人”榜单,同年又被《自然》杂志评为年度十大人物,被定义为“科技颠覆者”。

他的成功不是孤例。与此同时,杜梦然带领团队搭乘“奋斗者”号载人深潜器,在9000多米深的超深渊带发现了地球已知最深的化能自养生态系统。

这些在不同领域取得的突破,共同印证了中国科技创新的全面崛起。

梁文锋曾指出:“DeepSeek象征着中国科技从‘模仿者’到‘创新者’的加速转型。”这种转型不仅体现在技术成果上,更体现在创新思维和方法论的突破上。

就在雷军宣布未来五年投入2000亿研发资金的同时,梁文锋的团队正用不到30万美元的成本训练出世界级AI模型。

这位40岁的创业者登上《自然》杂志封面的那一刻,手中拿着的不是千亿投资计划,而是一篇详述如何用极高效率实现技术突破的论文。

他的存在本身,就是对中国科技圈最有力的提醒:真正的创新,有时需要的不是更多的资源,而是不同的思维方式。

免责声明:文章描述过程、图片都来源于网络,此文章旨在倡导社会正能量,无低俗等不良引导。如涉及版权或者人物侵权问题,请及时联系我们,我们将第一时间删除内容!如有事件存疑部分,联系后即刻删除或做出更改