2025年初,DeepSeek以其开源大模型技术席卷了海内外,一跃超过了OpenAI的ChatGPT,成为了历史上增长最快的应用程序。人们震惊地发现,DeepSeek达到1亿月活跃用户只用了7天,ChatGPT在推出两个月后用户过亿。而再往前,TikTok用时9个月,Instagram则耗时两年半。
OpenAI:非营利组织之初心
在DeepSeek出现之前,这十年来全球最令人瞩目的创新当属ChatGPT。其实,在ChatGPT出现之前,全世界都对人工智能技术的潜力半信半疑,它也并未得到美国政府的特别关注。
创立OpenAI的想法始于2015年的一次晚餐。在硅谷Rosewood酒店的晚餐上,萨姆·奥尔特曼(Sam Altman),埃隆·马斯克(Elon Musk),格雷格·布罗克曼(Greg Brockman),伊利亚·苏茨科弗(Ilya Sutskever)坐到了一起。
萨姆·奥尔特曼希望创建一间以“确保人工智能不会消灭人类”为使命的实验室,一间放弃所有研究成果的实验室——虽然OpenAI在2019年进行了重组,但最初的OpenAI是一家非营利组织,奥尔特曼希望没有任何竞争性的激励措施来扰乱这一使命。在这次晚餐之后,这一想法变成了现实。
OpenAI的几位初创者都是三十多岁的年轻人。首席执行官萨姆·奥尔特曼曾就读于斯坦福大学计算机系,20岁的时候退学了,转而开发移动应用程序Loopt,这是一款能实时分享用户位置的APP。28岁那年,奥尔特曼被Y Combinator的创始人选中,接替担任创业孵化器的CEO。
总裁格雷格·布罗克曼曾上过哈佛大学和麻省理工学院,但都以退学收场。格雷格高中毕业后没有立即上大学,在gap year期间,他读了图灵的《计算机与智能》,开始编写聊天机器人。大学期间,他发现了编程语言对自己的吸引力,开始频繁与创业公司的人接触,同时进行编程语言研究。大三那年他索性退学了,加入了一家初创公司Stripe。
首席科学家伊利亚·苏茨科弗出生于俄罗斯,5岁时跟随父母去了以色列,在耶路撒冷长大,16岁去往加拿大,最后来到美国。在加拿大期间,伊利亚师从多伦多大学深度学习先驱杰弗里·辛顿(Geoffrey Hinton)。职业生涯早期,伊利亚与人合著了关于序列到序列学习的论文,最著名的是2014年作为第一作者发表的论文“基于神经网络的序列到序列学习”(Sequence to Sequence Learning with Neural Networks)。
两个没有获得学位的美国人,一个外国移民,领着几十个研发人员组成了一家名叫OpenAI的小公司,采用当初包括Google在内的大公司都不看好的技术路线,搞出了足以撼动世界的生成式人工智能。
这样的事情是可以预见的吗?在《伟大不能被计划》一书中,作者(OpenAI的研究员)表示,如果你一开始就向着一个明确的目标努力,你就走不远。目标会窄化你的探索范围,对伟大事业来说,目标具有误导性。有时候,改变世界最好的方法,就是不要试图去改变它——也许你已经意识到,最好的点子往往都是偶然所得。
DeepSeek:好奇心是推动世界进步的动力
相比于OpenAI,发布了DeepSeek的幻方则神秘得多。幻方创始人梁文锋在20世纪80年代出生于广东湛江,父亲是一名小学教师。梁文锋在浙江大学完成了信息与电子工程本科与研究生学业,毕业后,他一直在探索全自动量化交易。2015年,梁文锋与同学一起创办了杭州幻方科技有限公司,抓住量化交易红利期的幻方量化迅速步入了快车道,于2021年年中突破了千亿元大关。
坊间有人戏称,梁文锋是用炒股赚来的钱投资人工智能的研究。2023年4月14日,幻方发布了《幻方新征程》,引用了法国新浪潮导演弗朗索瓦·特吕弗(Fran?ois Truffaut)曾经告诫青年导演的一句话:“务必要疯狂地拥抱雄心,同时要疯狂地真诚”,宣布幻方即将迈出新的一步,追寻一直以来的技术理想,成立新的独立研究组织探索AGI的本质。
DeepSeek不参与融资,也很少对外发声。从2023年和2024年暗涌对梁文锋的两次专访中,人们才得以一窥DeepSeek的究竟。
DeepSeek选人的标准一直都是热爱和好奇心,DeepSeek寻求的好奇心,是对AI能力边界的好奇。梁文锋认为,创新首先是信念问题,硅谷富有创新精神的首要原因就是敢。
在DeepSeek的团队中,并没有什么高深莫测的奇才,都是一些国内Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。有很多大模型公司都执着地去海外挖人,甚至有很多人觉得,大模型领域前50名的顶尖人才可能都不在中国的公司,然而DeepSeek v2模型的开发者没有从海外回来的人,都是国内本土培养的年轻人。“前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”梁文锋强调。
DeepSeek的组织架构是自下而上的,一般不前置分工,而是自然分工。梁文锋认为,每个人都有自己独特的成长经历,都是自带想法的,不需要人推动,在探索的过程中,遇到问题就会拉人讨论。当一个想法显示出潜力时,DeepSeek就会自上而下地调配资源。2024年,DeepSeek的MLA创新的点子最早来自于一个年轻研究员的个人兴趣:他突发奇想去设计一个替代Attention架构的方案,于是DeepSeek特意成立了一个小组花了几个月的时间跑通。
开源对闭源的胜利
DeepSeek的技术并不是护城河,人才是。在梁文锋看来,作为商业组织,DeepSeek选择了创新,又通过开源分享创新,是因为公司将价值沉淀在团队上,成员可以得到成长,积累认知,形成可以创新的组织和文化,这就是DeepSeek的护城河。开源、发论文并没有让DeepSeek失去什么,开源更像是一种文化行为,而非商业行为——对于技术人员而言,被follow是很有成就感的事。其实,开源更像是一个文化行为,而非商业行为。
OpenAI不Open。西方有句玩笑话:Rhode Island is neither a road nor an island. OpenAI may be producing AI, but it's not open.(罗德岛既不是公路也不是岛, OpenAI也许在制造AI,但它不Open)。OpenAI创立之初,曾经承诺将其产品向所有人免费提供,自成立以来也发布了包括Gym、TensorFlow Agents的多个开源项目,然而随着商业化,OpenAI选择了闭源,原因是“需要保护知识产权以及希望从研究中获得收入”。
图灵奖得主杨立昆(Yann Lecun)认为,DeepSeek对OpenAI的胜利,是开源对闭源的胜利。然而,技术的发展一日千里,正如清华大学李星教授所言,DeepSeek若要持续保持领先地位,还需要不断地创新。未来,我们拭目以待。
来源:《中国教育网络》
撰文:陈茜