这家中国公司让硅谷难安 只招1%的天分 (这家中国公司,让全球年轻人疯狂)
OpenAI的最强对手发生了,这一次性性来自中国。
2025年一开年就火遍全球的DeepSeek(深度求索),1月20日早晨演了一场“偷袭珍珠港”——公布推理模型 DeepSeek-R1 正式版, 同步开源模型权重,并支持用户运行模型输入、经过模型蒸馏等形式训练其他模型。这款大模型在数学、代码、天然言语推理等义务上,性能比肩OpenAI o1正式版。
R1版本的推出,在海外被惊呼“这才是真正的开通的人工智能”。英伟达初级研讨迷信家Jim Fan在评价R1模型时就这样说道:“我们生活在这样一个时代:一个不是美国公司的AI企业却成功了 OpenAI成立时的使命——做真正开通的前沿研讨、为一切人赋能。”
凤凰网科技在此前的文章《 英伟达的最大空头发生了 》中曾详细引见过深度求索(DeepSeek)和其系列大模型的中心竞争力来源,如今看来,DeepSeek的创新含金量还在上升。
随着DeepSeek的创新实力成为全球热议议题,外界也愈发关注,这家中国外乡科技公司及其面前的掌舵人,终究有何特地之处?
一个浙大学霸,勇闯无人区
1985年,梁文锋出生于广东湛江的一个五线城市。其详细的童年生长轨迹已无法考,从地下信息独一可知的是,梁文锋有在采访中提到过自己的父亲是一名小学教员。
2002年,17岁的梁文锋仰仗优秀效果考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上了浙江大学信息与通讯工程专业硕士。师从项志宇,关键做机器视觉研讨。
2008年,23岁的梁文锋在浙江大学攻读硕士学位时期,与同窗组建团队,末尾搜集市场行情、金融市场相关数据以及微观经济数据。这一年,他率领团队运用机器学习技术探求全智能量化买卖,而事先正值全球金融危机的迸发。
有信息称,大疆开创人汪滔曾约请梁文锋共同创业,彼时大疆正处于起步阶段。 假定梁文锋参与,或许也能在大疆的展开中成功财富自在。但梁文锋坚信人工智能将改动全球,最终选择独立创业。
2010年6月,25岁的梁文锋从浙江大学信息与通讯工程专业硕士毕业,其毕业论文标题为《基于低本钱PTZ摄像机的目的跟踪算法研讨》。
硕士毕业后的第三年,28岁的梁文锋将人工智能与量化买卖结合,和浙江大学的徐进校友创立了雅克比投资(杭州雅克比投资控制有限公司)。 2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产控制有限公司,次年又成立了宁波幻方量化投资控制合伙企业(有限合伙)。
所谓量化投资,深上天说就是用计算机取代人,经过数量化形式,程序化收回买卖指令,投资收益较为稳如泰山。
经过几年时期,幻方量化就在国际迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的买卖仓位上线行动。 到2017年底,简直一切的量化战略都采纳AI模型计算。 2019年,幻方量化控制规模打破百亿,成为国际量化私募“四巨头”之一。
尔后的幻方量化甚至一度成为中国首家打破千亿的私募量化大厂,准确地说也是迄今为止业内独一规模曾迈过千亿大关的量化私募。这时期梁文锋在量化投资范围积聚了弱小的技术实力和算力资源,幻方量化以弱小的算力支持知名。
2023年,全球人工智能热潮迸发,梁文锋也到来了他创业之路的第十个年头。
当年5月,38岁的梁文锋宣布要做通用人工智能(AGI)。7月,杭州深度求索人工智能基础技术研讨有限公司(DeepSeek)成立,专注于AI大模型的研讨与开发。梁文锋也成为量化投资者投身AI创业的“第一人”。
之后便是爽文剧本式的“AI界拼多多”崛起之路,就连大厂也只能是跟随, “在豆包和阿里云之前,DeepSeek最先在全网下降了模型本钱”,一位AI算法工程师对凤凰网科技表示,这让他印象十分深化。
2024年5月,DeepSeek公布的DeepSeek V2的开源模型率先拉起了行业内的多少钱战。DeepSeek V2提供了一种史无前例的性价比:推理本钱被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。
同年12月26日,仅仅时隔7个月,DeepSeek就又公布了DeepSeek V3,再次推翻了行业关于多少钱的认知。DeepSeek V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输入每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输入每百万tokens 9元的水平相当,在国产模型中性价比继续优化。
如今,当行业还沉溺在DeepSeek V3的震撼中时,DeepSeek-R1正式版又来了。这一次性性,DeepSeek真正引发了硅谷的恐慌。
微软CEO萨蒂亚・纳德拉在瑞士达沃斯全球经济论坛上表示:“看到DeepSeek的新模型,真的令人印象十分深化。他们实践有效地开收回了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”
“我们肯定十分、十分细心肠看待中国的这些进度,”纳德拉说。
DeepSeek的珍贵之处,仍是创新
“DeepSeek确实有过人之处,业内都觉得他们或许是用了一些o1的数据做蒸馏,但在算法层面做了更好的创新”, 一位行业从业人士以为。
在刚刚成立的一年多时期里,DeepSeek不时不声不响,据凤凰网科技了解,这家公司甚至没有设立公关团队。致使于,当少数大模型公司都在争声量,抢时期的时辰,DeepSeek在闷声尝试创新。
DeepSeek的创新也是自下而上,简直存在于整个公司外部。比如,时至今天,梁文锋的日常照旧是看论文、写代码、介入小组讨论。是少有的能堪比一线研讨员才干的公司掌舵者。
由于一末尾的目的就是AGI,所以DeepSeek历来不做跟随战略,即像其他商业类公司一样,选择跟随全球最先进的模型,用短平快的形式做好运行,而是在模型结构层面做从0-1的创新。
在接受《暗涌》采访时,梁文锋也曾明白地表达,“由于我们觉得如今最关键的是介入到全球创新的浪潮里去。过去很多年,中国公司习气了他人做技术创新,我们拿过去做运转变现,但这并非是一种天经地义。这一波浪潮里,我们的动身点,就不是趁机赚一笔,而是走到技术的前沿,去推进整个生态展开”。
过去,碍于人才造成和资本实力,中国企业做的往往是有限的创新,但现如今,强如字节等企业,曾经有数百亿美元规模的年度利润。 据凤凰网科技此前得知,字节豆包大模型团队已在外部组建AGI终年研讨团队,代号“Seed Edge”。
这意味着,创新已不再是难题,难的是如何坚持人才密度,以及拥有自信。
据多位与DeepSeek有过接触的行业人士表述,DeepSeek的优点之处就在于人才密度极高,且多来自于中国外乡市场。
“DeepSeek从一末尾团队就是百人左右规模,但个个都很抗打”,一位AI行业猎头对凤凰网科技表示,“其实早期Kimi也曾想走这个路途,只是没有特地成功。”
另一位与DeepSeek有过接触的行业人士称, “DeepSeek给出的薪酬待遇十分具有竞争力,这让其不时对人才有很强的吸引力”。
此前据多家媒体报道,雷军曾亲身出手“挖deepseek的人”,支付的薪酬则在千万元级别。这集团正是DeepSeek-V2的关键开发者之一罗福莉,一个95后。
据量子位整理资料发现,DeepSeek团队最大的特点就是年轻。应届生、在读生,特地是来自清北的应届生在其中十分生动。
“只招1%的天分,去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘品格。
这也使得DeepSeek全员上下,都坚持着极致的创。
梁文峰在接受《暗涌》采访时相同表达过一个观念:DeepSeek在招人时关键看才干,而不是看阅历。“我们的中心技术岗位,基本以应届和毕业一两年的人为主”。并且梁文锋还表达,“V2模型没有海外回来的人,都是外乡的。前50名顶尖人才或许不在中国,但也许我们能自己打造这样的人。”
和上一代功成名就的故事不同,DeepSeek代表的是一个硬核创新时代的到来。上一代的成功人士是属于互联网的,他们在技术层面的打破并不多,更多是拼速度、拼资本、拼规模。
一个可喜的信号是,DeepSeek不是孤例,相同来自杭州外乡市场,宇树科技最新推出的B2-W相同冷傲全球,宇树科技的开创人兼CEO王兴兴,本科就读于浙江理工大学机械与智能控制学院机电专业,本科毕业后进入上海大学攻读机械工程专业研讨生。
我们也有理由置信,中国科技创新的故事曾经翻入了新一页。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。