这家中国公司让硅谷难安只招1%的天分 (这家中国公司,让全球年轻人疯狂)

admin1 22小时前阅读数 32 #银行

OpenAI的最强对手发生了，这一次性性来自中国。

2025年一开年就火遍全球的DeepSeek（深度求索），1月20日早晨演了一场“偷袭珍珠港”——公布推理模型 DeepSeek-R1 正式版， 同步开源模型权重，并支持用户运行模型输入、经过模型蒸馏等形式训练其他模型。这款大模型在数学、代码、天然言语推理等义务上，性能比肩OpenAI o1正式版。

R1版本的推出，在海外被惊呼“这才是真正的开通的人工智能”。英伟达初级研讨迷信家Jim Fan在评价R1模型时就这样说道：“我们生活在这样一个时代：一个不是美国公司的AI企业却成功了 OpenAI成立时的使命——做真正开通的前沿研讨、为一切人赋能。”

凤凰网科技在此前的文章《 英伟达的最大空头发生了 》中曾详细引见过深度求索（DeepSeek）和其系列大模型的中心竞争力来源，如今看来，DeepSeek的创新含金量还在上升。

随着DeepSeek的创新实力成为全球热议议题，外界也愈发关注，这家中国外乡科技公司及其面前的掌舵人，终究有何特地之处？

一个浙大学霸，勇闯无人区

1985年，梁文锋出生于广东湛江的一个五线城市。其详细的童年生长轨迹已无法考，从地下信息独一可知的是，梁文锋有在采访中提到过自己的父亲是一名小学教员。

2002年，17岁的梁文锋仰仗优秀效果考入浙江大学电子信息工程专业。2007年，22岁的梁文锋又考上了浙江大学信息与通讯工程专业硕士。师从项志宇，关键做机器视觉研讨。

2008年，23岁的梁文锋在浙江大学攻读硕士学位时期，与同窗组建团队，末尾搜集市场行情、金融市场相关数据以及微观经济数据。这一年，他率领团队运用机器学习技术探求全智能量化买卖，而事先正值全球金融危机的迸发。

有信息称，大疆开创人汪滔曾约请梁文锋共同创业，彼时大疆正处于起步阶段。 假定梁文锋参与，或许也能在大疆的展开中成功财富自在。但梁文锋坚信人工智能将改动全球，最终选择独立创业。

2010年6月，25岁的梁文锋从浙江大学信息与通讯工程专业硕士毕业，其毕业论文标题为《基于低本钱PTZ摄像机的目的跟踪算法研讨》。

硕士毕业后的第三年，28岁的梁文锋将人工智能与量化买卖结合，和浙江大学的徐进校友创立了雅克比投资（杭州雅克比投资控制有限公司）。 2015年，他们共同创立杭州幻方科技有限公司，也就是今天的浙江九章资产控制有限公司，次年又成立了宁波幻方量化投资控制合伙企业（有限合伙）。

所谓量化投资，深上天说就是用计算机取代人，经过数量化形式，程序化收回买卖指令，投资收益较为稳如泰山。

经过几年时期，幻方量化就在国际迅速崛起。2016年10月，幻方量化推出第一个AI模型，第一份由深度学习生成的买卖仓位上线行动。 到2017年底，简直一切的量化战略都采纳AI模型计算。 2019年，幻方量化控制规模打破百亿，成为国际量化私募“四巨头”之一。

尔后的幻方量化甚至一度成为中国首家打破千亿的私募量化大厂，准确地说也是迄今为止业内独一规模曾迈过千亿大关的量化私募。这时期梁文锋在量化投资范围积聚了弱小的技术实力和算力资源，幻方量化以弱小的算力支持知名。

2023年，全球人工智能热潮迸发，梁文锋也到来了他创业之路的第十个年头。

当年5月，38岁的梁文锋宣布要做通用人工智能（AGI）。7月，杭州深度求索人工智能基础技术研讨有限公司（DeepSeek）成立，专注于AI大模型的研讨与开发。梁文锋也成为量化投资者投身AI创业的“第一人”。

之后便是爽文剧本式的“AI界拼多多”崛起之路，就连大厂也只能是跟随， “在豆包和阿里云之前，DeepSeek最先在全网下降了模型本钱”，一位AI算法工程师对凤凰网科技表示，这让他印象十分深化。

2024年5月，DeepSeek公布的DeepSeek V2的开源模型率先拉起了行业内的多少钱战。DeepSeek V2提供了一种史无前例的性价比：推理本钱被降到每百万token仅1块钱，约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

同年12月26日，仅仅时隔7个月，DeepSeek就又公布了DeepSeek V3，再次推翻了行业关于多少钱的认知。DeepSeek V3的API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中），输入每百万tokens 8元，与字节Doubao-pro-256k定价输入每百万tokens 5元，输入每百万tokens 9元的水平相当，在国产模型中性价比继续优化。

如今，当行业还沉溺在DeepSeek V3的震撼中时，DeepSeek-R1正式版又来了。这一次性性，DeepSeek真正引发了硅谷的恐慌。

微软CEO萨蒂亚・纳德拉在瑞士达沃斯全球经济论坛上表示：“看到DeepSeek的新模型，真的令人印象十分深化。他们实践有效地开收回了一款开源模型，在推理计算方面表现出色，且超级计算效率极高。”

“我们肯定十分、十分细心肠看待中国的这些进度，”纳德拉说。

DeepSeek的珍贵之处，仍是创新

“DeepSeek确实有过人之处，业内都觉得他们或许是用了一些o1的数据做蒸馏，但在算法层面做了更好的创新”， 一位行业从业人士以为。

在刚刚成立的一年多时期里，DeepSeek不时不声不响，据凤凰网科技了解，这家公司甚至没有设立公关团队。致使于，当少数大模型公司都在争声量，抢时期的时辰，DeepSeek在闷声尝试创新。

DeepSeek的创新也是自下而上，简直存在于整个公司外部。比如，时至今天，梁文锋的日常照旧是看论文、写代码、介入小组讨论。是少有的能堪比一线研讨员才干的公司掌舵者。

由于一末尾的目的就是AGI，所以DeepSeek历来不做跟随战略，即像其他商业类公司一样，选择跟随全球最先进的模型，用短平快的形式做好运行，而是在模型结构层面做从0-1的创新。

在接受《暗涌》采访时，梁文锋也曾明白地表达，“由于我们觉得如今最关键的是介入到全球创新的浪潮里去。过去很多年，中国公司习气了他人做技术创新，我们拿过去做运转变现，但这并非是一种天经地义。这一波浪潮里，我们的动身点，就不是趁机赚一笔，而是走到技术的前沿，去推进整个生态展开”。

过去，碍于人才造成和资本实力，中国企业做的往往是有限的创新，但现如今，强如字节等企业，曾经有数百亿美元规模的年度利润。 据凤凰网科技此前得知，字节豆包大模型团队已在外部组建AGI终年研讨团队，代号“Seed Edge”。

这意味着，创新已不再是难题，难的是如何坚持人才密度，以及拥有自信。

据多位与DeepSeek有过接触的行业人士表述，DeepSeek的优点之处就在于人才密度极高，且多来自于中国外乡市场。

“DeepSeek从一末尾团队就是百人左右规模，但个个都很抗打”，一位AI行业猎头对凤凰网科技表示，“其实早期Kimi也曾想走这个路途，只是没有特地成功。”

另一位与DeepSeek有过接触的行业人士称， “DeepSeek给出的薪酬待遇十分具有竞争力，这让其不时对人才有很强的吸引力”。

此前据多家媒体报道，雷军曾亲身出手“挖deepseek的人”，支付的薪酬则在千万元级别。这集团正是DeepSeek-V2的关键开发者之一罗福莉，一个95后。

据量子位整理资料发现，DeepSeek团队最大的特点就是年轻。应届生、在读生，特地是来自清北的应届生在其中十分生动。

“只招1%的天分，去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘品格。

这也使得DeepSeek全员上下，都坚持着极致的创。

梁文峰在接受《暗涌》采访时相同表达过一个观念：DeepSeek在招人时关键看才干，而不是看阅历。“我们的中心技术岗位，基本以应届和毕业一两年的人为主”。并且梁文锋还表达，“V2模型没有海外回来的人，都是外乡的。前50名顶尖人才或许不在中国，但也许我们能自己打造这样的人。”

和上一代功成名就的故事不同，DeepSeek代表的是一个硬核创新时代的到来。上一代的成功人士是属于互联网的，他们在技术层面的打破并不多，更多是拼速度、拼资本、拼规模。

一个可喜的信号是，DeepSeek不是孤例，相同来自杭州外乡市场，宇树科技最新推出的B2-W相同冷傲全球，宇树科技的开创人兼CEO王兴兴，本科就读于浙江理工大学机械与智能控制学院机电专业，本科毕业后进入上海大学攻读机械工程专业研讨生。

我们也有理由置信，中国科技创新的故事曾经翻入了新一页。

版权声明

本文来自网络，不代表本站立场，内容仅供娱乐参考，不能盲信。
未经许可，不得转载。

上一篇：1个月国股转贴票据利率上传100BP 票据行情飙升冲信贷开门红 (国投转股价) 下一篇：京沪深二手房周成交面积环比表现弱于二线城市京沪深全体环比降13% 二手房延续两周降温 (京沪山庄二手房出售)

这家中国公司让硅谷难安 只招1%的天分 (这家中国公司,让全球年轻人疯狂)

版权声明

作者文章

这家中国公司让硅谷难安只招1%的天分 (这家中国公司,让全球年轻人疯狂)