王维嘉 DeepSeek尚有余以撼动中美AI差距格式 (王维嘉的扮演者是谁)
从技术格式来看,虽然DeepSeek的效果参与了中美在人工智能技术上的差距,但中美人工智能全体魄局尚未被撼动。
媒体注 :本文为硅谷著名企业家&投资家、《暗知识》作者王维嘉在一个企业家社群里的讨论要点,媒体APP经授权公布,并略经编辑。
眼下科技圈最关注的莫过于Deepseek事情。网络上充溢着各种技术与财务剖析。在此,我愿分享一些集团见地,以期为诸位提供更明晰的思绪。
技术创新的探求之路
我在硅谷任务了40年,对技术创新有着深化的体会。技术创新似乎在大山中寻觅金矿。虽然有人指出大山中存在金矿,但详细位置却无人知晓。因此,众多探求者涌入,各自寻觅不同的方向。
回想人工智能展开历程,自 2012 年图像识别取得初次打破,到后来人工智能在围棋范围的运转,我们可将其视为人工智能 1.0 阶段。彼时,硅谷乃至全球人工智能行业关键聚焦于图像识别和视频识别范围。
2017年,谷歌推出Transformer模型,聚焦言语翻译,尤其是英文与法文之间的翻译。但是,谷歌在成功相关研讨后,并未深化探求,由于事先业界普遍以为言语翻译市场有限,远不及图像识别和视频识别范围。
但是,OpenAI 另辟蹊径,洞察到言语范围的广阔前景。人类智慧多以言语出现,因此 OpenAI 全力投入研发。虽然事先OpenAI 资源匮乏,与谷歌、微软等巨头相比,人力、财力均相差悬殊,但他们仰仗敏锐的洞察力,于2022年11月公布了ChatGPT。
这似乎在众人行走的阳光小道旁发现了一条小岔道,OpenAI 一头扎出来,竟异常发现了一座金矿,引发了行业的震动。众多从业者纷繁涌入,将此范围开拓成新的阳光小道。
尔后,行业预训练模型一直加大规模和数据量,但逐渐迷失方向。在此环节中,OpenAI 又做出了新的奉献 —— 推理学习。研讨发现,在模型规模并非极大的状况下,经过精心训练推理才干,模型性能可成功大幅优化。2024年 9 月 24 日,OpenAI 公布 o1 model,再一次性性为行业开拓了新的途径。
在这一探求环节中,全球团队,尤其是美国团队,发明了诸多工具,似乎更尖锐的砍刀与铲子,助力各团队在荆棘丛生的探求之路上减速前行。
DeepSeek的开源理想和成功偶然性
DeepSeek可谓一支怀揣技术理想的团队。他们坚持开源,与通常抢先者秘而不宣的做法不同,选择借助全球智慧共同推进技术展开。
在技术展开中,抢先者通常会对中心技术有所保管,而落后者则偏向于经过开源集聚全球智慧推进度开,如 Meta(Facebook)在与OpenAI 的竞争中选择开源。由于开源是一种相似公益社区的精气,阿拉善的企业家就会比拟更能了解,就是哪怕不知道有没有收获,但是仍会选择付出。
美国有开源的文明,比如软件的开源Linux,比如Wikipedia做成了全全球的字典,中国事先也来拷贝,结果做的很差。在中国,开源文明并不深沉,DeepSeek 能坚持开源,将优质效果与全球共享,实属难得。这表现了美国开源社区精气对中国年轻程序员和企业家的影响,虽然这种影响在国际仍较为稀缺。
团队中心人物梁文锋自2013年便末尾运用机器学习启动量化投资,团队在机器学习范围已有十余年的阅历积聚。在技术敏感度上,他们或许早在 ChatGPT 之前就已末尾经常经常使用 transformer 开发大言语模型,如 2019 年或许就已启动相关任务。同时,团队集聚了一批国际顶尖人才,在技术探求中,他们运行祖先开发的先进工具,在推理模型的基础上又发现了一条新途径 —— 完全智能训练,区别于 OpenAI 的人工训练方式,降低了本钱。
这种智能推理训练相似于 AlphaGo zero 的方式。AlphaGo 击败李世石后,谷歌工程师尝试让 AlphaGo zero 不依赖人类阅历从头学习,结果在短时期内,AlphaGo zero 便跨越了击败李世石的旧版 AlphaGo。DeepSeek 在这一途径上深化探求并取得成功,虽然其奉献水平不及 ChatGPT 和推理训练的发现,但也可谓自 ChatGPT 以来第三大关键奉献,将推理本钱降低了两个数量级。
从技术格式来看,虽然 DeepSeek 的效果参与了中美在人工智能技术上的差距,但中美人工智能全体魄局尚未被撼动。
在人工智能技术的几个关键方面,芯片范围中国仍与美国存在较大差距;在算法打破方面,过去十年间,从 2012 年的 alexnet 到2017 年的 transformer,再到 2022 年的 ChatGPT 以及后续的思想链、RAG 和推理训练等严重打破,大多出现在美国,法国的 Mistral 公司也有大批奉献,DeepSeek 的奉献占比约为 5%,但这已然十分了不起。
DeepSeek的成功在肯定水平上具有偶然性。在一个充溢偶然性的迷信探求环节中,众多团队在不同的方向上探求,总会有某个团队率先取得打破。中国拥有庞大的 AI 基础和工程师队伍,经过30年的展开,曾经与西方树立了良好的交流基础。因此,中国出现像 DeepSeek 这样的团队并不令人异常。这相似于苏联在1957年成功发射第一颗自然卫星,其面前是美国在两次全球大战时期对苏联技术的开放,使得苏联培育了弱小的技术基础。但是,一旦苏联闭关锁国,这种技术才干便迅速衰退。
AI浪潮前景广阔,目前仍处起步阶段
在商业和股市层面,人工智能范围的展开与英伟达亲密相关。我在2017 年《暗知识》一书便指出,AI 时代的芯片霸主是英伟达,事先其市值约三百亿美元,尔后涨幅近百倍。
近期美国股市大跌,部分要素是市场以为算法效率提高会参与对算力的需求,进而降低对英伟达等芯片的依赖。但这是一种静态思想,正如 19 世纪英国经济学家杰文斯发现的一个现象:当蒸汽机的效率大幅优化后,煤炭的消耗量并未参与,反而大幅介入。这一现象被称为“杰文斯悖论”(Jevons Paradox)。其面前的逻辑是:虽然单台蒸汽机的煤炭消耗量参与了,但由于蒸汽机变得愈加经济高效,人们末尾在更多范围普遍经常经常使用蒸汽机,从而形成蒸汽机的总数大幅介入,最终使得煤炭的总消耗量不降反升。
同理,AI 模型本钱降低将推进 AI 运转的普遍拓展,对芯片的需求也会随之增长。过去,AI 运转面临的一大阻碍是本钱高昂。以 ChatGPT 为例,用户每次提问都要求支付费用,且随着疑问复杂度的介入,计算本钱呈指数级上升。例如,回答一个方便疑问如“唐朝的第一任皇帝是谁”或许瞬间成功,而回答一个复杂疑问如“唐宋之变的中心要素是什么”则要求启动深化剖析和佐证,计算时期或许介入百倍甚至更多。
如今,AI 曾经展开到可以作为智能代理(agent)为用户提供片面服务的阶段。例如,用户方案前往巴西游览,AI 可以像公家助理一样,从行程规划到酒店预订,再到机票置办,全程提供服务。这一环节的计算本钱或许是方便问答的万倍以上。假定每次服务的费用高达10000元人民币,用户或许会望而生畏;但假定费用降至100元,用户则会毫不犹疑地经常经常使用。因此,低本钱的 AI 模型将极大地扩充 AI 的运转场景,或许成功百倍、千倍甚至万倍的增长。
关于 Deepseek,外界关注其芯片经常经常使用量以及能否存在数据盗用疑问。但从其市场定价来看,每次访问本钱仅为 OpenAI 的 1/30 且仍有利润,这标明其在本钱控制上传之有效,至于其他疑问,目前并无确凿证据,且对其技术价值和市场影响的判别并非关键。
DeepSeek 未来能否继续取得严重打破仍是一个未知数。随着团队的知名度优化,政府的高要求和大公司的高薪挖角,或许会对其地道的技术追求出现不利影响。能否在这种环境下据守技术理想,继续前行,是一个值得打问号的疑问。
AI 浪潮的前景极为广阔,目前仍处于起步阶段,未来十年甚至二十年仍将蓬勃展开。与互联网在20世纪90年代末和21世纪初的展开相似,AI 有望在未来十年到二十年内成功严重打破。
更为关键的是,AI 的潜力终究有多大?目前,包括 OpenAI、Anthropic、Google、微软在内的各大实验室都在积极研发通用人工智能(AGI)。AGI 的定义是:机器能够成功人类绝大部分的智力活动。依据目前的研讨进度,AGI 的出现时期或许在两年到五年之间。假定 AGI 成为理想,其市场规模将极为庞大,有望逾越互联网市场,抵达数万亿美元甚至数十万亿美元的规模。
DeepSeek 的技术打破进一步证明了人类有或许以较低本钱成功 AGI。假定 AI 的本钱过高,甚至逾越人力本钱,那么其运转范围将遭到限制。正如中国许多消费线依然经常经常使用人工而非,由于人工本钱更低。只需当机器人的本钱远低于人工时,机器人才干普遍普及。DeepSeek 在降低 AGI 本钱方面做出了严重奉献,这一点十分值得必需。
总之,DeepSeek 的成功是中国 AI 范围的一大幸事,其技术打破虽有偶然性,但更多源于团队终年的技术积聚和坚决的理想。在 AI 这场漫长的征程中,DeepSeek 曾经迈出了坚实的第一步,未来能否继续引领潮流,还需时期的检验。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。