支配硅谷!Meta被曝组建4个小组专门研讨 DeepSeek 恐惧感

admin1 1天前 阅读数 45 #财经

中国企业深度求索开发的大模型DeepSeek继续引发业内震动。硅谷对DeepSeek的“恐惧”不只是说说而已,巨头Meta已成立专门小组发展研讨和学习。

1月27日,据Information网站,脸书母公司Meta成立了四个专门研讨小组来研讨量化巨头幻方量化旗下的国产大模型DeepSeek的任务原理,并基于此来改良旗下大模型Llama。

其中两个小组正在试图了解幻方量化如何下降训练和运转DeepSeek的本钱;第三个研讨小组则正在研讨幻方量化或许经常经常使用了哪些数据来训练其模型;第四个小组正在思索基于DeepSeek模型属性重构Meta模型的新技术。

Deepseek来自国产大模型公司深度求索,其面前是量化巨头幻方。1月20日,DeepSeek正式发布推理大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、天然言语推理等义务上的性能能够比肩OpenAI o1模型正式版,并采纳MIT容许协议,支持不要钱商用、恣意修正和衍生开发等。

据DeepSeek引见,R1的预训练费用只需557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运转55天成功,仅是OpenAI GPT-4o模型训练本钱的不到十分之一。

一经推出,DeepSeek-R1便仰仗其“物美价廉”的特性在海外开发者社区中引发了惊扰,更是仰仗极低的训练本钱震撼了硅谷。

DeepSeek发布后不久,Meta首席行动官马克·扎克伯格就宣布,Meta方案在2025年投入超600亿美元,加大对人工智能的投入。扎克伯格自己不时是开源模型的倡议者。

OpenAI、Meta和其他顶级人工智能团队的开发人员不时在细心研讨DeepSeek模型,并试图搞清楚其为何能够比一些美国制造的模型更廉价、更高效地运转。

OpenAI迷信家Noam Brown上周在社交媒体上表示:“DeepSeek标明你可以用相对较少的计算取得十分弱小的AI模型。”

数日前,就有Meta的工程师们在匿名社交平台TeamBlind上吐露心声,表示DeepSeek所研发的AI模型为其带来了微小压力。

Meta首席AI迷信家杨立昆(Yann LeCun)在其宣布在Threads上的一篇文章中指出,比起“中国AI跨越了美国”的观念,DeepSeek-R1更关键的是证明了“开源模型正在跨越公用模型”:“DeepSeek得益于开源研讨和开源项目(例如PyTorch和来自Meta的Llama)。这就是开通研讨与开源的力气。”

DeepSeek的R1模型自身就是开源的,Meta的 Llama模型也是如此。而最后以开源为使命的OpenAI,近年来曾经转向了闭源方式。杨立昆表示,这并不是中国的人工智能“跨越美国”,而是“开源模型打败了专有模型”。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门