国产AI 战OpenAI 战况如何 MiniMax相继上新 三英 月之暗面 DeepSeek (国产战争视频)
OpenAI的GPT系列身后,国产大模型正紧追不舍。
1月20日, DeepSeek正式发布DeepSeek-R1,并同步开源模型权重 。据引见,DeepSeek-R1在后训练阶段大规模经常经常使用了强化学习技术,在仅有极少标注数据的状况下,极大优化了模型推理才干。在数学、代码、自然言语推理等义务上,性能比肩OpenAI o1正式版。
依据其发布的测试数据,DeepSeek-R1在美国AIME 2024、MATH-500和SWE-bench Verified测试中的比分均高于OpenAI o1(小K注:前两个测试专注于数学才干,SWE-bench Verified旨在评价AI模型处置理想全球软件疑问的才干)。
同一天, Kimi全新SOTA模型——k1.5多模态思索模型上线 。 在long-CoT方式下,Kimi k1.5的数学、代码、多模态推理才干,也抵达长思索SOTA模型OpenAI o1正式版的水平 。官方表示,这应该是全球范围内, OpenAI之外的公司初次成功o1正式版的多模态推理性能。Kimi技术团队第一次性性预备了详细的技术报告。
在short-CoT方式下,Kimi k1.5的数学、代码、视觉多模态和通用才干,大幅跨越了全球范围内短思索SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,抢先抵达550%。
其他国产大模型相同表现出色,1月15日,MiniMax发布全模型系列Minimax-01,在多个规范和外部基准测试中,Minimax-01的性能与GPT-4o、Claude3.5-Sonnet等顶尖模型相当,尤其在长上下文处置方面表现突出。
OpenAI区分在2024年5月、9月和12月发布了GPT-4o、GPT-o1(包括o1-preview和o1-mini,o1正式版推延到2024年12月发布)和GPT-o3,目前最弱小的模型是o3,具有出色的推理才干、迷信知识掌握更优良、编码才干更强。
o1紧随其后,善于编码、数学和写作,其多模态性能支持图片上传,支持它将推理运转于视觉,以取得更详细、更有用的回复。
以DeepSeek为代表的国产大模型团队力图在性能上比肩最先进的大模型,定价则展现了极致性价比。
DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中);每百万输入tokens 16元。
与之对比,GPT-o1模型每百万输入tokens 15美元(约合人民币110元);每百万输入tokens 60美元(约合人民币438元)。OpenAI目前最廉价的模型是GPT-4o mini,其定价为每百万输入Tokens 10美元(约合人民币73元);每百万输入tokens 20美元(约合人民币146元)。
国产大模型召唤国产算力
国际外大模型厂商你追我赶,短时期内迅速迭代,意味着大模型厂商对算力的需求仍在继续介入。
火山引擎智能算法担任人吴迪此前曾表示,字节跳动综合思索算力资源贮藏、市场未来用量、模型本钱降初等要素判别,2027年豆包每天Token消耗量会逾越100万亿,将是如今的100倍以上。
1月20日信息称,据芜湖市生态环境局官方,字节跳动(抖音集团)旗下芜湖江东名邑科技有限公司拟在安徽芜湖树立火山引擎长三角算力中心项目,项目环境影响评价文件近日获受理,并正在实施批前公示。该项目总投资80亿元,设计主机机柜数为21824台,网络机柜236台,一座220kV变电站。
此前有信息称,小米正在搭建自己的GPU万卡集群,并对AI大模型启动大规模投资。
东莞证券此前表示,未来,随着字节、幻方、小米等国际厂商积极规划AI范围,国产大模型有望加快崛起,推进国产算力需求增长,促进国产算力基础设备树立,我国国产算力产业链有望迎来展开机遇。
上海证券也发布研报称,以字节为代表的国产大模型崛起,以及小米等玩家的入局,有望拉动国际互联网大厂在算力端的支出,国际算力军备竞赛刚刚末尾,国产算力厂商迎来展开机遇。
表示,算力树立继续性至关关键,在此背景下,主机及液冷厂商、PCB厂商等有望受益。此外,数据存力和运力需求的继续攀升,为存储、光模块和光芯片等企业发明了更多的市场机遇,促使整个产业链一直优化更新,以满足日益增长的AI算力需求。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。