OpenAI公布推理模型o3 (openai和chatGPT什么关系)
中国AI模型DeepSeek引发的全球讨论热潮继续近半个月,美国OpenAI公司终于公布新模型对此启动“回击”。
北京时期2月1日清晨,OpenAI CEO奥尔特曼(Sam Altman)在 2 周前预告后,今天在ChatGPT和API服务中推出 AI 推理模型o3-mini,性能照应速度比o1-mini优化 24%,答案准确性也有所提高。
目前ChatGPT不要钱用户初次可以体验一个有限速率的o3-mini版本,速率限制与现有的 GPT-4o 限制相似;Plus用户可选择o3-mini-high更高自动版本;每月支付200美元的 Pro 用户可有限经常经常使用o3-mini和o3-mini-high;API层面,o3-mini输入1.10美元/百万token、输入4.40美元/百万token,多少钱比o1-mini廉价63%,比满血版o1廉价93%,但仍是GPT-4o mini的7倍左右。
OpenAI表示,o3-mini的公布是在追求高效力自动技术路途上的又一关键里程碑。经过优化迷信(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)范围的推理才干,同时坚持较低的本钱,让高质量AI技术变得愈加盛气凌人。
理想上,过去一周内,DeepSeek R1和V3两款开源 AI 模型都推翻全球关于“尺度定律”(Scaling Law)的看法,其模型的优秀表现以及不及OpenAI近1/20的算力本钱令OpenAI外部震动,而且让华尔街末尾质疑 AI 公司能否要求在算力本钱投入大批资金成功AGI模型迭代,英伟达股价一夜暴跌17%,损失近6000亿美元市值。
但是,据SemiAnalysis,与外界以为DeepSeek公司拥有5万张H100 GPU计算卡看法不同,该机构以为,DeepSeek堆积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“特供版”H800、3万张“特供版”H20,算力资本支出的总体拥有本钱(TCO)逾越140亿元,达19.96亿美元(约合人民币143.45亿元)。其中,CapEx总主机资本支出12.81亿元、运营本钱7.15亿美元。
要知道,英伟达过去一年内才消费100万张“特供版”GPU卡。
最新信息是,OpenAI正在启动新一轮400亿美元的融资,软银将领投,公司价值高达3000亿美金(约合人民币2.16万亿元),对此OpenAI并未置评。
而在o3mini正式推出之时,奥特曼今晨在回答网友疑问时,稀有供认OpenAI 过去在开源方面不时站在“历史错误的一边”。他表示,“我集团以为,我们在这里站在了历史的错误一边,要求找出一个不同的开源战略。OpenAI中并非一切人都认同这一观念,这也不是我们以后的最高优先事项。”这意味着,OpenAI正在思索开源。
那么,随着DeepSeek好评如潮,OpenAI这个昔日AI霸主如何对战?140亿(算力)VS 2.16万亿(公司价值),一场围绕中国、美国两家有实力的AI公司抗争曾经打响。
模型转向后训练和算法 300万美金的AI才干也能超GPT
回想过去4年,“DeepSeek缔造者”梁文锋率领200多人的团队围绕 AI 大模型启动深化研发。
由于DeepSeek面前的幻方量化是国际少数拥有数百亿控制规模的量化私募基金机构,既不缺钱又不融资,甚至DeepSeek没有预备做To B/To C商业化,手里的万卡算力也没有做云计算生意。
人才层面,DeepSeek目前约有不到200名研发人员,并且只从中国招聘人才,不看重过往资历,高度关注才干和求知欲,据称为研发人员提供最拙劣过130万美元的年薪,远超中国其他科技大厂,以及“大模型六小虎”这类 AI 创业公司。
方便来说,梁文锋以为的DeepSeek,就是猎奇心驱使,不要求靠大模型赚钱,只为推进AGI(通用人工自动)。因此,基于梁文锋关于高端算力限制的需求,DeepSeek不时堆砌数万张英伟达 AI 算力卡。
SemiAnalysis称,即使思索到出口管制要素,DeepSeek和幻方在GPU上的投资也逾越5亿美元。
从结果过去看,这种“降本增效”的效果是很好的:DeepSeek V3模型整个训练在2048块英伟达H800 GPU集群上成功,仅破费57天、算计约557.6万美元,不到其他顶尖模型训练本钱的十分之一;最新的开源多模态模型Janus-Pro-7B用256张英伟达A100 GPU卡训练了14天,最少的10亿参数模型用128张英伟达A100训练7天,本钱仅数千美金。
这种低本钱转化模型才干和运转落地,与所谓的“杰文斯悖论”(Jevons Paradox)现象有些相似。
“杰文斯悖论”是由英国经济学家威廉·斯坦利·杰文斯(William Stanley Jevons)在1865年发现的关键现象:蒸汽机效率的提高并非增加了,而是形成了对煤炭需求的继续增长,这是由于高效的蒸汽机逐渐进入了社会消费的每一个角落。
因此,相较于OpenAI GPT-4这类大言语模型(LLM),无论是GPT-o1、o3系列,还是DeepSeek R1,中心就是用更低的本钱成功更高的(推理)模型性能和更多的自动思想才干。而计算才干越强,推理模型就可以思索更多步骤,从而提高得出正确答案的或许性,在这其中,算力软件优化成为关键要素。
清华大学计算机系长聘教授、高性能计算研讨所所长、清程极智首席迷信家翟季冬表示,DeepSeek在MoE架构算法、系统软件层次做了很多创新,它给我们的启示,更多在于如何在有限的算力状况下,经过算法和软件的协同创新,充沛挖掘配件的极致性能,对中国未来展开 AI 产业至关关键。
翟季冬以为,在预训练模型成功后,还有一个很关键的阶段就是后训练(post training)。以OpenAI o1/o3 为代表的后训练技术,为整个训练环节带来了新的应战。然后训练包括生成阶段、推理阶段和微调阶段,每个阶段的负载特点都不同,最优的并行战略也会不同,不能方便地追求每个阶段的部分最优,由于阶段之间的切换也会出现开支。我们要从整个pipeline(管道)的角度来思索优化战略。后训练还面临着负载不平衡的疑问,要求探求如何有效堆叠不同阶段以提高资源运行率。
如今,o3 mini和DeepSeek R1都经常经常使用大批监视微调 (SFT)、强化学习 (RL) 、分解数据以及稀疏化MoE等才干。
苹果公司研讨团队和麻省理工学院的协作者 Harshay Shah近期共同宣布的《参数与 FLOPs:混合专家言语模型最优稀疏度的缩放定律》显示,包括DeepSeek 和其他最近创新在内,稀疏性是这类模型展开的关键要素,证明DeepSeek经过封锁越来越多的网络部分,在计算才干较低的状况下抵达相反或更好的结果,由于关键的是模型的稀疏性,它能找到AI模型和可用计算之间的最佳婚配。
很显然,有效经常经常使用有限的计算才干,将模型展开的关键要素。
AI独角兽零一万物开创人兼CEO李开复曾表示,如今一个模型训练只用了2000张GPU,训练周期仅一个半月,本钱只需300多万美元,是马斯克的xAI本钱的1%、2%。
全体来说,正如SemiAnalysis所讲,到目前为止,这种“降本增效”方式的结果是,每年算法的提高速度快4倍,这意味着每过一年,成功相反性能所需的计算量就会增加4倍。全体来说,本钱随时期变化,算法的改良和优化使本钱降低了10倍,而才干提高了数倍。
Anthropic首席执行官Dario Amodei以为,算法的提高速度更快,可以带来10倍的改良。就GPT-3质量的推理定价而言,本钱已降低了1200倍。
OpenAI预备开源? 完整版o3最快几周内上线
理想上,大模型推理本钱的降低是一个必需趋向。OpenAI在公布o3 mini时表示,其团队降低了token多少钱。自推出GPT-4以来,每个token的多少钱降低了95%,但同时坚持了顶级的推理才干。
在多少钱、性能等层面,o3-mini是目前OpenAI性价比最高的模型之一,多项技术才干跨越了DeepSeek R1(从上图看)。
“是的,我们在讨论。我集团以为我们在某些方面或许站错了历史的一边,要求找出不同的开源战略;并不是一切来自OpenAI的人都持有这种观念,这也不是我们以后的最高优先事项。”
这是奥尔特曼初次正面供认OpenAI的闭源“是一个错误”。在DeepSeek热潮抚慰下,奥尔特曼终于方案把推理o1,或基座GPT模型启动开源,在必需水平上,这将是一个打破性事情。
今晨公布的o3-mini模型,关键包括高、中、低三个版本,没有思索技术——奥尔特曼称将很快上线。
OpenAI表示,o3-mini模型善于迷信、数学和编码,测试人员在56%的时期里更喜爱o3-mini的回答,并观察到在困难的理想疑问上严重错误增加了 39%。在中等推理努力下,o3-mini在一些最具应战性的推理和智力评价(包括 AIME 和 GPQA)上的表现与o1相当。因此,与o1-mini相比,o3-mini的答案更准确、更明晰,推理才干更强。
依据OpenAI公布关于o3-mini研讨论文显示,OpenAI o3-mini已在各种数据集上启动了预训练,其中包括多种地下数据,以及外部开发的定制数据集,因此,OpenAI o3-mini 在某些基准上的表现与最先进的⽔平相当。经过方案支持用户使⽤ChatGPT o3-mini 搜寻互联⽹并汇总结果,OpenAI心愿o3-mini成为⼀个有⽤且安保的模型。
幻觉方面,OpenAI有走漏,o3-mini PersonQA 幻觉率(越低越好)低至14.8%,比4o的52%幻觉率大大降低,但PersonQA准确率却没有特地“缩水”。o3-mini全体表现与OpenAI o1-mini⽐较相似,但在模糊性疑问的准确性、明白疑问的准确性上均略有降低。
OpenAI API研讨主管Michelle Pokrass表示:“我们发现o3-mini与美国托管的Deepseek版本相比具有竞争力。我们以为关于这种级别的自动来说,这是一个真正实惠的选择。”
谈及DeepSeek,奥尔特曼在Reddit回答中表示,“这是一个十分好的模型!我们将消费出更好的模型,但抢先优点将比前几年有所削弱。”
那么,OpenAI会方案提高plus会员的多少钱吗?奥尔特曼回应称:“通常上我想随着时期的推移增加它。”
关于很多人都关心的GPT-5,奥尔特曼表示还没有时期表,但会有一些行将公布如初级语音方式的升级。
“是的,初级语音方式的升级行将到来!我以为我们会称之为 GPT-5 而不是 GPT-5o。(GPT-5)还没有时期表。”奥尔特曼称。
以后,DeepSeek正面临美国政企等各方面的考察承压。其中,微软和OpenAI都已末尾考察DeepSeek能否采纳其模型数据;美国总统特朗普正告称,DeepSeek为美国科技行业敲响了警钟,要求对美国AI开通、继续限制对华AI半导体出口;而美国商务部、美国议员都纷繁要求考察DeepSeek,以及继续限制半导体出口管制。
Dario Amodei近期发文表示,DeepSeek最新模型在特定基准测试中已迫近美国顶尖水平,基于此,他坦承,DeepSeek 的打破正在倒逼美国重新评价技术封锁政策的有效性,“我以为DeepSeek的进度反而令出口管制政策显得比一周前更具存在意义上的关键性。”在Dario看来,美国要在 AI 展开中坚持抢先位置,力所能及的状况下,美国不应将技术优点拱手让给中国。
在群众看来,对DeepSeek,中美的反响最好都过度冷却。对中国来说,要在庆贺和自豪的同时警觉危机,防止媒体和社会的“捧杀”;对美国而言,要客观理性看待DeepSeek的成功,用通常执前启动竞争,无论是OpenAI o3-mini,还是阿里通义新模型,都证明了这一点。
DeepSeek关于中国来说无疑是严重的新年礼物,如今只需+86手机号才干注册,这将对美国来说出现“壁垒”。
无论中美两国如何博弈,但过去一周的言论场,曾经对中美下一阶段 AI 竞争出现了深远影响。
中欧国际工商学院决策迷信与控制信息系统教授谭寅亮对媒体AGI表示,关于DeepSeek这样的产品来说,其成功更多依赖于高效的算力调度和模型优化才干,而非单纯堆积配件资源。因此,出口管制等外部限制或许影响行业展开速度,但并不用须会阻碍外乡大模型的终年竞争力和全球化扩张。
“DeepSeek的成功标明,中国企业在AI运转层面和用户体验上具有弱小的创新才干,尤其是在产品加快迭代和市场化方面更具优点。这为中国在全球AI竞争中提供了关键的决计,特地是在C端市场表现上,中国团队对用户需求的深化了解起到了关键作用。但从技术底层来看,美国在基座模型和前沿研讨上的继续抢先仍是关键支撑,全体竞争格式依然出现‘底层技术美国强、运转场景中国快’的局面。DeepSeek的崛起进一步推进了这种竞争的灵敏化展开。”谭寅亮表示。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。