如何看待DeepSeek R1推出后对投资的影响 摩根大通 (如何看待deepseek)
DeepSeek 引发投资者对人工自动支出势头的担忧;过往创新周期标明,效率 / 技术优化将推进进一步的运转 / 创新
上周 DeepSeek R1 推出后,鉴于该公司宣称其模型在训练本钱效率方面的表现,投资者对人工自动半导体支出的中终年影响表示担忧。据该公司称,DeepSeek V3 模型的训练本钱约为 560 万美元,清楚低于那些前沿基础模型的训练本钱,这标明了人工自动训练的可继续性。虽然 DeepSeek 的训练本钱效率令人印象深化,但仍存在未解答的疑问,包括 R1 的完整训练本钱(如先前模型训练 / 研发 / 开发 / 优化的本钱),以及对更早开发的开源基础模型(如 Meta 的开源 Llama 模型)的依赖水平。我们以为,在得出结论之前,验证这些本钱至关关键,由于训练数据集、“预训练” 优化、尚未经常经常使用的方法以及其他历史上推进效率优化的要素的详细状况尚未披露。
新技术创新周期(尤其是计算效率方面)推进了需求的介入(杰文斯悖论),这形成了半导体价值的优化 / 需求的激增。例如,21 世纪初的 x86 主机虚拟化(推进了对 CPU、内存 / 存储的更高需求),自入手机和物联网中的 ARM 采纳(推进了对更多移动 / 物联网产品的需求),以及早期的云采纳(推进了对计算、网络、存储的更高需求),一切这些都形成了对计算 / 网络 / 内存 / 硅的需求介入。
关于人工自动,DeepSeek 展现的效率优化将推进采纳 / 扩充,向左侧(更快采纳)转移,并在未来几个月 / 几年内为人工自动半导体处置计划发明更快的增长速度。此外,鉴于早期人工自动创新在 LLMs 中引发了新的基础人工自动模型(如英伟达用于物理人工自动的 WFM)的创新,我们估量将为人工自动解锁更多的用例。
除了基础模型和软件优化之外,我们以为依然有很大的机遇经过外部开发的定制 ASIC 处置计划来解锁半导体的差异化和效率,而不是采纳现成的商用 GPU。随着云服务提供商和超大规模企业构建更大的训练 / 推理集群,我们以为这一趋向将有利于博通和 Marvell 等定制 ASIC 供应商,由于它们在本钱和性能方面具有优点。底部线是我们的评级坚持不变;我们将运行新的机遇重新性能我们在 AVGO、MRVL 和其他公司的超配头寸。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。