针对DeepSeek启动深度优化英特尔也介入了 (针对DeepSeek正面宣传文章)

admin1 4小时前阅读数 379 #美股

美国科技巨头正积极拥抱DeepSeek。

2月1日，美国芯片巨头英特尔表示，近日中国AI公司DeepSeek公布Janus Pro模型，其超强性能和高精度惹起业界关注，英特尔Gaudi 2D AI减速器现已针对该模型启动深度优化，这使得AI开发者能够以更低本钱、更高效率成功复杂义务的部署与优化。

作为一款创新性的AIGC模型，DeepSeek Janus模型集成了多模态了解和生成性能。该模型初次采纳分歧的Transformer架构，打破了传统AIGC模型依赖多途径视觉编码的限制，成功了了解与生成义务的一体化支持。在此基础上，Janus Pro经过优化训练战略和扩展模型规模，清楚优化了文生图等性能的性能与稳如泰山性，并提供了10亿参数和70亿参数两个版本，在性能与精度上展现了较强的竞争力。

图源：github.com

在Janus Pro分歧的Transformer架构下，文生图模型的吞吐量上下曾经从依赖减速器的高算力，向充沛运行HBM内存高带宽和大容量转换。

英特尔表示，Gaudi 2D仰仗2.45TB/秒的高带宽和96GB HBM大容量内存，为Janus Pro模型提供了弱小的计算支持，使其在生图批处置义务中，随着批量大小（Batch Size）的介入，吞吐性能失掉清楚优化，大幅缩短义务处置时期。

与此同时，结合英特尔Optimum-Habana框架的优化，英特尔Gaudi 2D清楚优化了文生图义务的吞吐性能和推理效率，仅需约10秒即可生成16张高质量的图片。而且，开发者仅需调整数行代码，即可成功这一结果，极大下降了开发门槛和迁移本钱。此外，DeepSeek的蒸馏模型在至强和Gaudi平台上也失掉了支持。

这家美国芯片巨头还提到，DeepSeek-R1让轻量化模型本地部署更为方便，DeepSeek目前能够在英特尔产品上运转，更可以在AI PC上成功离线经常经常使用。

不止英特尔，一末尾便对DeepSeek赞赏有加的英伟达，也在昨天（1月31日）宣布推理模型DeepSeek-R1正式登陆NVIDIA NIM微服务。据引见，在单个NVIDIA HGX H200系统上，完整版DeepSeek-R1 671B的处置速度可达3872 Token/秒。

与此同时，亚马逊也在Amazon Bedrock和SageMaker AI中，上线了DeepSeek-R1模型。

曾经冲出来和OpenAI一同高调质疑DeepSeek“偷窃”数据的微软，甚至在前一天就把DeepSeek-R1抢先部署在了自家的云服务Azure上。

图源：微软社交媒体

英特尔的老对手AMD，也早在一周前就宣布，已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上，该模型经过SGLang强化，针对Al推理启动了优化。

在人工自动专家吴恩达看来，本周围绕DeepSeek的热议，让许多人明晰地看到了几个不时存在的关键趋向：美国在生成式AI范围的抢先位置正在被中国迎头赶上，AI供应链格式将被重塑；开通权重模型正在推进基础模型层商品化，为运转开发者带来新机遇；扩展规模并非通往AI提高的独一途径，虽然算力备受追捧，但算法创新正在加快下降训练本钱。

他在社交媒体上写道，当ChatGPT在2022年11月公布时，美国在生成式AI范围清楚抢先于中国。人们的印象转变是缓慢的，因此即使在最近，我依然听到美国和中国的好友都以为中国落后。但通常上，过去两年里，这种差距正在迅速参与。仰仗Qwen、Kimi、InternVL和DeepSeek等来自中国的模型，中国显然不时在参与差距，并且在视频生成等范围，中国似乎曾经处于抢先位置。

“我很快乐DeepSeek-R1以开源权重模型公布，并附带技术报告，分享了许多细节。与此构成鲜明对比的是，一些美国公司为了扼杀开源，大肆炒作诸如人类灭绝等假定性的AI风险，推进监管。如今，开源/开源权重模型显然是AI供应链的关键组成部分：许多公司都将经常经常使用它们。假定美国继续阻碍开源，中国将主导AI供应链的这一环节，许多企业最终将经常经常使用更多反映中国价值观而非美国价值观的模型。”他表示。