大厂或赔惨 DeepSeek接入潮汹涌适配商忙坏 (大厂会倒闭吗)

admin1 7小时前阅读数 41 #银行

DeepSeek引发的蝴蝶效应还在继续。

1月20日，DeepSeek公司正式公布了其推理模型DeepSeek-R1的完整版本。该模型经过算法优化，以较低的训练本钱成功了与OpenAI推理模型o1相媲美的性能，并且开源。

传统AI训练对算力的需求微小，当业内普遍为AGI（通用人工智能）贴上“鼎力出奇观”的标签，DeepSeek却开拓了一片“无人区”，吸引一众企业争相接入。企业接入DeepSeek，即企业经过配件设备衔接DeepSeek的访问地址，从而失掉DeepSeek的模型服务。

据不完全统计，接入DeepSeek-R1模型的国际上市公司曾经逾越100家，其中不乏阿里、腾讯、百度、三大运营商这类拥有自研模型和AI运转的企业。

时代周报记者采访多位业内人士发现，企业选择DeepSeek的要素关键集中在两方面。一是DeepSeek-R1开源较彻底，部署简易，且在特定场景下展现了弱小的处置和推理才干；另一方面，DeepSeek声量走高，意味着接入方无机遇承接其外溢的流量。QuestMobile数据显示，DeepSeek的日生动用户数在2月1日打破3000万大关。

不过，大厂接入DeepSeek模型也或许面临微小的盈余压力。近期，AI Infra（衔接配件和高层运转的两边层基础设备）企业潞晨科技CEO尤洋指出，满血版DeepSeek-R1每百万token（输入）定价16元，假定每日输入1000亿token，一个月算上去接入方企业可取得4800万元支出。据他测算，成功1000亿token的输入，要求约4000台搭载H800的机器，以目前H800的市价或许折旧来计算，每月仅机器本钱就达4.5亿元，因此企业方或许面临每月4亿元的盈余，“用户越多，服务本钱越高，盈余越多”。

AI Infra厂商市场担任人张迪（化名）通知时代周报记者，离DeepSeek疯狂发酵仅有数周，软配件适配、测试、上架等工程都要求时期，目前公司对外协作的项目还未落地，因此详细本钱数据暂不明晰。

在AI的潮汐效应下，接入DeepSeek能否一本万利，还需让子弹再飞一会儿。

接入模型并非“量”的比拼

目前来看，企业接入DeepSeek的水平有所不同。

2月13日，继微信、腾讯文档、QQ阅读器等业务侧产品先后接入DeepSeek-R1后，腾讯自研的AI助手“腾讯元宝”也正式接入DeepSeek-R1，支持用户切换经常经常使用混元大模型和DeepSeek-R1。

相比腾讯近乎片面拥抱DeepSeek的决计，阿里等公司对DeepSeek的接入关键体如今自己的主营业务侧产品，给自研的大模型产品保管了一部分空间。如阿里的1688、钉钉、阿里云相继接入DeepSeek，其旗下全能AI助手通义APP尚未表态。

不难发现，接入DeepSeek的企业，率先将DeepSeek运转在了AI才干运用场景较多的业务上。

“接入模型并非‘量’的比拼，需求方应该充沛思索模型与业务场景适配性。”科技CTO王云峰在接受时代周报记者采访时表示，当下大模型的运转方式愈发多样，不同模型有各自适配场景。

此前，值得买科技自研了130亿参数消费大模型，也接入了一些支流模型，谈及接入DeepSeek的要素，王云峰解释称，值得买科技的自研模型在商品了解、多少钱预测等垂直范围才干出色，但AI技术的复杂性，选择了单一模型无法掩盖一切场景。例如做检索增强时，外部工具流程需AI合理调度，外部通用模型难以适配，此时自研模型就担任外部流程调度、用户意图了解等关键义务，而通用模型则用于站内文章生成这类通用场景。

从通常落地效果来看，DeepSeek-R1的疑问处置和推理才干表现出色。王云峰通知时代周报记者，和包括DeepSeek-V3在内的其他模型相比，DeepSeek-R1生成内容的行文逻辑更明晰，文学性也更突出。其弱小的言语处置才干，让公司内容消费的效率有了清楚优化，“假定经常经常使用通用模型，还要求启动垂类数据微调才干更好发扬作用。”

网络安保公司知道创宇是DeepSeek更早期的受益者。

去年12月，知道创宇旗下的网络空间测绘引擎ZoomEye国际版同步上线了对DeepSeek的调用支持。知道创宇CSO（首席战略官）周景平向时代周报记者表示，从接入DeepSeek到如今，ZoomEye国际版的平台注册量增长28.5%，平台生动度增长121.6%，AI 搜寻性能经常经常使用率达35.8%。

周景平在接受时代周报记者采访时难掩兴奋。他称，DeepSeek被公司运转在包括破绽放掘、数据情报剖析、规则转化处置、智能化安保运营等多个细分业务场景中。在数据情报剖析上，受益于DeepSeek等大模型数据剖析及推理才干，公司可高效补齐之前所依赖的剖析师知识框架之外的细节点。

“相比GPT，DeepSeek聚焦经过低本钱高性能的技术路途，下降企业接入门槛，并经过开源战略促进技术普及和产业链协同，这为国际企业级运转的迸发提供了更大的或许性。”在周景平看来，DeepSeek-V3和DeepSeek-R1利好接入企业的意义在于性价比高。他说，DeepSeek开源较为彻底，同时公布了蒸馏模型的本地量化版，这使得企业启动本地化部署的性价比大幅度优化。

适配商等来春天？

企业扎堆接入DeepSeek，也忙坏了位于大模型产业链两边层的适配厂商。

张迪向时代周报记者表示，DeepSeek爆火后，公司往来的咨询者日益增多。“以前一两个月才有一位前来咨询业务的客户，如今我们每天要应付十几个。”张迪称，如今简直每天都要求加班，除了应对业务咨询，还要介入直播、客户验收、商务对接等任务，公司和小组的会议往往被布置在早晨8点和9点。

张迪称，DeepSeek大火之前，大家对私有化部署仅仅逗留在讨论产品性能的层面，而如今公司的咨询者，或许在焦虑的驱使下，协作目的愈加明白，双方说话主题大致锁定在为提需求、了解产品性能、给报价三个方面。

另一AI Infra厂商的开创人赵欣向时代周报记者表示，需求大涨，行业任务节拍普遍放慢，“有人手里拿着钱排队等你的产品，必要求比没事做的时辰兴奋。”他表示，产品走向市场，真正地为人所用，也是集团价值层面的正向反响。

此前，有剖析人士向时代周报记者称，因国产算力适配本钱较高，在英伟达的芯片稀缺状况下，经常经常使用国产算力的企业接入DeepSeek或许要面临肯定财务压力，继而影响到两边层厂商的展开前景。

尤洋向时代周报记者拆解了企业接入DeepSeek的途径，他表示，DeepSeek是开源模型，接入方只需有算力就可以部署运转。

尤洋说，算力的支流提供方式普通有两种，一种是企业自有算力，比如有本地的一体机或许机房；另一种是私有云上的算力，企业可以按月租用。除此之外，有一些云厂商还提供MaaS(Model as a Service)的方式，也就是将DeepSeek模型部署到私有云上后，需求企业再调用DeepSeek API，按通经常经常常使用的token量付费，适宜早期的轻量化探求需求。

企业接入DeepSeek的本钱关键分配件和部署本钱两部分。

配件本钱方面，不同规格的配件多少钱差异较大，相反规格不同规模的配件多少钱也十分不同。“关于仅要求经常经常使用模型的企业来说，选择推理芯片会有效下降配件本钱；而关于有微谐和训练要求的企业，或许在置办或租赁配件时要求经常经常使用训练芯片。另外，关于并发数量或许输入速度要求较高的企业，要求选择有充足算力和显存的芯片，这类芯片的多少钱会偏高。”尤洋表示。

而部署本钱的区别除了体如今不同规格芯片的部署难度上，还和企业的详细要求有关。比如，假定企业要求高并发、接入知识库、接入联网性能等，都会存在较大的任务量。

“关于满血DeepSeek-R1 671B模型来说，本地化部署的配件本钱在百万级别，普通来说是远高于部署本钱的。有些中小型企业会经常经常使用蒸馏版的模型，或许是直接调用云厂商的API，这样适配本钱就会低很多。”尤洋补充道。

关于业内的本钱担忧，赵欣称，目前公司客户以中小型企业和传统行业的大型企业为主，虽公司体量、业务不同，所牵涉的本钱数据也存在较大差异，但从目前的适配案例来看，客户企业普通都具有承当该项本钱的才干。