能跨越 DeepSeek 吗一手实测豆包深度思索方式 (能跨越的高墙都会成为自己的盾牌)

admin1 5小时前阅读数 9 #银行

字节跳动旗下 AI 助手豆包正在小范围测试深度思索模型，据豆包相关担任人对极客公园表示，以后测试的是自家深度思索模型的不同实验版本。

另外有报道称，豆包正在测试的深度思索模型是基于豆包 1.5 基座模型研发。

其实此前在 1 月中旬，在豆包大模型团队公布豆包 1.5Pro 时，就已宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在，并称「在完全不经常经常使用其他模型数据的条件下，经过 RL 算法的打破和工程优化，充散发扬 Test Time Scaling 的算力优点，成功了 RL Scaling，研发了 Doubao 深度思索方式。」

极客公园实测发现，与豆包对话时后者生成的答案确实有末尾显示推理环节的思想链，不过并不稳如泰山发生。目前在豆包对话页面也尚未发生「深度思索」性能的入口。

从 2 月 22 日末尾，豆包就被腾讯旗下的 AI 运转「腾讯元宝」压了一个身位，位居中国区苹果运转商店不要钱 APP 下载排行榜第三位（第一名还是 deepseek)，在腾讯、百度多个运转接入 deepseek 后，字节豆包会如何处之就成为大家关注的焦点，现在答案正在显现。

豆包也上「深度思索」了？

最早具有深度思索才干的模型是 OpenAI 于 2023 年 12 月推出的 o1 系统，但其采纳闭源战略而且仅限付费用户经常经常使用（每月 200 美元）。而 DeepSeek 则经过开源战略、本钱下降以及交互创新，成为首个将深度思索才干大规模普及的 AI 公司——DeepSeek 于 2024 年 11 月 20 日公布 R1-Lite-Preview，成为国际首个对标 o1 的推理模型，并在 2025 年 1 月 20 日开源了 R1 模型。

R1 模型的创新点在于：透明化思想链；展现完整的推理环节，包括自我质疑、假定验证等拟人化思索途径；低本钱与开源；R1 模型的推理本钱仅为 OpenAI o1 的 1/27，且代码完全开通。

DeepSeek 的深度思索方式是一种经过显性化 AI 模型的推理环节来增强用户了解的性能，思想链（Chain of Thought， CoT）是支撑这一方式的中心技术。

方便来说，深度思索方式可以让用户直观看到模型的思索环节，这两边触及思想链的展现，也就是 COT（Chain of Thought）——思想链是模拟出来的，经过训练让模型输入两边步骤，比如自我质疑和反思，尽管只是文字序列，但看起来像人类的思索环节。

在深度思索方式下，用户不只能看到 AI 的最终答案，还能观察到模型处置疑问的完整逻辑链条，包括自我质疑、假定验证、错误修改等步骤。比如，在处置数学题时，模型会展现其从疑问拆解、多方法验证到最终结论的全环节。

结合实时联网性能后，模型可抓取最新信息并启动逻辑整合。25 日，Anthropic 公布了 Claude 3.7 Sonnet 混合推理模型，阿里云 Qwen 推理模型「QwQ-Max 预览版」也亮相了，我让豆包评价了一下这两款推理模型：

思索环节的展现，让用户能够明晰地看到模型的推理步骤，而不只仅是最终结果，这样一来，用户能够感遭到模型的决策是有依据的，对模型输入的结果也会更有信任感。

豆包 vs deepseek，各有所长

由于还在测试中，目前在豆包对话页面暂未显示「深度思索」性能的入口，输入信息时也没有像其他接入 deepseek 的产品一样有选择框可以选择能否开启「深度思索」性能，只是被灰度到的用户在问一些疑问时会触发该性能。

我拿几个疑问同时问了一下豆包和 deepseek，看下两者在「深度思索」上会有哪些不同表现。

经典的数学疑问：「9.11 和 9.9 谁大」

先看下豆包的思索环节：

先说一下，在测试中，我发现豆包的「深度思索」方式发生得并不稳如泰山，在第一次性性输入「9.11 和 9.9 谁大」后，它只是方便地回应了我一下：

但在我又输入了一遍「9.11 和 9.9 谁大」想试试会不会触发「深度思索」方式时，还真发生了：

可以看到，尽管豆包看法到刚刚曾经回答过我，但它还是贴心肠思索了多种也许我没了解前面答案的或许性，然后再给出判别方法最后输入结果。

再看一下 deepseek 的思索环节：

可以看出，尽管这是一个「看起来很方便」的疑问，deepseek 的思索环节相同很详细，要比豆包的思索环节更片面。

在这个方便数学题上，豆包和 deepseek 都遵照了小数比拟的基本规则，并采纳多种方法验证；不同点在于豆包重视教学引导和思索到用户或许的曲解，而 DeepSeek 则更现自我质疑和重复验证，思索环节更复杂。

哲学疑问：看法的实质是什么？AI 会取得自我看法吗？

先来看豆包的回答：

再来看看 deepseek 的回答：

可以看出，DeepSeek 的回答分为迷信实际、AI 看法途径、伦理框架和处置途径四个部分，援用了神经迷信、量子实际等，还提到了法律案例和详细数据；而豆包的回答更倾向哲学实际分类，罗列了物理主义、二元论等，并讨论了支持与拥戴 AI 权益的观念，不过没有深化技术细节。

两者都供认看法实质尚无共识，也都提到了哲学和迷信实际、伦理疑问，不同则在于深度和技术细节，DeepSeek 更技术导向，触及神经外形计算、量子封印技术等，而豆包更偏重哲学流派和现有伦理指南。

经过本次实测，我们看到了豆包在深度思索方式上的初步表现，尽管目前处于测试阶段，且性能的稳如泰山性和入口尚未完全开通，但其对推理环节的初步展现已为用户带来了更直观的了解途径。

版权声明

本文来自网络，不代表本站立场，内容仅供娱乐参考，不能盲信。
未经许可，不得转载。

上一篇：来了！特斯拉FSD 中国首测！ (来了特斯拉电动车其他加油车价格会下降吗?) 下一篇：金价惊人暴跌的要素在这美国关键数据突然爆雷！特朗普关税传大信息 (金价惊人暴跌是真的吗)

能跨越 DeepSeek 吗 一手实测 豆包 深度思索方式 (能跨越的高墙都会成为自己的盾牌)

版权声明

作者文章

能跨越 DeepSeek 吗一手实测豆包深度思索方式 (能跨越的高墙都会成为自己的盾牌)