思考和编码能力超越DeepSeek-R1？Claude推出的全球首个混合推理模型什么样

siyushenqi.com • 2025 年 8 月 13 日下午9:50 • 海外营销 • 阅读 41

会思考的Claude。

作者丨汪酱

编辑丨火狐狸

就在今日凌晨（北京时间），Anthropic投下了两个“王炸”。

一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型，两种思考模式，既能快速响应用户提问，也能如DeepSeek一般展示深入的推理过程。

二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库，并且可以一次性完成超45分钟以上的人工任务，开发、编码、测试流程全包揽，在代码能力的完整性和完成性上远超其它大模型。

会思考的Claude 3.7 Sonnet

自DeepSeek上线以来，我们已经料想到AI大模型赛道会有源源不断的活水涌上来，只不过无论上涌的速度，还是能力的追赶，都太快了。Claude 3.7 Sonnet正是其中一个。

根据Anthropic官方的解释，他们认为推理是前沿模型的一种集成能力，而不是完全独立的模型，因此Claude 3.7 Sonnet和市场上其他推理模型有所不同，它既是一个普通的LLM（能够生成文本并理解语言模式），同时也是一个推理模型（能够将复杂的问题拆解成一个个步骤，显示出其达成最终解决方案的思维路线）。

（图：让其写五个世界上任何地方都找不到的原创笑话，Claude 3.7 Sonnet展示了思考过程）

值得一提的是，根据AWS生成式人工智能副总裁Vasi Philomin表示，Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益，比如可以构建更为复杂的GenAI驱动的应用程序。

（图：Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色，扩展思维在数学和科学上有显著提升）

根据早期测试显示，Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性，能力甚至超过OpenAI o1和DeepSeek R1。

（图：该测试评估了AI模型解决现实世界中软件问题的能力，Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能）

此外，当通过API使用Claude 3.7 Sonnet时，用户还能够控制预算进行思考，比如给其提供一个token的数值，告诉它思考不得超过该数量的token，就能够一定程度上控制预算（目前最高输出限制为128K个token），但需要注意的是，这一方式也会影响模型回答的速度和答案的质量。

安全性方面，Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性，因此减少了45%的“不必要拒绝”，这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。

从其目前的模型形态来看，对于企业级使用者更加友好。目前，Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划，比如免费版、专业版、团队版、企业版，同时不仅能通过Anthropic API接入访问，还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问，除免费版外的所有版本均支持扩展思考模式。

至于定价，无论哪种模式，其API定价均保持不变（和前代的模型一致），输入100万个token收费3美元，输出100万个token收费15美元（其中包括思考过程中使用的token）。相比之下，我们发现OpenAI o3-mini（早于Claude发布的能推理的模型）要更加便宜，输入定价1.1美元/1M token，输出为4.4美元/1M token。

写代码“神器”：Claude Code

虽然Claude 3.7 Sonnet的编码能力已经很强了（经官方测试），但Anthropic还是想将编码能力进一步拉高，进而推出了Claude Code这一专门的智能编程工具。目前，这一工具的功能还在持续优化中，因此尚未正式上线，仅作为研究预览版限量开放，并将根据用户反馈来进行改进。

根据Anthropic官方表示，Claude Code的定位是一个AI编程助手，能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是，Claude Code能直接理解开发者的代码库，并且无缝集成到开发环境之中，经过测试，Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作，极大降低人工成本。

结语

自DeepSeek推出后，AI大模型赛道无疑已经拉响了军备竞赛警报，各大科技公司纷纷加大投入，加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini，凭借其出色的性能和灵活性，在多个应用场景中展现出了强大的竞争力。而现在，Claude 3.7 Sonnet的横空出世，更是将这场竞赛推向了一个新的高潮。

这场AI大模型的军备竞赛，不仅能推动技术的快速发展，同时也将在更多领域发挥关键作用，从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是，在这场竞赛中脱颖而出的AI模型，无疑也将成为各个行业的首选工具，为行业的数字化转型和智能化升级提供强有力的支持。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.nodgame.com/32910.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

11.2K 文章

0 评论

298 问题

16 粉丝

私域神器：海外私域营销拓客软件

中国做题家，撑起美国AI

上一篇 2025 年 8 月 13 日下午9:50

阿里云视频生成大模型万相2.1重磅开源

下一篇 2025 年 8 月 13 日下午9:50

海外营销

2020年9月全球热门移动游戏收入TOP10

Sensor Tower 商店情报数据显示，2020年9月腾讯《王者荣耀》全球吸金2.4亿美元

siyushenqi.com
2025 年 8 月 26 日
61000
海外营销

干货荟萃 | 社交出海新风口欢澄互娱/阿里云/垦丁律所分享如何玩转Web3.0

音视频社交新风口07期圆满结束

siyushenqi.com
2025 年 8 月 3 日
63000
海外营销

日本首测口碑爆棚，《碧蓝档案》会成为悠星的下一个爆款吗？

以下文章来源于游戏葡萄，作者菲斯喵，内容仅供网友参考学习。私域神器欢迎行业优质稿件投稿。 8月6日下午，由韩国NAT Games研发，悠星发行的《碧蓝档案》（暂译，原名《ブルーア

siyushenqi.com
2025 年 8 月 26 日
67000
海外营销

微软AI投资大出血引股价下跌，华尔街或将撤出AI「军备竞赛」

GenAI热潮正在演变为一场名副其实的「军备竞赛」，巨额的资本投入和漫长的回报周期，无疑是对科技巨头和投资者的双重考验。

siyushenqi.com
2025 年 8 月 13 日
46000
海外营销

短剧狂飙，但为什么我们身边没人看？

到底谁在看短剧？

siyushenqi.com
2025 年 8 月 18 日
51000
海外营销

全球支付指南｜盘点海外市场主流支付类型

本期，光子易PhotonPay将仔细盘点较为主流的海外市场支付选项，以帮助您为客户精准打造具备竞争力的支付体验。

siyushenqi.com
2025 年 8 月 3 日
69000
海外营销

TOP 100跨境品牌出炉

其中深圳品牌多达52个，其次是广州（9个）、北京（6个）、苏州（6个）等地。

siyushenqi.com
2025 年 8 月 5 日
64000
海外营销

盗播、录播纷争不止！TikTok Shop“动真格”打击侵权

TikTok新规出台：严禁录播盗播，保护原创内容

siyushenqi.com
2025 年 8 月 13 日
48000
海外营销

私域神器每周合作精选No.116｜H5游戏求CPS/CPA/CPI推广；《圆梦庄园》找海外代理发行；MMORPG新游寻发行

本期精选的合作类型涵盖菲律宾H5游戏求CPS/CPA/CPI推广；《圆梦庄园》农场玩法、模拟经营休闲游戏，找海外代理发行；魔幻&科技题材MMORPG新游寻发行等。接下来就一起看看吧~

siyushenqi.com
2025 年 8 月 17 日
51000
海外营销

从《白荆回廊》的这次“巡声测试”中，我们能看到哪些亮点？

在这次仍旧处于持续状态的“巡声测试”中，我们究竟能够看到哪些亮点？《白荆回廊》从曝光至今又在各个方面表现出了怎么样的潜力？

siyushenqi.com
2025 年 8 月 22 日
66000
海外营销

牵狗绳创收千万美金！WILD ONE如何打造网红宠物品牌？

狗绳一年创收千万！WILD ONE是如何成为宠物界的网红王者的？

siyushenqi.com
2025 年 8 月 12 日
51000
海外营销

绝！又改！亚马逊页面最重要的栏目变了

大动作！

siyushenqi.com
2025 年 8 月 13 日
47000
海外营销

私域神器每周合作精选No.169｜RPG游戏寻发行及投资；海外译制短剧内容寻流量合作；需要Reddit广告户；寻小众软件开户

本期精选的合作类型涵盖RPG游戏寻发行及投资；海外译制短剧内容寻流量合作；需要Reddit广告户；寻小众软件开户等。接下来就一起看看吧~

siyushenqi.com
2025 年 9 月 1 日
81000
海外营销

从小众到游戏必备品，属于Cozy Game的2022年

Cozy Games，它并非指某种游戏机制或玩法，而是强调一种共同的游戏氛围，但凡玩家能在游戏中感到愉悦、轻松、岁月静好

siyushenqi.com
2025 年 8 月 24 日
60000
海外营销

苹果300亿参数大模型首亮相，还买了家AI公司

落后竞争对手一大截的苹果，正在加速入局大模型战场。

siyushenqi.com
2025 年 8 月 13 日
52000
海外营销

一周要闻NO.114丨微信与iPhone16二选一；第一个投资黑神话的人；淘宝天猫松绑“仅退款”；“搜索”迈入3.0时代

一起看看这周有哪些出海圈值得关注的大事记吧！

siyushenqi.com
2025 年 8 月 14 日
48000
海外营销

中小平台接连退场，海外短剧要变天？

2025年6月全球257款短剧App下载8459万、收入1.93亿美元，但多数平台仍在亏损，高成本与低爆款率（5%～10%）导致“无利润繁荣”。

siyushenqi.com
2025 年 8 月 15 日
46000
海外营销

不用手机号，3步搞定Google账号注册！

不用手机号，3步搞定Google账号注册！

siyushenqi.com
2025 年 8 月 3 日
79000
海外营销

1秒锁定7500万债务黑洞，OpenAI o系列模型7大实际应用案例

包括处理模糊任务、从海量信息中提取关键信息、复杂文档推理与决策、多流程AIAgent、视觉推理、代码审查和性能评估。这些场景展示了o系列模型在处理复杂任务和推理方面的强大能力。

siyushenqi.com
2025 年 8 月 13 日
51000
海外营销

游戏收入429亿，股价回涨48%，腾讯：版号问题总会解决的

“降本增效”正在成为腾讯的新关键词。在新增长点难寻的当下，压缩成本为腾讯争取到了一些利润空间，而这家风向标式的大厂，也正在储蓄能量，等待拐点的到来。

siyushenqi.com
2025 年 8 月 24 日
61000
海外营销

这款悄悄登上MENA多国社交榜TOP50的“变美社区”应用，想要成为下一个小红书？

变美社区+社交。

siyushenqi.com
2025 年 8 月 17 日
48000
海外营销

TikTok浏览量1.7亿，义乌引爆粉色圣诞潮

2022年，一场关于粉色潮流的复兴，形成了一种前所未有的消费洪流。

siyushenqi.com
2025 年 8 月 13 日
43000
海外营销

春节不打烊 | 消费电子卖断货、中国风产品拿下老外的心…一文盘点24年度跨境电商新动向

2025年，电商行业在海外有哪些新机会？

siyushenqi.com
2025 年 8 月 5 日
54000
海外营销

Manus的价值和意义是什么？

Manus AI作为一款AI工具，其能力与硬件行业关注的LAM（大型行动模型）概念密切相关。LAM旨在成为人类在数字世界的代理人，而Manus AI通过自然语义理解、计算机视觉、用户行为学习和跨应用调用工具等能力，展现了类似的功能，因此受到硬件行业的高度关注。

siyushenqi.com
2025 年 8 月 13 日
44000
海外营销

2022年了，这个快十年的打法还在赚钱

IP改编游戏的本质是什么？

siyushenqi.com
2025 年 8 月 24 日
64000
海外营销

上线3个月积累300万用户，月收入暴涨428%，又一新晋短剧平台闪耀东南亚

短剧网文联动，冲榜势头强劲。

siyushenqi.com
2025 年 8 月 17 日
62000
海外营销

爽文IP游戏打出暴爽开局，《我独自升级：起立》还能霸榜多久？

IP游戏异军突起。

siyushenqi.com
2025 年 8 月 18 日
56000
海外营销

中国先进芯片海外代工再遇阻，美实体清单扩大至大模型公司

美国商务部工业与安全局（BIS）发布芯片管制新规，将限制中国企业先进芯片海外流片范围从7nm及以下扩大到16nm或14nm及以下，对台积电、三星等芯片制造商为中国大陆企业尽职调查提出更严苛细则要求。同时将中国和新加坡27个AI和芯片公司添加至实体名单，包括中国大模型独角兽智谱科技。

siyushenqi.com
2025 年 8 月 13 日
59000
海外营销

【出海榜单】2024 年 2 月中国游戏厂商及应用出海收入 30 强

2024 年 2 月中国游戏厂商及应用出海收入TOP 30出炉

siyushenqi.com
2025 年 8 月 18 日
59000
海外营销

可口可乐、星巴克们暂停在Facebook投放广告，真是一步妙棋

上周，可口可乐宣布自7月1日起，将暂停全球社交媒体平台上的所有广告，为期至少30天。

siyushenqi.com
2025 年 8 月 13 日
44000