思考和编码能力超越DeepSeek-R1?Claude推出的全球首个混合推理模型什么样 siyushenqi.com • 2025 年 8 月 13 日 下午9:50 • 海外营销 • 阅读 41 会思考的Claude。 作者丨汪酱 编辑丨火狐狸 就在今日凌晨(北京时间),Anthropic投下了两个“王炸”。 一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型,两种思考模式,既能快速响应用户提问,也能如DeepSeek一般展示深入的推理过程。 二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库,并且可以一次性完成超45分钟以上的人工任务,开发、编码、测试流程全包揽,在代码能力的完整性和完成性上远超其它大模型。 会思考的Claude 3.7 Sonnet 自DeepSeek上线以来,我们已经料想到AI大模型赛道会有源源不断的活水涌上来,只不过无论上涌的速度,还是能力的追赶,都太快了。Claude 3.7 Sonnet正是其中一个。 根据Anthropic官方的解释,他们认为推理是前沿模型的一种集成能力,而不是完全独立的模型,因此Claude 3.7 Sonnet和市场上其他推理模型有所不同,它既是一个普通的LLM(能够生成文本并理解语言模式),同时也是一个推理模型(能够将复杂的问题拆解成一个个步骤,显示出其达成最终解决方案的思维路线)。 (图:让其写五个世界上任何地方都找不到的原创笑话,Claude 3.7 Sonnet展示了思考过程) 值得一提的是,根据AWS生成式人工智能副总裁Vasi Philomin表示,Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益,比如可以构建更为复杂的GenAI驱动的应用程序。 (图:Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学上有显著提升) 根据早期测试显示,Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性,能力甚至超过OpenAI o1和DeepSeek R1。 (图:该测试评估了AI模型解决现实世界中软件问题的能力,Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能) 此外,当通过API使用Claude 3.7 Sonnet时,用户还能够控制预算进行思考,比如给其提供一个token的数值,告诉它思考不得超过该数量的token,就能够一定程度上控制预算(目前最高输出限制为128K个token),但需要注意的是,这一方式也会影响模型回答的速度和答案的质量。 安全性方面,Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性,因此减少了45%的“不必要拒绝”,这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。 从其目前的模型形态来看,对于企业级使用者更加友好。目前,Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划,比如免费版、专业版、团队版、企业版,同时不仅能通过Anthropic API接入访问,还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问,除免费版外的所有版本均支持扩展思考模式。 至于定价,无论哪种模式,其API定价均保持不变(和前代的模型一致),输入100万个token收费3美元,输出100万个token收费15美元(其中包括思考过程中使用的token)。相比之下,我们发现OpenAI o3-mini(早于Claude发布的能推理的模型)要更加便宜,输入定价1.1美元/1M token,输出为4.4美元/1M token。 写代码“神器”:Claude Code 虽然Claude 3.7 Sonnet的编码能力已经很强了(经官方测试),但Anthropic还是想将编码能力进一步拉高,进而推出了Claude Code这一专门的智能编程工具。目前,这一工具的功能还在持续优化中,因此尚未正式上线,仅作为研究预览版限量开放,并将根据用户反馈来进行改进。 根据Anthropic官方表示,Claude Code的定位是一个AI编程助手,能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是,Claude Code能直接理解开发者的代码库,并且无缝集成到开发环境之中,经过测试,Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作,极大降低人工成本。 结语 自DeepSeek推出后,AI大模型赛道无疑已经拉响了军备竞赛警报,各大科技公司纷纷加大投入,加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini,凭借其出色的性能和灵活性,在多个应用场景中展现出了强大的竞争力。而现在,Claude 3.7 Sonnet的横空出世,更是将这场竞赛推向了一个新的高潮。 这场AI大模型的军备竞赛,不仅能推动技术的快速发展,同时也将在更多领域发挥关键作用,从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是,在这场竞赛中脱颖而出的AI模型,无疑也将成为各个行业的首选工具,为行业的数字化转型和智能化升级提供强有力的支持。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.nodgame.com/32910.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 11.2K 文章 0 评论 298 问题 16 粉丝 私域神器:海外私域营销拓客软件 中国做题家,撑起美国AI 上一篇 2025 年 8 月 13 日 下午9:50 阿里云视频生成大模型万相2.1重磅开源 下一篇 2025 年 8 月 13 日 下午9:50 相关推荐 海外营销 2020年9月全球热门移动游戏收入TOP10 Sensor Tower 商店情报数据显示,2020年9月腾讯《王者荣耀》全球吸金2.4亿美元 siyushenqi.com 2025 年 8 月 26 日 61000 海外营销 干货荟萃 | 社交出海新风口 欢澄互娱/阿里云/垦丁律所分享如何玩转Web3.0 音视频社交新风口07期圆满结束 siyushenqi.com 2025 年 8 月 3 日 63000 海外营销 日本首测口碑爆棚,《碧蓝档案》会成为悠星的下一个爆款吗? 以下文章来源于游戏葡萄,作者菲斯喵,内容仅供网友参考学习。私域神器欢迎行业优质稿件投稿。 8月6日下午,由韩国NAT Games研发,悠星发行的《碧蓝档案》(暂译,原名《ブルーア siyushenqi.com 2025 年 8 月 26 日 67000 海外营销 微软AI投资大出血引股价下跌,华尔街或将撤出AI「军备竞赛」 GenAI热潮正在演变为一场名副其实的「军备竞赛」,巨额的资本投入和漫长的回报周期,无疑是对科技巨头和投资者的双重考验。 siyushenqi.com 2025 年 8 月 13 日 46000 海外营销 短剧狂飙,但为什么我们身边没人看? 到底谁在看短剧? siyushenqi.com 2025 年 8 月 18 日 51000 海外营销 全球支付指南|盘点海外市场主流支付类型 本期,光子易PhotonPay将仔细盘点较为主流的海外市场支付选项,以帮助您为客户精准打造具备竞争力的支付体验。 siyushenqi.com 2025 年 8 月 3 日 69000 海外营销 TOP 100跨境品牌出炉 其中深圳品牌多达52个,其次是广州(9个)、北京(6个)、苏州(6个)等地。 siyushenqi.com 2025 年 8 月 5 日 64000 海外营销 盗播、录播纷争不止!TikTok Shop“动真格”打击侵权 TikTok新规出台:严禁录播盗播,保护原创内容 siyushenqi.com 2025 年 8 月 13 日 48000 海外营销 私域神器每周合作精选No.116|H5游戏求CPS/CPA/CPI推广;《圆梦庄园》找海外代理发行;MMORPG新游寻发行 本期精选的合作类型涵盖菲律宾H5游戏求CPS/CPA/CPI推广;《圆梦庄园》农场玩法、模拟经营休闲游戏,找海外代理发行;魔幻&科技题材MMORPG新游寻发行等。接下来就一起看看吧~ siyushenqi.com 2025 年 8 月 17 日 51000 海外营销 从《白荆回廊》的这次“巡声测试”中,我们能看到哪些亮点? 在这次仍旧处于持续状态的“巡声测试”中,我们究竟能够看到哪些亮点?《白荆回廊》从曝光至今又在各个方面表现出了怎么样的潜力? siyushenqi.com 2025 年 8 月 22 日 66000 海外营销 牵狗绳创收千万美金!WILD ONE如何打造网红宠物品牌? 狗绳一年创收千万!WILD ONE是如何成为宠物界的网红王者的? siyushenqi.com 2025 年 8 月 12 日 51000 海外营销 绝!又改!亚马逊页面最重要的栏目变了 大动作! siyushenqi.com 2025 年 8 月 13 日 47000 海外营销 私域神器每周合作精选No.169|RPG游戏寻发行及投资;海外译制短剧内容寻流量合作;需要Reddit广告户;寻小众软件开户 本期精选的合作类型涵盖RPG游戏寻发行及投资;海外译制短剧内容寻流量合作;需要Reddit广告户;寻小众软件开户等。接下来就一起看看吧~ siyushenqi.com 2025 年 9 月 1 日 81000 海外营销 从小众到游戏必备品,属于Cozy Game的2022年 Cozy Games,它并非指某种游戏机制或玩法,而是强调一种共同的游戏氛围,但凡玩家能在游戏中感到愉悦、轻松、岁月静好 siyushenqi.com 2025 年 8 月 24 日 60000 海外营销 苹果300亿参数大模型首亮相,还买了家AI公司 落后竞争对手一大截的苹果,正在加速入局大模型战场。 siyushenqi.com 2025 年 8 月 13 日 52000 海外营销 一周要闻NO.114丨微信与iPhone16二选一;第一个投资黑神话的人;淘宝天猫松绑“仅退款”;“搜索”迈入3.0时代 一起看看这周有哪些出海圈值得关注的大事记吧! siyushenqi.com 2025 年 8 月 14 日 48000 海外营销 中小平台接连退场,海外短剧要变天? 2025年6月全球257款短剧App下载8459万、收入1.93亿美元,但多数平台仍在亏损,高成本与低爆款率(5%~10%)导致“无利润繁荣”。 siyushenqi.com 2025 年 8 月 15 日 46000 海外营销 不用手机号,3步搞定Google账号注册! 不用手机号,3步搞定Google账号注册! siyushenqi.com 2025 年 8 月 3 日 79000 海外营销 1秒锁定7500万债务黑洞,OpenAI o系列模型7大实际应用案例 包括处理模糊任务、从海量信息中提取关键信息、复杂文档推理与决策、多流程AIAgent、视觉推理、代码审查和性能评估。这些场景展示了o系列模型在处理复杂任务和推理方面的强大能力。 siyushenqi.com 2025 年 8 月 13 日 51000 海外营销 游戏收入429亿,股价回涨48%,腾讯:版号问题总会解决的 “降本增效”正在成为腾讯的新关键词。在新增长点难寻的当下,压缩成本为腾讯争取到了一些利润空间,而这家风向标式的大厂,也正在储蓄能量,等待拐点的到来。 siyushenqi.com 2025 年 8 月 24 日 61000 海外营销 这款悄悄登上MENA多国社交榜TOP50的“变美社区”应用,想要成为下一个小红书? 变美社区+社交。 siyushenqi.com 2025 年 8 月 17 日 48000 海外营销 TikTok浏览量1.7亿,义乌引爆粉色圣诞潮 2022年,一场关于粉色潮流的复兴,形成了一种前所未有的消费洪流。 siyushenqi.com 2025 年 8 月 13 日 43000 海外营销 春节不打烊 | 消费电子卖断货、中国风产品拿下老外的心…一文盘点24年度跨境电商新动向 2025年,电商行业在海外有哪些新机会? siyushenqi.com 2025 年 8 月 5 日 54000 海外营销 Manus的价值和意义是什么? Manus AI作为一款AI工具,其能力与硬件行业关注的LAM(大型行动模型)概念密切相关。LAM旨在成为人类在数字世界的代理人,而Manus AI通过自然语义理解、计算机视觉、用户行为学习和跨应用调用工具等能力,展现了类似的功能,因此受到硬件行业的高度关注。 siyushenqi.com 2025 年 8 月 13 日 44000 海外营销 2022年了,这个快十年的打法还在赚钱 IP改编游戏的本质是什么? siyushenqi.com 2025 年 8 月 24 日 64000 海外营销 上线3个月积累300万用户,月收入暴涨428%,又一新晋短剧平台闪耀东南亚 短剧网文联动,冲榜势头强劲。 siyushenqi.com 2025 年 8 月 17 日 62000 海外营销 爽文IP游戏打出暴爽开局,《我独自升级:起立》还能霸榜多久? IP游戏异军突起。 siyushenqi.com 2025 年 8 月 18 日 56000 海外营销 中国先进芯片海外代工再遇阻,美实体清单扩大至大模型公司 美国商务部工业与安全局(BIS)发布芯片管制新规,将限制中国企业先进芯片海外流片范围从7nm及以下扩大到16nm或14nm及以下,对台积电、三星等芯片制造商为中国大陆企业尽职调查提出更严苛细则要求。同时将中国和新加坡27个AI和芯片公司添加至实体名单,包括中国大模型独角兽智谱科技。 siyushenqi.com 2025 年 8 月 13 日 59000 海外营销 【出海榜单】2024 年 2 月中国游戏厂商及应用出海收入 30 强 2024 年 2 月中国游戏厂商及应用出海收入TOP 30出炉 siyushenqi.com 2025 年 8 月 18 日 59000 海外营销 可口可乐、星巴克们暂停在Facebook投放广告,真是一步妙棋 上周,可口可乐宣布自7月1日起,将暂停全球社交媒体平台上的所有广告,为期至少30天。 siyushenqi.com 2025 年 8 月 13 日 44000 发表回复 请登录后评论...登录后才能评论 提交