摘要
在AI发展浪潮中,智谱推出的GLM-5-Turbo基座模型引发关注。它专为龙虾(OpenClaw)场景深度优化,从底层训练重塑,解决通用大模型在长链路任务中易失速的问题。该模型增强了工具调用、指令理解、时间处理和执行效率等核心能力。在龙虾场景端到端智能体评测基准ZClawBench评测中表现出色,获多家互联网大厂好评。智谱还推出算力套餐满足不同规模用户需求,构建企业级安全管理体系保障使用安全。
体验过龙虾(OpenClaw)场景的用户都有一个共同感受,大模型能聊好天,但未必能干好活。
通用大模型在进入真实复杂的智能体场景后,非常容易在长链路任务中失速。
智谱刚刚发布的GLM-5-Turbo,则是专为龙虾场景深度优化的基座模型。
从底层训练开始重塑的实干型模型,把人工智能从单纯的提效工具变成全天候待命的数字劳动力。
日常工作任务绝不是简单的一问一答。
真实的工作流通常涉及多轮理解、任务拆解、工具调用、状态衔接、时间触发和持续执行。
通用模型即使在对话能力上表现十分优秀,一旦进入真实场景,仍然容易出现指令遵循偏差。
工具调用不稳定以及长任务中途失速等问题更是屡见不鲜。
外围框架的修补终究有限,从根本上解决难题必须在基座模型层进行深度优化。
从训练数据构造到优化目标设计,研发团队构造了真实的智能体工作流,使模型具备极强的可执行性。
整个训练阶段重点增强了四项核心能力。
强化对外部工具与各类Skills(技能)的调用能力,确保关键环节不掉链子。
提升复杂多层以及长链路指令的理解和拆解准确度,完美支持识别目标、规划步骤以及多智能体协同。
针对定时触发和长时间运行等场景进行重点优化,让模型更懂时间维度的要求,保障长任务连贯不中断。
针对数据吞吐量大且链条长的任务进一步提升执行效率与稳定性,极其适合复杂的长程业务流程。
随着开源龙虾生态的普及,如何评测模型能力成为全行业的焦点。
基于大量真实用例的深度分析,智谱发布了龙虾场景端到端智能体评测基准ZClawBench。
当前的任务类型已经覆盖安装配置、代码开发、信息搜集、数据分析与内容创作等多元化领域。
用户群体也从早期的开发者,快速扩展到效率办公人群、金融从业者、运维工程师以及内容创作者与研究分析人员。
技能的使用比例在短时间内从26%快速增长至45%,智能体能力正全面向模块化与技能化的生态方向演进。
基于该基准的评测结果显示,新一代基座模型在开源龙虾场景中的表现提升显著,在多项关键任务上整体领先于多家主流模型。
基准题库与测试轨迹即将全面开源。
用户真实的体验永远是检验技术的试金石。
该模型以Pony-Alpha-2为代号接入AutoClaw(澳龙)进行用户盲测。高达90%的受访者认为其表现优于其他国产模型。
在内测阶段,众多互联网大厂给予了高度评价。
阿里QoderWork模型测评团队发现,精准的工具调用配合长程任务的稳定可靠,完美驱动了桌面级智能体上的跨应用数据流转与系统API操控,在攻克办公场景的幻觉痛点上表现优秀。
扣子测评团队认为其指令遵循力压群雄,面对长任务更加精准,极大提升了多智能体构建的成功率。
美团模型测评团队指出,模型在定时与长链路任务上表现稳健,对比同类模型展现出明显第一梯队的优势。
快手万擎测评团队体验到其高吞吐执行极快且不失速,响应稳定性领跑同类模型,真正解决了执行难题。
字节TRAE团队在编程场景实测中发现,其编程能力稳居第一梯队,处理长链路代码任务非常稳健。
该模型现已面向全球首发,接入软通动力旗下机械革命的龙虾盒子,全力打造原生人工智能终端体验。
真正能干活的人工智能,自然也会消耗大量的Tokens。
完成一次跨部门的会议纪要整理与任务分发,往往涉及数十轮工具调用与上下文衔接。整个过程的消耗远超普通对话。
对于大量使用的企业和个人用户来说,算力成本逐渐成为最大的瓶颈。
为了实现Token自由,智谱推出了专属的龙虾套餐,包含个人版和Team版。
无论你是一人公司、创业团队,或者是大中型企业,都能根据自身业务规模灵活订阅。
每个账号最多购买5个。企业用户可通过团队版,按照实际员工数灵活订阅,以可控成本实现充分保障,确保人工智能员工稳定在线。
在满足大规模使用的基础上,智谱专门构建了一套面向企业级场景的安全管理体系“Claw for Enterprise Security”。支持对不同类型开源龙虾的统一调度与权限编排。
无论是信息搜集、数据分析、代码开发还是跨系统操作,企业可以根据自身的业务流程,灵活组合各项能力。
通过集中化的管控台,管理者能够对每一个智能体任务的执行路径进行实时可视化监控。
工具调用链路和资源消耗一目了然,让复杂的多智能体协同彻底告别黑盒时代。
安全保障层面同样不遗余力。该系统提供多层防护机制。基于角色的权限管理,确保每一个调用只能在授权范围内访问数据。
所有的操作均会生成完整的审计日志,充分满足企业的合规要求。敏感业务数据采用全程加密处理,严格遵守数据本地化要求,确保数据绝对不离开企业可控边界。
在关键业务节点上,系统特意保留了人工审批机制,有效防止自动化流程产生不可控的业务风险。
以开源龙虾为代表的智能体正在加速进入组织内部,让每一家企业都有机会拥有7乘以24小时在线且随叫随到的数字员工。
它们也将成为每个人的专属助理,把人类从流程化与重复性的琐事中真正解放出来。一场从提效工具走向企业劳动力的关键跃迁正在发生。
开发者和企业用户现在就可以通过智谱开放平台直接调用应用程序接口,或者通过龙虾套餐快速接入。
GLM Coding Plan Max现已支持接入,Pro版将在本月支持,Lite版将在4月支持接入。
Coding Plan也可用于龙虾接入体验。
GLM-5、GLM-5-Turbo对标Claude Opus高阶模型,将按照“高峰期3倍,非高峰期2倍”系数消耗额度。作为限时福利,GLM-5-Turbo将在非高峰期仅作1倍抵扣持续到4月底。
AutoClaw澳龙默认模型为GLM-5-Turbo,让所有非程序员群体都能轻松体验龙虾能力,并享受一定免费额度。
智谱还推出了截至3月22日的澳龙限时福利期,加油包最高享3.4折优惠,加油包自购买起7日内有效。
大模型已经到了卷起袖子干苦活累活的时刻了,你的专属龙虾养了吗?
邮件:siyushenqi@gmail.com
工作时间:周一至周五,9:30-20:30,节假日休息