Anthropic 发言人表示,“Haiku 4.5 的发布,意味着所有用户都能通过 Claude.ai 免费使用接近前沿水平的智能。同时,它也为我们的企业客户带来显著优势:Sonnet 4.5 可负责前沿规划,Haiku 4.5 则为子智能体提供支持,打造出多智能体系统,从而快速、高质量地处理复杂重构、迁移及大型功能构建任务。”
Haiku 4.5 是一款混合推理模型,这意味着它能够根据处理请求的需求,灵活调整所使用的计算资源量。默认情况下,该模型的算法会通过一套仅需有限硬件资源的工作流程生成响应。用户可开启 “扩展思考”(extended thinking)模式,让 Haiku 4.5 生成更复杂的响应,不过这类响应的生成耗时会更长。据该公司介绍,Haiku 4.5 能够处理包含多达 20 万个 token 信息的多模态提示词。这一能力使其可以处理大型文件,例如篇幅较长的商业文档。该模型每次响应最多可输出 6.4 万个 token。
Anthropic 表示,这款模型速度更快,性能甚至优于数月前还被视为行业前沿的其他大型模型。例如,在计算机使用能力上,Claude Haiku 4.5 优于该公司 5 月推出的中型模型 Claude Sonnet 4。而在代码生成能力方面,根据用于测试 AI 系统软件编码能力的数据集 SWE-bench Verified 显示,它的表现与 Claude Sonnet 4 以及 OpenAI 最新模型 GPT-5 相近。
值得一提的是,有用户测试后反馈,“‘两倍多速度’其实还是低估 Haiku 了,说实话。我搭建了一个能直接对比 Sonnet 和 Haiku 4.5 的方法,发现 Haiku 4.5 速度大概是前者的 3.5 倍。而且用户体验感要好得多,因为 Haiku 能始终保持在‘流畅响应区间’内。”
该公司表示,Sonnet 4.5 仍是 Anthropic 性能最强的模型,而 Haiku 4.5 则为用户提供了新选择:当用户希望获得接近前沿的性能,同时又追求更高成本效益时,它便是理想之选。“即便对我个人使用而言,尽管它不如 Sonnet 智能,但我在 Claude 上已开始默认使用它,尤其是在移动应用端 —— 因为它能快得多地给出答案。” Krieger 说道。
例如,在多模型协同使用方面,Sonnet 4.5 可将复杂问题拆解为多步骤计划,随后协调多个 Haiku 4.5 模型组成 “团队”,并行完成各项子任务。Krieger 指出,让这两款模型协同工作,对希望借助 AI 处理长期项目的企业而言YY易游体育尤为实用。“企业可让 Haiku 监控金融数据流 —— 由于它体型更小、成本更低、速度更快,能处理更大体量的数据 —— 随后将初步洞察结果移交 Sonnet,由后者进行更深入的分析。” 他解释道。
Informa TechTarget 旗下子公司 Omdia 的分析师 Lian Jye Su 表示,Anthropic 设计 Haiku 的初衷显然就是为了辅助 Sonnet,“这样能带来高得多的成本效益比” 。他补充称,若用户选择通过大型模型 Sonnet 运行 AI 项目,会导致 token 消耗量大幅增加,成本也随之升高;相比之下,将任务分配给 Haiku 这类小型模型,性价比会更高。使用 AI 技术的企业应从一开始就明白,AI 工作流十分复杂,需做好准备,通过混合使用大型与小型模型来提升成本效益。
Futurum Group 分析师 David Nicholson 则对于 Sonnet 4.5 与 Haiku 4.5 之间 “分工协作” 的能力提出了一些疑问:“它们如何拆分任务,又如何确保原始目标的完整性不受影响?每个 Haiku 实例都会生成独特的数据,执行子任务的所有 Haiku 实例,是否能知晓其他实例的工作内容?将一项任务拆分为子任务的效率,又存在哪些局限?”
Krieger 表示,Haiku 将首次让全新的生产环境部署模式成为可能。“它为生产环境中的 AI 开辟了全新应用领域 ——Sonnet 负责复杂规划,而由 Haiku 驱动的子智能体则快速执行任务,我们为用户提供了一套完整的智能体工具库,其中每个模型都针对任务的不同环节,具备了智能、速度与成本的最优组合。”
Haiku 4.5 最直接的应用场景还可能出现在软件开发工具领域。Claude Code 已在该领域广泛使用,而延迟往往是该领域的关键影响因素。在 Anthropic 提供的声明中,Zencoder 首席执行官 Andrew Filev 将 Haiku 新版本描述为 “解锁了一整套全新应用场景”。
目前,已有多家企业接入 HaikuYY易游体育 4.5 并反馈了积极效果。代码初创公司 Augment 的联合创始人 Guy Gur-Ari 表示,该模型 “达到了我们此前认为不可能的平衡点:接近前沿水平的代码生成质量,兼具极快的速度与成本效益”。在 Augment 的内部测试中,Haiku 4.5 实现了 Sonnet 4.5 90% 的性能,同时表现与规模大得多的模型相当。
另一家聚焦代码领域的初创公司 Windsurf 首席执行官 Jeff Wang 称,Haiku 4.5 “模糊了” 速度、成本与质量之间传统权衡的界限。“它是一款兼具速度与前沿性能的模型,同时保持了成本效率,也预示了这类模型的发展方向。”演示软件公司 Gamma 的联合创始人 Jon Noronha 表示,Haiku 4.5“在幻灯片文本生成的指令遵循能力上,表现优于我们当前使用的模型:准确率达 65%,而我们付费层级模型的准确率为 44%。 这对我们的单位经济效益而言,是颠覆性的改变”。
此次模型发布之际,Anthropic 的业务正呈爆发式增长。据该公司发言人称,其月度年化收入即将突破 70 亿美元,而 8 月公布的这一数据还仅为 50 多亿美元。路透社获取的内部预测显示,Anthropic 设定的 2026 年年化收入目标为 200 亿至 260 亿美元,较当前水平增幅将超过 200%,接近 300%。
Krieger 将过去两年描述为 “AI 错失恐惧期”,期间企业纷纷采用 AI 工具,却缺乏清晰的成功衡量标准;而如今,企业开始要求获得可量化的投资回报。在 “Superhuman AI” 播客节目中,他表示:“优秀的产品必须有某种成功指标或评估标准作为支撑。在与部署 AI 的企业交流时,我多次发现了这一点。”对于评估 AI 工具的企业而言,其考量越来越聚焦于具体的生产力提升。
五个月前,Sonnet 4 的能力还需高价获取,且代表行业前沿;如今,Haiku 4.5 能以三分之一的成本提供相近性能。短短五个月内,AI 性能保持稳定,价格降了原先的三分之二 。若这一趋势持续(从 Anthropic 的发布节奏,以及来自 OpenAI、谷歌的竞争压力来看,这种可能性很大),那么如今看似先进的 AI 能力,一年内可能会变得常规且廉价。AI 的基本经济逻辑正以惊人速度发生转变。