128K上下文+工具调用原生集成,智谱GLM-4.6V发布并降价50%

【软盟资讯 2025年12月8日讯】2025年末,智谱AI以GLM-4.6V系列与高达50%的降价,向市场投下一枚“价格核弹”。这不仅是一次技术跃迁——128K长文本、SOTA级视觉理解与原生工具调用,更是一次深远的战略突进。它标志着中国大模型竞争已从参数竞赛,彻底转向以成本、生态和场景落地能力决胜负的“肉搏阶段”,一场围绕开发者与真实应用的多模态格局重构已然开始。

一张价格表、两项性能突破、三大模型发布,中国大模型市场在2025年底被一颗“价格核弹”引爆。

2025年12月8日,智谱AI正式宣布上线并开源其新一代多模态大模型GLM-4.6V系列。这不仅是一次版本迭代,更是一次集技术跃迁、战略降价与生态重构于一体的激进突进。

这一次,智谱带来了参数分别为106B的基础版和9B的轻量版Flash。官方宣称该系列实现了三大技术突破:长上下文窗口扩展至128k tokens、视觉理解精度达到同规模模型最高水平、首次在视觉模型中原生集成工具调用能力。

更令业界震动的是其价格策略——相比前代,API调用费用直接下调50%。轻量版完全免费开放。这一动作似乎将一个月前的行业分析变为现实:国产大模型市场已从“百模大战”收敛至头部竞争,技术突破与成本控制成为决胜关键。


01 技术跃迁

智谱GLM-4.6V的技术突破并非渐进式改良,而是架构层面的系统性革新。模型训练时上下文窗口被提升至128k tokens。

128k上下文窗口意味着什么?这意味着模型能一次性通读数百页文档,分析长达数小时的会议视频逐字稿,或处理包含大量图表的研究报告。

这一数据量级使GLM-4.6V在金融分析、法律文档审查、长视频内容理解等复杂场景中,具备了前所未有的连贯性处理能力。

在视觉理解能力上,智谱声称达到了“同规模SOTA”。在多模态核心的视觉-语言对齐任务中,模型在图像描述、视觉问答、图表解析、复杂场景推理等方面的准确性和细粒度实现质的提升。

02 感知到行动的跨越

最引人注目的突破点,是GLM-4.6V首次将工具调用能力原生融入视觉模型。

这一设计从根本上打通了“视觉感知-理解分析-行动执行”的完整链路。模型不仅能“看懂”和“理解”世界,更能直接调用专用工具来“执行”任务。

智谱为此定向开发了8类场景的专用工具,并融入GLM Coding Plan框架。这种从设计之初就围绕“图像即参数,结果即上下文”构建的原生多模态工具调用能力,减少了信息损失和工程复杂度。

这一突破意味着GLM-4.6V正试图成为多模态智能体的统一技术底座。从被动理解向主动执行的转变,使其在工业质检、医疗影像辅助分析、自动化办公等高精度要求领域具备了落地潜力。

03 价格核弹

如果说技术升级在意料之中,那么智谱的价格策略则堪称“价格核弹”。GLM-4.6V系列API调用费用较前代产品直接下调50%。

具体价格为:输入1元/百万tokens,输出3元/百万tokens。同时,参数规模达9B的轻量版Flash完全免费开放。

价格腰斩的背后,是智谱一贯的成本控制策略。早在2025年8月发布的GLM-4.5时代,外界就已给出“成本更低、性能更优”的评价。其API调用价格曾达到输入0.8元/百万tokens、输出2元/百万tokens的高性价比。

这一激进定价并非孤立决策。2025年4月,北京市人工智能产业投资基金宣布追加投资智谱2亿元人民币。智谱联合生态伙伴发起的Z基金也宣布出资3亿元,支持全球AI开源社区发展。

04 战略逻辑

智谱激进的定价策略背后,是清晰的市场战略逻辑。大幅降价和免费开源,旨在以最快速度吸引开发者、创业公司和学术研究机构入场。

这种策略与智谱的开源传统一脉相承。成立近六年来,智谱已开源55款模型,在国际开源社区累计下载量近4000万次。其开源模型在Hugging Face等平台上的受欢迎程度,为其建立了坚实的开发者基础。

轻量版9B模型足以满足大量场景化、边缘侧或对成本极度敏感的应用需求,这将极大刺激基于GLM-4.6V的创新应用涌现。

智谱正试图通过技术优势与价格优势的组合拳,快速构建起以自身技术为核心的生态系统,这一策略在日益激烈的多模态竞争中显得尤为关键。

05 竞争态势

GLM-4.6V的发布,正值中国大模型市场格局剧变之际。2025年,行业已从“百模大战”加速收敛至以字节跳动、阿里、阶跃星辰、智谱AI和DeepSeek为代表的“基模五强”竞争体系。

这一市场重组不仅标志着技术实力的分野,更预示着竞争焦点从无序扩张转向智能上限突破与多模态融合。

智谱的“顶配性能+亲民价格”组合拳,是对这一竞争态势的直接回应。面对DeepSeek以“GPT-4级别性能+十分之一的算力成本”的颠覆性突破,以及阿里Qwen开源模型在全球开源社区的广泛采用。

智谱选择以激进的定价策略,直接冲击现有市场格局,试图在中小企业与开发者这一关键群体中建立先发优势。

与此同时,全球开源模型榜单上中国模型的强势崛起,为智谱的国际化布局提供了有利背景。就在2025年8月,Hugging Face开源模型榜单前5名中,中国大模型已占据4席。

06 落地挑战

技术突破与价格优势并不能自动转化为市场成功。多模态大模型的技术路线仍远未收敛。自回归、扩散、原生多模态等不同技术路径仍在激烈竞争,行业尚未迎来“ChatGPT时刻”。

应用落地面临双重挑战:既要保证生成内容在叙事性、稳定性和可控性上满足商用要求,又要在生产效率上实现百倍提升、在生产成本上实现百倍降。

从市场实际需求看,2025年大模型招投标市场呈现出“规模爆发与结构优化”的双重特征。上半年中标项目达1810个,总金额突破64亿元,其中应用类项目数量占比已超过50%。

这一数据揭示了一个关键趋势:市场重心正从基础设施建设转向实际业务场景的应用落地。央国企成为主要采购方,推动行业应用向规模化与专业化发展。

07 商业路径

智谱选择了一条明确的商业化路径。与一些同行聚焦C端应用不同,智谱一开始即押注G端和B端市场。

这一战略使其商业化落地较快,成为国内首个启动IPO的大模型创业公司。2025年4月,智谱已在北京证监局办理上市辅导备案,由中金公司担任辅导机构。

智谱的股东背景多元,同时获得应用场景、政务资源、国际市场等支持。北京市人工智能产业投资基金等国资的战略投资,进一步强化了其在政企市场的优势地位。

从行业趋势看,2025年多模态生成正处于规模化生产落地的拐点。在技术迭代迅速、效果、速度和成本提升的同时,行业需求增长旺盛,视频相关产业的落地节奏正在提速。

智谱的8类场景专用工具,正是针对这一趋势的精准布局。


行业数据显示,2025年上半年大模型累计中标项目总金额突破64亿元,市场重心已从基础设施建设转向业务场景的实际应用。在百度智能云、科大讯飞和火山引擎占据中标额前三的激烈市场中。

智谱正凭借技术优势与资本加持下的价格策略,在多模态大战中迅速抢占生态高地。GLM-4.6V发布会场外,更大的变局正在酝酿。

免责声明:本文在AI技术辅助下完成,内容基于相关企业或机构的公开信息进行整合与分析,仅供行业交流与参考。我们不对内容的准确性与时效性作任何担保,所有信息请以官方最新发布为准,建议读者进行独立判断。

关于文章版权的声明:

https://news.softunis.com/48588.html 文章来自软盟资讯

若非本站原创的文章,特别作如下声明:

本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。

凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。

如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!

(0)
上一篇 2025年12月8日 17:32
下一篇 2025年3月20日 00:23

相关推荐

发表回复

登录后才能评论