出品 | 网易智能
作家 | 辰辰
裁剪 | 凤枝
硅谷时刻圈在列队夸个AI模子。
GLM 5.2发布后的48小时内,fast.ai首创东谈主、Vercel CEO、前DeepMind管,这群东谈主平时不正常夸敌手,不会夸模子,在X上排着队说它好。
莫得PR安排。莫得\"但咱们也有势\"。等于好用,是以说了。
前次硅谷被模子震到,是DeepSeek R1。那次的中枢词是低廉。此次不是低廉,是够用。
成本市集也在讲同个故事。6月22日,智谱港股盘中冲突1万亿港元,涨近20。DeepSeek那次让纳斯达克天挥发了1万亿好意思元。此次,智谱我方的市值在港股盘中冲突了1万亿港元。
列队点赞的东谈主
先看列队的东谈主王人有谁。
马特·维罗索(Mat Velloso),先后在Meta、DeepMind和微软担任过管,见过通盘顶模子。他在X上写了句话:
\"用了整天GLM 5.2。没以为缺什么。个能当日常用车(daily driver)的开源模子。事情不会样了。\"
\"日常用车\"在时刻圈有精准含义。 不是展台上的主张车,不是纽博格林赛谈上的圈速,是你每天上班、接送孩子、跑速王人不需要想二下的那辆车。维罗索说个开源模子达到了这个尺度。这是他管事生存里次这样说。
然后是吉列尔莫·劳赫(Guillermo Rauch),Vercel的CEO,旗下处事数百万修复者的云平台公司。他写的是:
\"忠诚佩服,简直不错说是胆怯。GLM-5.2的编程才略太强了。这会改变样式。\"
瞩目措辞。不是\"有道理\",不是\"有后劲\",是\"almost shocked\"。个每天看时刻发布会的东谈主,被震到了。
fast.ai首创东谈主杰里米·霍华德(Jeremy Howard),开源AI社区有影响力的声息之,用词满:
\"它至少跟Opus 4.8和GPT 5.5样好。我从未见过这样的开源权重模子。它快,不贵,也不啰嗦。回复带有分寸和判断力,处理长险峻文特地好。\"
\"至少样好\",从fast.ai首创东谈主口中说出来,不是轻浅飘的客套。
Redis首创东谈主antirez夸了。度学习时刻作塞巴斯蒂安·拉什卡(Sebastian Raschka)把它评为\"今天好的开源模子\"。以致连时刻圈抉剔的那批立修复者,拿着基准测试条条抠缺点的,说辞此次也稀少致。
伊塔马尔·戈兰(Itamar Golan)的追忆有详细:
\"大大批开源模子是这样的:Demo惊艳,benchmark漂亮,本色用起来让东谈主失望。GLM 5.2是个嗅觉不样的。不是说它败了Opus或GPT。不是说它。但它够近了,够近到能改变样式。'够近'等于颠覆运转的地。\"
个叫Scott的修复者用了逼真实说法:\"个不像是benchmaxxing(刷榜化)的通达模子。本色使用中很拼,有股'我颖悟'的劲儿。好多时候,你可能根蒂瞩目不到它跟闭源前沿模子的能差距。\"
这些话放在起,信号很了了:开源模子次跨过了谈心扉门槛,修复者不再以为在\"勉强\"。
曾在谷歌DeepMind责任过的布兰登·卡尔(Brandon Carl)列了份名单:维罗索、霍华德、拉什卡、劳赫。\"这些王人是分量东谈主物。\"他的判断是:闭源模子的订价权从此有了天花板。
虽然,任何新模子发布后王人有蜜月期。这些评价多来自48小时内的初步使用,永恒推崇还需要时辰考据。
\"够用\"有多够
但\"够用\"是迟滞的。让咱们把它隔断来塔城塑料挤出机价格。
先看硬数据。立评测机构Artificial Analysis把GLM 5.2排在一齐模子的四位,仅次于OpenAI ChatGPT 5.5和Anthropic Claude Opus 4.8,排在谷歌Gemini之前。 开源模子里的历史排行。
在长周期编程任务上,GLM 5.2压过了GPT 5.5:SWE-bench Pro得分62.1对58.6,FrontierSWE得分74.4对72.6。在器具调用评测MCP-Atlas上,77.0对75.3,不异压过。在个叫Design Arena的联想任务众测评测中,GLM 5.2拿了,以致过了Anthropic刚发布的Fable 5,阿谁强到被好意思国政府下令退却番邦东谈主使用的模子。
这些不是气运。GLM 5.2在架构底层作念了项叫IndexShare(索引分享)的关节更动:每四个稀薄瞩见解层复用同个索引器,在100万token险峻文窗口下,单token狡计量压低了2.9倍。加高涨版多Token预测层带来的20理率进步,长周期编程上的先有结构的原因。拉什卡在时刻解读中卓绝指出了这点。
但基准测试的寰宇有条暗线,叫教考分离。
挪威国盘考所的哈瓦德·特维特·伊勒(Havard Tveit Ihle)作念了项关节盘考。他把模子放在公开benchmark和擅自benchmark上永诀测试。公开测试中,模子过时好意思国4到6个月。擅自测试中,题目从未公开,模子不可能提前\"见过\",差距拉到8到10个月。简直翻倍。
他的措辞很严慎:本质室可能在\"意中\"让模子学会应考。
GLM 5.2在两项擅自benchmark上也革职这个模式:在WeirdML(需要仔细理的不寻常机器学习任务)上过时约7个月,在SimpleBench(用陷坑题测学问理)上过时整整年。
但还有另个数据点。 6月19日,Artificial Analysis发布了项全新评测,模拟办公室白的实在责任:从参差文献中索求信息、评估彼此矛盾的数据。GLM 5.2不可能提前考研过这套题。成果呢?它压过了4月才发布的ChatGPT 5.5。
\"教考分离\"的限定不是铁板块。
有些类型的任务,模子在追;有些,差距比公开数据看起来大得多。好意思国政府的5月叙述也得出了访佛的论断:差距莫得在扩大,但也莫得在轻松。
听起来是追平了。也不错连络成:追上来的速率莫得看起来那么快,但也莫得停驻来。
关节问题是:你敬重哪类任务?
若是你是个每天写代码的修复者,SWE-bench上的推崇对你是实在的,GLM 5.2在这个维度上立得住。若是你需要个连络秘谜语境、处理通达式判断的助手,它可能在某些时刻让你以为\"差语气\"。
个可能的讲授是:GLM 5.2在结构化、经由化的责任任务上如故追平以致越,但在需要随心判断、特地规理的任务上仍有短板。 它的\"够用\"有个范围,越接近尺度化责任流,越够用;越偏离旧例,差距越昭彰。
不是说它不好。是\"够不够\"这件事,取决于你站在那处。
低廉的另面
然后是价钱。二层需要隔断。
名义看,GLM 5.2低廉得离谱。API订价:输入每百万token 1.40好意思元,输出4.40好意思元。对比Anthropic Claude Opus 4.8的输出25好意思元,OpenAI GPT 5.5的30好意思元。智谱的编码订阅计算低每月12.60好意思元。
编码订阅分三档:Lite版每月12.60好意思元,面向微型代码库的轻量迭代;Pro版每月50.40好意思元,5倍于Lite的额度,面向中型代码库日常修复;Max版每月112.00好意思元,20倍额度,面向重度责任负载,峰期享有属资源。
硅谷AI不雅察者Lisan al Gaib在X上径直开火:\"前沿本质室在API订价上对在宰你。\"他列了组数字:7440亿参数的GLM 5.2收4.40好意思元,1.6万亿参数的DeepSeek V4 Pro收0.87好意思元,而闭源模子收15到30好意思元。\"开源修复者莫得新Blackwell芯片也能盈利,塑料挤出机阐述闭源厂商的利润率可能在90以上。\"
这个估算只看理成本。若是把考研参加、研发东谈主员和基础行径起算进去,利润率会低得多。但即便如斯,订价空间照实渊博于边缘成本。
如故有东谈主在花钱包投票了。凭据发票惩处平台Ramp的数据,6月向DeepSeek支付处事用度的好意思国企业数目急剧增多。据报谈,正在接洽在其旗舰Copilot聊天机器东谈主中使用DeepSeek的模子,好意思国科技巨头,可能要把我方紧迫的AI居品交给本质室的模子来驱动。
听着很颠覆。
但佐亚理工的杜正(Du Zheng)和作家6月新的项盘考,给了个复杂的数字:给定调换任务,DeepSeek模子使用了OpenAI竞品23倍的token数目,来达到基本调换的成果。
23倍。
杜正测的是DeepSeek,不是GLM 5.2。但指向的是同个结构问题:模子倾向于用多token来念念考和输出。这意味着比价不成看\"每个token几许钱\",而要看\"完成件事悉数花了几许token\"。 《经济学东谈主》按这个算法对GLM 5.2作念了测算,在项软件工程benchmark上,GLM 5.2的总花消过了Anthropic和OpenAI的竞品。
模子的才略在进步,但率莫得同步进步。
听起来是白菜价。也不错连络成:模子得多干23谈工序才略交卷,按token计价的低廉不定是真低廉。低廉未低廉,取决于你用得多。
轻量使用,问几个问题、写段代码,GLM 5.2照实省钱。重度使用,万古辰自主编程、复杂多法子理,总成本可能反过来。
平正地说,智谱提供了个缓解案:缓存输入token的订价降到每百万0.26好意思元,何况当今费提供缓存存储。关于反复调用调换险峻文的场景,这能大幅压缩成本。关节看你的责任模式。
不设锁
GLM 5.2发布的时机,巧也好,专诚也好,时辰线上的戏剧是实在的。
6月12日,特朗普政府奉告Anthropic,退却非好意思国公民使用Fable 5。Anthropic的回复是把模子下线。 个闭源模子,前天如故修复者手中好的器具之,二天就没法用了。
24小时后,6月13日下昼5点21分,北京时辰,GLM 5.2发布。 MIT开源许可证。区域甘休。使用甘休。不错下载、修改、商用,不需要付版税,不需要欢跃任何\"可继承使用\"战术。
智谱联首创东谈主唐杰(Tang Jie)在发布会上说了句:\"咱们的格调是激进通达。\"他接着炮轰\"外部禁闭\",指的等于Anthropic和好意思国政府联手制造的那种局面,说这让AI系统\"随时不错被拔除\"。
这不是时刻比拼。这是买卖模式、用户信任和外部战术的三重交叉点。
个企业CTO濒临的选定造成了这样:这边是Anthropic,模子很强,但好意思国政府句话就能让你的团队断供。那边是GLM 5.2,模子够用,你不错部署在我方的处事器上,谁也断不了你的供。
关于好意思国除外的企业,欧洲、东南亚、拉好意思,这谈选定题莫得那么难作念。
Anthropic我方近在份叙述中告诫,AI正迫临好意思国。叙述说好意思国过头盟友还有契机\"锁定12到24个月的前沿先势\"。但叙述的潜台词是:\"这个窗口不会直开着。\"
边在拉刹车,另边在踩油门。
Anthropic说的是\"咱们先但未几\",作念的是把模子下线让用户路可走。智谱说的是\"激进通达\",作念的是把模子权重径直扔到Hugging Face上,MIT许可证。
凯文·辛巴克(Kevin Simback)在X上指出了个冷峻的问题:\"模子好不等于收入好。西企业,信得过的AI金主,可能在土产货部署,钱根蒂到不了智谱手里。编码订阅计算的订价跟Anthropic和OpenAI差未几,未有几许东谈主转投。\"
翻译下:MIT许可证让模子处不在,但也让钱很难流回修复者口袋。对用户是礼物,对智谱的财务报表未。
虽然,那是成本市集的逻辑。对用户来说,多个不受好意思国开关规模的选定,本人等于价值。
那谈线
回到戈兰那句话:\"够近\"等于颠覆运转的地。
GLM 5.2不是强的模子。它在些维度上赶不上Anthropic和OpenAI的旗舰,在擅自基准测试上的差距大要比公开数据大,token率还有昭彰短板。
但它跨过了条线。
这条线之前,开源模子是\"尝鲜\",修复者下载试试,二天换回闭源模子干活。这条线之后,开源模子不错当\"日常用车\",你不错在它上头信得过责任了。
这条线的名字叫够用线。旦跨过,游戏轨则就变了。
不是开源会取代闭源。是闭源不成再仅凭\"咱们好\"来订价,因为\"二好\"如故够好了。当够用线和好之间的差距,小于价签上的差距,预算表会替修复者作念选定。
马斯克在X上说,他瞻望在来岁头赶上头前前沿水平。唐杰回了句:\"用不了那么久。\"
那场硅谷列队点赞发生在6月的二个周末。到了周,切看起来如故老容貌,修复者写代码,公司审预算,好意思国政府发禁令。
但维罗索说的那句话,挂在X的时辰线上,被转了又转:
\"事情不会样了。\"
电话:0316--3233399相关词条:玻璃棉毡 塑料挤出机 预应力钢绞线 铁皮保温 万能胶生产厂家
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
