
近日,Agnes开云官网切尔西赞助商旗下中枢模子矩阵显露上线Zenmux平台,连气儿洞开四款主力模子调用,袒护文本Agent与多模态生成两大中枢方针。
其中包括Claw系列的Agnes-1.5-Lite与Agnes-1.5-Pro,以及多模态方针的Agnes-Image-1.2与Agnes-Video-V1.2,平直把「文本+图像+视频」的整套才调打包上线。
更值得眷注的是,上线首周模子调用量即快速攀升,已跨越多家头部模子公司同类产物显露,浮现出强盛的市集接纳度与建造者活跃度,成为近期建造者侧增长最为迅猛的一组模子组合之一。

Agnes模子矩阵在Zenmux显露上线
在行业广泛参预「性能+资本」双重竞争阶段的布景下,Agnes通过高性价比模子与完满器用链的组合,正在速即掀开建造者生态进口。
AgnesClaw
低至1好意思元的「养虾」初学神器
在OpenClaw热度捏续攀升之际,Agnes将「Claw」接入自家App,AgnesClaw一键部署。
用户通过订阅会员(部分地区Starter新用户最低可低至1好意思元/月)即可免费部署并使用AgnesClaw,同期解锁平台一说念高等功能,性价比极高。
AgnesClaw的进口前置到首页,用户一键部署完成后,在对话框中切换至AgnesClaw方式,即可体验「养龙虾」,全体学习体验资本极低。
AgnesClaw当今支捏与Telegram绑定,后续接入更多平台,提供定时任务、永久牵挂和skills库,包括Agnes预置常用skills(如PPT生成、表格处理、图像/视频生成、AI搜索、深度参谋等)和开源skills。
部分AI应用由于底层模子才调的舍弃,可能存在无法装置或通顺运行特定skill组件的问题。
而Agnes官方默示,AgnesClaw凭借自研的「龙虾」基座模子与盛大的器用调用适配才调,简直不错无缝装置并使用绝大多数热点skills。
用户不错哄骗它创建定时任务、处理文献并整理为结构化文档、驱散办公自动化等。
同期,AgnesClaw具备自我进化才调,通过高下文清楚和牵挂才调,在使用经过中能更好地清楚用户民俗,从而更有用地协助完成任务。

一键部署AgnesClaw
AgnesClaw的最大亮点在于自研的「龙虾」基座模子,这是赋予Agnes版块「龙虾」具备更强的清楚力和skill适配才调的中枢。
Agnes为用户高性价比「养龙虾」,挑升推出了两款不同参数规模基于LLM优化的Agent模子,永诀是Agnes-1.5-Pro模子和Agnes-1.5-Lite模子。

PinchBench榜单中Agnes-1.5 系列模子在准确性维度显露隆起
AgnesClaw定位「下一代极速多模态混杂民众模子」,架构上和会了隐式MoE(Latent MoE)、Mamba-2景况空间模子与原生多模态早和会工夫,旨在同期贬责超长高下文、高频器用调用、复杂Multi-Agent结合三大痛点,冲破传统「规模-蔓延-牵挂」三元悖论。
左证公共泰斗「养虾」AI评测榜单PinchBench,Agnes-1.5-Pro模子在准确性维度显露隆起,已置身榜单前线,成为建造者「最好养虾模子」采选之一。


PinchBench榜单
Agnes-Image-1.2
开源第一,闭源第二
本次发布中,Agnes 20B全新图像裁剪模子Agnes-Image-1.2的显露超出预期。
左证官方公布的测试数据,该模子轮廓评分达到4.25分(满分5分),在闭源模子中仅次于NanoBananaPro的4.48分,杰出了Seedream4.0和Seedream4.5,在开源模子中名次序一。

全新图像模子轮廓评分达到4.25分(满分5分)
在单技俩的上,Agnes-Image-1.2模子在东说念主像维度栽植尤为显耀,针对东说念主像场景的定向微调有用增强了面部细节保真、局部裁剪可控性以及与布景的当然和会才调,Portrait从3.98栽植至4.30(+0.32)。
同期,Extract(2.47→3.05,+0.58)与Viewpoint(2.82→3.17,+0.35)也有进一步栽植,标明模子在方针区域分离与结构/几何雄厚性方面更可靠,有助于复杂裁剪任务的一致性显露。
完满模子眷属
袒护多模态全链路
除了Agnes-1.5-Pro与Agnes-1.5-Lite两款模子和Agnes-Image-1.2图像裁剪模子,Agnes这次还亮出了愈加完满的模子矩阵,包括搜索与参谋模子、AI Slides模子、图片与视频生成模子。
在图片和视频生成领域,Agnes构建了完满模子体系,包括图像和视频模子。除了之前先容的Agnes-Image-1.2(20B)模子,Agnes另外还有一款19B的Agnes-Video-V1.2视频生成模子。
据了解,Agnes-Video-V1.2可驱散原生音画同步生成,支捏图生视频和特定立场/变装的生成,可适配多种业务场景。
该模子继承双流音视频Transformer架构,能在并吞模子中同期生成音频与视频,从而驱散东说念主物口型、行为与声息自然同步。模子经测试可在有限显存环境下运行,便捷企业级规模化部署和个东说念主建造者的腹地实验。
在讲话模子方面,Agnes针对我方的主推市集东南亚地区,推出了8B参数的东南亚小语种模子Agnes-SeaLLM,当今已成为该地区小语种清楚与生成任务SOTA模子。

东南亚小语种模子Agnes-SeaLLM
在信息处理和参谋才调方面,Agnes发布了Agnes-Search(30B)模子和面向复杂参谋任务的Agnes-DeepResearch(30B)模子。
前者在里面测试中驱散78.6%的推理资本着落,生成速率栽植18.6%;后者测试援用准确率为100%,基准测试准确率平均栽植14.3%。
在办公自动化场景中,Agnes-Slides(30B)模子不错将网页或文档现实自动生成为PPT,时时1分钟即可生成15—20页演示文稿,平均生成资本低至约每页几好意思分。
模子后锤真金不怕火为主
RLAF框架减少东说念主工依赖
在底层锤真金不怕火范式上,Agnes继承的是一整套联结演进的工夫旅途:从CPT(continuous pre-training,捏续预锤真金不怕火)到PT(post-training,后锤真金不怕火),再到以自建RL(reinforcement learning)为中枢的强化阶段,使模子才调不错捏续迭代,而非一次性照顾。
更要津的是,他们把「进化」这件事,从模子层扩张到了Agent层。
在AgnesClaw体系中,Agent不仅调用skills,还不错在职务履行经过中通过反应不断优化自己政策,驱散智能体与skills的协同自进化。
这意味着,系统才调不再透顶依赖预锤真金不怕火,而是在确凿使用中捏续变强。
相沿这套体系的,是一支高度国外化的参谋团队——成员来自斯坦福、伯克利、MIT、NUS、NTU,以及清华、浙大、南大、东大等顶尖高校,中枢科研带头东说念主包括来自微软亚研院、英特尔参谋院的首席科学家,以及高校老师与图灵奖得主门下参谋者。
他们建议了一套名为RLAF(Reinforcement Learning with Agentic Feedback)的带智能反应的新的强化学习框架,以减少对东说念主工标注的依赖。该框架包含两个自研中枢组件:
DSPO(Dynamic-filter Sequence-level Policy Optimization):动态过滤序列级政策优化算法。
官方数据浮现,在同规模模子对比中,比较DeepSeek Search-R1 (GRPO,7B)驱散34.1%的性能栽植。
UV(Universal Verifier):通用考据器,用智能评估器替换东说念主工标注数据和东说念主工界说的奖励机制。
在RLAF框架中,多个AI Agent会对模子输出进行自动评估,从逻辑一致性、事实准确性和任务完成度等多个维度生成反应信号。
这种「AI锤真金不怕火AI」的形势,不错减少多半东说念主工标注,从而裁汰锤真金不怕火资本并栽植效果。
跟着AI行业参预新一轮竞争阶段,资本效果正冉冉成为交易化成败的要津身分。而这次登陆Zenmux,某种进程上亦然Agnes一个要津分水岭——
模子不再仅仅「榜单显露」,而是平直参预建造者确凿调用与对比的第一线。
从上线一周的调用显露来看,这套Claw+多模态组合如故运转改写一部分建造者的采选。
当越来越多模子走向平台化分发,着实能留住来的,梗概不仅仅更强的参数规模,而是谁更低廉、谁更好用、谁更能被快速接入确凿宇宙。
Agnes,昭着正在把谜底往这个方针推。