澳门在线赌钱娱乐网入口 智谱发布 GLM-5V-Turbo 多模态 Coding 基座模子, 为龙虾安上眼睛
发布日期:2026-04-02 15:19 点击次数:94

IT之家4月2日音信,本日,智谱发布面向视觉编程打造的多模态Coding基座模子GLM-5V-Turbo。其具备以下性情:原生多模态Coding基座,兼顾视觉与编程才能,并深度适配ClaudeCode与龙虾场景。
据先容,GLM-5V-Turbo从预查验阶段深度交融视觉与文本才能,让编程不再局限于纯文本输入。模子能看懂推断打算稿、截图、网页界面,并据此生成完好可驱动的代码,真是作念到看得懂画面、写得出代码。
IT之家附中枢重点如下:
原生多模态Coding基座:原生泄漏图片、视频、推断打算稿、文档版面等多模态输入,并守旧画框、截图、读网页等多模态用具调用,高下文窗口膨胀至200k,将Agent的感知-行径链路从纯文本蔓延到视觉交互。
兼顾视觉与编程才能:在多模态Coding、ToolUse、GUIAgent等中枢基准上得到卓绝发扬。通过多任务协同RL等本事妙技,确保纯文本场景下的编程、推理、用具调用等才能不退化。
深度适配ClaudeCode与龙虾场景:与ClaudeCode、OpenClaw/AutoClaw等Agent深度协同,守旧“看懂环境→经营算作→实行任务”的完好闭环,并提供全套官方Skills,开箱即用。
在多模态Coding、Agentic任务以及纯文本Coding维度的评测基准上,GLM-5V-Turbo均以更小尺寸得到了卓绝发扬。

GLM-5V-Turbo在推断打算稿规复、视觉代码生成、多模态检索与问答、视觉探查等基准上均得到卓绝发扬;在预计真是GUI环境操控才能的AndroidWorld、WebVoyager等基准上不异发扬隆起。在纯文本Coding才能方面,GLM-5V-Turbo在CC-Bench-V2的Backend、Frontend和RepoExploration三项中枢基准测试中均保握踏实发扬,标明视觉才能引入后,纯文本编程与推理才能保握了同等水准。

在AutoClaw等龙虾Agent中接入GLM-5V-Turbo后,澳门在线(赌钱)娱乐网龙虾具备了真是的视觉才能,能看懂屏幕上的信息。模子在预计龙虾Agent任求实行质料的PinchBench、ClawEval和ZClawBench上得到优异获利,考证了其在复杂任求实行场景中的空洞才能。
典型场景展示:
图像即代码
前端复刻:发送草图、推断打算稿、参考网站的截图或录屏,模子就能班师泄漏布局、配色、组件层级与交互逻辑,生成完好可驱动的前端工程,准确规复版式、配色、动效等视觉细节。
GUI自主探索复刻:补救ClaudeCode等框架,GLM-5V-Turbo能凭借自己雄壮的GUIAgent才能自主探索见解网站,浏览页面结构、梳理各页面之间的跳转关联、收集视觉素材与交互细节,终末基于纪录的探索效果班师生成代码复现所有这个词站点,竣事从“看图复刻”到“GUI探索复刻”的才能跃升。

为龙虾安上眼睛
龙虾的任务范畴被大幅拓宽,举例不错浏览网页和文档,生成图文并茂的诠释、PPT,还不错查询并解读K线图等复杂图表。
AutoClaw已上线“股票分析师”Skill,期骗GLM-5V-Turbo的原生视觉才能,龙虾能班师看懂K线走势、估值区间图和券商研报图表,竣事四路数据源60秒并行收集,输出图文交错的研报。立即在AutoClaw中切换至GLM-5V-Turbo澳门在线赌钱娱乐网入口,试试发问“帮我分析今天XXX的股价,生成专科分析诠释”。
斗鱼体育中国官网入口