$ loading_
帮助 AI 理解并操作网页界面,提取结构化 UI 场景图用于导航与分析
复制安装指令,让 AI 自动完成配置 · 推荐新手
"UI Perception Engine" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
访问这个网页 URL,并提取 UI Scene Graph。找出页面中的主要按钮、它们的可见性、是否可点击,以及当前所在区域。
返回页面主要按钮的结构化列表,包含位置、状态与所属界面区域。
打开目标网站,基于当前 UI Scene Graph 导航到登录页面,定位邮箱和密码输入框,并说明下一步可执行操作。
输出导航过程、识别到的关键元素,以及可继续执行的交互步骤。
分别提取同一网页在操作前后的 UI Scene Graph,对比页面元素、层级结构和状态变化,并总结差异。
生成页面变化对比结果,指出新增、消失或状态变化的界面元素。
调用真实世界导向的 GUI 智能体,自动执行桌面与网页界面操作任务。