让本地 AI 观察屏幕并执行点击输入等系统操作,自动完成桌面任务。
该工具声明为本地运行、无云 API、无密钥和无远程端点,整体未见明确数据外发红旗;但其具备屏幕监看与原生 OS 输入控制能力,且来源为第三方、社区采用与维护信息较弱,使用时仍需谨慎授权与隔离运行。
材料明确标注无需密钥或环境变量,未见 API token、账号凭证或秘密注入需求,因此凭证泄露面较小。
材料写明“without cloud APIs”,且远程端点为无;基于现有信息未见向外部服务传输用户数据或连接不明主机的证据。
该工具声明可在本机执行原生 OS 命令并进行点击、输入等自动化操作,这属于较强的本地执行/控制能力;虽与其声明功能一致,但应视为需谨慎授权的高影响本机能力。
其核心功能包含“watches your screen”并理解视觉布局,意味着可访问屏幕内容及交互上下文;当前未见超出声明范围的额外文件/系统数据权限说明,但屏幕可见信息本身可能包含敏感数据。
正面因素是源码公开可审计;但来源为 third_party_registry,仓库未声明许可证、社区采用为 0 star、维护状态未知,信任与持续维护信号偏弱,建议在审阅源码与依赖后再使用。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"mcp-vision" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请观察我当前打开的后台页面,找到“新建用户”按钮并点击,然后依次填写姓名“张三”、邮箱“[email protected]”、角色“编辑”,最后点击保存。整个过程只使用本机界面操作。
AI 根据屏幕布局定位按钮和输入框,自动完成点击、输入与保存操作。
读取我屏幕上表格中的客户名单,把每一行的姓名和电话复制到右侧 CRM 应用对应字段中;若出现弹窗,请先关闭再继续。
AI 在多个桌面应用之间识别界面元素并执行复制、切换和粘贴流程。
请打开当前测试环境中的设置页面,依次点击左侧菜单,检查每个页面是否成功加载且按钮可见;如果发现报错或空白区域,记录页面名称和问题位置。
AI 自动遍历界面并返回一份包含异常页面与可见性问题的检查结果。
让 AI 代理全面控制 Linux 桌面,执行操作、识别界面并管理系统任务