$ loading_

Vision MCP Server — askskill

$ ~/registry/mcp/leydidishc280-dotcom-vision-mcp-server

MCP

Vision MCP Server

帮助用户截图并用视觉模型分析屏幕、窗口与图片内容。

许可证

MIT License

来源

third_party_registry

更新于

2026-06-21

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

总评

该 MCP 工具材料较少，但从描述看其功能集中于截图、窗口枚举与图像分析，属于对本地图形界面和图像数据有访问能力的工具。其开源且无密钥、无声明远程端点是正面信号，但社区采用低、维护状态未知，且“cloud or local vision models”表述使潜在数据外发路径不够清晰，整体以 caution 为主。

凭证密钥低风险

材料明确标注无需密钥或环境变量，未见 API token、账号凭证或本地敏感凭证配置要求；从已知信息看，直接凭证泄露面较低。

网络外发需留意

材料未声明固定远程端点，但描述提到可使用 cloud 或 local vision models，说明存在将截图或图像发送到外部视觉服务的可能性；由于 README 缺失、目标端点未披露，数据是否外发及外发到谁目前不够透明。

代码执行需留意

系统检查项显示其具备 executes-code 能力；结合截图、窗口列表与图像分析功能，预计会在本机调用操作系统或图形界面相关能力。就 MCP 工具而言这属于常规权限，但材料未说明边界与具体调用方式。

数据访问需留意

其核心功能需要访问屏幕内容、窗口信息和用户提供的图像，这些数据可能包含敏感信息。现有材料未说明是否支持文件写入、访问范围限制、最小权限设计或敏感区域过滤，因此需留意本地可见数据暴露面。

来源供应链需留意

该工具为开源且 MIT 许可，可审计性优于闭源，这是明显降风险因素；但来源为 third_party_registry，GitHub 仓库社区采用仅 0 star、维护状态未知、README 缺失，导致可信度和持续维护证据偏弱，建议在审阅源码与依赖后再投入敏感环境。

安全建议

优先以本地模型模式运行；如启用云视觉模型，先确认实际请求目标、传输内容与日志策略。
在隔离环境中测试，避免在含敏感窗口、密码管理器或生产数据的桌面会话中直接使用。
安装前审查源码与依赖清单，重点核对截图上传、文件读写、子进程调用与遥测代码路径。
通过系统权限控制限制其屏幕录制/辅助功能访问，并仅在需要时授予。

审计模型: gpt-5.4 · 2026-06-19

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"Vision MCP Server" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

分析当前界面问题

输入

请截图当前屏幕，识别界面中的主要区域、按钮和可能的可用性问题，并给出优化建议。

预期产出

返回界面结构说明、关键元素清单，以及可执行的体验优化建议。

查看打开的窗口

输入

请列出我当前打开的所有窗口，并按应用分类，说明每个窗口的大致内容。

预期产出

输出窗口列表、所属应用，以及每个窗口内容的简要概述。

解读图片内容

输入

请分析这张图片，描述其中的对象、文字、布局和可能传达的信息。

预期产出

生成图片内容摘要，包含视觉元素、文字信息和整体含义解读。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具