$ loading_

npu-vision-fallback — askskill

$ ~/registry/mcp/byte-naut-npu-vision-fallback

MCP

npu-vision-fallback

为本地低功耗屏幕视觉提供OCR与界面检测，辅助识别受限屏幕内容

许可证

MIT License

来源

third_party_registry

更新于

2026-06-19

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

总评

该工具声明为本地屏幕视觉/OCR 的 MCP 服务，无需密钥且未声明任何远程端点，整体未见明显数据外发红旗。主要注意点在于其本机代码执行与屏幕内容访问能力，以及来源虽开源可审计但社区采用和维护信号较弱。

凭证密钥低风险

材料明确写明无需密钥或环境变量，未见 API token、账号凭证或第三方授权流程，因此凭证泄露与滥用面较低。

网络外发低风险

未声明任何远程端点，描述中也未提及云端 OCR/推理服务；基于现有材料，更像完全本地处理，未见将用户数据外发到外部服务的事实依据。

代码执行需留意

系统客观检查项已标记 executes-code，说明其作为 MCP 工具会在本机运行代码/进程；结合其 NPU 加速、系统 OCR 与屏幕视觉功能，预计会调用本地系统能力，但材料未显示超出声明用途的异常高权限请求。

数据访问需留意

该工具的核心功能是对“不可访问屏幕”执行 OCR 和 UI 检测，这通常意味着需要读取屏幕画面或相关图像数据；这属于其功能所必需的数据访问，但可能接触敏感界面内容，应按最小化授权使用。

来源供应链需留意

正面因素是其开源且采用 MIT 许可证，源码原则上可审计；但来源为 third_party_registry，仓库社区采用为 0 star、维护状态未知，且提供材料非常简略，因此供应链信号偏弱，建议先审查代码与依赖。

安全建议

在隔离环境中先测试，确认其仅执行本地 OCR/屏幕分析且无异常联网行为。
授予最小必要的屏幕访问权限，避免在处理敏感会话或高敏界面时启用。
安装前审查仓库代码、依赖清单与发布包是否一致，优先锁定具体版本。
结合主机防火墙与进程监控，持续观察其文件访问、子进程与网络行为。

审计模型: gpt-5.4 · 2026-06-19

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"npu-vision-fallback" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

识别远程桌面按钮

输入

请通过 npu-vision-fallback 分析当前远程桌面画面，识别可点击按钮、输入框和主要文本，并按屏幕区域列出它们的位置与标签。

预期产出

返回远程桌面中的界面元素清单，包含文本内容、控件类型和大致位置。

读取游戏界面文字

输入

使用 npu-vision-fallback 对当前游戏画面执行 OCR，提取任务提示、菜单文字和状态信息，并整理成结构化摘要。

预期产出

输出游戏界面中可识别的文字及其分类摘要，便于后续自动化处理。

辅助屏幕自动化测试

输入

调用 npu-vision-fallback 检测当前应用界面的关键控件与文本，判断登录页是否完整加载，并指出缺失或异常元素。

预期产出

给出页面加载状态判断，以及关键控件是否存在的检测结果。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

mcp-vision

让本地 AI 观察屏幕并执行点击输入等系统操作，自动完成桌面任务。

—装→

MCP 工具

Vison-MCP

将截图和图片转成代码、文本与故障诊断结果，提升视觉理解自动化。

—装→

npu-vision-fallback

// 用法示例

// 文档

// 功能相似

mcp-vision

Vison-MCP

mcp-vision

image-recognition-mcp

nvidia-vision-mcp

screen-mcp