通过豆包视觉模型解析本地或在线图片内容,并按提示返回理解结果。
该 MCP 工具材料较少,但声明具备图像理解能力并支持本地文件路径与 URL 输入,说明其可能接触用户图像/链接数据。因其为开源项目且未声明需要密钥,整体更适合评为需留意而非高风险,但网络外发路径与维护情况披露不足。
材料明确写明“需要的密钥/环境变量:无”,未见要求用户提供 API key、token 或本地敏感凭证;基于现有材料,凭证暴露面较低。
描述称“using Doubao vision models”且支持 URL 输入,说明存在处理外部资源或将图像/链接内容发送给模型服务的可能;但材料未披露具体远程端点,数据外发对象与范围不够透明。
系统检查项已标记为 executes-code,说明该工具作为 MCP 服务端会在本机运行代码/进程;这是此类工具的常规能力,当前材料未见进一步申请异常系统权限或执行无关操作的红旗。
描述明确支持“local file paths and URLs”,表明其至少可能读取用户指定的本地图片文件和远程资源;目前未见其会批量遍历磁盘或申请超出图像处理所需的数据访问,但可访问范围细节不足。
该项目为开源仓库,可一定程度审计源码,这是降低风险的正面因素;但来源为 third_party_registry,仓库 0 star、许可证未声明、维护状态未知且 README 缺失,供应链成熟度与可验证性偏弱。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"Doubao Vision MCP Server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请分析这张本地界面截图 /Users/demo/app.png,列出页面中的主要按钮、输入框、导航区和可能的交互流程。
返回结构化的界面元素清单,并概述页面功能与用户操作路径。
分析这张图片 https://example.com/chart.jpg,说明它展示了什么信息,并提取其中关键趋势与可见文字。
输出图片主题说明、关键数据趋势总结,以及图片中的文字内容提取结果。
查看本地图片 ./samples/product-photo.jpg,判断这是否是一张适合电商详情页的产品图,并从构图、清晰度、背景干扰三个方面给出评价。
给出是否适合使用的判断,并附带分项评价与改进建议。
帮助用户识别图片内容、提取文字,并以 JSON 或表格输出结构化结果。