vlm-mcp-server

分析监控视频事件

输入

请分析这段监控视频，按时间轴列出关键事件、人物动作、异常行为，并输出结构化摘要。

预期产出

一份按时间排序的事件摘要，包含异常片段与行为说明。

识别图片中的界面元素

输入

请识别这张产品界面截图中的主要按钮、输入框、导航区域和提示信息，并说明它们的功能。

预期产出

一份界面元素清单，附带位置说明和功能解释。

批量提取视频内容标签

输入

请对这批视频进行内容分析，为每个视频提取主题、场景、对象和情绪标签，并输出为 JSON。

预期产出

每个视频对应的结构化标签结果，便于检索、分类或下游自动化处理。

// 用法示例