$ loading_
提供视觉与视频分析能力,支持接入多种模型用于识别、理解与自动处理内容
复制安装指令,让 AI 自动完成配置 · 推荐新手
"vlm-mcp-server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请分析这段监控视频,按时间轴列出关键事件、人物动作、异常行为,并输出结构化摘要。
一份按时间排序的事件摘要,包含异常片段与行为说明。
请识别这张产品界面截图中的主要按钮、输入框、导航区域和提示信息,并说明它们的功能。
一份界面元素清单,附带位置说明和功能解释。
请对这批视频进行内容分析,为每个视频提取主题、场景、对象和情绪标签,并输出为 JSON。
每个视频对应的结构化标签结果,便于检索、分类或下游自动化处理。
用视觉大模型分析本地或远程图片并生成清晰文字描述。