$ loading_
自动将图片贴齐视觉模型分块边界,降低多模态调用的图像 token 成本。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "io.github.eralpozcan/vision-squeezer" MCP 服务: 执行:claude mcp add 'io-github-eralpozcan-vision-squeezer' -- npx -y vision-squeezer
请将这批用于 Claude 和 GPT-4o 识别的截图自动贴齐到视觉分块边界,在尽量不影响可读性的前提下减少图像 token 消耗,并输出优化后的文件列表与节省估算。
返回处理后的图片、对应尺寸调整结果,以及每张图片预计节省的 token 或成本说明。
帮我把 vision-squeezer 接入现有图片上传流程:上传后先按 Gemini 和 Qwen 的视觉分块规则优化,再交给后续识别服务,并说明集成步骤。
给出适合集成的处理流程、配置建议,以及优化前后在调用成本上的差异说明。
将这个待送入 Llama 和 Qwen 视觉模型的数据集图片批量处理为更省 token 的尺寸,保留关键信息,并生成处理报告。
输出优化后的数据集图片及一份报告,说明尺寸变化、适配模型和预计节省效果。
连接本地视觉大模型,提供图像分析、对比与 OCR 识别能力。