inferbench

帮助开发者在本地硬件上运行、部署并基准测试多种大模型与图像模型。

许可证

MIT License

来源

third_party_registry

更新于

2026-06-16

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

正在进行安全审计…

凭证密钥
网络外发
代码执行
数据访问
来源供应链

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"inferbench" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

为显卡选择最佳量化版本

输入

请使用 InferBench 测试我这台配备 RTX 4070 的机器，从目录中筛选适合代码生成的模型，并比较不同量化版本的 tokens/sec、显存占用和可用上下文长度，最后推荐最佳选择。

预期产出

返回候选模型对比结果，并给出最适合当前 GPU 的量化版本与推荐理由。

本地部署并压测模型服务

输入

请用 InferBench 在本机启动一个本地大模型服务，并执行基准测试，输出首 token 延迟、吞吐量、并发下的表现，以及适合开发环境还是生产验证环境的结论。

预期产出

得到可运行的本地服务及一份性能报告，帮助判断部署可行性。

比较文本与图像模型性能

输入

请使用 InferBench 分别测试一个 llama.cpp 文本模型和一个 Stable Diffusion 图像模型在当前硬件上的运行速度与资源占用，并总结两类任务的瓶颈差异。

预期产出

输出文本与图像模型的性能对比摘要，便于规划本地 AI 工作负载。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

cn-llm-mcp

将摘要、代码补丁等低风险任务委派给低成本模型并由主代理复核。

—装→

MCP 工具

ArmBench MCP Server

在 Arm64 云实例上完成大模型推理、压测与性能结果服务。

—装→

inferbench

// 用法示例

// 文档

// 功能相似

cn-llm-mcp

ArmBench MCP Server

openai-mcp

LocalLama MCP Server

Local LLM MCP Tool

mcp-multi-model