$ loading_
管理 llama.cpp 推理服务实例,支持启停、配置维护与孤儿进程排查。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"llauncher" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
使用 llauncher 启动一个 llama.cpp llama-server 实例,加载本地 GGUF 模型,监听 8080 端口;然后返回实例状态、启动参数和健康检查结果。
返回已启动的服务信息,包括端口、模型路径、运行状态与可访问性检查结果。
用 llauncher 查找名为 research-llm 的服务配置,将上下文长度调到 8192,线程数调到 8,并保存更新后的配置摘要。
输出修改后的关键配置项,并确认配置已成功写入或更新。
使用 llauncher 扫描当前环境中的 llama-server 相关实例,识别未被配置管理跟踪的孤儿进程,并列出 PID、监听端口和建议处理动作。
返回孤儿进程清单及处理建议,帮助清理残留服务或恢复管理状态。
将 Claude Code 连接到本地 llama.cpp,便于低成本测试与运行本地大模型。