$ loading_
将分类、抽取、摘要等轻量文本任务路由到低成本模型,节省主模型 token 消耗。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"tokens-saver-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请把这批用户访谈记录先交给低成本模型做主题分类、关键信息抽取和每篇 100 字摘要,再把汇总结果返回给主模型继续分析。
先由低成本模型完成基础文本处理,再输出结构化结果供主模型深入分析,从而降低整体 token 成本。
把新收到的客服工单先用低成本模型判断问题类型、紧急程度并提取订单号与客户情绪,只有复杂工单再交给主模型回复。
输出工单分类、优先级和关键字段,复杂案例才升级到主模型处理,提升效率并节省 token。
请将知识库文章批量路由到低成本模型,先生成标题标签、要点摘要和 FAQ 提取结果,再交由主模型生成最终对外答案。
获得可复用的标签、摘要与 FAQ 结构化内容,并减少主模型直接处理原文的 token 开销。
监控并提醒 AI 对话中的令牌浪费,减少冗长输出与重复上下文。