[{"data":1,"prerenderedAt":25},["ShallowReactive",2],{"$fPUS3mxZn1FKaNjcBi4wh8Ypmv5kEDXU6Ojot6HF067Q":3},{"id":4,"documentId":5,"title":6,"summary":7,"content":8,"author":9,"category":10,"tags":11,"icon":16,"views":17,"isTop":18,"isNew":19,"publishDate":20,"createdAt":21,"updatedAt":22,"publishedAt":23,"slug":24},196,"uxc7myaarjb5mpu6ldjbghsu","AI 每次对话都在偷你的钱？这 2 招让 Token 消耗直降 90%","本文讲解 QMD 按需检索模式与定期精简记忆两个方法，把 OpenClaw 会话记录从 1.7MB 降到几十KB，节省80-90%的Token消耗，附完整记忆规则代码。","\u003Cp>\u003C!DOCTYPE html>\u003C/p>\u003Cp>\u003Chtml xmlns:o=\"urn:schemas-microsoft-com:office:office\" xmlns:w=\"urn:schemas-microsoft-com:office:word\">\u003C/p>\u003Cp>\u003Chead>\u003C/p>\u003Cp>  \u003Cmeta charset=\"utf-8\">\u003C/p>\u003Cp>  \u003Cmeta name=\"viewport\" content=\"width=device-width\">\u003C/p>\u003Cp>  \u003Ctitle>AI 每次对话都在偷你的钱？这 2 招让 Token 消耗直降 90%\u003C/title>\u003C/p>\u003Cp>  \u003Cstyle>\u003C/p>\u003Cp>    /* Word 特定样式 */\u003C/p>\u003Cp>    body {\u003C/p>\u003Cp>      font-family: \"Microsoft YaHei\", \"微软雅黑\", \"SimSun\", \"宋体\", Arial, sans-serif;\u003C/p>\u003Cp>      line-height: 1.8;\u003C/p>\u003Cp>      max-width: 800px;\u003C/p>\u003Cp>      margin: 40px auto;\u003C/p>\u003Cp>      padding: 20px;\u003C/p>\u003Cp>      background: white;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    h1 {\u003C/p>\u003Cp>      font-size: 22pt;\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>      color: #2c3e50;\u003C/p>\u003Cp>      margin: 24pt 0 16pt;\u003C/p>\u003Cp>      border-bottom: 2px solid #3498db;\u003C/p>\u003Cp>      padding-bottom: 8pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    h2 {\u003C/p>\u003Cp>      font-size: 18pt;\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>      color: #34495e;\u003C/p>\u003Cp>      margin: 20pt 0 12pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    h3 {\u003C/p>\u003Cp>      font-size: 16pt;\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>      color: #34495e;\u003C/p>\u003Cp>      margin: 16pt 0 10pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    h4 {\u003C/p>\u003Cp>      font-size: 14pt;\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>      color: #7f8c8d;\u003C/p>\u003Cp>      margin: 14pt 0 8pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    p {\u003C/p>\u003Cp>      font-size: 11pt;\u003C/p>\u003Cp>      margin: 8pt 0;\u003C/p>\u003Cp>      text-align: justify;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    strong, b {\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>      color: #2c3e50;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    em, i {\u003C/p>\u003Cp>      font-style: italic;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    code {\u003C/p>\u003Cp>      font-family: \"Consolas\", \"Courier New\", monospace;\u003C/p>\u003Cp>      background: #f8f9fa;\u003C/p>\u003Cp>      padding: 2px 6px;\u003C/p>\u003Cp>      border-radius: 3px;\u003C/p>\u003Cp>      font-size: 10pt;\u003C/p>\u003Cp>      color: #e74c3c;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    pre {\u003C/p>\u003Cp>      background: #f8f9fa;\u003C/p>\u003Cp>      border: 1px solid #dee2e6;\u003C/p>\u003Cp>      border-radius: 5px;\u003C/p>\u003Cp>      padding: 12pt;\u003C/p>\u003Cp>      font-family: \"Consolas\", \"Courier New\", monospace;\u003C/p>\u003Cp>      font-size: 9pt;\u003C/p>\u003Cp>      overflow-x: auto;\u003C/p>\u003Cp>      margin: 12pt 0;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    pre code {\u003C/p>\u003Cp>      background: none;\u003C/p>\u003Cp>      padding: 0;\u003C/p>\u003Cp>      color: inherit;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    blockquote {\u003C/p>\u003Cp>      border-left: 4px solid #3498db;\u003C/p>\u003Cp>      margin: 12pt 0;\u003C/p>\u003Cp>      padding: 8pt 16pt;\u003C/p>\u003Cp>      background: #f8f9fa;\u003C/p>\u003Cp>      color: #555;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    ul, ol {\u003C/p>\u003Cp>      margin: 8pt 0;\u003C/p>\u003Cp>      padding-left: 24pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    li {\u003C/p>\u003Cp>      margin: 4pt 0;\u003C/p>\u003Cp>      font-size: 11pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    img {\u003C/p>\u003Cp>      max-width: 500px;\u003C/p>\u003Cp>      width: 500px;\u003C/p>\u003Cp>      height: auto;\u003C/p>\u003Cp>      display: block;\u003C/p>\u003Cp>      margin: 16pt auto;\u003C/p>\u003Cp>      border-radius: 4px;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    hr {\u003C/p>\u003Cp>      border: none;\u003C/p>\u003Cp>      border-top: 2px solid #ecf0f1;\u003C/p>\u003Cp>      margin: 24pt 0;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    a {\u003C/p>\u003Cp>      color: #3498db;\u003C/p>\u003Cp>      text-decoration: underline;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    table {\u003C/p>\u003Cp>      border-collapse: collapse;\u003C/p>\u003Cp>      width: 100%;\u003C/p>\u003Cp>      margin: 12pt 0;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    th, td {\u003C/p>\u003Cp>      border: 1px solid #ddd;\u003C/p>\u003Cp>      padding: 8pt 12pt;\u003C/p>\u003Cp>      font-size: 11pt;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>    th {\u003C/p>\u003Cp>      background: #3498db;\u003C/p>\u003Cp>      color: white;\u003C/p>\u003Cp>      font-weight: bold;\u003C/p>\u003Cp>    }\u003C/p>\u003Cp>  \u003C/style>\u003C/p>\u003Cp>\u003C/head>\u003C/p>\u003Cp>\u003Cbody>\u003C/p>\u003Cp>  \u003Cblockquote>\u003C/p>\u003Cp>\u003Cp>文末附完整的记忆规则代码，看完即可直接复用。\u003C/p>\u003C/p>\u003Cp>\u003C/blockquote>\u003C/p>\u003Cp>\u003Ch2>一个真实的数据对比\u003C/h2>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_31_21_cf61ec6f0f.png\" alt=\"优化前会话文件大小对比：2月份多个会话文件超过1MB甚至接近3MB\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>这是我的会话记录。\u003C/p>\u003C/p>\u003Cp>\u003Cp>你看 2 月 10 日，一个 1.71MB，一个 1MB。后面几天更大——2 月 25 日 2.98MB，2 月 26 日 2.48MB。这些都是优化前的。\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_30_31_e33abfbe91.png\" alt=\"优化后会话文件大小对比：3月份会话文件降至几十到几百KB\">\u003C/p>\u003Cp>现在呢？3 月份的会话，降到几十到几百 KB。\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cstrong>我是怎么做到的？\u003C/strong>\u003C/p>\u003C/p>\u003Cp>\u003Ch2>问题出在哪？\u003C/h2>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_frame_015_1ded563841.jpg\" alt=\"记忆文件大小\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>我的记忆文件有 5800 多字符，全量加载要 3000 多 Token。\u003C/p>\u003C/p>\u003Cp>\u003Cp>每次对话都加载一遍，\u003Cstrong>这就像找资料把整个图书馆搬回家\u003C/strong>。\u003C/p>\u003C/p>\u003Cp>\u003Ch2>第一招：QMD 模式\u003C/h2>\u003C/p>\u003Cp>\u003Cp>在 \u003Ca href=\"http://AGENTS.md\">AGENTS.md\u003C/a> 里，我写好了记忆访问规范。\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cstrong>核心原则是：按需检索，不全量加载。\u003C/strong>\u003C/p>\u003C/p>\u003Cp>\u003Ch3>具体怎么用？\u003C/h3>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_frame_027_005d5f872b.jpg\" alt=\"向量检索配置\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>我在 OpenClaw 里配置了智谱的 embedding-3 模型做向量化检索。\u003C/p>\u003C/p>\u003Cp>\u003Cp>选智谱是因为：\u003C/p>\u003C/p>\u003Cp>\u003Cul>\u003C/p>\u003Cp>\u003Cli>✅ 中文友好\u003C/li>\u003C/p>\u003Cp>\u003Cli>✅ 性价比高\u003C/li>\u003C/p>\u003Cp>\u003C/ul>\u003C/p>\u003Cp>\u003Cp>OpenClaw 也支持 OpenAI、Gemini 等其他向量服务。\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_25_12_8da77837a3.png\" alt=\"使用 memory_search 输入关键词进行语义检索的操作界面\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>用 OpenClaw 自带的 \u003Ccode>memory_search\u003C/code> 输入关键词，系统会在 \u003Ca href=\"http://MEMORY.md\">MEMORY.md\u003C/a> 和所有日志文件里搜索，找到最相关的片段。\u003C/p>\u003C/p>\u003Cp>\u003Cp>再用 \u003Ccode>memory_get\u003C/code> 精确读取需要的行。\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_frame_038_87f36caac2.jpg\" alt=\"省掉80-90% Token\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>\u003Cstrong>不用全量加载，省掉 80-90% Token。\u003C/strong>\u003C/p>\u003C/p>\u003Cp>\u003Ch2>第二招：精简记忆\u003C/h2>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_frame_042_0cb240a499.jpg\" alt=\"日志文件列表\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>你看这里有 20 多个日志文件——我在 \u003Ca href=\"http://AGENTS.md\">AGENTS.md\u003C/a> 里设置了定时任务：\u003C/p>\u003C/p>\u003Cp>\u003Cul>\u003C/p>\u003Cp>\u003Cli>每天结束后自动沉淀一份日志\u003C/li>\u003C/p>\u003Cp>\u003Cli>定期合成到主记忆文件里\u003C/li>\u003C/p>\u003Cp>\u003C/ul>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_27_40_032a06affa.png\" alt=\"AGENTS.md 中配置定期归档日志、防止记忆文件膨胀的规则设置\">\u003C/p>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_frame_046_a1282ad684.jpg\" alt=\"精简效果\">\u003C/p>\u003C/p>\u003Cp>\u003Cp>这样 \u003Ca href=\"http://MEMORY.md\">MEMORY.md\u003C/a> 就不会越来越臃肿。\u003C/p>\u003C/p>\u003Cp>\u003Ch2>总结：2 招省掉 80-90% Token\u003C/h2>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_28_32_45ed70f44d.png\" alt=\"优化前后会话文件体积对比：从1.7MB降至84KB的实测效果\">\u003C/p>\u003C/p>\u003Cp>\u003Ctable>\u003C/p>\u003Cp>\u003Cthead>\u003C/p>\u003Cp>\u003Ctr>\u003C/p>\u003Cp>\u003Cth>招数\u003C/th>\u003C/p>\u003Cp>\u003Cth>核心原理\u003C/th>\u003C/p>\u003Cp>\u003Cth>效果\u003C/th>\u003C/p>\u003Cp>\u003C/tr>\u003C/p>\u003Cp>\u003C/thead>\u003C/p>\u003Cp>\u003Ctbody>\u003C/p>\u003Cp>\u003Ctr>\u003C/p>\u003Cp>\u003Ctd>QMD 模式\u003C/td>\u003C/p>\u003Cp>\u003Ctd>向量检索 + 精确读取\u003C/td>\u003C/p>\u003Cp>\u003Ctd>省掉 80-90% Token\u003C/td>\u003C/p>\u003Cp>\u003C/tr>\u003C/p>\u003Cp>\u003Ctr>\u003C/p>\u003Cp>\u003Ctd>精简记忆\u003C/td>\u003C/p>\u003Cp>\u003Ctd>定时归档 + 保持精简\u003C/td>\u003C/p>\u003Cp>\u003Ctd>防止记忆膨胀\u003C/td>\u003C/p>\u003Cp>\u003C/tr>\u003C/p>\u003Cp>\u003C/tbody>\u003C/p>\u003Cp>\u003C/table>\u003C/p>\u003Cp>\u003Ch2>写在最后\u003C/h2>\u003C/p>\u003Cp>\u003Cp>如果你也在用 OpenClaw，这 2 招能帮你省下大量 Token。\u003C/p>\u003C/p>\u003Cp>\u003Cp>关注我，后续分享更多 OpenClaw 实战技巧。\u003C/p>\u003C/p>\u003Cp>\u003Cp>这里是 AI 共生阁，我们下期见~\u003C/p>\u003C/p>\u003Cp>\u003Ch2>附录 - ~.openclaw\\workspace\\AGENTS.md 的记忆规则\u003C/h2>\u003C/p>\u003Cp>\u003Cp>\u003Cimg src=\"https://aigongsheng.com/uploads/openclaw_token_2026_03_09_21_42_15_5564d0f211.png\" alt=\"AGENTS.md 记忆规则完整代码截图，包含 QMD 按需检索与定期归档的具体配置\">\u003C/p>\u003C/p>\u003Cp>\u003C/p>\u003Cp>\u003C/body>\u003C/p>\u003Cp>\u003C/html>\u003C/p>\u003Cp>\u003Ch2>常见问题\u003C/h2>\u003Ch3>Q: QMD 模式具体怎么省 Token？\u003C/h3>\u003Cp>A: 用 memory_search 按关键词在 MEMORY.md 和日志文件里做向量检索，找到最相关片段后再用 memory_get 精确读取需要的行，不用把几千字符的记忆文件全量加载，省掉 80-90% Token。\u003C/p>\u003Ch3>Q: 除了 QMD 模式还有什么方法？\u003C/h3>\u003Cp>A: 第二招是精简记忆——设定定时任务，每天结束后自动沉淀一份日志，再定期合成到主记忆文件里，防止 MEMORY.md 越来越臃肿。\u003C/p>\u003C/p>","AI 共生阁","AI工具",[12,13,14,15],"OpenClaw","Token优化","AI记忆","效率提升","📝",0,false,true,"2026-03-09","2026-03-09T14:24:41.789Z","2026-07-04T08:06:33.772Z","2026-07-04T08:06:33.787Z","reduce-ai-token-cost",1783157885781]