首頁(yè) 收藏 QQ群
 網(wǎng)站導(dǎo)航

ZNDS智能電視網(wǎng) 推薦當(dāng)貝市場(chǎng)

TV應(yīng)用下載 / 資源分享區(qū)

軟件下載 | 游戲 | 討論 | 電視計(jì)算器

綜合交流 / 評(píng)測(cè) / 活動(dòng)區(qū)

交流區(qū) | 測(cè)硬件 | 網(wǎng)站活動(dòng) | Z幣中心

新手入門 / 進(jìn)階 / 社區(qū)互助

新手 | 你問(wèn)我答 | 免費(fèi)刷機(jī)救磚 | ROM固件

查看: 1606|回復(fù): 3
上一主題 下一主題
[交流&討論]

如何讓Molili節(jié)省10倍Token消耗?本地部署qmd節(jié)省token積分消耗

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2026-3-3 16:34 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式 | 未知
最近在深度使用Molili的時(shí)候,相信很多人都已經(jīng)感受到了極其恐怖的Token消耗素度。要稍微掛載多一點(diǎn)本地文件,沒(méi)談幾輪對(duì)話下來(lái)就直接提示hit limit觸及限制了。而且很多時(shí)候Molili的agent會(huì)非常暴力地塞一堆完全無(wú)關(guān)的歷史信息進(jìn)context上下文里,這樣不僅極其費(fèi)錢,還會(huì)嚴(yán)重影響AI回復(fù)的精準(zhǔn)度。那么有沒(méi)有辦法讓Molili的agent做到“精準(zhǔn)回憶”,同時(shí)又能完全零成本運(yùn)行呢?答案是有的。今天給大家分享一個(gè)外掛神器:qmd。這是一個(gè)可以本地運(yùn)行、免費(fèi)永久且檢索精準(zhǔn)度高達(dá)95%以上的終極解決方案。

如何讓Molili節(jié)省10倍Token消耗?本地部署qmd節(jié)省token積分消耗

qmd是由Shopify創(chuàng)始人Tobi專門為AI Agent開(kāi)發(fā)的本地運(yùn)行語(yǔ)義搜索引擎,底層基于Rust語(yǔ)言編寫。它的核心功能包括了非常強(qiáng)大的混合搜索(BM25全文檢索+向量語(yǔ)義+LLM重排序),因?yàn)槭峭耆镜剡\(yùn)行的機(jī)制,所以API調(diào)用成本為零,并且完美支持MCP集成,可以說(shuō)是為Molili量身定制的插件。

如何讓Molili節(jié)省10倍Token消耗?本地部署qmd節(jié)省token積分消耗

廢話不多說(shuō),直接上這篇Molili節(jié)省Token消耗的保姆級(jí)教程,只需3步配置,大約10分鐘就能徹底搞定。

第1步:安裝qmd環(huán)境

首先你的電腦上需要先配置好Bun環(huán)境,安裝好Bun之后,直接在終端CMD執(zhí)行以下命令:

bun install -g github:tobi/qmd

注意一點(diǎn):首次運(yùn)行這個(gè)命令會(huì)自動(dòng)從網(wǎng)絡(luò)下載必須的Embedding模型和Reranker模型。根據(jù)你的網(wǎng)絡(luò)情況稍微等一會(huì),下載完成后即可完全離線本地運(yùn)行,后續(xù)再怎么折騰都不會(huì)消耗一點(diǎn)流量了。

第2步:創(chuàng)建Molili記憶庫(kù)并生成embeddings

進(jìn)入你的Workspace,也就是你平時(shí)存放Molili對(duì)話歷史的地方,我們需要索引你的memory文件夾。讓Molili依次執(zhí)行以下代碼:

如何讓Molili節(jié)省10倍Token消耗?本地部署qmd節(jié)省token積分消耗

#創(chuàng)建記憶庫(kù)
qmd collection add memory --name daily-logs --mask "**/*.md"

#生成embeddings
qmd embed
實(shí)測(cè)這里的索引速度極快,而且全部都是在你自己的電腦本地運(yùn)行不聯(lián)網(wǎng),所以完全不用擔(dān)心個(gè)人隱私數(shù)據(jù)泄露的問(wèn)題。

第3步:測(cè)試qmd搜索效果

數(shù)據(jù)跑完之后,你可以自己先在命令行測(cè)一下檢索能力看看準(zhǔn)不準(zhǔn):


#混合搜索(推薦,也是日常最精準(zhǔn)的模式)
qmd query "你的搜索關(guān)鍵詞"

#純語(yǔ)義搜索
qmd vsearch "你的搜索關(guān)鍵詞"

進(jìn)階玩法:配置MCP集成

想要讓Molili的AI agent直接全自動(dòng)調(diào)用qmd,我們就需要修改MCP配置文件。在你的mcporter.json文件里加上下面這段配置代碼:

JSON
{
  "mcpServers": {
    "qmd": {
      "command": "/Users/你的用戶名/.bun/bin/qmd",
      "args": ["mcp"]
    }
  }
}
新手提醒:如果是Windows用戶,請(qǐng)務(wù)必把command里的路徑換成你電腦對(duì)應(yīng)的Bun安裝絕對(duì)路徑)

這段MCP集成配置好并且重啟Molili后,你會(huì)發(fā)現(xiàn)agent已經(jīng)學(xué)會(huì)主動(dòng)從龐大的歷史log文件中尋找最相關(guān)的段落了。它可以完美實(shí)現(xiàn)跨文件精準(zhǔn)回憶,再也不用靠你手動(dòng)發(fā)Prompt去提醒它之前說(shuō)過(guò)什么設(shè)定。

實(shí)際效果總結(jié)

場(chǎng)景1:回憶用戶偏好。以前Molili要回憶一個(gè)設(shè)定,可能需要把整個(gè)長(zhǎng)達(dá)2000個(gè)Token的MEMORY.md文件全塞進(jìn)上下文?,F(xiàn)在有了qmd加持,它只會(huì)提取并返回最相關(guān)的200個(gè)Token片段,既省錢又精準(zhǔn),大幅度降低了Molili不必要的Token消耗。

場(chǎng)景2:跨文件本地知識(shí)檢索。它可以自動(dòng)從你所有的memory文件中精準(zhǔn)定位并找出最相關(guān)段落,準(zhǔn)確率極高,徹底解決了長(zhǎng)文本檢索經(jīng)常出現(xiàn)AI幻覺(jué)或者迷失的問(wèn)題。

總之,如果你在用Molili覺(jué)得Token燒得實(shí)在心疼,或者覺(jué)得Molili記憶力不佳經(jīng)常前言不搭后語(yǔ),強(qiáng)烈建議趕緊按照這個(gè)教程把qmd折騰起來(lái),絕對(duì)能大幅提升你的日常工作效率。


上一篇:Molili每日新聞簡(jiǎn)報(bào)自動(dòng)推送教程指南:定時(shí)任務(wù)配置方法
下一篇:Molili遠(yuǎn)程瀏覽器使用指南,怎么讓Molili遠(yuǎn)程控制瀏覽器
沙發(fā)
發(fā)表于 2026-3-3 19:58 | 只看該作者 | 來(lái)自廣西
我記得OpenClaw它自己就有一個(gè)memory search的功能吧?好像是有嵌入模型在里面的,需要。相比之下,這個(gè)QMD有多大的提升呢?
板凳
發(fā)表于 2026-3-3 19:58 | 只看該作者 | 未知
項(xiàng)目不錯(cuò),但是要注意,這里面需要自己緩存向量模型,模型大小兩個(gè)G,包括重排模型和分塊模型.如果用的是遠(yuǎn)程的小主機(jī)根本跑不起來(lái)。并不適合Openclaw來(lái)跑
地板
發(fā)表于 2026-3-3 19:58 | 只看該作者 | 來(lái)自四川
收藏,試試看

本版積分規(guī)則

關(guān)閉

站長(zhǎng)推薦 上一條 /1 下一條

Archiver|新帖|標(biāo)簽|軟件|Sitemap|ZNDS智能電視網(wǎng) ( 蘇ICP備2023012627號(hào) )

網(wǎng)絡(luò)信息服務(wù)信用承諾書(shū) | 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:蘇B2-20221768 丨 蘇公網(wǎng)安備 32011402011373號(hào)

GMT+8, 2026-3-8 17:06 , Processed in 0.077603 second(s), 14 queries , Redis On.

Powered by Discuz!

監(jiān)督舉報(bào):report#znds.com (請(qǐng)將#替換為@)

© 2007-2026 ZNDS.Com

快速回復(fù) 返回頂部 返回列表