今天就來給大家介紹一個Cherry studio中非常實用的功能,那就是本地知識庫的構建。 廢話不多說,開整! RAG原理簡介先給大家簡單科普一下RAG的原理。 RAG(檢索增強生成)是一種生成式AI技術,通過結合外部知識庫的信息和模型生成的內容,提升生成內容的質量和相關性。 ![]() 具體的流程就是:
實操環節下面進入實操環節。 首先,我默認大家已經配置好了白嫖的Qwen3-235B-A22B模型的api,如果沒有配置的可以看我上一期文章。 1. 準備嵌入模型注冊登錄硅基流動,注冊之后2000萬Tokens,deepseek爆火那會兒好像是直接送余額。 這個Token多少無所謂,因為我們已經設置了白嫖的qwen3了,我們實際上是要使用硅基流動免費的嵌入模型。 ![]() 嵌入模型的作用就是將文本轉換為向量,然后存儲在向量數據庫中。這是構建本地知識庫很關鍵的一步。 和上期一樣,我們注冊登錄認證后,新建一個API密鑰,然后復制備用。 ![]() 2. 配置模型打開Cherry studio的模型配置頁面,選擇硅基流動,粘貼剛剛復制的API密鑰,然后點擊模型管理。 ![]() 點擊嵌入模型列表,第一個BAAI/bge-m3就是免費的版本,1024維(維度越高,匹配越精準),8k的輸入長度,這個參數足夠我們日常使用了。 ![]() 接著點擊重排模型列表,選擇免費的BAAI/bge-reranker-v2-m3,這個模型是用來對檢索出的信息進行重排序的,提升匹配的精準度。 到這,我們需要的模型就全部準備好了。 3. 構建知識庫下面我們開始構建本地知識庫。 首先進行知識庫的初始配置,設置好名稱,再把剛剛配置好的嵌入模型和重排模型添加進來。 ![]() 點擊確認后,就會進入知識上傳頁面。可以看到這里的上傳方式有很多。我們先從最簡單的文件上傳開始。 點擊添加文件,我這里先選了10個AI相關的報告測試一下,點擊打開。 ![]() 接著所有的文件就會開始進行向量化,文件右側閃爍的小藍點就代表正在向量化,變成綠色就代表向量化完成。 ![]() 其他上傳方式也很好理解,我就不一一演示了,大家有興趣可以看下面這張圖。 ![]() 4. 測試知識庫到這我們的知識庫就配置好了,我先簡單測試一下。在搜索框內輸入【企業落地場景】。 ![]() 你會發現匹配到6個(之前默認設置的,可以自定義)相關內容切塊,按照相關性進行了倒序排列。 關鍵的是,就算文本塊中沒有關鍵詞,嵌入模型也會根據語意進行匹配,這個就是RAG的強大之處。 5. 構建智能體進行測試接下來我們構建一個簡單的智能體再測試一下。 分別進行提示詞、模型、以及知識庫的設置。 ![]() 知識庫問答最害怕模型出現幻覺,所以我們用簡單的提示詞進行限制。 僅根據知識庫內容進行回答,若無相關內容則回復用戶'知識庫中暫無相關內容',同時標注好引用來源 模型選擇白嫖的滿血版Qwen3-235B-A22B。 ![]() 知識庫選擇剛剛配置好的【AI學習知識庫】。 ![]() 接著實測一下知識庫問答的效果。 ![]() 可以看到,qwen3的指令遵循還是做的很好的,思考過程中也很好的考慮了我設置的系統提示詞。 非常克制地僅僅依據知識庫進行了回答,并標注了引用來源。 總結到這,基于最強開源模型qwen3構建的本地知識庫到這就算完成了。 這套方案是可以永久白嫖的,qwen3每天可以免費調用2000次,對于大多數人或者小的團隊都是夠用的。 如果你覺得匹配的精度還不夠,可以考慮使用硅基流動的其他收費的嵌入和重排序模型,價格也很便宜。 之前官方贈送的15元,我到現在才用了2塊錢! |
|