大模型賦能投研專題報告:RAGFlow應用篇,如何結合結構化數據搭建本地智能投研系統?.pdf
- 上傳者:2******
- 時間:2025/05/09
- 熱度:291
- 0人點贊
- 舉報
大模型賦能投研專題報告:RAGFlow應用篇,如何結合結構化數據搭建本地智能投研系統?
金融機構需求與 RAG
金融市場變化莫測,金融機構需要實時關注金融市場動向,在此過程中,金融機構面臨大量文本類信息以及結構化的 數據類型信息。對于多種類的大量信息,亟需大模型的參與進行輔助處理。在眾多 RAG 開源架構中,我們選擇了具有 高質量解析檢索特點的 RAGFlow 解決方案,針對其構建策略已經在《大模型賦能投研之七:如何結合結構化數據搭建 本地智能投研系統?-RAGFlow 原理篇》中進行了詳細分析,核心優勢體現在四個方面:(1)解析方面:通過開發者自 主實現的 DeepDoc 實現高質量知識解析;(2)檢索方面:使用“關鍵詞+向量”的雙路搜索方式,并以如 Raptor 以及 知識圖譜等策略提高檢索質量;(3)兼容方面:RAGFlow 支持結構化數據信息解析,可使用 Table 模型進行解析,實 現多模態知識兼容;(4)使用方面:RAGFlow 提供 Agent 搭建框架,基于高質量知識庫實現質量增強的自定義工作流。
RAGFlow 的部署與使用
RAGFlow 的部署基于于 Linux 環境上的 Docker 容器,對于 windows 用戶需要首先配置 Linux 環境作為準備。更進一 步,RAGFlow 對于軟件環境和硬件配置均有較高的要求:基礎要求 CPU >= 4 核、內存 >= 16GB、磁盤 >= 50GB,且要 求 Docker 版本 >= 24.0.0、Docker Compose 版本 >= v2.26.1。在實際部署中,推薦使用內存 >= 32GB 的機器進行 部署,同時開啟虛擬內存也是解決硬件配置不足的一個可行方案。 部署完成后,在具體使用中,用戶需依照“系統設置”、“文檔入庫”、“檢索配置”以及“檢索回答”的流程進行參數 與模型配置,首先配置 AI 大模型、向量化模型以及重排序模型為應用做準備;其次完成文檔解析入庫相關參數與策 略的配置,并可以選擇未文檔配置元數據提高檢索質量,進一步將傳入的文檔開始解析;解析完成后,可以開始檢索 相關配置,具體需要完成聊天助理設置、提示引擎設置以及創建助手設置,參數較多詳見正文列示,這一步的參數配 置關系到信息檢索質量,本文僅基于《大模型賦能投研之七:如何結合結構化數據搭建本地智能投研系統?-RAGFlow 原理篇》中的評估檢測給出推薦配置,用戶可根據實際情況進行調節;最終,選擇聊天助手,創建對話,即可問答。 除此之外,RAGFlow 提供了 Python API 進行批量操作,可以完成文檔傳入、文檔解析、設置元數據、創建聊天助手、 開始聊天、獲取回答、回去召回的文本塊等基礎操作,若有批量使用的需求,可以通過 Python API 調用 RAGFlow 的 基礎功能。但同時,當前版本下(v0.17.2 版本),RAGFlow 的 API 仍存在無法開啟 Deep Research 檢索等缺陷。
RAGFlow 項目運用實戰
在應用篇中,我們進一步基于 RAGFlow 框架,同時憑借其對結構化數據的高質量支持,搭建了有獲取結構化數據能力 的智能投研系統,已形成閉環數據鏈路。其中包括四個組件:1)三大財務報表通過 Table 解析入庫構建企業基本面 本地知識庫,在工作流中通過知識庫檢索獲取;2)通過 Text2SQL 組件實現實時調取所需的日行情以及相關研究報告; 3)通過 RAGFlow 內嵌的問財 Agent 實現簡易的邏輯選股功能;4)通過 RAGFlow 內嵌 AKshare 組件取實時新聞資訊。 最終,我們基于 Text to SQL 簡單工作流實現、以及結構化數據信息提取工作流實現的基礎上,融合以三大報表、股 票日行情為代表的結構化數據,以及研報信息和實時新聞行情信息,最終構建了多維度金融信息獲取 Agent,在實際 測試中政策的執行的設定的檢索與處理流程,效果較好。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 170 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 129 5積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 124 4積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 121 4積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 107 5積分
- Agent專題報告:Harness Engineering,構建自主進化的金融Agent.pdf 104 4積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 103 6積分
- MINIMAX_W-0100.HK-深度研究報告:從模型公司邁向AI時代平臺型公司.pdf 97 4積分
- 計算機行業深度報告:解析大模型行業,從發展歷程到投資視角.pdf 80 5積分
- 清新研究:2026年OpenAI FDE研究報告.pdf 79 14積分
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 170 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 129 5積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 124 4積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 121 4積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 107 5積分
- Agent專題報告:Harness Engineering,構建自主進化的金融Agent.pdf 104 4積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 103 6積分
- MINIMAX_W-0100.HK-深度研究報告:從模型公司邁向AI時代平臺型公司.pdf 97 4積分
- 計算機行業深度報告:解析大模型行業,從發展歷程到投資視角.pdf 80 5積分
- 清新研究:2026年OpenAI FDE研究報告.pdf 79 14積分
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 170 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 129 5積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 124 4積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 121 4積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 107 5積分
- Agent專題報告:Harness Engineering,構建自主進化的金融Agent.pdf 104 4積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 103 6積分
- MINIMAX_W-0100.HK-深度研究報告:從模型公司邁向AI時代平臺型公司.pdf 97 4積分
- 計算機行業深度報告:解析大模型行業,從發展歷程到投資視角.pdf 80 5積分
- 清新研究:2026年OpenAI FDE研究報告.pdf 79 14積分
