精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

知識圖與大型語言模型的協同作用

從非結構化文本中提取有價值的見解是金融行業的關鍵應用。然而,這項任務往往超出了簡單的數據提取,需要高級推理能力。

知識圖與大型語言模型的協同作用

一個典型的例子是確定信貸協議中的到期日,這通常涉及破譯一個復雜的指令,如“到期日應在生效日期三周年之前的最后一個工作日”。這種級別的復雜推理對大型語言模型(LLM)提出了挑戰。它需要結合外部知識,如假日日歷,以準確地解釋和使用給定的指示。集成知識圖是一種很有前途的解決方案,具有幾個關鍵優勢。

Transformer的出現徹底改變了文本矢量化,實現了前所未有的精度。這些嵌入封裝了深刻的語義含義,超越了以前的方法,這就是為什么大型語言模型(LLM)在生成文本方面如此出色的原因。

LLM進一步展示了推理能力,盡管有局限性:他們推理的深度往往會迅速下降。然而,將知識圖與這些向量嵌入相結合可以顯著提高推理能力。這種協同利用嵌入的固有語義豐富性,將推理能力提升到無與倫比的高度,標志著人工智能的重大進步。

在金融領域,LLM主要通過檢索增強生成(RAG)來使用,這種方法將新的、訓練后的知識注入LLM。這個過程包括對文本數據進行編碼,為有效檢索建立索引,對查詢進行編碼,并使用類似的算法獲取相關段落。然后將這些檢索到的段落與查詢一起使用,作為LLM生成響應的基礎。

這種方法大大擴展了LLM的知識基礎,使其對財務分析和決策非常寶貴。雖然檢索增強生成標志著重大的進步,但它也有局限性。

一個關鍵的缺點在于通道向量可能無法完全掌握查詢的語義意圖,從而導致忽略了重要的上下文。出現這種疏忽的原因是,嵌入可能無法捕捉到理解查詢的全部范圍所必需的某些推斷連接。

此外,將復雜的段落濃縮成單個向量可能會導致細微差別的喪失,模糊了分布在句子中的關鍵細節。

還有就是匹配過程單獨處理每個段落,缺乏可以連接不同事實的聯合分析機制。這種缺失阻礙了模型從多個來源聚合信息的能力,而聚合信息對于生成來自不同上下文信息達成全面而準確的響應通常是必需的。

改進檢索增強生成框架的努力有很多,從優化塊大小到使用父塊檢索器、假設問題嵌入和查詢重寫。雖然這些策略提供了改進,但它們不會導致革命性的結果變化。另一種方法是通過擴展上下文窗口來繞過檢索增強生成,就像Google Gemini躍升到100萬個令牌容量一樣。然而,這帶來了新的挑戰,包括在擴展的背景下不一致的焦點和大量的信息,通常是數千倍的成本增加。

將知識圖與密集向量結合起來是最有希望的解決方案。雖然嵌入有效地將不同長度的文本壓縮為固定維向量,從而能夠識別語義相似的短語,但它們有時無法區分關鍵的細微差別。例如,“來自銀行的現金和到期”和“現金和現金等價物”產生幾乎相同的向量,這表明相似性忽略了實質性差異。后者包括有息實體,如“資產支持證券”或“貨幣市場基金”,而“銀行到期”指的是無息存款。

知識圖能捕獲概念之間復雜的相互關系。這培養了更深層次的上下文洞察力,通過概念之間的聯系強調了額外的獨特特征。例如,美國公認會計準則知識圖譜清楚地將“現金和現金等價物”、“銀行計息存款”和“銀行到期”的總和定義為“現金和現金等價物”。

通過整合這些詳細的上下文線索和關系,知識圖顯著提高了LLM的推理能力。它們可以在單個圖中實現更精確的多級推理,并促進跨多個圖的聯合推理。

猜你喜歡