精品国产91,成人日韩av,久久视频一区

RAG準確率提升10.6%，多項基準拿下新SOTA！

ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架，首次系統性地將詞匯多樣性引入RAG的檢索與生成過程，提供了一個輕量、通用且易擴展的解決方案。

在多項基準任務中，該方法帶來了顯著性能提升，尤其在HotpotQA上刷新了當前最優結果。

讓RAG真正讀懂“言外之意”！新框架引入詞匯多樣性，刷新多基準

在大語言模型的浪潮下，Retrieval-Augmented Generation（RAG）已經成為提升模型事實性和時效性的重要手段。然而，現有方法普遍忽視了一個看似細微卻極為關鍵的問題——詞匯多樣性（lexical diversity）。

同一個問題，不同的表達方式，往往讓檢索模型“暈頭轉向”，最終導致錯誤答案。

由此，來自北航、北大、中關村實驗室的研究團隊提出了這項最新工作，他們首次將“詞匯多樣性”引入檢索增強生成的相關性評估過程，并通過新穎的風險稀疏校準機制解決了生成階段被無關信息干擾的問題。

團隊認為，該方法對信息檢索、問答系統、專業領域大模型應用都具有重要價值。未來，他們計劃進一步拓展該方法到更多專業場景，讓大模型不僅能“讀懂”，更能“理解”復雜的人類語言表達。

詞匯多樣性：RAG的隱形痛點

研究團隊指出，現有RAG方法大多通過“單一標準”判斷檢索文檔是否相關，但現實情況要復雜得多。如圖所示，以問題“What is Hattie McDaniel’s occupation?”為例，其中的語義成分表現出不同程度“詞匯多樣性”：

讓RAG真正讀懂“言外之意”！新框架引入詞匯多樣性，刷新多基準

這種詞匯多樣性往往導致模型錯誤地將部分相似但無關的文檔判為相關，或者忽略了真正有用的信息。

兩大關鍵創新

為解決“詞匯多樣性”帶來的挑戰，研究團隊提出了該框架，核心在于兩個互補模塊：

1、Diversity-sensitive Relevance Analyzer（DRA)

傳統檢索相關性評估往往“一刀切”，把整體查詢和檢索文檔進行比較。該方法則進一步拆解查詢語義，針對不同成分采用差異化策略：

在此基礎上，該方法通過該模塊對相似度檢索結果進行重排序，輸出一個更細粒度、多維度的相關性評分，避免檢索時存在的“假陽性”和“假陰性”的常見問題。

欧美黄色精品,国产精品91一区二区三区,免费观看在线综合,久久精品一区二区不卡