當前位置: 妍妍網 > 碼農

RecAI:開源AI推薦系統,用Agent來完成推薦的各環節,終於能刷到自己喜歡的內容了!

2024-05-26碼農

計畫簡介

RecAI是為了探索如何將大型語言模型(LLM)融入推薦系統,以增強推薦系統的互動性、可解釋性和可控性。該計畫透過采用全面的視角和方法,整合實際套用中的需求,發展出一系列技術,包括推薦AI代理、透過個人化提示註入知識、將語言模型作為推薦器進行微調、評估以及作為模型直譯器。最終目標是創造一個更加復雜、互動和以使用者為中心的推薦系統。

掃碼加入AI交流群

獲得更多技術支持和交流

(請註明自己的職業)

推薦人工智慧代理

LLM(大型語言模型)提供自然互動並聰明地響應人類指令,但缺乏特定領域的專業知識。相比之下,傳統推薦系統在領域數據訓練方面表現出色,但僅限於結構化數據並缺乏互動性。InteRecAgent介紹了一種結合兩者優勢的AI代理:它使用LLM作為大腦,傳統推薦模型作為工具。因此,傳統模型如矩陣分解可以轉化為對話式、互動式和可解釋的推薦系統。

InteRecAgent(互動式推薦代理)是一個框架,用於利用預訓練的特定領域推薦工具(如SQL工具、基於ID的推薦模型)和大型語言模型(LLM)來實作一個互動式的對話推薦代理。在此框架中,LLM主要負責與使用者互動並解析使用者興趣作為輸入給推薦工具,這些推薦工具負責尋找合適的計畫。

在InteRecAgent框架中,推薦工具分為三個主要類別:查詢、檢索和排名。你需要提供LLM和預配置的特定領域推薦工具的API,以便使用InteRecAgent框架構建一個互動式推薦代理。在InteRecAgent中,既不更新LLM,也不修改推薦工具。

InteRecAgent包含的必要元件:

·LLM: 一個大型語言模型,作為對話代理。

·物品資訊表: 一個包含物品資訊的表格,其列包括id、標題、標簽、描述、價格、釋出日期、存取數量等。

·查詢模組: 一個SQL模組,用於在物品資訊表中查詢物品資訊。

·檢索模組: 該模組旨在根據使用者的意圖(需求)從所有物品中檢索物品候選者。註意,該模組不處理與使用者個人資料相關的事務,如使用者歷史、使用者年齡等。相反,它專註於使用者所需,如「給我一些體育遊戲」,「我想要一些受歡迎的遊戲」。

·排名模組: 根據模式(受歡迎度、相似性、偏好)最佳化物品候選者的排名。使用者偏好包括喜好和不想要的。該模組可以是一個傳統的推薦模型,輸入使用者和物品特征,輸出相關分數。

選擇性知識外掛程式

如何在不對模型進行微調的情況下增強LLM的特定領域能力?關鍵在於提示。在這項工作中,我們引入了一種增強LLM的方法,使其能夠註入大規模、持續演變和特定領域的數據模式。

嵌入式推薦語言模型

密集檢索是推薦系統和檢索增強生成(RAG)等場景中的關鍵組成部份。盡管生成語言模型如GPT是為順序令牌生成而設計的,但它們並不適用於檢索導向的嵌入。我們的計畫RecLM-emb正是為此而生,它與文本嵌入模型如text-embedding-ada-002保持一致,但專門針對計畫檢索進行了最佳化。目前它僅支持文本模態,如搜尋查詢、計畫描述和使用者指令。

生成推薦語言模型

需要註意的是,不同領域的數據模式有顯著差異,這意味著通用LLM可能無法在特定領域內提供最佳化效能。為適應特定領域數據模式、以領域計畫目錄為基礎、增強指令執行能力,本計畫討論了為推薦系統微調生成語言模型的過程,稱為RecLM-gen。技術包括監督式微調(SFT)和強化學習(RL)。此方法的潛在套用包括排名器、對話推薦器和使用者模擬器。

推薦模型直譯器

基於深度學習的推薦系統廣泛用於各種線上服務,這歸功於它們在有效性和效率上的優越性。然而,這些模型通常缺乏可解釋性,這使得它們對使用者和開發者來說都不夠可靠和透明。在這項工作中,我們提出了一種新的推薦系統模型解釋方法,稱為RecExplainer,透過使用LLM作為替代模型,學習模仿和理解目標推薦模型。

推薦評估器

評估對於準確評估模型的真實能力和辨識改進的弱點至關重要。在使用語言模型作為推薦器的時代,其評估方法已大幅偏離傳統風格。本計畫旨在為基於LM的推薦系統提供全面的評估服務。無論是提供了訓練有素的LM還是API(如Azure OpenAI API),它都能從多個角度評估模型的效能,包括檢索、排名、解釋能力和一般AI能力。

計畫連結

https://github.com/microsoft/RecAI

關註「 開源AI計畫落地 」公眾號

與AI時代更靠近一點