RecAI：開源AI推薦系統，用Agent來完成推薦的各環節，終於能刷到自己喜歡的內容了！

2024-05-26碼農

計畫簡介

RecAI是為了探索如何將大型語言模型（LLM）融入推薦系統，以增強推薦系統的互動性、可解釋性和可控性。該計畫透過采用全面的視角和方法，整合實際套用中的需求，發展出一系列技術，包括推薦AI代理、透過個人化提示註入知識、將語言模型作為推薦器進行微調、評估以及作為模型直譯器。最終目標是創造一個更加復雜、互動和以使用者為中心的推薦系統。

掃碼加入AI交流群

獲得更多技術支持和交流

（請註明自己的職業）

推薦人工智慧代理

LLM（大型語言模型）提供自然互動並聰明地響應人類指令，但缺乏特定領域的專業知識。相比之下，傳統推薦系統在領域數據訓練方面表現出色，但僅限於結構化數據並缺乏互動性。InteRecAgent介紹了一種結合兩者優勢的AI代理：它使用LLM作為大腦，傳統推薦模型作為工具。因此，傳統模型如矩陣分解可以轉化為對話式、互動式和可解釋的推薦系統。

InteRecAgent（互動式推薦代理）是一個框架，用於利用預訓練的特定領域推薦工具（如SQL工具、基於ID的推薦模型）和大型語言模型（LLM）來實作一個互動式的對話推薦代理。在此框架中，LLM主要負責與使用者互動並解析使用者興趣作為輸入給推薦工具，這些推薦工具負責尋找合適的計畫。

在InteRecAgent框架中，推薦工具分為三個主要類別：查詢、檢索和排名。你需要提供LLM和預配置的特定領域推薦工具的API，以便使用InteRecAgent框架構建一個互動式推薦代理。在InteRecAgent中，既不更新LLM，也不修改推薦工具。

InteRecAgent包含的必要元件：

·LLM： 一個大型語言模型，作為對話代理。

·物品資訊表： 一個包含物品資訊的表格，其列包括id、標題、標簽、描述、價格、釋出日期、存取數量等。

·查詢模組： 一個SQL模組，用於在物品資訊表中查詢物品資訊。

·檢索模組： 該模組旨在根據使用者的意圖（需求）從所有物品中檢索物品候選者。註意，該模組不處理與使用者個人資料相關的事務，如使用者歷史、使用者年齡等。相反，它專註於使用者所需，如「給我一些體育遊戲」，「我想要一些受歡迎的遊戲」。

·排名模組： 根據模式（受歡迎度、相似性、偏好）最佳化物品候選者的排名。使用者偏好包括喜好和不想要的。該模組可以是一個傳統的推薦模型，輸入使用者和物品特征，輸出相關分數。

選擇性知識外掛程式

如何在不對模型進行微調的情況下增強LLM的特定領域能力？關鍵在於提示。在這項工作中，我們引入了一種增強LLM的方法，使其能夠註入大規模、持續演變和特定領域的數據模式。

嵌入式推薦語言模型

密集檢索是推薦系統和檢索增強生成（RAG）等場景中的關鍵組成部份。盡管生成語言模型如GPT是為順序令牌生成而設計的，但它們並不適用於檢索導向的嵌入。我們的計畫RecLM-emb正是為此而生，它與文本嵌入模型如text-embedding-ada-002保持一致，但專門針對計畫檢索進行了最佳化。目前它僅支持文本模態，如搜尋查詢、計畫描述和使用者指令。

生成推薦語言模型

需要註意的是，不同領域的數據模式有顯著差異，這意味著通用LLM可能無法在特定領域內提供最佳化效能。為適應特定領域數據模式、以領域計畫目錄為基礎、增強指令執行能力，本計畫討論了為推薦系統微調生成語言模型的過程，稱為RecLM-gen。技術包括監督式微調（SFT）和強化學習（RL）。此方法的潛在套用包括排名器、對話推薦器和使用者模擬器。

推薦模型直譯器

基於深度學習的推薦系統廣泛用於各種線上服務，這歸功於它們在有效性和效率上的優越性。然而，這些模型通常缺乏可解釋性，這使得它們對使用者和開發者來說都不夠可靠和透明。在這項工作中，我們提出了一種新的推薦系統模型解釋方法，稱為RecExplainer，透過使用LLM作為替代模型，學習模仿和理解目標推薦模型。

推薦評估器

評估對於準確評估模型的真實能力和辨識改進的弱點至關重要。在使用語言模型作為推薦器的時代，其評估方法已大幅偏離傳統風格。本計畫旨在為基於LM的推薦系統提供全面的評估服務。無論是提供了訓練有素的LM還是API（如Azure OpenAI API），它都能從多個角度評估模型的效能，包括檢索、排名、解釋能力和一般AI能力。

計畫連結

https://github.com/microsoft/RecAI

關註「開源AI計畫落地」公眾號

與AI時代更靠近一點