本期推薦開源計畫目錄:
1. Llama 3 大模型開源了!
2. 知識庫問答系統
3. 構建 AI 助手的框架
4. 開源的 RAG 引擎
01
Llama 3 大模型開源了!
Llama 3 是 Meta 釋出的最新大型語言模型,旨在讓個人、創作者、研究人員和各種規模的企業能夠負責任地試驗、創新和擴充套件他們的想法。
相比於之前釋出的開源模型, Llama 3 的特性是:
數據量:訓練的數據是 Llama 2數據集的 7 倍多
能力增強: 推理和程式碼能力增強
訓練效率: 比 Llama2 高 3 倍;
模型大小: 提供從 8B 到 70B 參數的不同大小的預訓練和指令調整的 Llama 3語言模型
下載和使用: 提供了模型權重和分詞器的下載指南,以及如何在本地執行模型的快速入門步驟
支持模型並列: 不同大小的模型需要不同的模型並列(MP)值
授權證: 模型和權重對研究人員和商業實體開 放,旨在促進發現和道德的AI進步
開源地址:https://github.com/meta-llama/llama3
02
知識庫問答系統
MaxKB 是一個基於大型語言模型(LLM)的知識庫問答系統,旨在成為企業的「最強大腦」,由開發者 1Panel-dev 開源,目前已經獲得了 2.9k 的 Star。這個是該開源計畫的特性:
開箱即用:支持上傳文件和自動爬取線上文件,文本自動拆分和向量化,提供良好的智慧問答互動體驗。
無縫嵌入: 可以快速嵌入到第三方業務系統中,無需編碼。
多模型支持: 支持多種 主流的大型模型,包括本地私有模型和雲服務模型。
開源地址:https://github.com/1Panel-dev/MaxKB
03
構建 AI 助手的框架
Phidata 是一個用於構建具有記憶、知識和工具的AI助手的框架,用來解決大型語言模型(LLM)上下文限制和無法執行操作的問題。他的工作原理如下:
記憶:透過資料庫儲存聊天歷史,使LLM能夠進行長期對話。
知識: 透過向量資料庫儲存資訊,為LLM提供上下文。
工具: 使LLM能夠執行如 從API提取數據、發送電子信件或查詢資料庫等操作。
開源地址:https://github.com/phidatahq/phidata
04
開源的 RAG 引擎
RAGFlow 是由開發者 infiniflow 開源,目前已經獲得了 5.2K 的 Star。該計畫是一個開源的 RAG(Retrieval-Augmented Generation,檢索增強生成)引擎,基於深度文件理解,為不同規模的企業提供簡化的 RAG 工作流程。
它由如下關鍵特性:
高品質輸入輸出: 從復雜格式的非結構化數據中進行深度文件理解並提取知識。
樣版化分塊: 提供智慧且可解釋的樣版選項。
基於參照的參照: 減少幻覺,透過視覺化的文本分塊允許人工幹預,快速檢視關鍵參照和可追溯的參照來支持基於事實的答案。
異構資料來源相容性: 支持 Word、PPT、Excel、TXT、影像、掃描副本、結構化數據、網頁等。
自動化 RAG 工作流: 提供為個人 和大型企業量身客製的簡化 RAG 編排,包括可配置的 LLM 和嵌入模型,多重召回與融合重排,以及與業務無縫整合的直觀 API。
開源地址:https://github.com/infiniflow/ragflow
歷史盤點
逛逛 GitHub 每天推薦一個好玩有趣的開源計畫。歷史推薦的開源計畫已經收錄到 GitHub 計畫,歡迎 Star:
地址:https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo
推薦閱讀
1.
2.
3.
4.