當前位置: 妍妍網 > 資訊

李彥宏:開源模型會越來越落後,自然語言將成為新的通用程式語言

2024-04-16資訊

整理 | 沭七

出品丨AI 科技大本營(ID:rgznai100)

一個月前,百度創始人、董事長兼執行長李彥宏在【對話】中直指:以後不會存在「程式設計師」這種職業了,因為只要會說話,人人都會具備程式設計師的能力。「未來的程式語言只會剩下兩種,一種叫做英文,一種叫做中文。」

類似的話,OpenAI 聯創 Andrej Karpathy 曾在 2023 年初也表達過( The hottest new programming language is English」 ),但李彥宏直指程式設計師這一職業將不復存在的言論一出便引發了廣泛的熱議。

一個月 之後的今天,台北時間 4 月 16 日,李彥宏在 Create 2024 百度 AI 開發者大會上發表「人人都是開發者」的主題演講,再一次力證「未來,自然語言將成為新的通用程式語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界。」

基於此,李彥宏 為開發者們 式釋出了 三大 開箱即用」的工具, 分別是 智慧體開發工具 AgentBuilder、AI 原生套用開發工具 AppBuilder,以及各種尺寸的模型定 制工具 ModelBuilder,助力所有開發者實作生產力的躍升

李彥宏的此次演講資訊量巨大,其多個觀點都引發了 AI、開源等不同從業者的深度討論。在大模型風靡席卷的一年後,AI 從業者逐漸回歸理性,一個模型無法解決所有問題、大小模型混用成為結論之一,賈揚清也贊同了李彥宏對於 AI 原生套用的具體思路。但另一方面,李彥宏提出在大模型時代,「開源模型會越來越落後」引發了爭議,在以 GPT、Llama 為代表的閉開源並駕齊驅的今天,對於開閉源模型至今尚未有定論。

精彩觀點速覽:

  • 自然語言將成為新的通用程式語言,只要會說話就可以成為一名開發者。今天,你不會寫程式碼,也可以做出一個 AI 套用;不用編程,也可以做出一個智慧體。

  • AI 正在掀起一場創造力革命,未來開發套用就像拍個短視訊一樣簡單,人人都是開發者,人人都是創造者。

  • 大模型本身並不直接創造價值,基於大模型開發出來的 AI 套用才能滿足真實的市場需求。

  • 智慧體可能是未來離每個人最近、最主流的大模型使用方式,基於強大的基礎模型,智慧體可以批次生成,套用在各種各樣的場景。

  • 大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。

  • 面向未來,我認為多模態大模型,或者說文字、圖片、語音、視訊等多模態的融合,是基礎模型非常重要的長期發展方向,是通往 AGI 的必經之路。

  • 以下為李彥宏演講實錄 (為便於閱讀,經過不改變原意的刪減):

    大家好,歡迎參加 Create 2024 百度 AI 開發者大會,這是 Create 大會首次在粵港澳大灣區舉辦。今天現場來了 5000 多位開發者和科技愛好者。過去這一年,我跟很多創業者、開發者交流,感覺大家都處在一種「FOMO」狀態,也就是 Fear of Missing Out,既興奮、又害怕錯過。確實,大模型和生成式 AI,將徹底改變開發者這個群體。

    過去,開發者用程式碼改變世界;未來,自然語言將成為新的通用程式語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界。

    這一天並不遙遠,我們看到,因為有了強大的基礎大模型,有了很多低門檻,甚至零門檻的開發工具,開發者的生產力大大提高了。

    比如,基於文心大模型的智慧程式碼助手 Comate,不僅支持 100 多種語言和所有主流 IDE 平台,可以推薦程式碼、生成程式碼註釋、尋找程式碼缺陷、給出最佳化方案,還可以深度解讀程式碼庫、關聯私域知識生成新的程式碼。上崗一年多,Comate 已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的程式碼采納率達到了 46%, 百度每天新增的程式碼中,已經有 27%是由 Comate 生成的。

    今天,你不會寫程式碼,也可以做出一個 AI 套用;不用編程,也可以做出一個智慧體。AI 正在掀起一場創造力革命,未來開發套用就像拍個短視訊一樣簡單,人人都是開發者,人人都是創造者。

    作為一家技術公司,百度的角色定位,就是盡可能地為大家提供所需的開發工具,不斷提升整個社會的創造力。具體來說,我們提供 1 個強大的基礎模型系列,就是文心大模型系列,這包括旗艦版的 ERNIE3.5, ERNIE4.0, 也包括輕量版的 ERNIE Speed、Lite、Tiny 等等。

    我們還提供基於大模型來開發各種套用的工具,包括智慧體開發工具 AgentBuilder,AI 原生套用開發工具 AppBuilder,以及各種尺寸的模型客製工具 ModelBuilder。這三個工具,都代表了先進生產力。下面,我會給大家一一展示。

    文心一言使用者超 2 億,文心大模型 4.0 工具版釋出

    首先講一下,文心一言和文心大模型的最新進展:

    文心一言從去年 3 月 16 日釋出,到今天是一年零一個月的時間。我們的使用者數突破了 2 億,API 日均呼叫量也突破了 2 億,服務的客戶數達到了 8.5 萬,利用千帆平台開發的 AI 原生套用數超過了 19 萬。

    我們可以看到,文心一言正在改變更多人的工作和生活。

    支撐文心一言的基座模型,就是文心大模型。過去一年,它經歷了從 3.0 版本到 3.5,再到 4.0 版本的前進演化。文心 4.0 在理解、生成、邏輯、記憶四大能力方面,均達到了業界領軍水平。

    近幾個月來,文心大模型在程式碼生成、程式碼解釋、程式碼最佳化等通用能力方面實作了進一步的顯著提升,達到國際領先水平。

    今天,我們正式釋出文心大模型 4.0 的工具版,現在,大家可以在工具版上,體驗程式碼直譯器功能,透過自然語言互動,就能實作對復雜數據和檔的處理與分析,還可以生成圖表或檔,能夠快速洞察數據中的特點、分析變化趨勢、為後續的決策提供高效精準的支撐。

    文心大模型已經成為了中國最領先、套用最廣泛的 AI 基礎模型。

    不僅如此,相比一年前,文心大模型的演算法訓練效率提升到了原來的 5.1 倍,周均訓練有效率達到 98.8%,推理效能提升了 105 倍,推理的成本降到了原來的 1%。

    也就是說,客戶原來一天呼叫 1 萬次,同樣成本現在可以呼叫 100 萬次。媒體可能不會因為成本下降 99%而興奮。但是企業也好,開發者也好,一旦用起來,最關註的就是效果和成本。

    我們能在提升效能的同時,把推理成本降到 1%,正是因為百度在芯片、框架、模型、套用這四層架構上有著全棧的布局,透過端到端最佳化,不斷地把成本打下來,讓更多人都可以高效、低價地用大模型來做 AI 套用。

    毫無疑問,大模型相關的話題,在 2024 年依然會很熱,各類技術突破還會不斷湧現。媒體也會繼續熱衷於用「震撼釋出」「史詩級更新」這樣的標題進行渲染。但 我想強調的是,大模型本身並不直接創造價值,基於大模型開發出來的 AI 套用才能滿足真實的市場需求。

    「踩了無數的坑,交了高昂學費」,李彥宏 分享開發 AI 原生套用的具體思路和工具

    今天我想跟大家分享的是一些基於大模型開發 AI 原生套用的具體思路和工具。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。

  • 第一是 MoE。

  • 未來大型的 AI 原生套用基本都是 MoE 架構,這裏所說的 MoE 不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。但什麽時候呼叫小模型、什麽時候呼叫大模型、什麽時候不呼叫模型,這都是有技術含量的,要針對套用的不同場景做匹配。

  • 第二是小模型。

  • 小模型推理成本低,響應速度快,在一些特定場景中,經過 SFT 精調後的小模型,它的使用效果可以媲美大模型。 這就是我們釋出 Speed、Lite、Tiny 三個輕量模型的原因。我們透過大模型,壓縮蒸餾出來一個基礎模型,然後再用數據去訓練,這比從頭開始訓小模型,效果要好很多,比基於開源模型訓出來的模型效果更好,速度更快,成本更低。

  • 第三是智慧體。

  • 智慧體是當下很熱的一個話題,隨著智慧體能力的提升,會不斷催生出大量新的套用。智慧體機制,包括理解、規劃、反思和前進演化,它讓機器像人一樣思考和行動,可以自主完成復雜任務,在環境中持續學習、實作自我叠代和前進演化。在一些復雜系統中,我們還可以讓不同的智慧體互動,相互協作,更高品質地完成任務。這些智慧體能力,反思、規劃、自我計劃的能力,我們已經開發出來了,並且向開發者全面開放。

    在 MoE、小模型、智慧體這三個方向上,百度都已經給大家做好了「開箱即用」的工具。下面,我就給大家介紹三種不同的工具,分別是:智慧體開發工具 AgentBuilder、AI 原生套用開發工具 AppBuilder、各種尺寸的模型客製工具 ModelBuilder。

  • 智慧體開發工具 AgentBuilder

  • 首先是智慧體開發工具 AgentBuilder。智慧體可能是未來離每個人最近、最主流的大模型使用方式,基於強大的基礎模型,智慧體可以批次生成,套用在各種各樣的場景。

    百度剛剛升級了文心智慧體平台。截至目前,已經有 3 萬多個智慧體被建立、5 萬多名開發者和上萬家企業入駐。我們的目標是,讓每個人、每個組織都成為智慧體的開發者,打造國內最完整的智慧體生態。

    那如何實作這個目標呢?就是給大家提供零門檻的智慧體開發工具 AgentBuilder。

    下面我們就先以「新加坡旅遊局」為例,看一個智慧體是如何做出來的。

    首先,我們開啟文心智慧體平台,建立頁面有著零程式碼、低程式碼兩種模式,新手可以直接選擇「零程式碼模式」,用自然語言,幾句話就能建立一個智慧體。

    我們先給智慧體起名叫「新加坡旅遊局」,然後在設定裏寫明需要打造旅遊方案、解答問題,提供酒店門票預訂服務,這些設定都是用來指導智慧體的,告訴它都能做什麽。

    如果只需要基礎智慧體,平台會自動完成填寫。但我們希望「新加坡旅遊局」是一個專業的智慧體,所以要進行高級配置。我可以把新加坡百科詞條和官網連結都添加到知識柯瑞,讓它每天更新。然後添加一些工具,如酒店查詢、景點門票購買等,增強它的服務能力。目前我們已經跟攜程合作,提供了酒店、景點、票務等旅遊服務工具。這樣,一個新加坡旅遊局的智慧體就做好了,可以進一步預覽、調優。

    現在開啟百度 App,搜尋「什麽時候去新加坡人最少」,因為大家出去旅遊都想避開人潮。智慧體會綜合多個來源的資訊,生成一個答案,「1-3 月人最少」。我們還可以點選智慧體,和它進一步互動,比如去新加坡旅遊的註意事項,推薦新加坡排名前三的酒店,還能讓它直接預訂新加坡環球影城的門票,一站式解決需求,大大節省了使用者時間。

    除了新加坡之外,大連、沈陽等文旅類智慧體也都在文心智慧體平台上線,還有知識類、創作類、學習類、娛樂類等各式各樣的智慧體,這些都是用 AgentBuilder 做出來的。

    去年文心一言剛釋出的時候,我就說過,文心一言會影響到每一家公司。因為它強大的自然語言理解能力、表達能力、推理能力,可以使任何一個公司都離自己的客戶更近。

    今天,每一個商家、每一個客戶,都能在百度擁有專屬的智慧體。整個過程完全不需要編程,透過類似提示詞的資訊輸入,和簡單的幾步操作調優,就能迅速生成一個智慧體,成為 7X24 小時線上的金牌業務員。

    我們接著來看一下,一個商家智慧體是怎麽做出來的。

    啟德教育是家知名教育企業,在全國有 60 多家分支機構,還有很多海外分公司,覆蓋國家廣,對接待的話術要求很高。如何能全天 24 小時回復客戶的咨詢,並且提高接待水平、降低經營成本呢?

    啟德教育利用百度的 AgentBuilder,打造了專屬的智慧體。

    我們來看看,如何打造一個具備基本能力的智慧體。很簡單,在平台上填寫智慧體的頭像、名稱、經營業務範圍和歡迎語,再設定一些需要使用者提供的資訊,比如年齡、學歷。5 分鐘、零門檻,一個智慧體就做好了。

    啟德教育還希望這個智慧體是個懂業務、懂學生的留學顧問。它可以針對學生的不同情況,比如想去美國還是澳洲、是碩士還是學士、雅思和托福考了多少分等等,做出專業分析,給出精準回答。我們可以透過添加知識、角色、工具這幾大模組,來打造一個更高級的智慧體。

    在知識模組中,上傳私域知識,讓平台即時解析,自動生成對話語料;在角色模組,把一些不在經營範圍內的留學國家,增加到過濾方案中,可以提高使用者線索的有效率;在工具模組,加入預約到店等服務。透過這樣幾步簡單操作,一個擁有專業能力的啟德教育智慧體就做好了。

    現在,我們來搜尋「澳洲留學申請條件」,可以看到智慧體快速給出了需要的語言能力、專業選擇等七大必備條件,還給能出相應的留學咨詢方案,對各種難題都有問必答、有求必應。

    啟德教育智慧體非常的受歡迎,上線第一周,就成功分發了 155 萬次,與使用者互動了 5.8 萬次,線索轉化量直線增長、有效線索的轉化成本明顯降低,經營效率大幅提升。

    下面,我再給大家介紹一個家居行業的智慧體。

    佐菲雅是專註全屋客製的家居品牌。它也可以透過填寫極其簡單的資訊,建立出一個基礎的商家智慧體。但對於家居行業,消費者的線下體驗更重要,所以佐菲雅希望能線上上打造出一個金牌銷售,還原線下的接待體驗。

    因此在進一步的設定中,它在角色模組,選擇了數位人作為展示方式,然後給數位人選取了合適的背景和聲音,並且結合平台的智慧解析能力,自動總結了一套銷售話術。最終打造出一位溫柔親切、話術專業的金牌銷售,她能 24 小時滿足使用者的各種需求,提供高水準的服務體驗。

    當百度搜尋使用者有裝修訴求時,佐菲雅智慧體會利用文心大模型的能力,優先給出問題的答案。除此之外,她還會主動與客戶確認具體需求,如裝修型別、預算等,並推薦附近的線下門店。

    佐菲雅商家智慧體上線以來,有效線索成本下降了 30%。也就是說,它獲得一個有效客戶,如果過去的成本是 100 塊,現在只需要 70 塊了。

    目前,已有超過 1 萬個百度的客戶擁有了商家智慧體,涵蓋了教育培訓、房產家居、機械裝置、商務服務等超過 30 個行業。

    上面,透過三個 Demo,我展示了開發者和商家,如何利用 AgentBuilder,制作不同行業智慧體的過程。

    現在,制作一個智慧體,真的就是分分鐘的事。但問題來了!如果沒流量、沒分發、找不到、沒人用,那麽開發者和商家就沒有收益,沒有收益就沒有動力。怎麽解決這個痛點呢?

    我們的文心智慧體平台,為開發者們提供了流量變現的通路。除了百度搜尋,百度生態的其他產品,如小度、地圖、貼吧、車機等,都能接入智慧體的相關能力,為開發者解決流量分發的後顧之憂,獲得實打實的收益。

    有分發,就會有數據反饋;有數據反饋,飛輪轉起來,智慧體就能夠自主叠代,越用越聰明。文心智慧體平台還上線了智慧體的數據分析和問答調優模組,不久後還將有更多的新能力上線。文心智慧體平台將透過分發-診斷-收益的數據飛輪,驅動智慧體形成品質更優、流量更好、收益更大的正迴圈。

  • AppBuilder:自然語言三步就能開發一個套用

  • 下面,我給大家介紹第二個開發工具,AppBuilder。它是目前最好用的 AI 原生套用開發工具。在 AppBuilder 上面,我們提前封裝和偏好設定了開發 AI 原生套用所需的各種元件和框架,大幅降低開發門檻。

    最快只需三步,開發者就可以用自然語言開發出一個 AI 原生套用,並且能夠便捷地釋出、整合到各種各樣的業務環境中。我們來看幾個案例:

    今年年初,我們搞過一期 AI 原生套用開發挑戰賽,賽題是利用 AppBuilder 打造一款「遊樂場排隊規劃助手」,幫助遊客更好地了解遊樂場排隊情況,設計個人化的遊玩路線,在有限時間內獲得最好的遊玩體驗。

    這期比賽的冠軍選手,沒寫一行程式碼,就開發出了套用,拿到了百度提供的 10 萬元大獎。這個題目如果會寫程式碼的話,你寫一個並不難,但是你一行程式碼都不寫還能做出來,那還是非常依賴基礎模型和 AppBuilder 這個工具的能力的。

    我們來看下,怎麽用 AppBuilder,把這個 AI 套用做出來。

    我們先回顧一下賽題。它假定了「環球影城」各個計畫的排隊時間和刺激指數,那麽在有限的時間內獲得刺激指數最高的體驗,就是這期賽題要解決的問題。

    首先,開啟 AppBuilder 的開發界面,給套用起名「遊樂場排隊助手」;第二步,我們在角色指令中描述具體要求,包括呼叫程式碼直譯器、算出在固定時間內的最佳組合、輸出結果等;第三步就是到工具元件中,把程式碼直譯器添加進來,幫助運算。

    現在,我們來測下效果,在右側輸入問題「我有 3 個半小時時間,怎麽玩最刺激?」,可以看到,程式碼直譯器將這個問題轉譯成了程式碼,再呼叫數據理解工具,對已知條件進行分析。經過一系列計算,得出將【哈利波特禁忌之旅】、【侏羅紀大冒險】、【霸天虎過山車】、【大王峰回旋機】,這四個計畫組合遊玩,效果最佳。測試沒問題,點選釋出,在零程式碼的情況下,一個套用就生成了。

    現在,AppBuilder 又進一步升級了,在建立的過程中,全部可以透過「AI 最佳化配置」功能,自動幫助開發者最佳化角色指令、元件配置等環節,進一步提高開發效率。

    我們再看一個例子。

    今年年初,華北電力大學提出,希望為全校師生提供智慧化的專屬服務。基於百度的 AppBuilder,我們共同打造了一個華電 AI 助理,下面,我來給大家展示一下,華電 AI 助理是怎麽做出來的:

    第一步:開啟 AppBuilder,進入建立頁面,點選 AI 自動生成配置。首先為套用設定名稱、簡介、頭像等基本資訊。

    第二步:透過自然語言在角色指令中描述具體要求,包括任務、元件能力、要求與限制。

    第三步:插入自訂的圖書借閱查詢、課表查詢、學生成績查詢等元件,讓校園助手能夠具備智慧化服務的能力。之後再為校園助手添加一個開場白,這樣套用就配置好了。

    接下來,我們在預覽界面中,結合使用者提問,對助手進行偵錯。比如詢問四六級考試的報名時間,測試各元件自動呼叫的效果。

    大家可以看到,透過這些簡單的操作,這個套用就構建完成了。目前已經小規模測試上線,接入了查制度、查課程,充飯卡、借書籍等高頻場景,服務了學校廣大師生。後續,我們將與華北電力大學一起,進一步深化套用合作,提供更為豐富便捷的服務。

    百度在跨模態方面,也有著多年技術積累。在 AppBuilder 上面,我們也提供了一定的跨模態能力,你只需要給一段文字,或者幾句話,就可以快速建立繪畫類的套用,像漫畫、兒童畫本等。

    過程也很簡單:開啟 AppBuilder,點選進入「套用建立」,輸入角色指令,選擇「添加文生圖」元件,再輸入三個推薦問題,就可以點選釋出了。套用做好後,我們只需要輸入一個大概想要的角色或劇情,AppBuilder 就可以自動生成故事、輸出圖畫。

    百度文庫最新推出的智慧漫畫和畫本生成功能,就利用了 AppBuilder 上提供的這類元件。我們來看看,百度文庫的漫畫生成功能,是如何讓每一個有創想的人,都能做出好作品的。

    咱們以經典的【周處除三害】為例。

    開啟百度文庫,輸入主題【周處除三害】,這在【晉書】和【世說新語】裏都有寫到,文庫搜尋後,會根據原文生成故事,我們也可以再對故事內容進行修改;然後點選右側的 AI 工具列,開始建立這篇漫畫。

    進入漫畫制作界面,文庫將根據故事情節為我們自動生成漫畫分鏡;然後從光影、寫實、卡通等多種風格中,選擇最貼合故事的漫畫風格;最後根據角色選擇不同的人物形象,這樣就完成了漫畫的生成。

    漫畫生成後,我們可以在百度文庫的智慧漫畫編輯器裏,瀏覽完整的漫畫。同時,文庫支持對每一個畫面進行編輯、修改和精調,比如,在左側選中畫面「周處與白額虎」,點選編輯,增加畫面描述「人物面容清晰,畫面明亮」,就能精調出更符合需求的漫畫。大家看到,百度文庫的漫畫功能在角色和場景的風格一致性方面,都做得非常出色。

    百度文庫的智慧漫畫能力,極大地提高了創作漫畫的效率,降低了漫畫創作的成本和門檻,可以讓更多有想法、有創意的人實作自己的漫畫創作夢。

    不止生成漫畫,百度文庫現在還可以幫助使用者零門檻的創作畫本。大家可能不知道,中國小孩一年的人均繪本閱讀量只有 10 本,而歐美國家是 50 本左右。現在,AI 能夠讓完全沒有繪畫能力的父母,也可以為自己的孩子創作一個專屬的兒童畫本了。下面我們就來看一下這個圖文並茂的有聲畫本吧!

    從去年開始,我們用 AI 重構了百度文庫,使它成為使用者「內容生產的起點」。如今,在 AppBuilder 的支持下,百度文庫新推出的智慧漫畫和智慧畫本功能,更是把場景延伸到了更加有趣的跨模態創作領域。

    剛才我用三個案例,展示了如何用百度的 AppBuilder,做出 AI 原生套用。大家應該能夠感受到 AppBuilder 的兩個明顯優勢:

    一是功能強大。依托文心 4.0 對指令的理解和遵循能力,我們的 AppBuilder,能保證冷啟動就能達到一個不錯的水平,不會因為效果差,再花很長時間去調優,大大降低了開發門檻。依托檢索增強技術 RAG,在知識問答等典型場景,我們的問答準確率和友好回復程度都達到了 95%以上,大幅超越其他同類產品。AppBuilder 還提供豐富完整的元件工具,包括百度搜尋等基於百度多年技術積累的 AI 能力元件、大模型能力元件,還有百度獨家開放的業務元件等 55 個元件。以及一些主流場景的第三方 API,比如航班查詢、論文查詢等。我們還剛剛支持了自訂元件,客戶可以直接對接自己專有的任何工具和數據。這些豐富的元件,共同支撐起了 AI 原生套用的高效開發。

    二是簡單易用。使用 AppBuilder,只需三步即可快速建立套用、一鍵分發。我們也支持開源的 SDK,方便大家進行二次開發。

  • 模型客製工具 ModelBuilder:高效低價生產模型

  • 下面我再介紹一下更適合專業開發者使用的工具,那就是 ModelBuilder,它可以根據開發者的需求客製任意尺寸的模型,並根據細分場景對模型進一步精調 SFT,這樣就能達到更好的效果。對開發者來說,用好大模型很重要的一件事兒,就是掌握模型精調的方法。

    我們以教育行業的作文批改場景來舉例。因為作文批改有明確的評分標準,並且不同年級對作文的要求和打分標準,也是不同的。這就需要模型精調,讓大模型輸出的結果,更符合特定的要求。

    我們就來看一下,ModelBuilder 是如何實作作文批改的模型精調的。

    第一步:建立數據集。模型精調的效果很大程度依賴我們的數據品質。在這個案例中,原始數據只有 180 條,品質也不夠高。我們就需要用到三個功能:數據清洗、數據標註和數據增強。數據清洗,可以快速去除數據的空缺、亂碼等問題。數據標註方面,我們對作文增加了更多維度,比如內容深度、寫作手法等評價。數據增強功能,可以生成同類但不重復的數據,進行數據擴充。擴充後,ModelBuilder 給我們生成了 920 條高品質數據。

    第二步,就進入模型精調階段了。首先,我們需要選擇一個進行精調的基礎模型,這裏我們選擇了 ERNIE Speed 作為基礎模型。然後,我們根據平台推薦值來配置參數,這次數據接近 1000 條,按照推薦的叠代輪次,配置為 10 輪,然後就可以讓模型開始訓練了。

    第三步:把模型部署在平台上,這樣整個精調過程就完成了。

    我們來用一篇中學作文,測試下精調後的模型效果。作文題目是【期待長大】,題材不限,不少於 800 字。

    我們將一篇學生的作文及批改格式要求,輸入到精調前後的兩個模型裏。來看下,兩個模型及老師點評三者的對比。可以看到,精調後的大模型擁有了更加專業的老師點評思維、更好地做了格式遵循。原本老師需要較長時間才能完成的作文批改任務,現在借助大模型,幾秒鐘就可以快速完成,大大地提升了給學生反饋的速度和效率。目前,這一類精調後的模型,已經在多個教育行業的頭部企業中套用起來了。

    我前面談到大型 AI 原生套用一般都是 MoE。那麽,該如何組合使用這些模型,獲得最好的價效比呢?下面,我就用小度來展示一個 MoE 模型路由的案例。我們首先來看看,有了大模型的加持,小度是不是變得更聰明了:

    Robin:小度小度

    小度:在呢

    Robin:今天有什麽新聞?

    小度:小度播 3-5 條當日新聞快訊

    Robin:小度小度。聽說你最近長本事了?

    小度:我不單能陪你聊天,還能做你的 AI 日程助手

    Robin:那我要來考考你了。幫我安排一下日程,今天活動結束後,我會和張總一起用晚餐,之後在酒店有個管理層的會議,大概需要 1 個半小時,希望 10 點之前可以結束。明早我準備晨跑,看看天氣如何,然後上午 8 點有個早會,請幫我安排好日程。

    小度:根據您需求,小度給您制定最優的日程安排如下

    o 您與張總晚餐安排在 18:00-19:30,結束後,您將在 20:00 參加管理層會議,21:30 左右結束

    o 明早 6 點鬧鐘將提醒您起床去晨跑,跑步時長控制在 1 個小時以內,確保明早 8 點早會不遲到

    o 明早天氣晴朗,氣溫 25 度,建議您穿短袖外出,做好防曬

    o 您看我能不能當你的秘書,我還有更多新技能呢

    Robin:挺好的,很棒(向小度豎起大拇指),把這些日程同步到我的手機上吧。

    剛剛,我向小度提出了好幾個問題,其中既有簡單的新聞問詢,也有復雜的日程安排需求。看起來是跟同一個小度在交流,其實背後呼叫了不同的模型。當它接受到我的問題後,先是由小模型 ERNIE Tiny 執行了「模型路由」的工作;對於天氣問題,它根據天氣查詢的結果,呼叫基於 ERNIE Lite 打造的精調模型,也是經過 SFT 的 ERNIE Lite,給出了穿衣建議;對於更復雜的日程安排,則呼叫了效能最好的大模型——文心 4.0,來計算出從今晚到明早的各項事項安排。

    今天,我們提給小度的每個問題,都會這樣分配給不同模型來執行,呼叫套用的 API 介面時,會用 ERNIE Functions 模型,給孩子講題時,用文心大模型 3.5 或 4.0,智慧助理的打造則用了 ERNIE Character 模型,提高人設一致性、激發使用者聊天欲望。

    透過這種大小模型的組合排程方式,小度不僅順利完成了「換腦行動」,裝上了全新的 AI 原生作業系統 DuerOS X,而且形成了效果、速度和成本的最優組合,相比全部使用文心大模型的旗艦版,讓響應速度提升 2 倍,成本下降了 99%。剛才和我對話的這個小度添添 AI 平板機器人,昨天已經在各大平台全面開售,有興趣的朋友們可以即刻下單體驗了。

    這幾個關於 ModelBuilder 的例子,展示的是百度高效低價生產模型的能力。因為有了最強大的基礎模型文心 4.0,我們可以根據需要,兼顧效果、響應速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,並且支持精調和 post pretrain。這樣透過降維裁剪出來的模型,比直接拿開源調出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。 大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。

    為了方便大家快速上手,ModelBuilder 偏好設定了最全面最豐富的大模型。包括了 ERNIE3.5 和 ERNIE4.0,這是旗艦版的大模型,它適合通用的復雜場景,能力強大;還有三個輕量級的大模型, ERNIE Speed、Lite、Tiny;另外還有兩個垂直場景的模型,ERNIE Character 適合角色扮演;ERNIE Functions 適合對話或問答場景中的外部工具使用和業務函式呼叫。當然 ModelBuilder 也支持國內外第三方主流模型,總數量達到 77 個,是國內擁有大模型數量最多的開發平台。

    剛才,我給大家展示了百度文心大模型系列,以及三個開發工具——AgentBuilder、AppBuilder、ModelBuilder,它們組成了一個工具箱,你們可以馬上打包帶走,隨取隨用。

    此時此刻,我站在這裏,其實也是一個開發者、一個創業者,跟大家一樣興奮。今天的中國,有 10 億互聯網使用者,有強大的基礎大模型,有足夠多的 AI 套用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持「人工智慧+」行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。

    今天,人人都可以成為開發者。而未來,也必將是一個由開發者一起創造出來的未來!

    謝謝大家!

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」預約領取大會 PPT