當前位置: 妍妍網 > 碼農

終端如何才能更智慧?華為雲盤古大模型給出解決之道

2024-06-21碼農

在科技日新月異的今天,大模型如同一位無所不能的魔法師,用其神秘的力量點亮了智慧終端的新未來。

你只需輕聲呼喚,手機就能精準執行你的指令,無論是文本創作還是圖片編輯,均能得心應手;自動駕駛汽車也能在虛擬世界道路中不斷磨礪技藝,讓駕駛變得更加安全智慧;機器人能輕松完成復雜的任務規劃,將人們的生活打理得井井有條……

隨著大模型能力的提升,手機、汽車、機器人等智慧終端正迎來爆發。以AI手機為例,據Canalys預計,2024年AI手機出貨量將占全球智慧型手機出貨量的16%,到2028年,AI手機市場份額將激增至54%,年均復合增長率(CAGR)將達到63%。

我們不禁要問,怎樣的大模型才能讓終端更智慧?端雲協同如何更高效?在華為開發者大會2024(HDC 2024)期間,華為雲盤古大模型5.0釋出,在全系列、多模態、強思維三個方面全新升級。我們也能看到華為雲盤古大模型如何讓終端越來越「聰明」的具體案例。其中,會上亮相的搭載盤古能力的人形機器,讓我們看見科幻片中的機器人真的來了!

接下來,讓我們一同揭開華為雲盤古大模型5.0的神秘面紗,探尋其如何引領終端智慧化。

01

釋出槽古大模型5.0,

加速終端智慧化行程

對此次重磅釋出的盤古大模型5.0,筆者認為,最大的變化是多模態能力全面升級。此時,可能有人要問,多模態能力提升有何獨特價值?

要知道,物理世界是一個包含多種模態的復雜系統。多種模態間的相互聯系、交互作用,共同構成了豐富多彩的物理世界。因此,大模型只有具備更強的多模態能力,才能生成符合物理規律的內容,也能看懂圖表、圖片等不同資訊,更懂物理世界。

華為雲盤古大模型5.0能夠更好更精準地理解物理世界,包括文本、圖片、視訊、雷達、紅外、遙感等更多模態;在圖片和視訊辨識方面,可支持10K超高分辨率;在內容生成方面,采用業界首創的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術,聚焦自動駕駛、工業制造、建築等多個行業場景,生成更加符合物理規律的多模態內容。

基於多模態能力的提升,華為雲盤古大模型可在眾多的衛星遙感圖片中,找到細微的地表變化,讓細微的變化也能輕松發現;可輕松從公司年報圖片,找到財務數據的變化;能夠透過紅外影像,精準地辨識車輛的位置,幫助交通違停的管理;透過可見光和雷達的影像綜合判斷該地區的植被覆蓋情況,幫助生態部門進行自然保育地的監測……真是相當厲害。

由此可見,盤古大模型5.0的多模態能力提升,才能讓這些我們生活中需要的場景走進現實,也能讓大模型支撐下的智慧終端,更好地服務現實生活、融入現實生活。

除多模態能力全面升級外,盤古大模型5.0包含不同參數規格模型,十億級參數的Pangu E系列可支撐手機、PC等端側的智慧套用;百億級參數的Pangu P系列,適用於低時延、高效率的推理場景;千億級參數的Pangu U系列適用於處理復雜任務;萬億級參數的Pangu S系列超級大模型能夠幫助企業處理更為復雜的跨領域多工。

盤古大模型5.0還將思維鏈技術與策略搜尋深度結合,大幅提升數學能力、復雜任務規劃能力,以及工具呼叫能力,可支撐終端處理復雜環境中的各項工作。

此之,盤古大模型5.0的雲端協同能力,讓終端可「端」可「雲」,不僅可實作在端側處理大部份簡單任務,還可借助雲端大模型完成對復雜任務的分析與處理。

02

盤古大模型5.0為終端疊加智慧buff

此次盤古大模型5.0多種能力的提升,必將加速終端智慧化,帶來豐富的套用場景。此時,你或許好奇,華為雲在推動盤古大模型賦能終端方面的具體成效如何?我們以手機、汽車、機器人這三類終端為例,詳細解讀分析下。

盤古大模型+華為手機終端,讓手機更懂「主人」

智慧語音操作、文學創作、日程安排等手機AI套用,讓許多消費者眼前一亮。Canalys調研顯示,全球有63%的受訪者對手機上的AI套用及AI能力有興趣。

但在實際套用中,部份手機配備的語音助手或AI套用,卻常常「洋相百出」。如何讓手機成為真正的AI手機?雲助小藝提供了一種思路。雲助小藝可以呼叫雲上千萬級參數大模型,支撐千萬級使用者線上推理,使語音對話、AIGC線上創作及個人化推薦能力全面提升。

除讓小藝更具智慧外,盤古大模型還讓華為手機基於雲端協同,擁有了強悍的雲拍照能力。以大火的華為Mate60系列手機為例,其獨有的AI雲增強拍照功能,讓許多消費者連連稱贊。

大受歡迎的背後,是消費者在用手機拍照時,往往在處理大合照場景時面臨畫質不佳、細節模糊、噪點多、人物面部僵硬等問題。華為Mate60系列手機依靠華為雲KooVerse全球存算網呼叫雲端算力,在雲端進行AI推理,讓照片更高畫質、更自然。

隨著技術發展,雲手機也走入大眾視野,無須強悍的硬體配置,來媲美旗艦機的使用體驗。比如,HarmonyOS雲手機,呼叫雲端多元算力,讓雲手機具備智慧運維、智慧排程、智慧協同等能力,可勝任大規模仿真測試、移動安全辦公、雲手遊、直播互娛等場景,幫助開發者輕松開發各種鴻蒙原生行動應用。

盤古大模型+自動駕駛,讓汽車更聰明

自動駕駛作為汽車行業最前沿技術,不僅消費者翹首企盼,汽車廠商更是紛紛布局。自動駕駛大模型作為汽車的大腦,要做得很好,就要不斷積累數百萬公裏的實際駕駛視訊數據,從中訓練學習各種疑難場景。然而,路測數據的局限性使得大模型的成長受到制約。為此,虛擬環境仿真成為關鍵。但傳統的建模仿真方式成本高且難以完全模擬現實場景。

盤古大模型則讓自動駕駛訓練數據的積累方式,從建模仿真邁向AI生成,節省虛擬場景構造成本。更為重要的是,盤古大模型5.0透過創新的STCG技術,能很好地理解物理規律,生成不同路況、不同光照、不同天氣的訓練視訊數據。

從事自動駕駛大模型訓練的工作人員向筆者表示,過去,自動駕駛模擬訓練時,空間多視角相機、連續時間下生成的邏輯如果沒處理好,往往導致生成汽車發生形變,甚至導致生成的兩輛車融合到一起。

盤古多模態大模型可以很好地理解物理規律,生成更加真實的訓練視訊。比如,在模擬中,一輛汽車可依次從右後、右前、正前三個網路攝影機中出現。如果穿越多個視角時,車輛的尺寸、外觀、都不會發生變化。

此外,在駕駛場景生成中,盤古大模型生成的場景也更貼近生活,不僅可以按照要求生成街道、不同方向的車輛,而且生成晴天、雨天、黑夜等環境,讓自動駕駛模型能夠學會應對豐富多樣的場景變化,幫助汽車解決自動駕駛數據集泛化生成、難例生成兩大難題。

盤古大模型賦能自動駕駛能力到底有多強?筆者發現,盤古大模型在生成雨天視訊時,還能細膩地模擬出車輛尾燈因光線昏暗而開啟的細節。

據華為常務董事、華為雲CEO張平安介紹,面向未來,盤古的多模態生成還會支持更多的場景,更好地為自動駕駛服務。

盤古大模型+具身智慧,讓機器人變得「智慧」

具身智慧是指讓機器人或智慧系統像生物一樣,透過自己的身體去感知世界、理解世界,並在世界中行動和完成任務的智慧技術。

在實際套用中,機器人往往存在智慧化水平不足、泛化能力弱等問題。以史丹佛大學人工智慧實驗室開發的Mobile Aloha家務機器人為例,該機器人在處理復雜任務時,無法將鍋放入櫥櫃,炒完菜後蝦會粘在鍋上,甚至找不到碗的位置。這種表現讓消費者直呼「智障」。

「智障」表現背後,則是機器人對復雜室內空間的環境感知、物理空間認知不足,面向多場景的綜合任務只能規劃1到2步。

如何讓機器人擺脫「智障」標簽?我們看到,華為雲推出盤古具身智慧大模型,以雲助端,一腦多形,賦能端側機器人裝置。

具體而言,華為雲推出盤古具身智慧大模型,可以讓機器人完成10步以上的復雜任務規劃,並且在任務執行中實作多場景泛化和多工處理。對機器人企業而言,可借助大模型生成機器人需要的訓練視訊,加快機器人成長速度。

盤古具身智慧大模型已經在實際套用中展現出其巨大潛力。華為雲與樂聚(深圳)機器人技術有限公司的合作,成功提升了人形機器人的雙臂可泛化操作能力,並實作了小樣本數據訓練的泛化操作,為其在工商業、特種領域、家庭等場景的套用奠定了堅實基礎。在智慧家居領域,添可公司借助盤古大模型,將烹飪領域的豐富經驗和技巧整合到料理機中,實作了智慧菜譜的生成。

現場,樂聚人形機器人誇父透過辨識物品、問答互動、擊掌、遞水等互動演示,引來現場多次歡呼。

張平安也指出,除了人形機器人,盤古具身智慧大模型還可以賦能多種形態的工業機器人和服務機器人,讓它們幫助人類去從事危險和繁重的工作。

筆者觀察:

構築智慧世界天梯,開啟智慧生活新篇章

多年來,華為雲以終端智慧化為核心使命,不斷突破技術邊界。從2021年釋出槽古大模型,到2023年釋出槽古大模型3.0,華為雲盤古大模型持續提升多模態能力,賦能終端知識問答、文案生成、程式碼生成,以及多模態大模型的影像生成、影像理解等能力提升。

如今,隨著盤古大模型5.0釋出,我們看到了手機終端、自動駕駛汽車、具身智慧等領域的真正智慧化。這也預示著智慧生活的新篇章即將開啟。

在賦能終端智慧化的道路上,華為雲與各大終端廠商緊密合作,推動端雲協同生態的蓬勃發展。比如,問界M9的車載智慧助手小藝,在盤古大模型的加持下,已經能夠提供豐富的知識問答、熱點資訊總結等功能,讓駕駛過程更加智慧便捷。而華為MateBook X Pro膝上型電腦不僅借助盤古大模型,且精選100+個智慧體,為使用者帶來了全新的華為AI空間功能,讓AI套用觸手可及。

如今,我們看到了一個基於昇騰、鴻蒙、鯤鵬、GaussDB、歐拉等華為核心技術組建的強大生態。這些根技術為盤古大模型提供了堅實的支撐,為開發者打造雲端協同能力,讓智慧化體驗走進現實。

正如張平安在會上所講:「華為雲將持續做好昇騰AI雲服務,做好對百模千態的適配,做好AI套用的‘黑土地’!」

舉目眺望,盤古大模型5.0將架起智慧世界與現實世界的橋梁,加速智慧化走進千行萬業,重塑各行業未來。

未來已來,讓我們拭目以待,看華為雲盤古大模型如何引領終端智慧化新浪潮,開啟智慧生活新篇章!

點選下方名片,關註我們

【海峰看科技】側重科技通訊技術和產業分析,定位解讀延伸,深度思考。

【黃海峰的通訊生活 】側重科技通訊資訊和數位產品體驗,定位快速、有趣。

往期推薦

  • 黃海峰,獨立科技評論員,多次接受央視、環球時報、科技日報采訪。

  • ICT行業雜誌前副主編,從業十多年,聚焦5G、手機、IoT、光、雲、AI、互聯網等。

  • 每年與超100位科技行業企業 CXO /VP/總監面對面交流。

  • 多年度【中國資訊通訊行業發展報告】特約撰稿人。

  • 獲十大通訊行業自媒體、IT科技十佳創作者稱號。

  • 覆蓋今日頭條、百度、新華、人民、搜狐、鳳凰、新浪、網易、知乎、騰訊、一點、微博等。

  • 微訊號:174455367