當前位置: 妍妍網 > 資訊

深入解讀蘋果 AGI 第一槍究竟帶來了什麽?

2024-06-12資訊

作者 | 唐小引

出品丨AI 科技大本營(ID:rgznai100)

人們一度很為蘋果感到著急。

在動不動就迎來一夜巨變的大模型時代,隔壁 Google、Meta、Amazon 幹得熱火朝天,而蘋果卻異常悶聲,我們時常只能從人員招聘、論文釋出等來找尋蘋果布局大模型的蛛絲馬跡。

在 WWDC 2024 上,蘋果終於眾望所歸地將 AI 帶入了蘋果全系產品,還一如 2007 年賈伯斯釋出首代 iPhone 喊出重新定義手機一樣,以「Apple Intelligence」要重新定義 AI, :

  • 最備受關註的,與 OpenAI 強強聯手,GPT-4o 入駐蘋果生態,這一操作讓 Sam Altman 來了,卻讓馬斯克徹底怒了。

  • Apple Intelligence 跨平台互動生成式AI體驗,Siri 浴火重生,期待 Siri 能夠不再「智障」。

  • 萬萬沒想到:(1)蘋果重新定義了小算盤,將 iPad 小算盤用作記事本可以即時獲得答案,還能幫助畫曲線、公式解析。(2)使用者盼了 20 年的通話錄音功能一分鐘帶來了。

  • 蘋果自家的模型風頭因為 OpenAI 又再次被蓋過,但在 Hacker News 沖上了 TOP 榜。蘋果自研模型的細節可以檢視 AI 科技大本營的文章:【 】。

  • ……

  • 蘋果這 AGI 第一槍,究竟給我們帶來了什麽?從開發者的角度亟需關註的有哪些?CSDN 特別邀請了四位專家一起深度點評和解讀 WWDC 的釋出以及蘋果的 AGI 戰略背後值得深思的地方。他們分別是:

  • 王佳梁,觸寶科技創始人

  • 汪源,前網易副總裁

  • 任鑫,雲九資本合夥人、Sky9 Build 孵化器 CEO、前京東O2O副總裁

  • 王巍(@onevcat),知名 iOS 開發者

  • 一句話總結 WWDC 2024 有多少驚喜有多少失望

    王佳梁: 這屆 WWDC 沒有特別深刻的點。即使是最大的亮點 AI,也基本在預期之中。

    任鑫: 印象最深的是小算盤,這是唯一沒想到的創新,其他都太普通。這也給了我很大的啟發,應該把多模態的辨識能力和生成能力用得更廣泛一些、更有想象力一些。

    汪源: 我印象最深刻也最意想不到的點是蘋果用自家的硬體搭建了大模型的雲服務,之前還沒有聽說過這方面的訊息。但 這次釋出會,蘋果只是在自家的幾個軟體中增加了一些相對比較簡單的「套殼」類套用,遠非完美,只能打 70 分。

    王巍: 終於支持圖示排列了(iOS 18 終於可以自由排列 App 圖示了,iOS 開發者該「哭」了)

    蘋果大模型的組合拳:左手整合 ChatGPT,右手自研大模型

    蘋果的大模型步伐雖慢,但我們能夠不斷看到了一些動態。比如:

  • 2023 年 9 月,蘋果大模型核心團隊首次曝光。

  • 2023 年 12 月,蘋果開源 M 系列芯片專用、能跑 70 億參數大模型的機器學習框架。

  • 2024 年 3 月,蘋果收購專註於視覺技術的 AI 初創公司 DarwinAI,同時釋出 300 億參數的 。

  • 就在 WWDC24 首日結束後,蘋果默默地放出一篇文章介紹自己推出的一系列人工智慧基礎模型策略,其中既有參數為 3B 的 On-Device Models(端側模型),也有 Server Foundation Models(伺服器端模型),引起了開發者社群大量圍觀。

  • 但具有標誌性的是,和 OpenAI 合作整合 ChatGPT,這是蘋果首次在核心技術層面不是完全自研,同時蘋果也表示「未來還會使用其他大模型」,那麽蘋果自己的模型會處於什麽樣的位置呢?

    王佳梁: 其實這次和 OpenAI 的合作並不是很深度,至少比預期的低一些。在大部份場景下,蘋果都還是有自己的端模型和雲模型。尤其在它展示的主要幾個場景,例如個人助理、效率工具、跨套用協調,文案覆寫,都沒有采用外部模型,而是采用了自己的模型,特別是自己訓練的本地模型。

    雖然蘋果並沒有像谷歌那樣以模型為亮點進行宣傳,但看得出它的本地模型能力還是很強的。這也體現出蘋果一直以來和谷歌微軟的最大區別: 以使用者體驗為核心,而不是以技術為核心。 和 OpenAI 和合作,更有點像一個外部搜尋,並不像微軟那樣把 GPT 作為核心做了大量的基礎,用 GPT 來排程自己的套用。所以這次合作有很多象征性的意義,但還是體現了蘋果一貫的謹慎態度。

    未來,蘋果應該會接入更多大模型,而且主要目的是為了它的套用開發者生態,因為一旦開發者全部依賴雲服務商來整合,如 AWS 或者 GCP 的話,使用者數據和私密安全就會變得不可控。所以蘋果最好是把這部份整合工作抓在自己手裏。不過這些外部呼叫的模型和 GPT 一樣,不太可能深入到套用場景裏。 真正和場景耦合最大的,肯定還是自家的模型。

    至於專用模型運用到對應領域的 App,這個應該並不是蘋果決定的,而是開發者自己決定的。未來蘋果可能會做一個模型商店,所有符合它標準要求的模型(數據、私密安全)都可以上架,讓開發者自主選擇。

    任鑫: 蘋果 還是把 Siri 放在最前面的,如果 Siri 判斷自己搞不定才交給 ChatGPT。所以理論上講,如果 Siri 不斷增強的話,需要轉發給 ChatGPT 的需求就會減少很多。而絕大部份人絕大部份命令,應該是簡單的(例如設定一個鬧鐘)、原生的(拷貝貼上),或許給 ChatGPT 的量並不會太大。

    汪源: 蘋果的大模型分端側、自有雲端和第三方三層,ChatGPT 只是最外圍的第三層,如果將來蘋果自身的大模型能力更強,完全可以把更多的任務用自有模型滿足,主動權在蘋果側。當然也不排除蘋果最終會讓整個 OS 裏同時呼叫多種不同的模型,這很難預測。

    同時,蘋果也選擇了雲端協同的方式,透過端側 AI 確保即時性和私密保護,而如果使用者需要更復雜的功能,則可以呼叫雲端大模型完成。

    王佳梁: 雲和端的協同肯定是未來的趨勢。可以在端上做的智慧,沒必要放到雲上面去做。未來的手機芯片算力也會越來越強,而模型的最佳化和壓縮也會做得越來越好。端模型的效能,主要看套用場景。蘋果這次演示的日常效率場景,已經可以在地化,有些場景端模型足夠了。

    任鑫: 斷網場景太小,但海外確實存在很多人有很強的私密保護需求,他們會寧可犧牲便利性來使用本地模型,應該不是個太小的市場。另外,如果是 toB 場景,也可能有一些合規要求不能用雲端模型。

    汪源: 我認為是趨勢,並且端側大模型的價值會進一步增加,因為模型小型化的趨勢很明顯。

    AI + OS,蘋果在 AGI 時代究竟會處於什麽樣的位置?

    這一次,蘋果給 AI+OS 是否交出了一份完美的答卷?當前,諸多手機廠商、模型廠商都在著力將 AI 能力整合到系統層,蘋果能夠後來居上嗎?它和 Android 手機廠商的整合方式,又有哪些差異和超越?

    王佳梁: AI+OS 是未來的一個大趨勢。蘋果交出的答卷談不上完美,但還是很紮實也很有遠見的。首先蘋果有著最好的套用生態和套用場景,和 AI 結合也有著必然的優勢。大家一直存在一個誤解,認為 AI 的核心在於大模型和底層技術。實際上,套用場景和數據才是 C 端最核心的機會。所以蘋果後發制人,並不會有任何問題。但如何把使用者關註的數據私密安全處理好,效率和私密之間如何找到平衡點,才是最難的。 這次蘋果提出的 Apple Inteligence 以及 Private Cloud Compute 底層架構,顯然是深思熟慮的。 這才是蘋果比其他手機廠商更強的地方。

    手機廠商們一直在探索如何將 AI 的能力整合到系統層,對於這一點,我們要分國內和國外來看。海外的 Android 生態主導者是谷歌,谷歌的套用開發者生態沒有蘋果好,主要變現模式也在廣告而非內購。但近幾年谷歌也逐步有所好轉。谷歌在大模型方面肯定比蘋果更有優勢,有一部份場景在 I/O 上也已經有了。但的確谷歌在套用生態控制力上遠不及蘋果,數據和私密保護也做得沒有蘋果那麽好,這都是歷史遺留問題。蘋果這次的架構,我覺得就設計得比谷歌和微軟更加先進。

    而對於國內廠商而言,最大的問題是生態的割裂,以及信任的缺失,還有就是模型能力不足。其實很多功能已經有實作了,但底層的架構還是不一樣的。這就好像有些家具看上去樣子一樣,裏面的材質不一樣。

    王巍: 鑒於 Siri 弱智一般的表現,沒有 OpenAI 支持的 Apple Intelligence 用起來到底如何,還需要觀察。

    AGI 之戰,蘋果最熟悉的戰場 —— 人機互動

    蘋果終於將大模型軍備競賽拉到了自己最熟悉的戰場人機互動上,蘋果的跨 App 互動是獨屬於蘋果的生態又是,還是大家都可以實作的?

    王巍: 基於 AI 的非結構化 API 會是趨勢,今後 App 間的互動可能是以一種沒有見過的自然語言方式打破的,而不是現在的結構化數據和 API。

    王佳梁: 跨 App 互動只要在系統層面有足夠的許可權,誰都可以做,這方面沒有什麽特別壁壘。只不過 Android 生態在國內比較分散,除非大家形成一個統一標準,否則很難像蘋果那樣有一個統一的 Intent 系統。谷歌應該會跟進和定義這樣的介面,到時看看效果如何。最重要的還是對數據和私密的架構設計,這部份是有壁壘的,還有就是端模型需要的算力支持。

    任鑫: 微軟也可以做到,AI PC 可能還可以做更徹底一些,畢竟微軟在 AI 上走得更前面,而且前面探路的夥伴更多(類似 Android 生態在很多 UI 玩法上已經領先 iOS 了)。國內比較麻煩,沒有作業系統,但如果日後都是 AI Agent 化,可能 App 這層會被斷路,Agent 直接調 API 幫助使用者完成任務,這樣說不定有繞開現有 OS 的新機會。

    最為關鍵的擔憂:私密性、數據安全性

    這次蘋果智慧最大的爭議點在於它的私密性和數據安全性,除了馬斯克沖冠一怒的整合 ChatGPT 之外,有人說蘋果智慧為了實作跨 App 互動幾乎動用了所有的私密數據,也有人說只有蘋果靠多年的口碑積累才能讓使用者放心把數據交出去,對此, 王佳梁 表示:

    我們應該反過來想,如果蘋果來做這件事他們都不放心的話,那麽這群人基本上就會放棄大部份 AI 套用場景。巧婦難為無米之炊,不存取套用數據,怎麽可能給你做智慧推薦呢?這是一個必要條件。再說了,本身作業系統就會有幾乎所有的數據,無非是它是否存取和如何存取罷了。關鍵是自願、知情、可控、透明。一方面要征求使用者的同意,一方面要將所有處理透明化,做到可審計。包括 App 裏的數據,也是開發者自主接入 Intent 來實作對接的。這件事蘋果給了最嚴格的方案,其他廠商肯定做不到那麽嚴謹的。所以這也是蘋果牛逼的地方。

    我認為這些數據只要不上到雲端就沒有問題,但蘋果強調自有雲端大模型的安全性,這點我表示懷疑。

    結語:學習 在蘋果生態裏開發程式是不是更加重要了?

    在 iOS 的黃金時代,無數的開發者投身 iOS 開發,時至今日即使 AI 很熱但 iOS 開發者依然很是搶手。此次 WWDC,Apple Intelligence 搭建的雲端伺服器,采用了蘋果自家的芯片,並且用 Swift 語言編程,伺服器的程式碼接受第三方專家的審查。從開發者的角度來講,在蘋果生態裏開發程式會有什麽樣的變化?學習 Swift 的必要性是否有所提升?對此, 王佳梁和汪源的觀點不謀而合。 汪源 表示, 學習 Swift 語言的必要性取決於蘋果的市場占有率,目前沒有理由表明蘋果的市占率會顯著提升。而 王佳梁 則這樣說道:「 現在有了 AI 編程之後,學某一門語言的重要性都在不斷下降。 你很容易就可以讓 AI 幫你編程或者把一門語言轉換成另一門語言。 這個問題應該換成,學習在蘋果生態裏開發程式是不是更加重要了? 那就要看開發者需要用到多少 OS Native 的功能。 目前大部份商用 App 都采用 H5 等跨系統的方案,用 Swift 或者 Kotlin 開發原生套用,對於一些以業務邏輯為導向的 App 本身就不是必要的。 當然如果要用到 OS 提供的這些底層能力,互動上也比較註重原生體驗的,就自然會在 Swift 上多花時間。」