騰訊大模型 App 正式上線，微信 QQ 等全面接入！

2024-05-30資訊

行動網際網路有 12 億 使用者，AI 頭部產品卻只有百萬量級的日活。

作者 | 王啟隆

責編 | 唐小引

出品丨AI 科技大本營（ID：rgznai100）

台北時間 5 月 30 日，基於混元大模型的 C 端 App「 騰訊元寶 」正式上線，各大市集一早就開放了下載，這款套用瞄準了大家在工作效率場景中的核心需求： 資訊獲取 — 處理 — 生產 ，對應了其主打的 AI 搜尋 + AI 總結 + AI 寫作 三大功能，深度貼合每個人的實際生活。

CSDN 現場參加了「元寶」的媒體溝通會， 騰訊雲副總裁、騰訊混元大模型負責人劉煜宏 發表演講，同時做了不少的演示。

這次真正主打的核心功能是 AI 搜索 ，騰訊其實在搜尋上有著相當久遠的歷史。除了大家現在熟悉的微信搜一搜，騰訊還有搜狗搜尋，其前身是「門戶時代」的 Soso，至今已經有了 18 年的歷史，可謂時代的眼淚。現在結合了 AI 技術增強，既有傳統的穩定性，又有更智慧的生成答案，問它電視劇都能答上來：

元寶的最大特色是深度整合了騰訊自家的微信生態資源，特別是微信公眾號這一內容豐富的平台 —— 基於公眾號的搜尋，全網只有這一家。前陣子谷歌 CEO 才說 AI 搜尋「幻覺」問題無法解決，所以騰訊規避問題的方式也很簡單粗暴，因為它很多時候做的不完全是搜尋，而是對自己搜尋到的公眾號進行了總結。

我們這就考考元寶，看它認不認識 CSDN 最新上市的【】：

這題不難，只要讀了標題就能解出來。

接下來再考考元寶，看它讀沒讀文章內容：

看來，只要是公眾號上面的知識，都難不倒它了。

在 AI 總結方面，元寶可上傳最多 10 個 PDF、word、txt 等多種格式的文件，並能夠一次性解析多個微信公眾號連結、網址。劉煜宏介紹元寶擁有 256K 的原生視窗上下文 ，這相當於一本【三國演義】，或是英文原版的【哈利波特】全集。

這段時間「AI 教母」李飛飛創業的事特別火，而她創業前其實還在史丹佛以人為中心的人工智慧研究所（HAI）釋出了一篇年度報告，我們先前做過，看看元寶能否總結這份 圖文並茂的報告 ：

到了 AI 寫作這塊兒，劉煜宏強調了元寶的多輪問答能力，甚至表示元寶能夠將對話的內容整理成報告，按照要求進行結構化輸出，大大提升資訊從獲取到處理再到生產的效率。

創意寫作現在似乎已經成為了各大通用模型的「基本功」了，所以我更想測試它有趣的文生圖能力。點開 App 上方的「發現」一欄，我發現元寶預設了一堆琳瑯滿目的智慧體。現在我想繪畫，所以選擇了「創意繪畫」：

先來一張像素風的城市落日圖：

在這個預設的智慧體裏面，我還可以進行風格切換和比例設定，值得點個贊。

切換成「油畫」風格和 16：9 比例之後，我又讓元寶生成了一張城市落日圖：

智慧體的效果還是相當不錯的。劉煜宏在溝通會上表示，騰訊之前已經推出過了「元器」這樣的創作者工具平台，鼓勵開發者、企業乃至普通使用者自行建立個人化的智慧體。 目前，騰訊的產品策略著重於早期階段的內部需求滿足和使用者體驗的提升 。所以，未來元寶不會再推出太多的預設智慧體，而是透過智慧體創作平台的開放和騰訊外掛程式的支持，鼓勵開發者自主構建智慧體，實作技術的廣泛套用。

下面，讓我們進一步了解元寶還有哪些秘密。

脫胎換骨

元寶背後的混元目前有多強？劉煜宏給出了一個數位：自釋出以來，混元模型的 效能提升了 50% 。

參數方面，千億升級到了萬億。

訓練和推理框架上，騰訊自研的機器學習平台訓練速度是主流框架的 2.6 倍，大模型推理成本相比業界主流框架下降 70%。此外，預訓練語料還從萬億升級至了 7 萬億 tokens。

演算法上，稠密模型已經演變為時流行的 MoE （專家混合網路），參數量和處理的 tokens 數量分別增加了十倍和七倍，顯示了技術上的重大突破和最佳化。這些最佳化不僅提升了系統的吞吐量，也降低了能耗。

在多模態方面，五月份開源的騰訊混元文生圖大模型是 全球第一個中文原生 DiT 架構模型 ，也就是 Sora 帶火的同款架構，生成效果相比上代提升超 20%。劉煜宏透露，在 Sora 出現之前，騰訊自研的視訊生成能力在業內「遙遙領先」，但隨著二月份那個驚奇演示之後，混元也隨之更換了架構。如今，混元文生圖大模型在 GitHub 累積了 2000+ star ，前文也演示了元寶在這個文生圖模型的加持下展示的創作能力。

GitHub： https://github.com/Tencent/HunyuanDiT

Hugging Face： https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

此外，騰訊混元大模型在視訊、3D 生成等方面也持續探索，目前已經支持 16s 視訊生成 ，單圖僅需 30 秒即可生成 3D 模型 ，相關能力也將於後續在元寶中上線，這點十分值得期待。

套用場景從哪找？

「騰訊做大模型不爭一時之先。」

劉煜宏在溝通會上一直強調騰訊的「慢戰略」，而這段時間，他們真正的工作是「看」，也就是 洞察使用者的真實需求 。

自 2022 年 ChatGPT 釋出以來，大模型領域異常火爆，頻繁傳出各種產品突破性進展的新聞。我們最經常看到的標題可能就是「超越 GPT-4」，「xx 評測榜單再度重新整理」 …… 但是，這股熱潮被局限於一個「圈」內，並沒有被普羅大眾所感知到。

按照劉煜宏的說法，現在中國行動網際網路有超過 12 億的使用者 ，其中不乏大量對互聯網十分熟悉的群體，如大學生、互聯網從業者和職場人士，這部份核心使用者群體估計有 數千萬之眾 ，然而大模型 AI 套用的實際日活躍使用者（DAU）總量去除重復後，即使各家公司聲稱有數十萬至數百萬不等，綜合起來也不過 百萬量級 ，這意味著在整個互聯網使用者群中的滲透率低至不足 1% 。

通常的說法是「藍海市場很大」，但我們也可以用兩個字形容這種現象：「自嗨」。

對於廣大普通使用者而言，這些 AI 資訊顯得相對遙遠且缺乏實際感知。大模型仍在發展期，產品解決方案不成熟，且大家對 IA 套用的認知仍集中在搜尋/效率（文本提煉、總結、創意文案）等比較窄的探索 —— 沒人知道怎麽用 AI 。

劉煜宏透露，有很多企業高管對 AI 套用的第一想法還是「智慧客服」。

沈寂了一年之久的混元，既不刷榜也不主動參加評測，而是慢慢的尋找卻在 15 號突然全面開源了文生圖大模型，後續參加了激烈的「國產大模型價格戰」。

為什麽騰訊會這麽晚「參戰」？其實，我們不需要考慮這個問題，答案事實上很簡單：因為他是騰訊。

這家社交帝國除了火急火燎地追趕 OpenAI 以外，還有第二條路可走。依靠它在行動網際網路時代打下的「江山」：微信、QQ 積累的 龐大使用者規模 ，從「跳一跳」開始火遍全國的 小程式生態 ，無數公眾號交織起來的 優質內容寶庫 ，甚至是騰訊視訊正在熱播、被用於元寶 App 演示的【慶余年 2】，都映現了這道江山的風貌。

現在，讓混元大模型賦能這一切，就能立刻實作 Sam Altman 口中的那種「魔法」（Magic）。騰訊並不需要做出一個 SOTA，他們現在就可以端出一套完整的、基於行動網際網路時代套用的「AI 生態」。

目前，騰訊內部有超過 600 個業務 正式采用了混元大模型技術， 日呼叫量已超過 2 億次 ，這一數據早前就已經達到，並持續保持高位；相較於最初僅有少數產品嘗試，實作了快速擴張。透過大模型的套用，騰訊內部提升了約 20% 的整體工作效率 ，特別是在程式碼生成方面，約有 23% 的程式碼是由 AI 自動生成的 ，省下了四分之一的人力。

騰訊的兵法，是「徐徐圖之」。

開發者正在迎接新一輪的技術浪潮變革。由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的 2024 年度「全球軟體研發技術大會」秉承幹貨實料（案例）的內容原則，將於 7 月 4 日-5 日在北京正式舉辦。大會共設定了 12 個大會主題：大模型智慧套用開發、軟體開發智慧化、AI 與 ML 智慧運維、雲原生架構……詳情👉： http://sdcon.com.cn/