作者:魚羊 衡宇
轉自:量子位 | 公眾號 QbitAI
這年頭,哪有人上班不發瘋的 (doge) 。
就拿PPT來說,趙曉卉「PPTSD」這詞兒一出,那真是戳到了打工人心坎上。
對啊,PPT是什麽高貴的東西啊!都大模型時代了,就沒有哪個AI能又好又快地幫我搞定這事兒嗎!
還真別說,打工人是會心疼打工人的。就在俺們量子位編輯們孜孜不倦尋找解放雙手的大模型工具的日常中,誒嘿,最近還真又挖到了新神器——
通義直接在網頁版裏上新了「 效率 」版塊,功能很直給:即時記錄、閱讀助手,還有PPT創作。
其中, PPT創作 屬於是新鮮出爐。
簡單來說,主打一個功能是大模型給的,但並沒多大「AI味」。
最關鍵的是, 免費 。
這咱不得抓緊測試一波——
拒絕PPTSD
具體來說,通義PPT創作主要提供了兩種PPT制作方式。
一句話主題生成PPT :如果你啥思路沒有,只有一句話主題,那麽可以把主題當成Prompt直接扔給大模型。當然,如果你已經有完整的思路大綱,它也支持 最多10萬字的超長文本輸入 。
上傳檔生成PPT: 文件、音視訊檔都支持。
一句話生成PPT
那麽就,先給又菜又愛玩的手殘黨同事們,搞一份【黑神話:悟空】攻略(PPT版)吧。
提示詞很簡短,就是:【黑神話:悟空】遊戲攻略。
一份像模像樣的PPT大綱秒速生成:
哪裏看不順眼可以上手修改,懶人黨也可以直接下一步——選樣版。
在不提供任何背景資料的情況下,通義生成的PPT能達到什麽樣的效果?
點選「生成PPT」,等待不到1分鐘,答案即刻揭曉。
應該是基於通義大模型的聯網搜尋能力,生成的遊戲介紹裏,【黑神話】的制作方、遊戲引擎等重點資訊都沒出錯。
不過大模型本身看上去並沒有被「劇透」,在具體遊戲內容上,有點腦洞大開。但話術組織,設計排版,還真可圈可點。
單看這文案,確實沒什麽AI味兒,說得上是言之有物。
人機協作修改起來也很方便:
點選文字域既能直接修改文字,也可以一鍵召喚大模型幫忙一起最佳化文案。
配圖同樣可以交給AI生成。
不會寫提示詞也沒關系,通義PPT內建「咒語書」,點選即用,也可以作為參考。
看樣子,日常用來糊弄老板妥妥夠用了 (不是) 。
上傳檔生成PPT
咳咳,還是回到正經用途上,如果餵給通義PPT更詳細的文件資料,它又會表現如何?
比如,投餵一份量子位的內部培訓資料,讓通義PPT來幫忙搞定培訓PPT。
效果上be like:媽媽再也不用擔心我開會前做不完PPT。
PPT生成的內容和上傳檔關聯性很高,基本上把文件重點都劃出來了,直接拿來用問題也不大。
簡單總結一下,通義這波上新的PPT創作,具有以下幾個優點:
言之有物 :做到了生成文本更像人話 (去AI味) ,並且不是片湯話,能結合使用者需求和上傳檔輸出有資訊量的PPT內容。
樣版豐富 :提供了各個不同場景、行業適用的PPT樣版,設計美觀,大學生到上班族都能用。
智慧編排 :提供了全流程智慧編排的能力,可線上即時調整PPT樣版編排、PPT配圖智慧生成、PPT文本智慧覆寫等。
量子位進一步扒拉了一下,通義PPT背後的基礎模型是通義千問大模型2.5,相比上一版本,Qwen 2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%,效能超越GPT-4 Turbo。
在對長文件的支持方面,通義PPT支持1000萬字長文件,包括PPT、PDF和網頁。
多模態方面,支持上傳最長6小時的音訊、視訊,也可以輸入連結匯入線上音視訊。
文生圖功能,則是引入了通義萬相的能力。
三合一「通義效率」
值得一提的是,與PPT創作共同存在於通義效率版塊的,還有另外兩個功能:
即時記錄 ,以及 閱讀助手 。
不說不知道,這兩者其實都是通義使用者的老朋友。
即時記錄,原通義聽悟 ,是音視訊內容方面的AI助手。
套用場景聚焦課堂記錄、會議記錄,能完成的工作,包括語音轉文字、發言人區分、智慧總結等。
界面非常簡潔,選擇語言 (能辨識中、英、日三種語言) ,確定需不需要即時轉譯成中文,即可開始線上錄音。
外教課or國際會議,不用愁了。
在通義即時記錄,錄音是即時的,語音轉文字是即時的,英文/日語錄音轉譯成中文是即時的。
連邊轉文字邊修正錯別字,也是即時的。
是真的很即時(手動狗頭)。
不僅可以很好地 區分發言人 ,根據不同發言人整理核心觀點,而且,使用者 可以邊聽邊選中文段,自己劃重點。
邊開會邊做會議紀要,不是夢。
整個界面的右側板塊,是用來寫寫畫畫自個兒做筆記的部份。
當錄音結束後,這一板塊會劃分成三個區域:
• 導讀 :對錄音內容進行AI總結,包括摘要、章節速覽、待辦事項等;
• 腦圖 :根據錄音內容整理出思維導圖,幫助快速掌握會議要點和脈絡;
• 筆記 :顧名思義,是錄音過程中使用者自己記錄下的內容。
關於即時記錄,最後來劃個重點:支持每天20小時的錄制撰寫時長,使用免費!還是免!費!
閱讀助手,功能等同於原來的通義智文。
上來就先告訴你,與實際記錄一樣,它同樣 是免費的。
在閱讀助手,各種格式的文件/論文/圖書,包括PDF (含掃描件) 、word、圖片、HTML、Markdown、EPUB、Mobi,無論是網頁連結還是播客連結,都能被精準速讀。
而且, 超多格式伴隨著超大容量——
文件,可以是長達1000萬字的;音訊視訊,可以是6小時起步的。
非常Nice。
上手測試過程中,我們餵給了它兩本書,分別是193頁、英文版的【我們賴以生存的隱喻】,和500頁、中文版的【埃隆·馬斯克傳】。
首先,很關鍵的一個功能是閱讀助手 支持全文轉譯 ,轉譯速度還很快,幾乎不用等。
對經常讀外文文獻的朋友們來說,真的非常友好。
其次,AI提煉出的導讀部份,也會轉譯成中文呈現。
這一部份由全文概述、關鍵要點、速度導覽等組成;如果丟給它的是論文,還會有論文速讀 (核心要點總結) 、論文總結 (文章優點、方法創新點、未來展望) ,幫助使用者快速理解內容。
如果嫌棄導讀還是太長?
沒關系,指路旁邊的腦圖,分分鐘厘清主要脈絡。
更有意思的是,在閱讀助手裏,使用者能針對原文劃詞解讀,輔助理解關鍵點。
可以選擇在板塊底部的對話方塊,問出所有你不明白不理解的文件相關問題。
這個功能約等於「 讓死的論文活過來交流探討 」。
如此這般,即時記錄、閱讀助手、PPT創作,形成了三合一的通義效率。
即時記錄功能能夠迅速捕捉並保存每一個重要資訊;
閱讀助手則是輔助位,幫助在知識中篩選、提煉,讓使用者短時間內掌握核心要義;
而PPT創作則能借用大模型的AI能力將散落的資訊整理成富有邏輯性和視覺沖擊力的展示材料。
這三者相輔相成, 共同構成了一個從資訊整理、閱讀理解到內容創作的完整工作學習流程 ;每一步環環相扣,不管是面對工作還是學習,都能事半功倍。
大模型套用想卷,得靠技術和體驗
上面提到的三個功能,都可以在PC端絲滑使用。
多說一嘴,除了PPT創作,另外兩個功能還能在手機端體驗。
「我們希望透過這些工具幫助使用者節省時間,提升工作學習效率,激發無限創意。」通義效率產品經理王曉明表示,未來圍繞工作學習場景,通義會持續幫使用者用AI技術提效。
通義效率背後,正是 基於強大的通義大模型 。
阿裏旗下通義千問大模型聚焦開源路線,家族陣容龐大,是國內的頭部梯隊玩家,在多個全球評測榜單上也常常名列前茅。
通義近期釋出了全球效能最強的開源模型Qwen2-72B,該模型提升了程式碼、數學、推理、指令遵循、多語言理解等能力。多個國內外榜單顯示,Qwen2-72B成為排名第一的中國大模型,也是全球最強的開源模型。
長期耕耘得來的技術優勢,為通義效率提供了源源不斷的創新動力。
而三合一整合後推出的通義效率,精準地圍繞工作學習流程,將資訊整理、閱讀理解到內容創作這三大功能進行了無縫打通,形成了一個高效的工作學習閉環。
這一閉環不僅能夠激發使用者的創意思維,還能夠顯著提升工作效率。
更為重要的是,通義效率 率先將這些功能全部實作在PC端,真正做到了「需求在哪裏,效率就在哪裏發揮作用」 。
這種以使用者需求為導向的設計理念,使得通義效率在提升使用者工作效率的同時,也極大地增強了使用者體驗。
當然了,換個視角來看,通義上線「效率」的背後,其實反映了市場的選擇和趨勢——
大模型的套用正在朝著智慧化、個人化、一站式、高效率、少人工的方向發展。
這正是大模型在套用層面的本質體現。
隨著大模型日益融入大眾的日常生活,使用者在入門上手之後,追求的便是更加卓越的體驗。
如果技術不夠先進,體驗不夠優秀,那麽就容易被使用者和市場所拋棄。
因此, 大模型的套用落地和推廣,必須走向更實用、更好用的方向。
實際上,我們正在見證這一趨勢的發生,通義效率的選擇,就是最好的證明之一。
它告訴我們,套用落地和推廣,只有真正滿足使用者需求,提供優質體驗的產品,才能在AI 2.0的模型與套用大潮中站穩腳跟。
— 完 —