今天中午, Vidu 突然發了他們的AI視訊模型Vidu2.0。
網址在此:https://www.vidu.cn/
AI視訊領域真的卷麻了,比2023年的大模型還卷。
自從可靈1.6發了之後,明顯感覺所有家都坐不住了,基本都把自己的牛逼貨加速推了出來。
整體看了一下Vidu2.0的效果,在模型品質上,比較驚艷,能躋身T1梯隊。
最基礎的圖生視訊,動作更穩了,人物的表情看著也更生動了。比如這個馬朗普。
3D卡通的動作效果也很絲滑的前進演化了。
比如這個狐貍喝水的動作和被子裏冒的熱氣,自然、生動且合理。
2D動漫圖生的效果一直都是 Vidu 的王牌,這次也是穩如老狗。
比如這個case,戴著頭盔「轉頭」這種魔鬼動作,都能保持還不錯的人臉穩定性,只能說一句牛逼。
玩兒了一圈下來,最直觀的感受是:
2.0的 穩定性、首尾幀變化、參考生視訊的一致性,全都上了一個台階 。
整體模型品質,和上一次的1.5比較可以說是水桶級的升級。
不過,這些都不是我覺得 Vidu 這次升級2.0最屌的地方。
速度,還有價格,這才是很多人沒關註到的重點。
他們,簡直就是AI視訊領域的 DeepSeek ,妥妥的價格屠夫。
給大家看一下這次 Vidu 2.0的價格。
我們也把市面上目前主流的AI視訊價格都整理了一下,直接單月購買非連續包月,全都按圖生視訊720P的品質,橫向對比每秒的價格:
如果表格大家感受沒那麽強烈。
我再拉個條形圖,給大家更直觀地對比一下。
同樣都是720p的視訊, Vidu 一秒才不到三毛錢。
是可靈的60%,Runway的30%,更別提Sora這個貴上天的玩意兒了。他們明明可以搶錢的,但是還非要送你一個垃圾視訊。
之前AI視訊一直有個很多人都在討論的問題,就是價格。
雖然對比傳統的廣告和影視,在能達到80%同等鏡頭品質的情況下,AI視訊確實會便宜很多。但是動輒大幾百的會員費和積分價格,依然不是普通的個人使用者隨隨便便就能玩的。
生成出來的一條視訊也就5秒,一次得花好幾塊錢。再加上AI視訊這東西本來就隨機性強,roll個4、5條才能出一個能用的視訊太正常不過了。算下來的總成本,其實還是貴。
但是現在, Vidu 直接走上了價格屠夫的新賽道。
雖然沒有當年 DeepSeek 的價格降幅那麽離譜, 但在AI視訊領域,不要小看這30%的最佳化,這都是活生生的錢,有人開始帶頭卷,對消費者和使用者才是最有利的。
而且還有個很有趣的功能,是無限量錯峰生成。
這個很有意思,就是類似於閑時流量,而且是免費的、無限量的,你可以隨便送出N個任務。
開了以後,排隊等他們流量低峰時再去跑,用時間來換免費,使用者白嫖到了算力,
Vidu
也平衡了波峰波谷。唯一的弊端就是,得開那檔最貴的旗艦版才能用。
除了價格外,還有另一個我覺得極度牛逼超級香的點,就是速度。
極速的只要10s就能生成。
而跑一條720p的視訊,加上排隊的時間,大概30秒就能搞定。
這確實就是在我用過的所有AI視訊產品裏,最快的。
就比如我自己,以前跑一個滿意的視訊,扛哧癟肚半小時,最後可能只有5秒能用,不是錢的問題,是效率是真的低,一個視訊等5分鐘以上。
浪費的時間成本,不是多roll幾次就能回來的啊。
如果一定要在價格和時間的最佳化裏二選一,我用腳投時間一票。
但是還好, Vidu 2.0這波,兩個全都做到了。
極低的價格+飛快的速度,直接把AI視訊從「神壇」拉到地面。這才是,真正的技術平權。
莫名讓我想起了小米的Slogan:
讓每個人都能享受到科技的樂趣。
把AI視訊領域的不可能三角: 便宜、速度、品質 ,Vidu在某種程度上,做到了可能。
最後,再看看品質。
前面其實也說了,是一個比較水桶的升級。
我就直接做了一些跟 Vidu 1.5的對比,來讓大家直觀的感受一下品質。
Vidu 家的最牛逼的長板,就是美術還有2D、3D的動漫畫風。
比如這個「黑悟空」裏鏡頭。Prompt我就寫了個「角色睜開眼睛」。1.5的效果其實也不錯,但還是很容易在結尾崩掉,2.0的質感則明顯提升了一個層次。
還有這個我自己挺滿意的油畫效果。Prompt是「男人用煙鬥抽煙,轉頭向左看」。1.5的穩定性不太行,畫風越來越崩。但2.0的就穩很多,而且能順利實作prompt要求的動作。
除了基礎的圖生視訊,Vidu這次首尾幀生成視訊也有了史詩級的加強,效果確實更自然了。
比如辣個即將解凍的男人。。。。
1.5的效果是「你誰?還我劉財神」。到了2.0終於可以正確做到「幫劉德華春節解凍」了。
還有海綿寶寶的這個可愛到爆的case。
1.5還是ppt轉場,2.0的動作變化就非常合理,海綿寶寶把小蝸放腦袋上了,直接給我萌出血。。。
這個【賽博龐克:邊緣行者】的耍槍case也是。2.0的效果,穩就一個字,動作效果很絲滑。
1.5的首尾連線,確實難roll出自然過渡。但2.0的首尾間動作和運鏡,補充得就非常合理,我基本是roll個兩三次就能得到非常絲滑的動畫結果。
而且這些動作,讓我感覺它是真的懂點兒動作邏輯的。
首尾幀的效果也終於不是PPT轉場了。繼AI影視後,AI動畫也越來越可能實作了,這波實用性直接拉滿。
還有一個 Vidu 自己的看家功能,內送流量備援容錯機制體參考,在2.0的加持下,更加穩定、語意理解更好後,也有了更秀的玩法。
這個玩法是在群友Eason Wang那看到的。
簡單來說就是:圖1的位置,可以上傳視訊的 主體 ;圖2的位置上傳主體的 參考表情或者服裝 ;圖3可以傳 場景、道具 或者其他什麽物體都行。
支持多個參考融合已經很牛了,更騷的是 Vidu 的這個「框選」功能。
動畫的角色設計裏有一個很重要的美術環節,就是做角色的表情參考。方便在制作動畫的過程時讓協同的各部門隨時可以確認和控制角色的一致性。
比如,你想讓自己的角色做出某個微妙的,很難用prompt控制的表情,你就可以上傳一套滿意的表情參考。
例如哪咤的這組參考,6個表情的原圖直接傳。不需要再用ps啥的裁剪半天,框選工具一拉,就能精準選到你需要用的表情,真的,太能給影視和遊戲制作省事兒了。。。
正好餃子導演的【哪咤】第二部春節馬上要上映了, 我也嘗試用這個方法, 也來蹭一波熱度。做個哪咤送紅包的效果。
效果就非常的可愛。
人物和場景的融合、表情的處理都非常OK。
這個效果稍微再細化細化,感覺能直接混進今年的春節檔。
單個主角的case效果都不錯,不過盡量不要兩個人或以上,那個效果就會比較一般了。
整體來看, Vidu這一波,在平衡速度和品質之後,還能有這麽低的價格,在價效比上真有點兒當年DeepSeek那個味道了。
我一直都在說「創意」才是內容的核心和根本,但要是連工具都用不起,再多的創意也只能放角落吃灰。
我的態度一直是生成式AI的技術進步,就應該以大眾化為方向。
有人說現在是AI視訊的革命元年,但我覺得,真正的革命不只是技術,而是讓更多普通人,都能輕松把腦子裏的想法變成畫面。
讓每個人的想象力即刻成真,這大概就是科技最浪漫的樣子。
畢竟,創意這種東西。
如果可以不被價格所束縛。
那就,太棒了。