這兩天,X上一個賊可愛的視訊爆火了。
截止到我發文,100w的播放,1.5w的贊。
最關鍵的是,這個視訊來自國人,也是我一直以來在AI領域的兩位偶像:
海辛和阿文。
直接放一下這個視訊。
作為一個老任死忠粉,又是從紅藍寶石就開始入坑的骨灰級寶可夢玩家,看到這個視訊的一瞬間,心裏的某根弦就動了。
按那句話說,就是打在了我的心趴上。
最核心的是,海辛和阿文還做了一系列,也都在圈裏瘋狂刷屏。
「一覺醒來,羅馬塌了。
羅馬雖然不是一天建成的,但可以一天塌掉!」
我太太太太太太太喜歡了。
而且數據也非常好看。
一夜之間,模仿者也開始湧現。
因為效果太好, 很多朋友,都在在瘋狂的問是怎麽做的。
所以, 在征得海辛和阿文的同意和授權後 ,我就來,給大家拆解一下,這個視訊的做法。
其實蠻簡單的。
就是先出圖,然後圖生視訊。
視訊部份反而是最簡單的,圖生視訊誰好用誰, 海辛這個品質很明顯的就是可靈1.6,上周我也發過可靈1.6的評測,在圖生視訊領域現在就是斷層式的領先。
最核心的其實是最開始的圖片部份,要讓圖片融合的天衣無縫栩栩如生,還要保證主體和場景的一致性,才能達到完美的效果。
所以,圖片部份,要祭出的是上周Google更新的一個很有趣的AI繪圖產品:
Whisk。
網址在此:https://labs.google/fx/zh/tools/whisk
雖然它上手極度簡單,小白也是有手就行上手就會,但是效果卻好的令人發指。
使用邏輯非常簡單,給主體、場景、風格,然後Whisk就能給你完美的拼合在一起。
比如我們想做一個跟海辛類似的,一個皮卡丘抱著埃菲爾鐵塔。
你只需要找到皮卡丘和埃菲爾鐵塔的圖,然後傳上去。最後樣式風格空著就行。
寫一句賊簡單的Prompt:
巨大的皮卡丘抱著埃爾菲鐵塔。
然後點選生成,大概只需要十幾秒鐘,一張賊可愛的圖,就誕生了。
就是這麽迅速。。。
就是這麽無腦。。。
海辛還做過更多的例子。
真的,酷斃了好嘛。
而且Whisk最屌的點是,它並沒有用圖片參考,而是把這些圖,用大模型Gemini 2的能力,硬生生轉成Prompt,再用Google的AI繪圖產品 Imagen3,硬生生的直接生成。
比如我給朋友做的這個圖。
上面有一段超長的Prompt。
而我給的原圖是這樣的:
只能說一句,Google的硬實力卻是還是太猛了。。。
不用參考圖,就能把一致性保持的這麽好,這要是到時候原生多模態的Gemini 2上了還得了。。。
不過如果直接把Whisk出的圖拿過來直接用,其實效果也還達不到海辛和阿文的那種級別。
因為,AI的圖,總歸是有些瑕疵和細節缺失。
比如文章一開始的那個視訊,卡比獸還有一個之前的版本,Whisk直出的圖是這樣的:
一個對細節要求不那麽高的人,可能會覺得已經很好了。
但是阿文覺得不行。
於是,他直接扔到PS裏,扣了很多細節,調了顏色、調了光影、調了構圖,特別是還加了一些大氣透視和雲層,讓這個卡比獸,更有巨物感,更寫實。
效果直接立竿見影,瞬間真實可信多了。
這,就是職業玩家,和普通人的區別。
也所以,才有了最開始視訊的,大爆特爆。
這真的,就是專業者和創意者,最好的時代。前路AI已經為你盡情鋪好,而你,只需要肆意揮灑你的靈感就行。
而後一步,圖生視訊,就非常簡單了,直接無腦可靈1.6的圖生視訊。
我也找海辛和阿文把他們兩個圖生視訊的prompt給要來了,供大家參考(其實很簡單,說明白你的想法就行)
Prompt: 巨大的卡比獸,把一碗雪倒扣在富士山上,富士山瞬間被雪覆蓋。
Prompt:巨大的可達鴨在鬥獸場上熟睡並打呼,肚皮緩慢起伏,馬路上的車在行駛,突然鬥獸場塌了,冒出滾滾沙塵,可達鴨突然驚恐地睜大眼睛。
最終,配上音效,就成了一段創意極佳、制作精良的超級有趣的短視訊。
AI+專業者+超棒的想法,等於真正的好內容。
而這,才是我認為的,真正的流量密碼。
所以, 流量的盡頭從來不是跟風,而是創造。
創造讓人眼前一亮的世界,創造能引發情感共鳴的瞬間,創造屬於你自己的語言和故事。
AI只是助力。
而內容,才是永恒的靈魂。