當前位置: 妍妍網 > 碼農

AI美女圖成了過去式,「巨物寶可夢」才是新的流量密碼。

2024-12-25碼農

這兩天,X上一個賊可愛的視訊爆火了。

截止到我發文,100w的播放,1.5w的贊。

最關鍵的是,這個視訊來自國人,也是我一直以來在AI領域的兩位偶像:

海辛和阿文。

直接放一下這個視訊。

作為一個老任死忠粉,又是從紅藍寶石就開始入坑的骨灰級寶可夢玩家,看到這個視訊的一瞬間,心裏的某根弦就動了。

按那句話說,就是打在了我的心趴上。

最核心的是,海辛和阿文還做了一系列,也都在圈裏瘋狂刷屏。

「一覺醒來,羅馬塌了。

羅馬雖然不是一天建成的,但可以一天塌掉!」

我太太太太太太太喜歡了。

而且數據也非常好看。

一夜之間,模仿者也開始湧現。

因為效果太好, 很多朋友,都在在瘋狂的問是怎麽做的。

所以, 在征得海辛和阿文的同意和授權後 ,我就來,給大家拆解一下,這個視訊的做法。

其實蠻簡單的。

就是先出圖,然後圖生視訊。

視訊部份反而是最簡單的,圖生視訊誰好用誰, 海辛這個品質很明顯的就是可靈1.6,上周我也發過可靈1.6的評測,在圖生視訊領域現在就是斷層式的領先。

最核心的其實是最開始的圖片部份,要讓圖片融合的天衣無縫栩栩如生,還要保證主體和場景的一致性,才能達到完美的效果。

所以,圖片部份,要祭出的是上周Google更新的一個很有趣的AI繪圖產品:

Whisk。

網址在此:https://labs.google/fx/zh/tools/whisk

雖然它上手極度簡單,小白也是有手就行上手就會,但是效果卻好的令人發指。

使用邏輯非常簡單,給主體、場景、風格,然後Whisk就能給你完美的拼合在一起。

比如我們想做一個跟海辛類似的,一個皮卡丘抱著埃菲爾鐵塔。

你只需要找到皮卡丘和埃菲爾鐵塔的圖,然後傳上去。最後樣式風格空著就行。

寫一句賊簡單的Prompt:

巨大的皮卡丘抱著埃爾菲鐵塔。

然後點選生成,大概只需要十幾秒鐘,一張賊可愛的圖,就誕生了。

就是這麽迅速。。。

就是這麽無腦。。。

海辛還做過更多的例子。

真的,酷斃了好嘛。

而且Whisk最屌的點是,它並沒有用圖片參考,而是把這些圖,用大模型Gemini 2的能力,硬生生轉成Prompt,再用Google的AI繪圖產品 Imagen3,硬生生的直接生成。

比如我給朋友做的這個圖。

上面有一段超長的Prompt。

而我給的原圖是這樣的:

只能說一句,Google的硬實力卻是還是太猛了。。。

不用參考圖,就能把一致性保持的這麽好,這要是到時候原生多模態的Gemini 2上了還得了。。。

不過如果直接把Whisk出的圖拿過來直接用,其實效果也還達不到海辛和阿文的那種級別。

因為,AI的圖,總歸是有些瑕疵和細節缺失。

比如文章一開始的那個視訊,卡比獸還有一個之前的版本,Whisk直出的圖是這樣的:

一個對細節要求不那麽高的人,可能會覺得已經很好了。

但是阿文覺得不行。

於是,他直接扔到PS裏,扣了很多細節,調了顏色、調了光影、調了構圖,特別是還加了一些大氣透視和雲層,讓這個卡比獸,更有巨物感,更寫實。

效果直接立竿見影,瞬間真實可信多了。

這,就是職業玩家,和普通人的區別。

也所以,才有了最開始視訊的,大爆特爆。

這真的,就是專業者和創意者,最好的時代。前路AI已經為你盡情鋪好,而你,只需要肆意揮灑你的靈感就行。

而後一步,圖生視訊,就非常簡單了,直接無腦可靈1.6的圖生視訊。

我也找海辛和阿文把他們兩個圖生視訊的prompt給要來了,供大家參考(其實很簡單,說明白你的想法就行)

Prompt: 巨大的卡比獸,把一碗雪倒扣在富士山上,富士山瞬間被雪覆蓋。

Prompt:巨大的可達鴨在鬥獸場上熟睡並打呼,肚皮緩慢起伏,馬路上的車在行駛,突然鬥獸場塌了,冒出滾滾沙塵,可達鴨突然驚恐地睜大眼睛。

最終,配上音效,就成了一段創意極佳、制作精良的超級有趣的短視訊。

AI+專業者+超棒的想法,等於真正的好內容。

而這,才是我認為的,真正的流量密碼。

所以, 流量的盡頭從來不是跟風,而是創造。

創造讓人眼前一亮的世界,創造能引發情感共鳴的瞬間,創造屬於你自己的語言和故事。

AI只是助力。

而內容,才是永恒的靈魂。