作者:西風
轉自:量子位 | 公眾號 QbitAI
Gemini 2.0 說說話就能一鍵P圖 的功能爆火,把玩不了的大夥兒都饞哭了!
比如一輛小車車:
輸入指令「把這輛車改裝成敞篷車」,它就能立馬將文字指令和圖片結合起來,完成一鍵P圖。
讓我們來找茬兒,發現除了車變成了敞篷的,其它元素木有變化,很好地 保持了一致性 。
不僅於此,Gemini 2.0還有點「多模態版o1」那味兒。
繼續輸入指令:想象一下,這輛車內裝滿了海灘用品。接著,將車身顏色改為一種令人聯想到夏日的顏色,並在改變過程中進行說明。
然後Gemini 2.0就開始圖文並茂地 一步步推理生成 了,先把車變成了明亮的黃色,接著又再車裏裝滿了遮陽傘等海灘用品
這就是Gemini 2.0系列的原生影像輸出能力。
評論區底下,一水兒都是求具體上線時間的:
被谷歌挖走的OpenAI大將Logan Kilpatrick回應,大夥兒別急,明年年初將更廣泛地推出。
各種P圖都是一句話的事兒
除了上面展示的簡單P圖,你甚至可以 同時P圖片中的多個元素 ,還能把 一個物件變成另一個 。
比如,把蓬松的夾克變成一個小枕頭,並且拿掉毯子:
這還沒完, 結合不同的圖來P 也行。
貓和抱枕結合,就得到了一個很有質感的貓貓抱枕:
把貓貓和滑板結合就得到了貓貓代言滑板。
遵從文字指令,Gemini 2.0成功將貓貓變成了插畫貼紙形態。
除此之外,Gemini 2.0 P圖時還能 更有 想象力 。
比如一個箱子,把箱子開啟就變成了醬嬸兒:
開頭展示的小車車,也能變成「飛車」:
另外,還有一種玩法。
在影像中 圈出需要P的區域 ,只需「Open this」,Gemini 2.0可以直接結合文字指令理解影像,知道「this」的指代:
不得不說,那些有內測資格的玩家,可算了把大夥兒饞壞了。
參考連結:https://x.com/OfficialLoganK/status/1868364831948251419
— 完 —