Gemini 2.0成P圖神器，各種P圖只需一句話的事兒，可把網友饞哭了

2024-12-19碼農

Gemini 2.0 說說話就能一鍵P圖的功能爆火，把玩不了的大夥兒都饞哭了！

比如一輛小車車：

輸入指令「把這輛車改裝成敞篷車」，它就能立馬將文字指令和圖片結合起來，完成一鍵P圖。

讓我們來找茬兒，發現除了車變成了敞篷的，其它元素木有變化，很好地保持了一致性。

不僅於此，Gemini 2.0還有點「多模態版o1」那味兒。

繼續輸入指令：想象一下，這輛車內裝滿了海灘用品。接著，將車身顏色改為一種令人聯想到夏日的顏色，並在改變過程中進行說明。

然後Gemini 2.0就開始圖文並茂地一步步推理生成了，先把車變成了明亮的黃色，接著又再車裏裝滿了遮陽傘等海灘用品

這就是Gemini 2.0系列的原生影像輸出能力。

評論區底下，一水兒都是求具體上線時間的：

被谷歌挖走的OpenAI大將Logan Kilpatrick回應，大夥兒別急，明年年初將更廣泛地推出。

各種P圖都是一句話的事兒

除了上面展示的簡單P圖，你甚至可以同時P圖片中的多個元素，還能把一個物件變成另一個。

比如，把蓬松的夾克變成一個小枕頭，並且拿掉毯子：

這還沒完，結合不同的圖來P 也行。

貓和抱枕結合，就得到了一個很有質感的貓貓抱枕：

把貓貓和滑板結合就得到了貓貓代言滑板。

遵從文字指令，Gemini 2.0成功將貓貓變成了插畫貼紙形態。

除此之外，Gemini 2.0 P圖時還能更有想象力。

比如一個箱子，把箱子開啟就變成了醬嬸兒：

開頭展示的小車車，也能變成「飛車」：

另外，還有一種玩法。

在影像中圈出需要P的區域，只需「Open this」，Gemini 2.0可以直接結合文字指令理解影像，知道「this」的指代：

不得不說，那些有內測資格的玩家，可算了把大夥兒饞壞了。

參考連結：https://x.com/OfficialLoganK/status/1868364831948251419

— 完 —