
1句指令生超逼真相 Google推AI Banana模型超級火熱 成Adobe噩夢
不懂用Photoshop,也能用一句話就把照片變時尚大片?Google(美股:GOOGLE)近日推出紅遍全球的AI編輯模型Gemini 2.5 Flash,它又名「Nano Banana」,現已整合至Gemini AI,被譽為「地上最強AI生成圖片工具」,能生成真假難辨的AI相片,挑戰Adobe(美股:ADBE)王牌產品Photoshop的地位。此外,Google在反壟斷案中避開最嚴厲處罰,法官裁定無需分折出售Chrome,只是禁止簽訂獨家搜尋引擎合約,料助Google股價創新高。
技術突破與產品優勢
Google推出的Gemini Nano Banana的核心亮點,在於其前所未有的「角色一致性」。這項技術徹底解決了過往AI圖像編輯的痛點:當你為照片中的人物或寵物更換造型、改變場景時,AI模型往往會因為多次編輯而導致主體「變臉」,面部特徵或整體樣貌產生扭曲,但它仍能使人物或寵物的樣貌依然能保持高度一致。Google DeepMind產品負責人Nicole Brichtova表示,「在編輯自己或熟悉的人的照片時,細微的瑕疵很重要——一個描繪「接近但不完全相同」的形象是不對的」,而這正是Google致力解決的關鍵問題。
除了精準度,製作的速度也是一大亮點。Nano Banana編輯一張舊照片僅需不到30秒,相較之下,部分競爭對手如ChatGPT通常需要更長時間。TechRadar的評測更是指出,Nano Banana在生成與編輯速度上,比ChatGPT快上高達6倍。這種極致的速度結合用戶友好的體驗,讓複雜的圖像編輯不再需要圖層遮罩或精密的摳圖技巧。使用者僅需用自然語言指令,例如「把我換成穿橘色禮服」,AI便能自動完成任務,將專業級的編輯門檻從「專業人士才能用」降至「誰都能用」,這無疑是一場大眾化革命。
圖像編輯賽道對比
Nano Banana支援多輪編輯功能,用戶可層層疊加修改,同時保持整體一致性。它還具備圖像融合能力,能巧妙結合多個元素,例如將雨靴與粉色玫瑰融合,創造出花卉圖案的靴子設計。同時,模型結合了多模態推理與世界知識,能在編輯中做出策略選擇,例如為特定環境添加合適植物。
此外,它還能自動添加SynthID可見/看不見水印保障來源透明,特別適合廣告與日常創作。與Photoshop對比,它仍欠缺在精確裁切、文字排版、解析度提升與精細圖層控制上的靈活性,因此更適合用於快速創作與營銷素材,而不是取代專業後製工作。
與ChatGPT-5相比,兩者則呈現出不同的側重。Nano Banana強調現實感與精準度,適合專業與商業應用;ChatGPT-5則偏重創意與藝術風格。儘管Gemini技術強大,其用戶規模仍落後於ChatGPT。ChatGPT每週用戶達7億,Gemini月度用戶僅4.5億,Google在擴展市場份額上仍面臨挑戰。
反壟斷案勝訴與展望
在發布AI編輯模型Nano Banana的同時,Google在另一場重要戰役中也迎來了重大勝利。美國法院裁定Google在反壟斷案中無需強制拆分其Chrome瀏覽器,駁回了司法部要求剝離Chrome或Android的提案。法官AmitP.Mehta在判決中指出,沒有足夠的證據顯示Google存在壟斷利益濫用行為,同時也注意到AI工具正為市場帶來新的競爭格局,因此採取了較為溫和的判決方案。
這項判決為Google帶來重大利好,Alphabet股價盤後大漲逾6%。擺脫拆分威脅後,Google將能更自由地將Gemini、Nano Banana等AI技術深度整合至其生態系統,未來可透過Chrome、搜索等產品推廣Nano Banana,提供更無縫的AI體驗,同時也促進整個AI產業良性競爭與創新。
Text by BusinessFocus Editorial
免責聲明:本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力自行作出投資決定,如因相關言論招致損失,概與本公司無涉。投資涉及風險,證券價格可升可跌。