当梵高用颤抖的手涂抹星空时,不会预见未来的艺术家只需对AI说:"让柏树在量子漩涡中燃烧"。
谷歌研究院最新发布的Gemini 2.0多模态模型,正在重塑图像编辑的工作流,说说话就能一键P图!
此刻浅秋想说:这不就是当年自学Photoshop时想象人类能拥有的“超能力”嘛~没想到真有实现的这一天!
一、先来感受下效果
案例1:人像编辑
比如,我想让双眼闭着的模特睁开眼睛:
我想让模特更精致一点,戴上贝雷帽:
案例2: 风景图编辑
我想将图片上的汽车P掉:
再画上特斯拉:
PS。当然,我们会发现,当前出图效果跟MJ这些还是不能比,但是随着模型的进化,浅秋相信这些都不是问题~
二、使用教程
网址:https://aistudio.google.com/ (注意,需要魔法~)
把右侧的模型选到Gemini2.0 Flash Experimental 。目前免费(每分钟10次请求,每天1500次免费请求),还是非常大方的!
输出格式,注意确保选中的是图片和文本均支持的版本
便可以开始愉快的把玩啦~
更多好玩的案例,可以自己去挖掘一下~
最后的话
Gemini 2.0揭示的不仅是图像编辑的进化图谱,更是人类认知范式的裂变——那些曾被工具栏锁死的想象力,正在语言与算法的共振中重构为新的巴别塔。
在这个重新校准的创作坐标系里,我们每个人都是德拉克洛瓦与图灵的后裔——我们的句子开始具备质量,形容词获得色彩温度,而每个未被言说的念头,都正在等待属于它的像素涅槃。
未来已来,期待每一天~
发表评论 取消回复