🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
Gemini 2.0 Flash Experimental 模型火了。但今天不只聊这个。
它能生成图片,还能写文案,而且风格、角色、环境都挺统一。
比如,我让它“从 0 到 1 创建一个黑暗奇幻风原创 IP‘堕落术士’”,要求每一步都出图。 看,它就按步骤来:
接着 3D 建模,低模到高模,再到高级渲染,还是每步出图;
最后,所有阶段合成 IP 海报,角色、背景、IP 标识、特效,搞定。

Gemini 2.0 Flash Experimental 这模型,只能在 Google AI Studio 上用:https://aistudio.google.com/ 。这平台挺特别的,下面说说。
Gemini 很好,但热度不够。
Gemini 其实挺好用的,就是不火。我现在用 Gemini 可能比 ChatGPT 还多。
我喜欢跟模型聊很久,这样它更懂我。
我通常会为了一个场景的任务耗费许多时间和模型对话,迭代出一个比较好的上下文后,它才能更有效率的帮我解决问题。
ChatGPT 有时候会限制次数,不爽。Gemini 呢,个人用完全够,网页端、API 都行。
1、平时我主要用这两个模模型:一个通用2.0 Pro,一个专门用来思考的2.0 Flash Thinking。都是谷歌的旗舰模型。
我一般用来内容创作、辅助思考、多模态内容处理。这些模型基准水平高,速度快,还没限制。
谷歌三款新模型齐发,Gemini-2.0-Pro免费、跑分超o1登顶第一,适合编码、处理复杂提示。
2、有两个键很重要:”Save” 用来保存对话。是的,这就是你对话丢失的原因,只需要点一次就行;我估计谷歌也是想让你整个聊天对话框保持清洁,因为有些对话我们默认就是只想聊天一次的,但是有些是比较重要的。
点击Compare,比如在内容创作场景中,对于同一段内容的优化,我们可以参考两个模型。比如我们的主窗口选择2.0 pro后再点击Compare并选择2.0 think:
不过需要注意的点是:点击叉叉之后右边被比较的模型会丢失所有上下文。以至于下次我们再点击Compare,右边的这个模型会和左边保持一致,且上下文都是左边的样子。
此外,我们在https://chat.qwen.ai/ 中仍然可以找到相同的功能。它可以添加很多模型进行对话比较。
Google AI Studio 对话特灵活。你自己的提问、模型的回答,都能删,而且只影响当前对话。意思就是,你可以在一轮对话里,随便删掉中间的某个问题和回答,但后面的对话内容不会被删除。
这样就能很方便地调整上下文,在开始新对话前,把之前的上下文整理好。 上下文控制最自由了。
更绝的是,它还有分支对话功能。 你看图,点右边那个框框里的分支按钮点两下,左边就能分出两个新的聊天窗口。
不得不说,谷歌的这个对话设计是真牛,太灵活了。 很多其他 AI 厂家的产品,真没这么方便。
而且 Google 的模型,还有让我印象深刻的就是它的多模态能力。 图片、视频、音频,它都能理解,也能生成。 还有实时对话啥的,都很强。
再聊Gemini 2.0 Flash Experimental
最新的这个模型可以同时输出图像和文本。在许多需要连续性图像任务中有大用。注意需要切换到这个模型。并且这样选择:
此外,它还可以修改图片:动漫人物表情改为愤怒:
模型生成的图片还可以和其他的ai视频工具结合。比如可灵。
连续性创建图片,最终汇成GIF:
再聊其他模型
除了Gemini模型,我日常还需要用Deep Research。
我会用到两个,一个是Grok、一个是Gemini官网:https://gemini.google.com/(注意不是Google AI Studio)
Gemini Deep Research原来是需要订阅才有的,现在免费了。而且刚刚还升级成思维模型作为基础模型进行深度研究。不过它每月会限制使用次数。
另外还有一个就是前面提到的Qwen chat了,多模态、推理、模型对比都有。
当然,还有一个,Deepseek。
以上。
🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
点这里👇关注我,记得标星哦~
(文:AI进修生)