FLUX“官方版ControlNet”来了!景深轮廓更精准控制,共四款官方工具一齐上线
FLUX更新四款创意工具,包括fill、Canny、Depth和Redux。这些工具能够修改细节、扩展画面、控制景深,并让人物动作变化。开发者通过ComfyUI整合进绘图工作流。FLUX的官方和第三方工具在编辑任务中表现出色,优于Ideogram和SD 1.5。
王炸!谁能想到年底杀出的黑马是美图啊
美图展示了其在视频生成、文生图、表情制作、图像编辑等方面的最新能力,包括惊艳的视觉效果和丰富的功能选项。这些技术不仅提升了用户体验,也为电商等场景提供了解决方案。
国产大模型黑马的首个推理模型来了,和 o1 PK后,我发现了AI深度思考的大问题
DeepSeek 推出 R1-Lite 推理模型预览版本,并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型,同时讨论了思维链的利与弊及其在实际应用中的挑战。
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
新智元报道
编辑:LRS
【新智元导读】
Meta最近开源了一个7B尺寸的Spirit LM的多模态
如今的智能体,已经像人一样「浏览」视频了,国内就有
英伟达的NVIDIA AI Blueprint和OmAgent项目展示了AI技术如何帮助用户更好地理解和分析视频内容,OmAgent提供了原生多模态智能体框架,支持设备开发和使用。