跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

生成能力

首款设计Agent被挑战,Manus、Lovart 像素级对比

下午2时 2025/05/18 作者 卡尔的AI沃茨

通过比较通用 Agent Manus 和垂直场景 Agent Lovart 的经典案例,分析了他们在图像融合、品牌视觉设计和原图风格化任务中的表现差异。

分类 分享 标签 Lovart、 Manus、 图像处理、 屏幕使用时间、 生成能力、 设计系统化 发表评论

CVPR 2025 Zero-shot能力拉满!随机顺序自回归解锁视觉领域的“GPT时刻”

下午4时 2025/04/21 作者 PaperWeekly

统江湖,但是
视觉领域还没有范式让大家的 “Scaling Law” 可以跨越更多任务、更多应用
。

分类 大模型、 学术 标签 Visual AR、 判别能力、 动作能力、 智能家居控制、 生成能力、 通用Transformer 发表评论

首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距

下午4时 2025/04/09 作者 量子位

LMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生

分类 资讯 标签 Gemini2.0-flash-exp、 U-MLs、 复杂视觉链式推理、 理解能力、 生成能力、 视频生成 发表评论

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

下午11时 2025/03/19 作者 极市干货

沿研究中一窥复制 Manus 的启示。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
Man

分类 学术 标签 Qwen、 Trunk Attention、 上下文长度扩展、 林俊旸、 生成能力、 通义千问 发表评论

100镜实测Gemini2.0″用嘴改图”新功能,AI生图的天被捅破了(附五档难度、12个真实案例)

下午2时 2025/03/14 作者 卡尔的AI沃茨

修改提示语、每张图生成时间不超过10s,
你肯定以为我是吹牛,
但现在
Gemini 2.0 Fla

分类 分享 标签 Gemini 2.0、 多功能性、 多模态能力、 生图模型、 生成能力、 简单易用 发表评论

Ilya Sutskever 在 NeurIPS 2024 的演讲:预训练时代已经结束了

上午8时 2024/12/17 作者 AI前线

作者 | Ilya Sutskever
译者 | 王强
策划 | Tina
上周五的人工智能顶级会议

分类 资讯 标签 人工智能、 分布外泛化、 大模型、 生成能力、 自我意识、 语言模型 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 盲测击败了ElevenLabs的一款TTS:Chatterbox
  • K8S集群化部署RAGFlow文档
  • DeepSeek 发布DeepSeek R1-0528
  • DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
  • WebDancer:迈向自主信息寻求的智能体

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×