跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

零样本

英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化

2025年5月21日23时 作者 量子位

英伟达的DreamGen项目通过梦境学习技术,仅凭少量现实视频数据就能让机器人学会执行多种新任务。该技术利用AI视频世界模型生成神经轨迹,显著提升了复杂任务的成功率,并首次实现了从0开始的泛化能力。

分类 资讯 标签 45.5%、 复杂任务、 梦 genie、 梦境学习、 英伟达、 零样本 发表评论

MiniMax推出高质量文本转语音模型MiniMax-Speech

2025年5月17日8时 作者 NLP工程化

MiniMax发布的新模型MiniMax-Speech通过可学习的说话人编码器和Flow-VAE架构提高了文本转语音的质量与保真度,在零样本情况下实现了跨语言合成,多项测试中表现优异。

分类 开源 标签 MiniMax-Speech、 变分自编码器、 多语言合成、 文本转语音、 说话人相似度、 零样本 发表评论

Gemini 2.5实现视频理解重大突破:一口气处理6小时视频,任意视频秒变互动网页

2025年5月10日11时 作者 AI寒武纪

谷歌Gemini 2.5 Pro视频理解能力提升,可在6小时内处理长达6小时视频,并实现视频到应用的转化、精准片段检索及强大的时序推理等新功能。

分类 国际、 资讯 标签 Gemini 2.5、 低媒体分辨率、 学术基准测试、 少样本训练、 零样本、 音视频信息 发表评论

OpenAI 发布企业运用 AI 大模型的 7大场景

2025年4月25日14时 作者 AI先锋官

1 和 o3-mini)和GPT 模型(如 GPT-4o)
。
那开发者面对这两种类型的模型该如何选

分类 资讯 标签 分隔符、 开发者消息、 思维链提示、 推理模型、 零样本、 预算 发表评论

图像生成推理大模型,港中文北大等联手破解画质提升难题

2025年2月8日16时 作者 量子位

来自港中文、北大和上海AI Lab的研究团队将思维链(CoT)与生成模型结合,显著提高了自回归图像生成的质量,并提出了潜力评估奖励模型(PARM)及其增强版本(PARM++),进一步优化了图像生成质量。

分类 资讯 标签 CoT、 GenEval、 PARM++、 图像生成、 扩散模型、 零样本 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 看完雷军发布会,高盛上调小米、宁德时代目标价,预言“当下的AI眼镜就是2017年的TWS耳机”
  • 筹资290亿美元,Meta要联手PE巨头建AI数据中心
  • 首次使用“非英伟达”芯片!OpenAI租用谷歌TPU,降低推理计算成本
  • MindOmni:腾讯联合清华等机构推出的多模态大语言模型,推理生成能力卓越
  • 【博客转载】CUDA Reduction

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×