3行代码做出自己的数字人,GitHub爆火的国产项目你用上了吗? 上午8时 2025/05/24 作者 开源星探 一秒视频,短短30秒即可克隆你的数字分身;无需编程基础,三行代码即可构建实时对话数字人。 硅基智能推
超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了! 上午11时 2025/05/16 作者 量子位 成天花板被重新定义了。 MiniMax最新发布 Speech-02 ,同时拿下 Artificial
刚刚!梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案 上午8时 2025/05/16 作者 AI寒武纪 》(Insights into DeepSeek-V3: Scaling Challenges an
LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论? 下午2时 2025/05/15 作者 Datawhale 图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子: 内容是关
「不思考」反而更强?上海AI Lab重新定义视觉强化学习微调最优路径 下午4时 2025/05/08 作者 PaperWeekly 且在一些模型上取得了优于监督微调(SFT)的成果。 RFT 利用可验证的奖励进行训练,鼓励模型在回答
开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录 上午11时 2025/05/08 作者 量子位 SOTA来了! 格灵深瞳、阿里ModelScope团队,以及通义实验室机器智能团队联合发布通用多模态
ICLR 2025 差分注意力机制爆火!DIFF Transformer击穿长文本建模天花板 下午4时 2025/04/30 作者 PaperWeekly 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
10秒生成官网,WeaveFox重塑前端研发生产力 蚂蚁徐达峰@中国AIGC产业峰会 上午11时 2025/04/30 作者 量子位 如今已非新鲜事。 不过,随着实践的深入,新的问题正在出现:AI生成代码需要大量翻修、安全生产难以保障
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25 下午4时 2025/04/23 作者 量子位 就能重建出一个完整、细节丰富且可自由交互的3D场景? 在传统方法中,这几乎是不可能完成的任务,稀少的
GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类 上午11时 2025/04/23 作者 量子位 拼好乐高吗? 你有没有想过这样的问题: 多模态大语言模型真的具备理解和推理空间结构的能力吗? 在多步