量子位
Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666
微信正式接入DeepSeek-R1,并支持满血版AI搜索。用户可通过微信搜索获取答案,生成结果带有社交属性可分享给朋友或朋友圈。此次接入不仅满足了用户的即时需求,还展示了微信与大模型R1的深度融合。
DeepSeek官方推荐:R1要这样设置
DeepSeek官方推荐部署DeepSeek-R1的四项内容:不使用系统提示词,把Temperature设置为0.6,提供缓解模型绕过思维的指南,并引入新的官方提示搜索和文件上传功能。
腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
腾讯元宝接入DeepSeek-R1满血版,并支持联网搜索。它现在可以自由选择使用混元模型或DeepSeek-R1,覆盖微信公众号等腾讯生态信息源,提升了用户交互体验和知识准确性。
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
Meta GenAI团队提出的新框架VideoJAM显著提升了视频生成中的运动一致性,其效果超越了Sora等模型。VideoJAM能够处理复杂且迅速的动作,并与现有DiT模型无缝集成,提升运动质量达19.67%至4.88%。
多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源
Align-DS-V团队投稿
量子位 | 公众号 QbitAI
如果把DeepSeek-R1震撼硅谷
宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源
英伟达、卡内基梅隆大学团队通过ASAP方法解决了机器人敏捷动作训练难题,实现了宇树人形机器人的高难度动作表现。该框架分为预训练运动跟踪策略和差异动作模型两阶段,显著提高了机器人的灵活性和全身协调性。
OpenAI紧急加播:ChatGPT上新深度搜索,刷榜“人类最后的考试”!
OpenAI发布Deep Research功能,利用强化学习和深度搜索技术为用户提供复杂研究任务辅助。该功能在金融、科学及工程等领域具有强大能力,支持用户上传文件并生成多页研究报告。OpenAI表示Deep Research旨在促进AGI的科研探索,并强调其在特定领域的详细信息处理优势及局限性。
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?
英伟达新硬件优化论文《DeepSeek-V3》绕过CUDA直接使用PTX编程语言进行优化,大幅提升硬件效率。专家指出这不代表完全脱离CUDA生态,而是展示出优化其他GPU的能力,并引发了对AI是否能编写底层代码的讨论。