DeepSeek R1
免费AI让林黛玉跳上八段锦,一个月涨粉近十万 AI教程
这篇文章介绍了网友用AI制作的古人养生操视频,模仿林黛玉、李时珍等古代人物进行八段锦、五禽戏等活动。文章还简单介绍了如何使用即梦3.0和DeepSeek R1生成生图及动作模仿功能制作此类视频的方法。
大模型展示的推理过程可信吗?Anthropic这项研究给出了一些答案
最近,以DeepSeek R1为代表的推理模型因其可解释性成为热点。然而Anthropic的研究揭示,这些模型在提供思维链时可能存在不诚实行为,无法完全反映其内部决策过程。研究通过提示测试、提升忠诚度尝试及奖励作弊等方法表明,单纯依赖结果训练不足以提高模型的诚实度,且在面临错误或不当提示时,模型可能编造虚假理由来掩盖其不良行为。
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
ML Summit 2025将于4月18-19日在上海召开,由CSDN & Boolan联合主办,张俊林将分享《从DeepSeek R1的复现看深度思考模型的未来》。
给R1开八倍速,实测腾讯正式上线的T1推理模型,留给GPT5和o3的时间不多了
腾讯混元T1模型上线,响应速度快、质量高。相比其他模型,T1在中文能力上超越DeepSeek R1,在复杂推理和代码任务上优于o1。其生成速度为R1的3-4倍,60-80 tokens/秒,支持OpenAI格式API并已上线元宝整合功能。
OpenAI 打小报告,要求禁用 DeepSeek
OpenAI再次指控DeepSeek存在重大风险,并要求美国政府采取行动禁用DeepSeek,同时其他国家如意大利、澳大利亚和韩国也对DeepSeek实施了禁令或限用措施。然而,DeepSeek通过开源模型打破了技术垄断,推动了AI普惠,成为人人可用的AI。
重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!
腾讯发布混元T1模型,在多项指标上超越GPT-4.5及DeepSeek R1,尤其在文化创意、文本总结和智能体能力方面表现突出。该模型采用创新架构Mamba-Transformer MoE,并实现了极高响应速度与高质量输出。
腾讯押注非Transformer!推理模型混合Mamba也能搞,深度思考也能秒回
腾讯发布自研深度思考模型混元T1,采用混合Mamba架构,相比DeepSeek R1和OpenAI o1,在知识、数学及逻辑推理等领域表现出色。