DeepSeek R1
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
ML Summit 2025将于4月18-19日在上海召开,由CSDN & Boolan联合主办,张俊林将分享《从DeepSeek R1的复现看深度思考模型的未来》。
给R1开八倍速,实测腾讯正式上线的T1推理模型,留给GPT5和o3的时间不多了
腾讯混元T1模型上线,响应速度快、质量高。相比其他模型,T1在中文能力上超越DeepSeek R1,在复杂推理和代码任务上优于o1。其生成速度为R1的3-4倍,60-80 tokens/秒,支持OpenAI格式API并已上线元宝整合功能。
OpenAI 打小报告,要求禁用 DeepSeek
OpenAI再次指控DeepSeek存在重大风险,并要求美国政府采取行动禁用DeepSeek,同时其他国家如意大利、澳大利亚和韩国也对DeepSeek实施了禁令或限用措施。然而,DeepSeek通过开源模型打破了技术垄断,推动了AI普惠,成为人人可用的AI。
重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!
腾讯发布混元T1模型,在多项指标上超越GPT-4.5及DeepSeek R1,尤其在文化创意、文本总结和智能体能力方面表现突出。该模型采用创新架构Mamba-Transformer MoE,并实现了极高响应速度与高质量输出。
腾讯押注非Transformer!推理模型混合Mamba也能搞,深度思考也能秒回
腾讯发布自研深度思考模型混元T1,采用混合Mamba架构,相比DeepSeek R1和OpenAI o1,在知识、数学及逻辑推理等领域表现出色。
还在发愁没办法用Claude?秘塔帮你一键从文档&链接生成网页
上周分享了使用Claude生成文档可视化网页的方法后,秘塔开发者已优化并推出了新功能,利用其强大的搜索能力和交互设计能力,用户可以直接通过输入链接或整理内容生成美观易懂的可视化网页,大大降低了门槛。
手把手实战:用 DeepSeek R1 + Ollama 搭建高效 RAG 系统!
构建 RAG 系统利用 DeepSeek R1 和 Ollama 提升知识问答、信息检索和内容创作能力,涵盖环境设置、核心流程、优化策略和最佳实践。