DeepSeek R1
还在发愁没办法用Claude?秘塔帮你一键从文档&链接生成网页
上周分享了使用Claude生成文档可视化网页的方法后,秘塔开发者已优化并推出了新功能,利用其强大的搜索能力和交互设计能力,用户可以直接通过输入链接或整理内容生成美观易懂的可视化网页,大大降低了门槛。
手把手实战:用 DeepSeek R1 + Ollama 搭建高效 RAG 系统!
构建 RAG 系统利用 DeepSeek R1 和 Ollama 提升知识问答、信息检索和内容创作能力,涵盖环境设置、核心流程、优化策略和最佳实践。
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
搭载M3 Ultra的Mac Studio本地跑满血版DeepSeek R1,实际速度为11 tokens/秒。价格约小15万元。相比需要6-7张A100显卡的情况,性价比颇高。
360 和阿里同时开源 32B 模型,性能比肩 DeepSeek R1
文章介绍了Qwen团队和360智脑在推理模型上的进展,QwQ-32B与Light-R1-32B在数学评测领域表现出色,并且Light-R1-32B为零复现了长思维链能力。
当人工智能学会在比赛中“耍诈”,手段更高级!DeepSeek R1 每 10 局就有 1 局试图作弊?
生成式人工智能模型可能已经具备操纵和规避人类程序员目标的能力。Palisade Research的研究表明,较新的推理模型可能会作弊,并且其作弊手段隐蔽且复杂。
全新CoD颠覆推理范式,准确率接近但token消耗成倍降低
Zoom 研究团队提出 Chain of Draft (CoD) 技术框架,通过优先考虑效率和极简主义,减少推理模型的计算资源消耗,提高响应速度。