当AI搜索速度X10,我的知识体系开始动摇了

文章介绍了秘塔在2025年的AI搜索速度提升至400 tokens/秒,并与Perplexity对比分析了其输出质量和信息来源多样性。作者尝试将秘塔作为主要的信息处理引擎,发现其能快速生成高质量回答和可视化网页,改变了传统的阅读习惯和信息处理逻辑。

HuggingFace上的热门开源模型,一半都来自中国了

HuggingFace热门榜单显示中国大模型超过50%。DeepSeekR1和Qwen等模型因性能、实用性和稳定性提升而受欢迎,Apache 2.0/MIT许可协议提供法律确定性。开发者更偏好开源深度更高的中国模型,如Qwen系列支持多种参数规格及全面数据集。中国大模型已在OpenAI的Llama3之上或在某些任务上超越,其在部署门槛和性能方面均表现优异。

再聊误区–Deepseek-R1思考过程在使用中的几个问题及对策

DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注,包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题,并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。

Deepseek R1及Deep research复现回顾及近期前沿进展速递

2025年02月16日,北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束,老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展,包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库,并展示了OpenThinker-32B在MATH500测试中的表现。研究发现,长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。