陳寳

DeepSeek满血微调秘籍开源了

2025年2月19日16时作者陳寳

DeepSeek-R1开源满血版工具链，Colossal-AI团队将6710亿参数的大模型驯化为开发者私有化模型，降低硬件需求和成本，标志着AI竞争正式进入’场景深水区’。

2025年2月18日23时作者陳寳

老马旗下xAI公司发布Grok 3及Deepsearch，强调逻辑推理能力和多模态处理能力。文章指出AI竞赛已从参数规模转向推理能力，并分析了Grok 3的优势和潜在风险。

2025年2月17日16时作者陳寳

DeepSeek与OmniParser V2.0结合，使得大模型能直接操控计算机系统完成复杂任务，引发人机交互范式迁移和智能体进化。

2025年2月16日8时作者陳寳

”
》推文，里面提到了给内容创作提供了新的思路和方向。
刚刚，微信开始内测接入DeepSeek-R1

2025年2月14日12时作者陳寳

DeepSeek-R1 模型在解决业务问题时有时会遇到问题的连贯性和隔天再问情况。谷歌 Gemini 2.0 推出‘全局记忆’功能，通过构建用户专属的记忆图谱，实现对话历史记录和调用，改变人机交互范式。但这项技术升级也引发数据伦理的深水区。

2025年2月12日23时作者陳寳

字节跳动豆包团队提出UltraMem架构，通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈，推理成本降幅最高83%，速度提升6倍，入选ICLR 2025。

2025年2月10日23时作者陳寳

字节跳动开源VideoWorld视频生成模型，无需语言模型即可学习时空动态规律，降低技术门槛，具有广泛应用前景。但存在抽象概念建模困难、算力需求高等挑战。

2025年2月8日12时作者陳寳

谷歌DeepMind AlphaGeometry系列通过神经符号混合架构解决国际数学奥林匹克几何问题，显著提升解题效率和成功率。但其仍受限于预设规则和复杂推理能力不足等问题。

2025年2月7日16时作者陳寳

DeepSeek作为新一代认知智能平台，通过信息处理范式转移、决策支持系统的智能跃迁和人机协同的新型工作模式重构了知识工作的逻辑框架，显著提升了效率。

2025年2月5日23时作者陳寳

春节前夕发布的大语言模型R1给市场带来了全新活力，重塑了光通信产业。DeepSeek低成本AI模型大幅降低了成本壁垒，使得光通信成为AI数据传输的最佳选择，并推动了其在智慧城市、智能制造等领域的应用拓展。