2025年2月3日23时

目前为止分析DeepSeek最全面的文章了

2025年2月3日23时作者 NLP工程化

DeepSeek-V2 采用 DeepSeekMoE 架构优化训练成本和推理效率，引入稀疏激活的专家网络。

2025年2月3日23时作者 NLP工程化

统计学是一门研究数据搜集、整理和分析的学科，并涉及编程实现相关算法。本书涵盖传统统计计算概念与算法，如误差分析、矩阵计算等，以及现代计算机技术在统计推断中的应用方法，如自助法、MCMC方法等。

2025年2月3日23时作者 NLP工程化

R1-V项目展示了DeepSeek RRP在视觉语言模型上的效果，仅需30分钟和不到3美元的训练成本，在100个步骤内超越了72B模型的OOD测试表现。

2025年2月3日23时作者 NLP工程化

Jina AI发布Node.js版DeepResearch实现，使用Gemini、Brave和Jina Reader进行搜索、阅读和推理。

2025年2月3日23时作者财联社AI daily

在ChatGPT问世后，高校师生几乎全部使用生成式AI进行学习和工作。复旦大学等多所高校已发布关于人工智能工具使用的规定，以确保其合理使用并避免学术不端行为。

2025年2月3日23时作者财联社AI daily

界面财联社旗下‘AI小财神’今日正式上线，提供A股实时行情、资讯研报解读等功能，并对语音输入进行全面升级，提升信息获取和分析效率。

2025年2月3日23时作者智东西

DeepSeek的写作能力为何飞跃？PTX是否真正做到了绕开CUDA的垄断？
编辑 |
ZeR0
智