Llama 4开源空降!1000万超长上下文、单GPU可跑,还有近2万亿参数巨模型 上午11时 2025/04/06 作者 智东西 。 编译 | ZeR0 编辑 | 漠影 智东西4月6日报道,今日,Meta发布Llama 4系列首批
掌握线性状态空间:从零构建一个Mamba神经网络架构 上午8时 2025/04/02 作者 极市干货 开始构建 Mamba 的全部代码过程,作者将Mamba算法模型从理论转化为具体实践。这一探索过程不仅
用LLM做文本分类,微调选base还是chat 下午2时 2025/01/13 作者 Datawhale 作者:LeonYi 链接:https://www.zhihu.com/question/632473
北航&ZGCLAB提出XRAG:首个高级检索增强生成的基准测试 上午8时 2025/01/01 作者 PaperWeekly 首个全面的 RAG 的测评 Benchmark 与 Toolkit 终于来了,ZGCLAB 与北航提
AI 取代低技能工作?别慌,这些领域仍是人类主场|独家对话 OpenAI 前研究员和中关村科金总裁 上午8时 2024/12/12 作者 AI前线 作者|冬梅 采访嘉宾|喻友平,中关村科金总裁;Kenneth Stanley,OpenAI 前杰出研