关注我,记得标星⭐️不迷路哦~
✨ 1: qwq-max-preview
QwQ-Max-Preview是Qwen系列的新进展,专注于深层推理和多领域问题解决,未来将开源。

QwQ-Max-Preview是Qwen系列最新进展,旨在推动深度推理和多领域问题解决的边界。该模型基于强大的Qwen2.5-Max构建,专注于数学、编程和一般领域任务,同时在代理相关工作流程中表现出色。作为即将发布的QwQ-Max的预览版本,QwQ-Max-Preview展示了其增强能力,未来还会进行持续优化,并计划在Apache 2.0许可下正式开源QwQ-Max和Qwen2.5-Max。
目前在qwen中,可以使用
地址:https://chat.qwen.ai/
✨ 2: FlashMLA
FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。

DeepSeek 团队开源了 FlashMLA,这是一个专为 NVIDIA Hopper 架构 GPU 优化的高效 MLA(多头潜在注意力)解码内核. FlashMLA 旨在提升大语言模型在 GPU 上的运行速度和效率,尤其是在处理可变长度序列的服务场景中.
FlashMLA 是一个多头潜在注意力(MLA)解码内核,专为处理可变长度序列而设计。它通过低秩分解压缩 KV 缓存和分页内存管理,从而显著降低显存占用并提升计算效率。
FlashMLA 的核心是 MLA(多头潜在注意力机制)。与传统 MHA(多头注意力机制)为每个注意力头分配独立的键(Key)和值(Value)不同,MLA 通过引入低维潜在向量,将所有头共享的键和值压缩到一个低维空间,仅保留关键信息,从而大幅减少内存占用。
FlashMLA 虽然仅适配 Hopper 架构,国产 GPU 兼容性待验证,且可能引发技术竞争,但其开源策略和长序列处理能力,有望推动 AGI 技术的突破。
地址:https://github.com/deepseek-ai/FlashMLA
✨ 3: Claude Code
Claude Code 是一个终端编码工具,通过自然语言命令帮助开发者更快地执行常规任务和处理代码。

Claude Code 是一个智能编码工具,旨在提升开发者的编码效率。它集成在终端中,能够理解代码库,并通过自然语言命令执行常规任务、解释复杂代码以及处理 Git 工作流。
主要功能包括:
-
编辑文件和修复代码库中的错误 -
解答关于代码架构和逻辑的问题 -
执行和修复测试、代码检查及其他命令 -
搜索 Git 历史记录、解决合并冲突,并创建提交和拉取请求(PR)
地址:https://github.com/anthropics/claude-code
✨ 4: EasyR1
EasyR1是一个高效、可扩展的多模态强化学习训练框架,支持各种语言和视觉模型。

EasyR1是一个高效、可扩展的多模态强化学习(RL)训练框架,旨在支持视觉语言模型(VLM)。它是原有项目veRL的一个干净的分支,利用了HybirdEngine设计和vLLM的最新SPMD模式,使其在性能上更具优势。
地址:https://github.com/hiyouga/EasyR1
✨ 5: GibberLink
GibberLink演示了两个对话式AI在发现彼此身份后,从英语切换到音频协议的互动过程。

GibberLink是一个演示项目,展示了两个会话人工智能(AI)代理在意识到彼此都是AI代理时,从人类语言切换到声波协议进行交流的过程。这个项目基于Georgi Gerganov的ggwave库,结合了ElevenLabs的会话AI技术。
地址:https://github.com/PennyroyalTea/gibberlink
(文:每日AI新工具)