关注我,记得标星⭐️不迷路哦~
✨ 1: MiniMax-M1
MiniMax-M1:首个开源混合注意力推理大模型

MiniMax-M1是一个大型混合注意力推理模型,它具有以下主要功能和特点:
-
混合专家模型(MoE):该模型采用混合专家模型架构,该架构结合了闪电注意力机制。总共有4560亿个参数,每个token激活459亿个参数。
-
超长上下文:原生支持100万token的上下文长度,是DeepSeek R1的8倍。
-
高效计算:由于采用了闪电注意力机制,MiniMax-M1在测试时能够有效地扩展计算能力,例如,在生成10万个token时,其FLOPs消耗量仅为DeepSeek R1的25%。
-
强化学习训练:使用大规模强化学习(RL)进行训练,涉及数学推理到基于沙盒的真实世界软件工程环境等多种问题。
-
CISPO算法:采用了名为CISPO的新型算法,该算法裁剪重要性抽样权重而非token更新,优于其他竞争性RL变体。
-
模型变体:提供MiniMax-M1模型的两个版本,分别具有40K和80K的思考预算。
-
优越性能:在标准基准测试中,该模型优于其他强大的开放权重模型,尤其是在复杂的软件工程、工具使用和长上下文任务方面。
-
支持Function Calling:该模型支持函数调用功能,可以识别何时需要调用外部函数,并以结构化格式输出函数调用参数。
-
在线服务和API:提供具有在线搜索能力的Chatbot以及面向开发者的在线API。
地址:https://github.com/MiniMax-AI/MiniMax-M1
✨ 2: Kimi-Dev-72B
Kimi-Dev-72B:用于问题解决的开源编码LLM

Kimi-Dev-72B 是一个用于软件工程任务的开源代码 LLM,主要用于问题解决,并在 SWE-bench Verified 上实现了最先进的性能。它通过大规模强化学习进行优化,能够自主修复 Docker 中的真实仓库,并在整个测试套件通过时获得奖励,从而确保正确且稳健的解决方案。该项目可以在 Hugging Face 和 GitHub 上下载和部署,并提供用于代码修复和测试编写任务的简化两阶段框架,包括文件定位和代码编辑。
地址:https://github.com/MoonshotAI/Kimi-Dev
✨ 3: Zibly
LLM应用分析利器:Zibly,提升你的LLM表现

Zibly 是一个旨在提升大型语言模型 (LLM) 应用分析的工具,它通过精确的测量、智能的测试数据生成以及从数据中提取的洞察,帮助用户评估和优化 LLM 应用。Zibly 主要功能包括精确评估(结合 LLM 驱动和经典指标)、智能测试数据生成(覆盖各种用例)、流畅的兼容性(与 LangChain 等框架和主流可观测性解决方案集成),以及通过生产数据创建循环以持续改进 LLM 应用。
地址:https://github.com/zibly-foundation/zibly
✨ 4: GHOSTCREW
AI渗透测试助手:GHOSTCREW

GHOSTCREW是一个基于大型语言模型和MCP/RAG架构的AI红队助手,旨在通过自然语言交互帮助用户执行渗透测试任务、查询安全信息和分析网络流量。
- 自然语言交互
:允许用户使用自然语言提问和指示AI助手。 - MCP服务器集成
:通过 mcp.json
配置文件灵活集成和管理多个MCP服务器,以扩展助手的功能。 - 工具管理
:通过交互式菜单配置、连接和管理MCP工具,并可清除所有配置。 - 工具调用
:AI助手可以根据用户请求调用配置的MCP服务器提供的工具(如:nmap、metasploit、ffuf等)。 - 智能代理模式
:通过智能渗透测试任务树(PTT)进行战略决策和动态目标实现,从而实现自主渗透测试。 - 预定义工作流程
:执行预定义的渗透测试工作流程,系统地使用配置的安全工具来执行全面的评估。 - 报告生成
:生成包含结构化发现、证据和建议的Markdown报告。 - 对话历史
:支持多轮对话,记住之前的交互内容。 - 流式输出
:AI响应可以进行流式传输,以获得更好的用户体验。 - 知识库增强(可选)
:支持通过本地知识库RAG( knowledge
目录)增强AI响应。 - 文件感知工具集成
:AI识别并使用来自知识文件夹的实际文件(单词列表、有效负载、配置)与安全工具。 - 可配置模型
:支持配置不同的语言模型参数。
地址:https://github.com/GH05TCREW/ghostcrew
✨ 5: Roo Commander
Roo Commander: 智能工作流编排系统

Roo Commander 是一个流线型、智能的编排系统,旨在通过利用专门的 AI 模式来管理复杂的工作流程。它采用了“Manager + Squad”的架构模式,其中manager-data-product
作为初始旗舰实现,用于指导数据产品概念验证 (PoC) 的设计。该系统的目标是提供一个精简且适应性强的核心协调器,并通过专门的“Manager”模式实现模块化、特定于领域的工作流程管理。“Squad”模式在每个 Manager 下执行专注的、专家级的任务。Roo Commander 确保通过强大的会话管理系统(包含详细的日志和链接的工件)实现可追溯性和上下文保留,并使用 Markdown 驱动的任务管理 (MDTM) 来标准化任务委托和跟踪。该项目的愿景是创建一个强大而直观的系统,通过智能地协调由专业 AI 代理组成的团队来帮助用户实现复杂的目标。核心功能包括定义新的数据产品 PoC 的策略,集思广益 PoC 的想法和范围,开发详细的用户角色,设计模拟数据模式和描述样本数据,概念化 PoC 用户界面,并将所有发现整合到全面的数据产品 PoC 计划中。
地址:https://github.com/jezweb/roo-commander
(文:每日AI新工具)