MiniMax开源首个混合注意力推理大模型，Kimi开源编码LLM

关注我，记得标星⭐️不迷路哦～

✨ 1: MiniMax-M1

MiniMax-M1：首个开源混合注意力推理大模型

MiniMax-M1是一个大型混合注意力推理模型，它具有以下主要功能和特点：

混合专家模型(MoE)：该模型采用混合专家模型架构，该架构结合了闪电注意力机制。总共有4560亿个参数，每个token激活459亿个参数。
超长上下文：原生支持100万token的上下文长度，是DeepSeek R1的8倍。
高效计算：由于采用了闪电注意力机制，MiniMax-M1在测试时能够有效地扩展计算能力，例如，在生成10万个token时，其FLOPs消耗量仅为DeepSeek R1的25%。
强化学习训练：使用大规模强化学习(RL)进行训练，涉及数学推理到基于沙盒的真实世界软件工程环境等多种问题。
CISPO算法：采用了名为CISPO的新型算法，该算法裁剪重要性抽样权重而非token更新，优于其他竞争性RL变体。
模型变体：提供MiniMax-M1模型的两个版本，分别具有40K和80K的思考预算。
优越性能：在标准基准测试中，该模型优于其他强大的开放权重模型，尤其是在复杂的软件工程、工具使用和长上下文任务方面。
支持Function Calling：该模型支持函数调用功能，可以识别何时需要调用外部函数，并以结构化格式输出函数调用参数。
在线服务和API：提供具有在线搜索能力的Chatbot以及面向开发者的在线API。

地址：https://github.com/MiniMax-AI/MiniMax-M1

✨ 2: Kimi-Dev-72B

Kimi-Dev-72B：用于问题解决的开源编码LLM

Kimi-Dev-72B 是一个用于软件工程任务的开源代码 LLM，主要用于问题解决，并在 SWE-bench Verified 上实现了最先进的性能。它通过大规模强化学习进行优化，能够自主修复 Docker 中的真实仓库，并在整个测试套件通过时获得奖励，从而确保正确且稳健的解决方案。该项目可以在 Hugging Face 和 GitHub 上下载和部署，并提供用于代码修复和测试编写任务的简化两阶段框架，包括文件定位和代码编辑。

地址：https://github.com/MoonshotAI/Kimi-Dev

✨ 3: Zibly

LLM应用分析利器：Zibly，提升你的LLM表现

Zibly 是一个旨在提升大型语言模型 (LLM) 应用分析的工具，它通过精确的测量、智能的测试数据生成以及从数据中提取的洞察，帮助用户评估和优化 LLM 应用。Zibly 主要功能包括精确评估（结合 LLM 驱动和经典指标）、智能测试数据生成（覆盖各种用例）、流畅的兼容性（与 LangChain 等框架和主流可观测性解决方案集成），以及通过生产数据创建循环以持续改进 LLM 应用。

地址：https://github.com/zibly-foundation/zibly

✨ 4: GHOSTCREW

AI渗透测试助手：GHOSTCREW

GHOSTCREW是一个基于大型语言模型和MCP/RAG架构的AI红队助手，旨在通过自然语言交互帮助用户执行渗透测试任务、查询安全信息和分析网络流量。

自然语言交互

：允许用户使用自然语言提问和指示AI助手。
MCP服务器集成

：通过mcp.json配置文件灵活集成和管理多个MCP服务器，以扩展助手的功能。
工具管理

：通过交互式菜单配置、连接和管理MCP工具，并可清除所有配置。
工具调用

：AI助手可以根据用户请求调用配置的MCP服务器提供的工具（如：nmap、metasploit、ffuf等）。
智能代理模式

：通过智能渗透测试任务树（PTT）进行战略决策和动态目标实现，从而实现自主渗透测试。
预定义工作流程

：执行预定义的渗透测试工作流程，系统地使用配置的安全工具来执行全面的评估。
报告生成

：生成包含结构化发现、证据和建议的Markdown报告。
对话历史

：支持多轮对话，记住之前的交互内容。
流式输出

：AI响应可以进行流式传输，以获得更好的用户体验。
知识库增强（可选）

：支持通过本地知识库RAG（knowledge目录）增强AI响应。
文件感知工具集成

：AI识别并使用来自知识文件夹的实际文件（单词列表、有效负载、配置）与安全工具。
可配置模型

：支持配置不同的语言模型参数。

地址：https://github.com/GH05TCREW/ghostcrew

✨ 5: Roo Commander

Roo Commander: 智能工作流编排系统

Roo Commander 是一个流线型、智能的编排系统，旨在通过利用专门的 AI 模式来管理复杂的工作流程。它采用了“Manager + Squad”的架构模式，其中manager-data-product作为初始旗舰实现，用于指导数据产品概念验证 (PoC) 的设计。该系统的目标是提供一个精简且适应性强的核心协调器，并通过专门的“Manager”模式实现模块化、特定于领域的工作流程管理。“Squad”模式在每个 Manager 下执行专注的、专家级的任务。Roo Commander 确保通过强大的会话管理系统（包含详细的日志和链接的工件）实现可追溯性和上下文保留，并使用 Markdown 驱动的任务管理 (MDTM) 来标准化任务委托和跟踪。该项目的愿景是创建一个强大而直观的系统，通过智能地协调由专业 AI 代理组成的团队来帮助用户实现复杂的目标。核心功能包括定义新的数据产品 PoC 的策略，集思广益 PoC 的想法和范围，开发详细的用户角色，设计模拟数据模式和描述样本数据，概念化 PoC 用户界面，并将所有发现整合到全面的数据产品 PoC 计划中。

地址：https://github.com/jezweb/roo-commander

（文：每日AI新工具）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

✨ 1: MiniMax-M1

✨ 2: Kimi-Dev-72B

✨ 3: Zibly

✨ 4: GHOSTCREW

✨ 5: Roo Commander

发表评论 取消回复

发表评论取消回复