关注我,记得标星⭐️不迷路哦~
✨ 1: OpenManus
OpenManus是由MetaGPT贡献者构建的无需邀请码的代理,让你自由实现各种想法。
OpenManus 是一个由 MetaGPT 团队成员在短短 3 小时内构建的工具,旨在让用户无需邀请码即可自由地实现各种创意。它是一个简单易用的实现,鼓励用户提供建议、贡献和反馈。
地址:https://github.com/mannaandpoem/OpenManus
✨ 2: HunyuanVideo-I2V
HunyuanVideo-I2V是腾讯开源的图像到视频生成框架,加速社区对图像转视频的探索研究。
HunyuanVideo-I2V 是腾讯 Hunyuan 团队开源的一个图像到视频生成框架,它建立在 HunyuanVideo 的基础上,通过图像潜在空间连接技术,将参考图像信息融入到视频生成过程中。
关键特性:
- 图像到视频生成:
将静态图像转换为动态视频。 - 高质量视频:
支持高达 720p 的分辨率和最长 5 秒的视频长度。 - LoRA 可定制特效训练:
提供 LoRA (Low-Rank Adaptation) 训练代码,用于创建自定义的视频特效,例如头发快速生长、拥抱等。 - 结合图像和文本信息:
利用预训练的多模态大型语言模型(MLLM)作为文本编码器,增强模型对输入图像语义内容的理解,并将图像和相关文本描述的信息融合。 - 简明的提示词:
通过简洁的提示词有效引导视频生成过程,提示词应包含主体、动作和背景等关键元素。
地址:https://github.com/Tencent/HunyuanVideo-I2V
✨ 3: Light-R1
Light-R1-32B通过课程学习超越R1-Distill,仅用约1000美元训练成本,在数学问题上表现出色。

Light-R1-32B 是一个基于 Qwen2.5-32B-Instruct 模型,经过特别训练,专门解决数学问题的语言模型。 它的主要特点和亮点包括:
- 卓越的数学解题能力:
在 AIME24 和 AIME25 等数学竞赛中取得了比 DeepSeek-R1-Distill-Qwen-32B 更好的成绩,尤其是在从零开始(即使用没有长链思维能力的模型)训练的情况下。 - 低成本和可复现性:
训练成本低廉,仅需约 1000 美元,并且公开了所有训练数据、代码和训练流程,便于复现和进一步研究。 - 课程学习 SFT 和 DPO:
采用了课程学习的方式,通过监督微调(SFT)和直接偏好优化(DPO)逐步提升模型性能。 -
**着重思维链:**训练过程中强化模型的思考能力,通过在提示词中强制加入 <think>
提示词,来鼓励模型产生推理过程。 - 数据清洗:
对训练数据进行了彻底的清洗,以避免数据污染影响评测的公正性。
地址:https://github.com/Qihoo360/Light-R1
✨ 4: Audio-Reasoner
Audio-Reasoner是一个大型音频语言模型,通过CoT推理,在MMAU和AIR-Bench-Chat上表现出色。
Audio-Reasoner是一个大型音频语言模型,实现了音频任务中的深层推理和推断扩展。它基于Qwen2-Audio-Instruct构建,采用结构化的链式思维(CoT)训练。Audio-Reasoner在MMAU-mini和AIR-Bench-Chat等基准测试中取得了最佳结果。该模型使用CoTA数据集进行训练,该数据集包含120万个高质量的描述和问答对,用于结构化推理和增强预训练。Audio-Reasoner可以理解各种类型的音频,包括声音、音乐和语音。它的预训练模型和数据集在多个基准测试中取得了最佳结果。
地址:https://github.com/xzf-thu/Audio-Reasoner
✨ 5: SolGraph
SolGraph是Solana首个AI工作流协议,利用链上基础设施实现快速、透明且可验证的AI应用。

SolGraph是构建在Solana区块链上的第一个AI工作流协议。 它允许开发者在链上组合、执行和验证AI驱动的工作流,具有极高的速度和透明度。SolGraph结合了LangGraph的动态AI工作流和Solana的高性能基础设施,为AI驱动的应用提供了一个开放、模块化和无需信任的执行层。
地址:https://github.com/SolGraphDev/SolGraph
(文:每日AI新工具)