OpenManus开源复刻Manus，腾讯开源的图像到视频生成框架，大型音频语言CoT推理模型

关注我，记得标星⭐️不迷路哦～

✨ 1: OpenManus

OpenManus是由MetaGPT贡献者构建的无需邀请码的代理，让你自由实现各种想法。

OpenManus 是一个由 MetaGPT 团队成员在短短 3 小时内构建的工具，旨在让用户无需邀请码即可自由地实现各种创意。它是一个简单易用的实现，鼓励用户提供建议、贡献和反馈。

地址：https://github.com/mannaandpoem/OpenManus

✨ 2: HunyuanVideo-I2V

HunyuanVideo-I2V是腾讯开源的图像到视频生成框架，加速社区对图像转视频的探索研究。

HunyuanVideo-I2V 是腾讯 Hunyuan 团队开源的一个图像到视频生成框架，它建立在 HunyuanVideo 的基础上，通过图像潜在空间连接技术，将参考图像信息融入到视频生成过程中。

关键特性:

图像到视频生成:

将静态图像转换为动态视频。
高质量视频:

支持高达 720p 的分辨率和最长 5 秒的视频长度。
LoRA 可定制特效训练:

提供 LoRA (Low-Rank Adaptation) 训练代码，用于创建自定义的视频特效，例如头发快速生长、拥抱等。
结合图像和文本信息:

利用预训练的多模态大型语言模型（MLLM）作为文本编码器，增强模型对输入图像语义内容的理解，并将图像和相关文本描述的信息融合。
简明的提示词:

通过简洁的提示词有效引导视频生成过程，提示词应包含主体、动作和背景等关键元素。

地址：https://github.com/Tencent/HunyuanVideo-I2V

✨ 3: Light-R1

Light-R1-32B通过课程学习超越R1-Distill，仅用约1000美元训练成本，在数学问题上表现出色。

Light-R1-32B 是一个基于 Qwen2.5-32B-Instruct 模型，经过特别训练，专门解决数学问题的语言模型。它的主要特点和亮点包括：

卓越的数学解题能力:

在 AIME24 和 AIME25 等数学竞赛中取得了比 DeepSeek-R1-Distill-Qwen-32B 更好的成绩，尤其是在从零开始（即使用没有长链思维能力的模型）训练的情况下。
低成本和可复现性:

训练成本低廉，仅需约 1000 美元，并且公开了所有训练数据、代码和训练流程，便于复现和进一步研究。
课程学习 SFT 和 DPO:

采用了课程学习的方式，通过监督微调（SFT）和直接偏好优化（DPO）逐步提升模型性能。
**着重思维链：**训练过程中强化模型的思考能力，通过在提示词中强制加入 <think> 提示词，来鼓励模型产生推理过程。
数据清洗:

对训练数据进行了彻底的清洗，以避免数据污染影响评测的公正性。

地址：https://github.com/Qihoo360/Light-R1

✨ 4: Audio-Reasoner

Audio-Reasoner是一个大型音频语言模型，通过CoT推理，在MMAU和AIR-Bench-Chat上表现出色。

Audio-Reasoner是一个大型音频语言模型，实现了音频任务中的深层推理和推断扩展。它基于Qwen2-Audio-Instruct构建，采用结构化的链式思维(CoT)训练。Audio-Reasoner在MMAU-mini和AIR-Bench-Chat等基准测试中取得了最佳结果。该模型使用CoTA数据集进行训练，该数据集包含120万个高质量的描述和问答对，用于结构化推理和增强预训练。Audio-Reasoner可以理解各种类型的音频，包括声音、音乐和语音。它的预训练模型和数据集在多个基准测试中取得了最佳结果。

地址：https://github.com/xzf-thu/Audio-Reasoner

✨ 5: SolGraph

SolGraph是Solana首个AI工作流协议，利用链上基础设施实现快速、透明且可验证的AI应用。

SolGraph是构建在Solana区块链上的第一个AI工作流协议。它允许开发者在链上组合、执行和验证AI驱动的工作流，具有极高的速度和透明度。SolGraph结合了LangGraph的动态AI工作流和Solana的高性能基础设施，为AI驱动的应用提供了一个开放、模块化和无需信任的执行层。

地址：https://github.com/SolGraphDev/SolGraph

（文：每日AI新工具）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

✨ 1: OpenManus

✨ 2: HunyuanVideo-I2V

✨ 3: Light-R1

✨ 4: Audio-Reasoner

✨ 5: SolGraph

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复