80亿参数归档

ContentV：字节跳动开源的高效文生视频模型框架，助力AI视频生成技术突破

2025年6月18日14时作者小兵的AI视界

字节跳动开源的ContentV项目通过高效训练策略和极简架构实现了高质量视频生成。支持文本到视频生成、自定义参数、风格迁移等多功能，并已上线多个应用场景。

智能手机屏幕截图作为输入，能够自主执行用户指定的任务AgentCPM-GUI，简易的代理框架Minion Agent

2025年5月14日11时作者每日AI新工具

AgentCPM-GUI 是由 THUNLP 和 ModelBest 联合开发的 GUI 智能体模型；Node.js Sandbox MCP Server 用于在 Docker 容器中运行 JavaScript 代码并动态安装 npm 依赖项；Scrapling 是高性能 Python 网页抓取库，具备自适应爬取和智能元素追踪功能；Minion Agent 支持浏览器操作、MCP 和自动工具注入等功能；Matrix-Game 是一个交互式世界基础模型，拥有170亿参数，能够生成高质量的游戏世界。

阿里 MinMo 登场，多模态语音交互 “内卷” 升级！

2025年2月22日14时作者小兵的AI视界

阿里通义实验室推出的MinMo多模态大型语言模型在语音交互领域表现卓越，能够实现无缝语音交互，支持多种任务处理和多样化可控生成。其主要功能包括全双工语音交互、多样化可控生成以及多任务处理能力。应用场景涵盖智能客服、语音助理、人机对话系统及语音翻译等场景。

大型语言扩散模型

2025年2月19日8时作者 NLP工程化

LLaDA 将扩散模型应用于大规模语言建模，提出了一种新方法解决传统语言模型无法逆向生成内容的问题，并在多个任务上表现出色。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30