Qwen2.5归档 - 每时AI

字节跳动发了个新模型：BAGEL-7B-MoT

上午8时 2025/05/22 作者 NLP工程化

这是一个混合专家多模态模型，基于Qwen2.5-7B-Instruct和siglip-so400m-14-980-flash-attn2-navit模型微调，并使用FLUX.1-schnell VAE模型，支持视觉理解、文本到图像生成及图像编辑。

破解合规难题，AI高质量数据集建设正当时

下午2时 2025/04/21 作者 AI探索时代

阿里开源的Qwen2.5系列训练数据规模达18万亿 token，推动AI大模型发展。但大规模训练带来幻象问题，RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范，提升数据标注行业的合规能力。

速递｜印度初创公司Ziroh Labs，推出无需高端芯片即可运行大型AI模型

下午4时 2025/04/11 作者 Z Potentials

印度初创公司Ziroh Labs开发了一套名为Kompact AI的新系统，该系统无需使用昂贵的GPU芯片就能运行大型AI模型。

零样本复刻任意人声!中英文混合生成丝滑无界!

上午11时 2025/04/10 作者 GitHubStore

Spark-TTS 是一个先进的文本到语音系统，利用大型语言模型实现高度准确和自然的声音合成。它简洁高效，支持零样本语音克隆及双语支持，具备可控语音生成功能。

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

下午2时 2025/04/02 作者老刘说NLP

2025年4月1日，北京天气晴。文章介绍了R1进展中的两个工作，一是研究多种基础模型预训练特性的影响；二是将GRPO-RL强化用于Agent的UI动作预测，数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力，但模板会破坏数学解题能力。此外，文章还讨论了强化学习在图形用户界面（GUI）动作预测中的应用。

50条数据解锁空间智能，RL视觉语言模型3D空间推理框架MetaSpatial ｜西北大学

下午4时 2025/03/22 作者量子位

模型（VLM）生成结构合理、物理一致的场景布局仍是一项挑战。以“请将这些家具合理摆放在房间中”为例，

阿里国际站AI布局引多家外媒关注：AI搜索Accio企业用户超百万

下午11时 2025/03/11 作者 AIGC开放社区

阿里国际站总裁张阔透露，Accio企业用户已超百万。接入Qwen2.5等先进推理模型后，让阿里国际站在AI外贸领域引发关注。海外买家在采购时信息类搜索量是商品类的10倍。目前Accio的用户规模超百万，且已有超过10万中小企业使用AI工具做外贸。张阔称AI能协助人完成外贸经营中的绝大部分环节，将提高转化率、客户互动和商品管理。

基于Qwen2.5模型的高效文本转语音（TTS）系统 Spark-TTS

下午12时 2025/03/09 作者 GitHubStore

一种基于大语言模型的高效文本转语音系统，采用BiCodec编码简化架构，提升推理效率，并实现零样本语音克隆和精细控制。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31