速递|印度初创公司Ziroh Labs,推出无需高端芯片即可运行大型AI模型
印度初创公司Ziroh Labs开发了一套名为Kompact AI的新系统,该系统无需使用昂贵的GPU芯片就能运行大型AI模型。
印度初创公司Ziroh Labs开发了一套名为Kompact AI的新系统,该系统无需使用昂贵的GPU芯片就能运行大型AI模型。
Spark-TTS 是一个先进的文本到语音系统,利用大型语言模型实现高度准确和自然的声音合成。它简洁高效,支持零样本语音克隆及双语支持,具备可控语音生成功能。
2025年4月1日,北京天气晴。文章介绍了R1进展中的两个工作,一是研究多种基础模型预训练特性的影响;二是将GRPO-RL强化用于Agent的UI动作预测,数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力,但模板会破坏数学解题能力。此外,文章还讨论了强化学习在图形用户界面(GUI)动作预测中的应用。
阿里云千问团队发布了Qwen2.5-VL-32B-Instruct模型。该模型在多个方面实现了重要突破:优化了模型规模、提升了性能,并在视觉理解和数学推理等方面取得了显著进步。
阿里国际站总裁张阔透露,Accio企业用户已超百万。接入Qwen2.5等先进推理模型后,让阿里国际站在AI外贸领域引发关注。海外买家在采购时信息类搜索量是商品类的10倍。目前Accio的用户规模超百万,且已有超过10万中小企业使用AI工具做外贸。张阔称AI能协助人完成外贸经营中的绝大部分环节,将提高转化率、客户互动和商品管理。
Qwen发布了QwQ-Max-Preview模型,该模型基于Qwen2.5-Max推理模型,具有更强的数学理解、编码和代理能力。即将发布QwQ-Max正式版,并在Apache 2.0下开放源代码。
X-R1 是一个低成本且易入门的强化学习训练框架,旨在降低 R1 的复现门槛。通过使用0.5B预训练模型,在4张3090/4090显卡上仅需2小时就实现了 ‘aha Moment’,展示了极小模型也能触发Aha Moment的现象。