开年特辑|盘点去年最让我心动的 5 款数码好物

2024 年度,vivo X200 Pro mini 成为主力机;HUAWEI Mate XT 凭借三折叠屏成为最佳备用机;硬糖工厂小电拼+贴贴线简化充电流程;一加 Buds 3 在音质、续航和佩戴体验上表现优异;华为智能眼镜 2 代在无感设计上突出。

HTML转换为高质量的Markdown支持29种语言,使用Kokoro-82M将电子书变为有声书,唱歌声音转换模型

本期内容涵盖了ReaderLM-v2、PDF to Podcast、Audiblez、RIFT-SVC和MangaNinja等五个AI工具或模型,分别用于HTML转Markdown/JSON、PDF转换音频、电子书转化为有声书、唱歌声音转换以及基于参考的动漫线条艺术上色。

实体清单扩散至大模型公司,美国“AI出口禁令”一边被美国公司骂,一边已开始发力

美国商务部将智谱AI列为实体清单,这是中国大模型公司首次被列入。美国对中国的AI研究进行限制,主要理由是认为其有助于提升中国的军事能力。智谱方面对此回应称不会对公司业务产生影响,并继续为用户提供世界一流的大模型技术和服务。

港科大、地平线提出DrivingWorld:基于视频GPT构建自动驾驶世界模型

港科大与地平线联合提出DrivingWorld模型,采用基于自回归架构的方法实现精准的自动驾驶世界模型。通过空间-时间先解耦后融合机制和next-state预测策略,实现超长时序视频生成及可控性提升。

速递|AI视频Synthesia融资1.8亿美元,估值21亿美元,拥有6万家企业客户

Synthesia,一家专注于为企业提供AI头像技术的企业,已完成1.8亿美元融资。目前估值为21亿美元,主要投资者包括NEA、WiL等。该公司计划利用这笔资金扩大招聘和产品开发,并致力于实现更真实的动作、环境互动以及用户互动等功能。

MiniMax-01 开源即精品:破解超长文本处理难题!

MiniMax-01系列模型开源,支持400W token长文本处理。该系列通过线性注意力机制大幅降低计算成本和提高效率。MiniMax-Text-01在文本任务与多模态任务上表现优异,展示了强大的超长文本理解和处理能力。