预训练归档 - 每时AI

三位顶流AI技术人罕见同台，谈了谈AI行业最大的「罗生门」

下午2时 2025/05/28 作者智能涌现

AI行业，这是最大的“罗生门”事件。
2023年，模型预训练，还是第一性原理。然而，从OpenAI前

图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型，触发像素自主推理

下午4时 2025/05/17 作者机器之心

GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫

也看大模型排行榜Chatbot Arena的评估结论及MiMo-7B推理大模型实现思路

下午2时 2025/05/03 作者老刘说NLP

题。
最近看到一句话，很有感触，
真正的技术护城河是：十年如一日的苦活、脏活、累活，说不清、道不明的

终于，它来了！Qwen3深夜发布，再次登顶全球大模型开源王座，再见DeepSeek。

上午11时 2025/04/29 作者开源AI项目落地

Qwen3今日发布，参数量2350亿的旗舰模型Qwen3-235B-A22B超越多个模型。亮点包括混合思维模式、多语言支持和增强代理能力；预训练数据集涵盖119种语言，计算成本更低；链接见原文。

爆火开源TTS，支持零样本克隆，200ms超低延迟，情感语调超自然。

下午11时 2025/04/16 作者开源AI项目落地

最近TTS开源项目大爆发。介绍4个模型：Medium、Small、Tiny和Nano，涵盖英语及多语言模型，并提供详细的Orpheus TTS项目简介和功能特点。

OpenAI揭秘GPT-4.5训练：10万块GPU，几乎全员上阵，出现“灾难性问题”

下午4时 2025/04/13 作者智东西

消息，近日，在OpenAI史上最贵模型GPT-4.5发布1个多月后，OpenAI联合创始人兼CEO萨

250多篇论文，上海AI Lab综述推理大模型高效思考

下午4时 2025/04/04 作者机器之心

oning Models，LRMs）通过加长「思考链」（Chain-of-Thought，CoT）在

开源可商用！RF-DETR实时目标检测新标杆：2900万参数轻量级模型，160FPS速度精度双突破

下午2时 2025/04/03 作者小兵的AI视界

能不断提升。然而，如何在保证检测精度的同时实现实时性，仍然是一个亟待解决的问题。
近期，
Robof

SmolVLM2: 让视频理解能力触手可及

下午2时 2025/03/22 作者 Hugging Face

本性转变——从依赖海量计算资源的巨型模型，转向可在任何设备运行的轻量级模型。我们的目标很简单: 让视