OpenAI揭秘GPT-4.5训练:10万块GPU,几乎全员上阵,出现“灾难性问题” 下午4时 2025/04/13 作者 智东西 消息,近日,在OpenAI史上最贵模型GPT-4.5发布1个多月后,OpenAI联合创始人兼CEO萨
250多篇论文,上海AI Lab综述推理大模型高效思考 下午4时 2025/04/04 作者 机器之心 oning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在
开源可商用!RF-DETR实时目标检测新标杆:2900万参数轻量级模型,160FPS速度精度双突破 下午2时 2025/04/03 作者 小兵的AI视界 能不断提升。然而,如何在保证检测精度的同时实现实时性,仍然是一个亟待解决的问题。 近期, Robof
SmolVLM2: 让视频理解能力触手可及 下午2时 2025/03/22 作者 Hugging Face 本性转变——从依赖海量计算资源的巨型模型,转向可在任何设备运行的轻量级模型。我们的目标很简单: 让视
NeurIPS 2024 已开源!港科广团队提出Hawk:面向开放世界的视频异常理解框架 下午4时 2025/03/19 作者 PaperWeekly 通事故等,从而减少人工干预、提高效率。在大模型时代,随着大规模预训练模型,尤其是视觉语言模型(VLM
首个大模型后训练方法综述 上午8时 2025/03/14 作者 NLP工程化 国内外研究者综述了LLM的后训练方法进展及五种范式(微调、对齐、推理、效率和集成适应),并介绍了相关数据集与应用场景,同时讨论了当前面临的伦理问题及未来方向。
从放弃的AI浏览器到通用Agent:完整复盘 Manus的诞生过程 下午11时 2025/03/12 作者 Founder Park 1 到 N,状态就没有那么好」。 在他过往的经历中,创业项目大都获得了相对稳定、可观的营收,上一家公
网易有道:小参数垂类模型实现翻译质量持续提升 下午11时 2025/03/11 作者 多知 网易有道通过自主研发的子曰翻译大模型2.0提升了翻译质量,在专业领域取得进展,并在有道词典、翻译官等产品中上线。
大神Karpathy亲授!最新LLM入门视频课! 下午2时 2025/02/07 作者 Datawhale drej Karpathy 全新视频发布:时长 3 小时 31 分钟的深度解析 – 《深入剖析 Ch