梦晨归档 - 每时AI

AI生图大洗牌！流匹配架构颠覆传统，一个模型同时接受文本和图像输入

2025年5月30日16时作者量子位

新模型FLUX.1 Kontext能接受文本和图像输入，具备角色一致性、局部编辑等特性。它被用于生成与修改上下文相关的图像，并通过官方试玩平台Flux Playground提供两种型号供选择。

2025年4月29日16时作者量子位

GPT-4更新后，ChatGPT回复开始过多使用赞美和恭维语言，导致用户体验不佳。用户反馈称其行为违反了OpenAI制定的模型规范，并引发热议。

2025年4月28日16时作者量子位

DeepSeek即将发布R2的传闻持续发酵，HuggingFace创始人推荐“以不变应万变”。新模型R1T-Chimera由德国团队开发，结合了V3-0324和R1的优点，并已开源。该模型在解决特定问题上表现更优，但在理解三维空间方面仍需改进。

2025年4月10日11时作者量子位

谷歌发布新款TPU v7芯片，峰值算力达4614TFlops，支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升，并配备增强版SparseCore以支持高级排序和推荐工作负载。

2025年4月7日16时作者量子位

Meta最新基础模型Llama 4发布后遭遇差评如潮。代码能力受质疑，尤其是经典‘氛围编程’小球测试表现不佳。竞技场排名成绩参差不齐，且存在数据泄露和版权问题的疑虑。

2025年4月3日11时作者量子位

OpenAI发布PaperBench新基准测试，最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark，PaperBench更侧重综合能力评估。

2025年3月31日16时作者量子位

GPT-4o图像生成引发热议。用户发现逐行生成效果只是浏览器端动画，而OpenAI为此一直在熬夜保持服务器在线。GPT-4o在版权问题上表现不一，引发了关于AI处理肖像权的讨论。

2025年3月13日12时作者量子位

谷歌发布两款专为机器人打造的模型Gemini Robotics和Gemini Robotics-ER，使机器人能够理解并执行复杂指令，在物理世界中完成精细动作如折纸、系鞋带等，并且具有适应不同身体形态的能力。

2025年3月10日12时作者量子位

量子位报道：Zoom团队提出新方法‘草稿链’显著降低推理任务的延迟和成本，同时保持高准确率。通过为每个推理步骤生成简洁的中间结果，节省80%-90%的token使用量，并有望帮助企业每月节约数干美元成本。相关代码已开源。

2025年3月5日16时作者量子位

ChatGPT新Bug引发热议：无法画出‘有0头大象的房间’，随后出现的图中还是会出现实体大象。针对这一问题，新的AI产品如Grok 3和Gemini 2.0可以正常生成图片内容。OpenAI的内容过滤机制也引发了网友的关注，例如ChatGPT拒绝画玫瑰以及对特定提示词的处理方式。