量子位 – 第 26 页 – 每时AI

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

下午8时 2024/12/15 下午5时 2024/11/22 作者量子位

IDEA研究院最新成果DINO-X通用视觉大模型，在各种开发世界感知和目标理解任务中实现全面检测、泛化能力增强、细粒度目标理解和多任务感知，已在多个基准测试中获得新SOTA成绩。

百度AI营收占比翻倍，净利润涨12%，李彦宏主动剧透新版文心大模型

下午8时 2024/12/15 下午3时 2024/11/22 作者量子位

百度第三季度生成式AI收入占比从5%增长至11%，文心大模型日均调用量达15亿次。智能云业务中，AI云业务营收占比提升显著。李彦宏预计明年年初推出新版本的文心大模型。

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

下午8时 2024/12/15 下午2时 2024/11/22 作者量子位

Janus团队提出了一种名为JanusFlow的新模型，该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架，实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器，并利用REPA方法加速生成训练，JanusFlow在多模态理解和生成任务上表现出色。

汽车上的《Her》：模型竟然想做个人了，甩掉机械感，让灵魂有趣，来自吉利的全新尝试

下午8时 2024/12/15 下午1时 2024/11/22 作者量子位

允中发自凹非寺
量子位 | 公众号 QbitAI
今天，如果你身边有这样一个对话大模型，它就像你

谷歌Gemini突发试验版模型，重回竞技榜第一！新版GPT-4o只领先了1天

下午8时 2024/12/15 下午1时 2024/11/22 作者量子位

谷歌发布Gemini-Exp-1121模型夺回OpenAI GPT-4o冠军宝座，提升代码、推理及视觉理解能力。

FLUX“官方版ControlNet”来了！景深轮廓更精准控制，共四款官方工具一齐上线

下午8时 2024/12/15 下午1时 2024/11/22 作者量子位

FLUX更新四款创意工具，包括fill、Canny、Depth和Redux。这些工具能够修改细节、扩展画面、控制景深，并让人物动作变化。开发者通过ComfyUI整合进绘图工作流。FLUX的官方和第三方工具在编辑任务中表现出色，优于Ideogram和SD 1.5。

王炸！谁能想到年底杀出的黑马是美图啊

下午8时 2024/12/15 下午1时 2024/11/22 作者量子位

美图展示了其在视频生成、文生图、表情制作、图像编辑等方面的最新能力，包括惊艳的视觉效果和丰富的功能选项。这些技术不仅提升了用户体验，也为电商等场景提供了解决方案。

第二波嘉宾曝光！二十位科技圈大咖齐聚MEET2025智能未来大会

下午8时 2024/12/15 下午1时 2024/11/22 作者量子位

组委会发自凹非寺
量子位 | 公众号 QbitAI
2024年，
以
大模型为代表的智能科技，如