12 月 18 日,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。 豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用,可完成智能训练、数据合成和数字资产制作。 豆包大模型旗下多款产品也迎来了更新:豆包通用模型 pro:全面对齐 GPT-4o,使用价格仅为后者的 1/8;音乐模型:可生成 3 分钟的完整作品;文生图模型 2.1 版本:精准生成汉字、一句话 P 图,已接入即梦 AI 和豆包 App。
公众号「信息平权」对这次发布会的看法如下:
01
日均Token 4万亿意味着什么
这远超我们之前的匡算结果…里面最大的变量,是to B。假如按照4万亿倒算用户DAU的话,人均每天消耗40万字!靠我们平时搜索、读研报、哪怕偶尔文生图一下,也不会达到这种token使用量。说明某些C端感知不到的to B场景,正以惊人的速度消耗token。具体结构未知,但从本次发布能看到些许线索:汽车、本地生活、休闲娱乐、眼镜玩具教育硬件、客服,这次还没提到字节内部使用场景(抖音飞书等等),都是以“百倍千倍”速度在增长。
而这里引发思考的是,AI To B的体量最终是否会远超to C?中国过去软件数字化没有走成的路,AI能做成吗?通过AI用量收费的方式,能否撬动过去艰难的企业付费订阅商业模式?
总之按照我们之前的测算,以及公司自己制定的目标,明年日均token很可能超过每天百万亿。
02
AI=超级入口+连接器
这次发布会,会让国内其他互联网巨头重新在AI上FOMO,不仅百度,尤其腾讯。这显然不是一个Chatbot,也不仅仅是搜索,长期来看这就是个大一统的超级入口,而之前最接近这个角色的显然是微信。过去每家公司讲过的、实现或未实现的任何概念,数字化、IOT、智能管家等等,都可以被囊括进去。
过去字节的边界局限于头条和抖音,图文和短视频信息流为主要形态,基于此去拓展商业化,发现即便是帝国也有边界。而AI有潜力成为字节拓展其帝国边界的抓手,可与千行百业、线上线下、软件硬件链接。中间有强大的商业化引擎(豆包已经出现展示广告),下面是庞大算力支撑、海量数据喂养的模型底座。
03
应用平推和成本最低
字节其实印证了之前一些假设:模型的领先没有护城河,找到应用与模型之间的“数据飞轮”才是护城河。而后发甚至有优势,以更低算力成本实现更好的训练和推理。剩下的就是持久战能力,在如此早期的行业里面不被技术变革甩下车。
谷歌最近的一系列发布证明在前沿研究储备、场景流量、甚至财力上的持续作战能力,远超OpenAI。字节也一样,模型本身甚至不是国内顶级,但已经是国内甚至世界范围内,最有机会实现AI模型、应用、商业变现的正向循环。
而字节这次秀出的姿态,就是全行业“平推”,能覆盖的全部覆盖,从应用到中台到垂直模型,能填满的场景迅速填满。一是一片蓝海赶紧占地盘,二是从算力上和当年的AWS可能模式类似,谁算力用的越满,谁平摊下来算力成本最低(千字3厘,明年只会更夸张),而现阶段的AI应用,说不定算力成本就是核心竞争力。尤其到了to B,下一步就是简单粗暴的价格战,杀到某些创业公司出局。而降价的过程显然对算力芯片是好事而不是坏事,为什么?整个规模扩展的过程就是实现软硬件协同优化,陪跑的几家只会越做越强,量越来越大(唯一担心就是后面流片和DDR怎么弄…)
04
All in的决心
上述的一切只源于一点,就是张一鸣在AI上的投入决心,远大于国内其他互联网公司。如果之前腾讯阿里了解到字节的Capex和投入力度,还是观望,这次发布之后相信会有新的感受。以及字节这次会给全世界一个模板,有一个商业化能力极强的玩家正以“应用平推”“高举高打”,试图快速拿下一张船票。很庆幸我们国内有这样的企业和企业家,以“豪赌”的姿态继续参与这次AI浪潮。
(文:Founder Park)