用AI绘画的思路做语言大模型:Mercury

现在一提AI大模型,言必称ChatGPT、DeepSeek、Grok3等知名大语言模型唵,这类模型有一个共同的名字:LLM(Large Language Model)。

而它们的底层逻辑是相通的,靠一个token一个token的推测要回复的下一个词。

这样就带来两个缺点,一是比较消耗token(成本),二是速度比较慢。

假如智能汽车使用这种大模型,就会出现这样的情况:

车主:左拐。

大模型:思考76秒。

(以上是段子)

有一家叫做inception的公司,推出了一个叫做Mercury的模型,称其为DLLM。

这里的D,指的是Diffusion,也就是扩散模型的逻辑。

玩AI绘画的都清楚,现在AI绘画的基本原理,正是Diffusion,最流行的绘画大模型就是Stable diffusion(当然最近被Flux代替,但Flux依然是diffusion)。

所谓Diffusion,是先瞬间生成一个模糊图像,然后不断修正,最终生成和提示词精准匹配的画面。

DLLM采用了这样的逻辑,先生成一个答案,然后不断的修正,最终生成和问题相契合的答案。

Mercury这个名字也很有意思,虽然国内经常翻译成水星,但实际上它应该音译为墨丘利,是罗马神话中众神的使者。

只是恰好西方命名水星的时候用了这个神祇的名字。

inception想做众神的使者,而inception的意思是开端。

谁是神?

也许,未来AI大模型就是神。

按照inception的宣传,Mercury比传统LLM快5-10倍,使用价格还更便宜。

那它的效果如何呢?

我简单试了下,作为第一个版本,应该说完成度非常高,至少可用性很强。

在提问的时候,Mercury会迅速给出答案,但和AI绘画类似,答案是在变化的:


我们可以发现答案并不精准,掺杂着很多不明字符。

几秒钟后答案固定下来:

当然了,快的代价是不够精准,很显然Mercury把曹冲当成了曹丕的长子,有点过于离谱(也可能是中文语料训练不足)。

期待后续版本的表现。

https://chat.inceptionlabs.ai/ 

(文:路过银河AI)

欢迎分享

发表评论