大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。
从今天起,使用o1的方法又多了一种!
Perplexity,AI搜索领域的老大哥,近期(就这两天)已经添加了o1
模型作为搜索的底层模型。
Perplexity不生产AI模型,它是AI模型的搬运工。Perplexity添加新模型的速度并不算快,相比You.com
而言,这次的o1
也是虽迟但到了。
Perplexity目前已支持8个高级模型:
-
默认模型
: 经过优化的快速搜索模型,专门用于网页浏览和快速检索,通过微调实现,对所有用户开放使用。 -
Claude 3.5 Sonnet
: Anthropic发布的最强模型,最新版本更新于2024年10月22日。我平时在用Perplexity时默认就是用这个模型,擅长总结,喜欢用“bullet points”的形式回答。 -
Sonar Large
: 前面说Perplexity自己不生产模型是一句玩笑话,这个模型就是由Perplexity官方基于Llama 3.3 70B
训练出的自有模型。 -
GPT-4o
: OpenAI推出的最新通用基座模型。在Perplexity里的回答和Claude 3.5 Sonnet
相比,略显啰嗦,但确实内容很丰富。 -
Sonar Huge
: 和上面的Sonar Large
一样,是Perplexity官方基于Llama 3.1 405B
训练而来,参数量更大。 -
Grok-2
: 马斯克的xAI推出的最新模型,一个月前才开放API版本。 -
Claude 3.5 Haiku
: Anthropic推出的Claude 3.5
系列中的小模型,主打速度快。相当于Claude 3.5 Sonnet
的弟弟。 -
o1
: 本文的主角,OpenAI发布的最新推理模型,Perplexity集成的是刚发布不久的满血版。
由于o1
API昂贵,Perplexity内使用o1
模型是有使用数量限制的,官方写的是每天10次,但实际体验下来,过几个小时还能自动恢复额度。整体来看应该是要大于10次的。听起来10次不多,但这可是满血版o1
,ChatGPT Plus付费会员也只有每周50次的额度,稍微聊几句就消耗光了。Perplexity的每天10次算起来比ChatGPT Plus额度还要多。
另外需要指出的是,目前o1
模型只能在Perplexity Web网页端选择使用,换句话说,只有网页端的AI Model
列表里有o1
这个选项,而Mac客户端里还看不到o1
模型。
下面来小试牛刀,测试一下Perplexity里的o1
模型是不是正版的,还是注了水的。
用数字 2、3、5、12 和四则运算得出结果 24。
还是用这个24点的难题来测试,正确答案是:12 / (3 – 5 / 2)= 24。在之前的测试中,只有满血版o1正确回答出了这个答案。
o1
模式下,Perplexity的回答完全正确。
点击展开本次的搜索过程,可以看到Perplexity写了一个Python代码来用“枚举法”找可行解,但具体不清楚背后是如何搜索/思考的。
当我把模型切换回Claude 3.5 Sonnet
,则得到了下面这个结果,表示:根据计算结果,使用数字2、3、5、12和四则运算(加、减、乘、除)无法得到结果24。
从侧面能反映出o1
作为一个推理模型的强大。
结语
Perplexity的o1
,是有点东西的。
(文:AI信息Gap)