使用o1的方法又多了一种:Perplexity添加o1模型!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。

从今天起,使用o1的方法又多了一种!

Perplexity,AI搜索领域的老大哥,近期(就这两天)已经添加了o1模型作为搜索的底层模型。

Perplexity不生产AI模型,它是AI模型的搬运工。Perplexity添加新模型的速度并不算快,相比You.com而言,这次的o1也是虽迟但到了。

Perplexity目前已支持8个高级模型:

  1. 默认模型: 经过优化的快速搜索模型,专门用于网页浏览和快速检索,通过微调实现,对所有用户开放使用。

  2. Claude 3.5 Sonnet: Anthropic发布的最强模型,最新版本更新于2024年10月22日。我平时在用Perplexity时默认就是用这个模型,擅长总结,喜欢用“bullet points”的形式回答。

  3. Sonar Large: 前面说Perplexity自己不生产模型是一句玩笑话,这个模型就是由Perplexity官方基于Llama 3.3 70B训练出的自有模型。

  4. GPT-4o: OpenAI推出的最新通用基座模型。在Perplexity里的回答和Claude 3.5 Sonnet相比,略显啰嗦,但确实内容很丰富。

  5. Sonar Huge: 和上面的Sonar Large一样,是Perplexity官方基于Llama 3.1 405B训练而来,参数量更大。

  6. Grok-2: 马斯克的xAI推出的最新模型,一个月前才开放API版本。

  7. Claude 3.5 Haiku: Anthropic推出的Claude 3.5系列中的小模型,主打速度快。相当于Claude 3.5 Sonnet的弟弟。

  8. o1: 本文的主角,OpenAI发布的最新推理模型,Perplexity集成的是刚发布不久的满血版。

由于o1 API昂贵,Perplexity内使用o1模型是有使用数量限制的,官方写的是每天10次,但实际体验下来,过几个小时还能自动恢复额度。整体来看应该是要大于10次的。听起来10次不多,但这可是满血版o1,ChatGPT Plus付费会员也只有每周50次的额度,稍微聊几句就消耗光了。Perplexity的每天10次算起来比ChatGPT Plus额度还要多。

另外需要指出的是,目前o1模型只能在Perplexity Web网页端选择使用,换句话说,只有网页端的AI Model列表里有o1这个选项,而Mac客户端里还看不到o1模型。

下面来小试牛刀,测试一下Perplexity里的o1模型是不是正版的,还是注了水的。

用数字 2、3、5、12 和四则运算得出结果 24。

还是用这个24点的难题来测试,正确答案是:12 / (3 – 5 / 2)= 24。在之前的测试中,只有满血版o1正确回答出了这个答案。

o1模式下,Perplexity的回答完全正确。

点击展开本次的搜索过程,可以看到Perplexity写了一个Python代码来用“枚举法”找可行解,但具体不清楚背后是如何搜索/思考的。

当我把模型切换回Claude 3.5 Sonnet,则得到了下面这个结果,表示:根据计算结果,使用数字2、3、5、12和四则运算(加、减、乘、除)无法得到结果24。

从侧面能反映出o1作为一个推理模型的强大。

结语

Perplexity的o1,是有点东西的。



(文:AI信息Gap)

欢迎分享

发表评论