AI视觉神器!一款真正懂你的AI助手,OCR进化版,图片元素全理解。

 

你敢信,如今的AI智能到“碉堡”了。

由于这两年 “AI们” 是越来越卷了!

从最开始的文本生成、图像生成到后面的视频生成。

它们还不满足哇,如今又在卷数学推理以及视觉思考。

起初我也没当回事,因为隔三岔五就有大厂发布各式的AI模型,已经司空见惯了。

直到我前几天体验了 Kimi最新的视觉思考模型k1,这就是我的全能助手呀。

从柴米油盐酱醋茶吃住行。。。到数理化。。。从生活到工作的方方面面,它都能懂你,给予你帮助。

下面就来一探究竟,这只 戴眼镜的Kimi 有哪些魔力。

k1模型简介

在介绍Kimi视觉思考模型k1之前,还是要给大家种草一下Kimi这款智能助手。

Kimi是一款功能全面、完全免费、可无限使用的国产人工智能助手。

超长文本处理、文件阅读理解、网页内容总结、多语言翻译、PPT制作、代码编写等等功能都不在话下。

而Kimi最新发布的视觉思考模型k1,也是让Kimi更加完美了。

它是支持 端到端的图像理解及思维链(CoT),推理能力也是给人惊喜,识别能力也更让用户青睐。

只需一张图即可解决很多现实性问题,让你不再无从下手。

使用入口

以Kimi网页端(kimi.com)为例,进入主页后,认准侧边栏那个戴眼镜的Kimi图标,点击即可快速使用了。

之后只需要上传图片,编辑问题即可。

k1视觉模型场景应用

case01:房树人绘画,心理学分析

最近由檀健次和金世佳主演的《猎罪图鉴2》开播,剧中“夺命达芬奇案”,画像师用房树人绘画,就能看出每个人的性格特征,以及在当下的心理状态。

以剧中李晗的房树人为例,进行视觉推理。

有几个关键词,家庭和童年、缺乏安全感、缺乏自信等分析结果。和剧中人物当时的心理状态很是对应。

不得不赞叹,k1真的不是徒有其表,而是有真才实学的。

case02:洗衣机功能分析推理

我们家里的智能洗衣机,年轻人都知道功能怎么用,但是对于老年人,甚至不经常接触智能产品的爸妈,他们就很容易犯怵。

洗什么材质的衣服,用哪个功能,都不懂。

现下kimi支持了k1视觉思考,直接给我爸妈手机上装个Kimi智能助手。拍一个洗衣机的功能图片上传,交给它。

从回复结果看,k1并不是说上来就直接给你个明确的回答,有时也会很谦虚的回答说有些专业术语我并不是很熟悉。

然后再根据自己的理解,给了每个功能的解释,以及衣物类型该如何匹配。

这下爸妈自己在家的时候,即使不懂,也可以随时找Kimi解答了。

case03:服装穿搭方案推荐

之前如果想让AI给我们做穿搭方案,都是文字型描述,还是存在信息不对等的情况。

但是通过实际服装图片,就能精准的给出穿搭方案。

比如:我现在有一个黑色的裤子,当然我再卖个关子,不说什么材质,让k1给我看看这件衣服什么季节穿合适,然后再给我穿搭方案。

好家伙,的确我这件衣服是秋冬款,刚买回来保暖穿的,也是宽松款。

在穿衣搭配上,也给出了上衣、鞋子与其搭配,这个季节当然风衣是在合适不过了。按照这个搭配方案来,的确是又时尚又保暖。

好了,我的穿搭助手又更全面了。

case04:识菜并给出菜谱

你是不是只记得吃,不记菜名的同胞。但有时候想吃了自己想尝试去做,又忘了菜名。

这时候交给k1,它也能胜任,还能给出完整的菜谱,手把手教会你。

当然k1视觉识别也不是万能的,第一次识别不是特别精准(是另外一个名字,不过菜谱都差不多)。

所以撤回给了他第二次机会。这次识别到这道菜是口水鸡,材料准备,制作步骤都很清晰。

case05:根据网站截图,编写实现代码

因为本职是个后端工程师,对于前端页面、UI并不懂。有时候想要自己独立做一个小工具站点,就有些头疼。

但是通过k1视觉思考,就能很快速解决我的痛点。

比如我想要做一个这样的爬虫工具库:

那就可以将该截图上传到k1视觉思考模型会话中。

然后将实现代码拷贝到IDE编辑器中,根据实际效果微调,就能复刻一个爬虫工具库。

是不是很方便呢,即使是完全不懂编程的小白,也可借助Kimi开发出自己的小应用。

case06:解答复杂数独题

都说Kimi视觉思考模型,在数理化推理方面行业领先,测试结果表现超OpenAI o1、GPT-4o、Claude 3.5 Sonnect等主流模型。

相信大家也看过了k1对于几何、函数、微分等题型的解题能力。

今天看看Kimi k1 对于复杂数独的推理能力是否也一如既往的牛。

这道数独题,还是让Kimi算了蛮久的。

但是它同时也给我们展示了整个解题的过程,包括它的解题思路。把这个解题文字发出去,不知道的人还以为是谁写的呢,完全看不出是机器解出来的。

在整个解题过程中,问题深入的也比较细,拆分的也比较深。而且在得到结论后,也会进行一些反思与认证。

有了这款眼镜版Kimi,妥妥的给自己找了一个能力全面的助教老师。主要是思路清晰,步步有条理说明,不怕你不懂。

写在最后

Kimi视觉思考模型才刚上线一周,其层层嵌套的推理能力就已经让人惊叹!!!

当然是产品都会有Bug、有短板,有时候也会分析有误,但是相信后续k1模型经过用户反馈及场景完善优化升级后的能力,是毋庸置疑的能带给每个人工作和生活的帮助。

Kimi不论是对于工作提效还是充当生活助手,都是值得一试的。

👇🏻戳一戳下面的小程序,就能立马使用Kimi智能助手

 

(文:开源星探)

欢迎分享

发表评论