前几天我用腾讯元器做了一个DeepSeek分身,实现了粉丝通过DeepSeek和“我”交流,能够精准的输出我写过的文章资料。
随着对腾讯元器的熟悉,我尝试着做了一个资产盘点小程序,可以直接通过微信小程序码拉起,在手机上实现盘点的功能。
先放一下截图:

当然,目前这个小程序还是有一些缺点的:
因为是大模型识别,所以速度有点慢,腾讯混元需要识别几秒到十几秒,和传统的摄像头直接识别相比,体验差一些(但考虑到免费,也不是不可以接受)。
腾讯的智能体的配置工具,叫腾讯元器,智能体的发布工具,叫腾讯元宝。
但元宝不是唯一的智能体入口,这要比其他的平台强大的多。
由于腾讯的智能体和微信小程序、公众号、QQ等生态无缝打通,就能实现一个非常完美的效果。
很多人没有意识到,这将颠覆IT行业。

腾讯元器提供了一个非常类似ComfyUI的工作流配置后台,AI时代这种工作流界面已经成为主流。
1、设计逻辑
智能体(小程序)获取用户上传的图片url,然后由图片解析插件进行解读,把包含条形码信息的解读内容送给混元大模型,再由混元大模型输出标准的数字格式。
把数字送到知识库,知识库提前上传(可用RPA每日自动上传)资产编码对应信息,然后知识库输出条形码数字对应的资产信息(因涉及商业机密,知识库部分本文不做介绍,原理很简单)。
2、参数提取节点

我原以为参数提取节点是多么的高深,后来发现其实也是内置的大模型。
提取用户上传的图片url,参数选择fileUrls,提取参数如下:

需要注意的是,因为目前腾讯元器的工作流试运行的时候无法上传图片,只能找一个已知图片地址按照规定格式复制过去,格式如图:

3、图片理解插件
腾讯元器自带图片理解插件(AI绘画一般叫反推),反推的效果非常不错,能把条形码的数字信息反推出来。

此处的prompt、resource_url都引用fileUrls,我尝试了其他参数,都会报错。
4、大模型节点
图片理解后,会输出大量的信息,用大模型提取其中的数字信息,因为这个不需要很复杂的功能,所以选取速度比较快的混元turbo。

5、知识库(略)
知识库选择导入TXT,再输出给大模型,进行格式输出。
工作流配置完成后,可以创建智能体,然后挂接该工作流,最终生成的智能体可以在小程序、网页等多种入口使用。
6、测试版(删掉了知识库,只能识别到条形码)
https://yuanbao.tencent.com/chat/aAuL1X9MOBLP
(文:路过银河AI)