🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
论文、资料太多,想批量处理,还想用够快、够便宜的模型。
所以,我找到了。我调用了智谱GLM-4 Batch API 将N篇论文一次性转成 系统性文献综述。是的,可以20篇、200篇一次性转完。
结合AI编程还可以自定义处理规则,或者搭建自己的Agent工作流。
更重要的是,我用了高校认证的号,模型相当便宜,甚至如果使用GLM-4-Flash转还不花钱。
data:image/s3,"s3://crabby-images/acb00/acb009f119a1445a93cebec470401fc7f1c9cc87" alt=""
据了解,过去一年,已经有很多高校师生使用了智谱这个平台。大模型不仅改变了科研方式,也让更多人在教学中体验到了AI的力量。
data:image/s3,"s3://crabby-images/f5474/f5474f96e421a44a9937de3e86c7e59c08c2440d" alt=""
data:image/s3,"s3://crabby-images/dcc27/dcc2712df094b61e588deeab89451885ea1a10ec" alt=""
下面我们以AI编程零代码的方式。调用一下他们的GLM-4 Batch API 完成20余篇(时间关系)的论文转综述需求转成系统性文献综述。并涉及一些Cursor MCP操作。
data:image/s3,"s3://crabby-images/bcbf4/bcbf469124ab6a4f5b9a76a418e585553c952eb8" alt=""
我想把上面这一整页API文档提取出来,方便给到Cursor。
我尝试了三种办法(主要想说这些操作也可以用于提取其他的文档):
1、手动复制,粘贴到Notion(和飞书一样可以保留原网页格式)
data:image/s3,"s3://crabby-images/fcc09/fcc091722dfc599d25dc90f21c70235417e47b68" alt=""
2、通义小插件,收藏网页,导出md
data:image/s3,"s3://crabby-images/89cd3/89cd3b1e2701f32a251d724e70117e289004e3d1" alt=""
data:image/s3,"s3://crabby-images/4f971/4f971180bba05b22f81ecebb5311ce36ab2da21c" alt=""
3、使用Playwright MCP获取页面信息并保存,我录了个视频(手机模糊的话,可电脑查看哦~):
MCP不了解、MCP的好处、Playwright是什么?我这里有成套的文章帮助你快速了解:
Cline的MCP商店来了。
Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。
Windsurf Wave3:MCP协议让AI直接读取控制台错误,自动化网页调试不用复制粘贴了!Tab智能跳转、Turbo模式。
MCP是新的AI编程方向,值得你研究呢。
好了,我们有了API文档,我这样提问让Cursor看看基于这个API文档有什么可以做的:
@【原文】智谱AI开放平台.md 我可能用其中的glm-4模型, 然后他这里是Batch API。所以看过这个文档之后,你能给个prd吗?
data:image/s3,"s3://crabby-images/26024/26024ffcb6f8cc7bfc489e0afbaa430cdcaeec3f" alt=""
他提供的PRD文档(产品需求文档)有产品背景、目标用户、核心功能需求等等。
data:image/s3,"s3://crabby-images/5617a/5617a4a246083bd33ec4534308306145b69d36ea" alt=""
data:image/s3,"s3://crabby-images/81d7f/81d7fefa918b2a620e99f5c7ce6154af36354d9b" alt=""
让它开始:
data:image/s3,"s3://crabby-images/b9f34/b9f34dc3460d9fe9ef42e078360ddae3c3c0884d" alt=""
它写了两个Python脚本:
-
读取PDF文本 -
将文本内容封装成规定的JSON格式(包含model、messages等字段) -
将这些JSON按行存储在JSONL文件中
data:image/s3,"s3://crabby-images/8236b/8236b922ab0587dee03bc249a3ebbe83e4a7bbb6" alt=""
-
使用client.files.create()上传JSONL文件 -
使用client.batches.create()创建批处理任务
data:image/s3,"s3://crabby-images/d3a5c/d3a5c4ca872ef94b8cf27993419b92913e94c114" alt=""
执行process_papers.py后,在智谱界面也会看到你上传的批处理任务。
data:image/s3,"s3://crabby-images/883c1/883c166c05692c6309f0f75af1ebd9329d5cc424" alt=""
data:image/s3,"s3://crabby-images/3e3ad/3e3ad882ac6934f442f85cae3a90b10bc2057b98" alt=""
[
{
"标题": "论文标题",
"核心主题": "研究主题描述",
"研究方法": "采用的方法论",
"创新点": ["创新点1", "创新点2", ...],
"主要发现": ["发现1", "发现2", ...],
"应用场景": ["场景1", "场景2", ...],
"技术架构": "系统架构描述",
"未来方向": ["方向1", "方向2", ...],
"Agent类型": "Agent的类型分类"
},
// ... 更多论文的分析结果
]
data:image/s3,"s3://crabby-images/a5d48/a5d485f5f4751734ba14678aad23101243911584" alt=""
本次实验传入的是22篇关于Agent应用的最新论文:
data:image/s3,"s3://crabby-images/d19a8/d19a85c7b8c57ec577b701620321b2d7cf887c4f" alt=""
22篇耗时约11分钟。
不过,还是不太满足于现在这个简单的结果格式报告,我们让他继续建立关联分析报告:
data:image/s3,"s3://crabby-images/cc312/cc3124229fe349f924fbc1e1dc20f22843b353f0" alt=""
那么它继续生成了一个关联性分析的脚本:
data:image/s3,"s3://crabby-images/1353b/1353b5d863f1c769518becd266c189e73c33ca1d" alt=""
最终:
data:image/s3,"s3://crabby-images/3d046/3d046c3f20a57f6041a6fb5e0c7bad1edea0e125" alt=""
完整如下:
data:image/s3,"s3://crabby-images/bbacf/bbacff30a28ea1125564f9dc9bf8412e1997f898" alt=""
从这份报告中,我们可以看出以下几个重要趋势:
-
1. 多样化的Agent类型: -
• 基于LLM的代理 -
• 自主语言代理 -
• 合作型代理 -
• 具身智能体
等多种类型,显示了Agent技术的广泛应用 -
2. 应用领域广泛: -
• 社会模拟 -
• 复杂任务解决 -
• 教育 -
• 软件开发 -
• 自动化任务执行
等多个领域 -
3. 技术创新方向: -
• 多代理协作 -
• 语言引导的决策 -
• 自主学习能力 -
• 快慢思考结合
本次完成这些,实际耗时约30min,使用Claude3.5模型(Claude 3.7又双叒因为高频调用被限制访问了,不然可以用它的思维模型的)。
基本上可以说,迭代了3轮:一轮 PRD、一轮批处理脚本、一轮关联分析脚本。
中间还有一轮MCP演示(注意我演示是在Windows上使用Cursor配置MCP的,其中我也去解决了一些在Windows下MCP报错的问题):
Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。
后台回复“高校”获取本期所有源码、教程。
data:image/s3,"s3://crabby-images/71a36/71a36dea5706554d22e1b1866ff42a0e414f61b3" alt=""
最后,智谱的话,他推出过许多免费模型:GLM-4-Flash、GLM-4V-Flash,以前文章也有介绍。
然后这次。智谱BigModel高校X计划,直接所有模型打了5折,挺不错的:
data:image/s3,"s3://crabby-images/59af2/59af2363bf9a028d651b6b24901cc48beb0dc29d" alt=""
扫码下方立即认证 / 点击原文链接:
data:image/s3,"s3://crabby-images/a64fb/a64fb13ec86ee84ec4477c3d9c0e5dd1fdb6b6f7" alt=""
data:image/s3,"s3://crabby-images/d9cee/d9cee628908ed9a5e66b96183e7fdb570cb5090f" alt=""
[1] https://www.bigmodel.cn/console/batch/task
点这里👇关注我,记得标星哦~
(文:AI进修生)