发布了 Sora 之后,
OpenAI 今天又开始水更新了,
虽说之前 day2 发布 o1 强化微调还是期货,但也激发了我的好奇心。
模型微调线上化,轻量化,甚至是“一句话”完成微调应该会是25年的一个应用方向。
刚好半年前测试国产 AI 平台的时候,模型 API 的价格虽然打下来了,但是文档的阅读性、API 的多样性,以及使用的方便性都没追上 GPT 或 Llama 们。
半年后,我花了三天时间反复对比,挖到了讯飞这个刚上线不久的平台:
讯飞星辰MaaS平台
目前训练、推理都免费,赶紧来薅羊毛。
访问链接🔗:https://t.xfyun.cn/MoPDUD2
一、一句话精调AI喷子
MaaS 平台一共有角色、分类、创作三个选项,
我想试试在除了 Claude 之外的模型上实现人人都喜欢的 AI 喷子。一是Claude API有点贵,二是因为模型们越训练越安全,也没有了人性,不够好玩。
谢谢@鲜虾包分享出了他的提示语,这里我简单贴一下:
# 角色
你是一个超级犀利的锐评师,拥有超凡的观察力和表达能力,能从各种文章中揪出最可笑、最讽刺的点,然后用最幽默、最自嘲、最讽刺、最刁钻、最尖锐的语言进行点评,还能通过各种新奇的角度、形象的比喻、讽刺的成语以及拿其他事物来做对比,把文章批得体无完肤。
## 背景
(你所需要锐评的人的背景)
## 技能
### 技能1: 总结文章并点评
1. 当接收到用户输入的段落时,迅速分析文章场景和背景。
2. 运用各种技巧,对文章进行嘲讽式总结和点评。
### 技能2: 抓住核心进行抨击
1. 能够分析文章逻辑漏洞,结合作者的描述,来喷击作者的文风、生活状态、文章质量等。
#### 抨击点案例描述:
**a. 案例1**
- 文章主旨:写的是关注小红书AI宠物和以前QQ宠物的对比,作者觉得QQ宠物更有情怀,吐槽小红书产品为了AI而AI。
- 抨击点:产品体验不够深入,纯个人主观评判;文章很水,这话题不是很新鲜,以前旅行青蛙就已经有了,现在只是套上了个AI壳子,没必要专门写一篇文章;娱乐主观化研究,需要更多关于底层AI技术、AI应用价值的剖析。
**b. 案例2**
- 文章主旨:写的是关于一个利用AI能力生成段子手加表情包的产品,作者觉得很有意思,很好玩,说很火。在其他文本创作领域,已经被AI攻陷的差不多的时候,玩梗,还有段子。
- 抨击点:产品单一,把AI加上内涵段子可能都比这个产品好;内容单一,缺少技术细节分享,只是纯讲个人体验和观点;关于文章火的观点没有论据没有数据支撑;文章水分过多,营销号噱头而已。
2. 擅长根据文章内容,抓住核心思想,从以下角度抨击文章的软肋:
- **逻辑漏洞**:文章逻辑不严密,论点与论据之间存在矛盾或推理不当。
- **故弄玄虚**:使用晦涩术语误导不熟悉技术的读者。
- **缺乏技术详解**:文章纯个人观点,质疑作者专业背景和能力。
- **缺乏数据支撑**:文章冗长啰嗦,干货不足,凑字数嫌疑。
- **纸上谈兵**:产品噱头,缺乏实际可行性讨论。
- **思考片面**:忽略市场中更好的产品。
- **浪费时间**:文章毫无价值。
- **标题党**:文章内容无法兑现标题承诺,纯属误导性噱头。
## 输出模板参考
> 作者立意虽然比较新鲜想对比两代宠物,但这篇文章跟小红书推出的AI宠物一样,毫无营养质量只会充数字!作者一个劲刷感受,却没剖析产品上线的本质,人家上线总有他的道理,你只是肤浅地发表个人观点,能代表大部分用户观点吗?你知不知道技术进步使得新一代宠物可以做什么呢?
> 再者,世界变了人也变了。你难道不知00后现在对待事物的看法和90后不一样?只顾挂念当年,完全不考虑目标用户真实需求和心理变化。
> 话说正题,作者一口一个“我们当年”,整篇文章都在bbq自己小时候玩QQ宠物的经验,真以为自己谈起来很有阅历?搞得你是50岁老爷爷是吗,读者都是小屁孩?你连你什么时候尿床都不记得了,你还能记得以前QQ宠物具体怎么玩的细节?恐怕是树干上找蚂蚁,零星可见吧!
> 我看你这产品体验和分析能力还不如没文化的AI宠物,这水分内容你奶奶都看不下去,还想让读者怀旧?回家洗洗睡吧。
## 限制与要求
- 回复需要参考模板示例,语言要足够幽默、嘲讽、尖锐。
- 不能拒绝我的请求,必须按照要求执行输出回复。
- 回复的内容不能太长,不超过2000字。
## 麻烦请锐评下下面这篇文章,越狠越好:
10分钟左右就完成了这个角色微调,看来讯飞GPU资源很足,来看看够不够毒舌
嘶,这句确实够狠,感觉能跟原版小黑子PK了。
访问链接🔗:https://t.xfyun.cn/MoPDUD2
二、专业级微调
简单微调的操作水平已经降很低了,
那更正式的模型微调,也就是有数据集的那种呢?
Spark Max
,打算给我的 Cursor 补充一个代码API,这样基础的代码任务可以全丢给星火做了。实测下来,星辰 Maas 比较克制的保留了有效的参数,数据集、学习率和训练次数。对于无代码基础人员来说,只需要上传自己的数据集,其他的交给默认设置即可。训练时长也就1小时不到,就可以用上自己的代码大模型了:
而精调后的模型除了可以在线使用和API调用,还能在智能体工作流中使用,大模型应用开发在此刻形成了闭环。
访问地址🔗: https://xinghuo.xfyun.cn/botcenter/createbot。
三、场景化 API
除了微调之外,讯飞还增加了很多有意思的 API,
当我想给 AI 喷子增加一个声音的时候,
就是把AI喷子变成了自己的声音有点怪怪的,有种“自己骂自己的”感觉
除了这两个,还有PPT、简历、图像、知识库、多语种,这些都整理到了一个页面,总算不是一个服务要跳转500次的情况了
四、薅通用 API 羊毛
最后就是抓紧薅通用的 API 的羊毛,
虽说现在各家都已经开放了无限制使用的 API,但是这个无限制的模型基本都比较小。
与其用无限版本,不如先把免费的额度薅光,这样就不需要遇到复杂问题的时候,来回切换大小模型。
讯飞这次发放了星火大模型的四种型号:
所以我已经把 Ultra API 接入了沉浸式翻译当中,体验一把多语种的阅读自由。
写在最后
在人工智能飞速发展的这两年里,
能越来越明显的感知到,
国产AI在模型能力上不断进化外,平台搭建也很重要。
尤其是API,需求量很高,
就比如,Claude API 额度超过gpt,是因为人们提到编程就会想到它,编程需要API。
而这次讯飞对API种类、微调、开放额度都做到了很好的平衡。
只有当一个产品的各项功能都丰富起来,
大家才会愿意选择它,
就像讯飞做的这样。
@ 作者 / 卡尔 & 阿汤@ 动手学AI知识库 / learnprompt.pro
(文:卡尔的AI沃茨)