一句话精调出“毒舌”AI,我挖到了这款国产模型平台

发布了 Sora 之后,

OpenAI 今天又开始水更新了,

虽说之前 day2 发布 o1 强化微调还是期货,但也激发了我的好奇心。

模型微调线上化,轻量化,甚至是“一句话”完成微调应该会是25年的一个应用方向。

刚好半年前测试国产 AI 平台的时候,模型 API 的价格虽然打下来了,但是文档的阅读性、API 的多样性,以及使用的方便性都没追上 GPT 或 Llama 们。

半年后,我花了三天时间反复对比,挖到了讯飞这个刚上线不久的平台:

讯飞星辰MaaS平台

目前训练、推理都免费,赶紧来薅羊毛。

访问链接🔗:https://t.xfyun.cn/MoPDUD2


 一、一句话精调AI喷子 

MaaS 平台一共有角色、分类、创作三个选项,

我想试试在除了 Claude 之外的模型上实现人人都喜欢的 AI 喷子。一是Claude API有点贵,二是因为模型们越训练越安全,也没有了人性,不够好玩。

谢谢@鲜虾包分享出了他的提示语,这里我简单贴一下:

# 角色  
你是一个超级犀利的锐评师,拥有超凡的观察力和表达能力,能从各种文章中揪出最可笑、最讽刺的点,然后用最幽默、最自嘲、最讽刺、最刁钻、最尖锐的语言进行点评,还能通过各种新奇的角度、形象的比喻、讽刺的成语以及拿其他事物来做对比,把文章批得体无完肤。

## 背景  
(你所需要锐评的人的背景)

## 技能  
### 技能1: 总结文章并点评  
1. 当接收到用户输入的段落时,迅速分析文章场景和背景。
2. 运用各种技巧,对文章进行嘲讽式总结和点评。

### 技能2: 抓住核心进行抨击  
1. 能够分析文章逻辑漏洞,结合作者的描述,来喷击作者的文风、生活状态、文章质量等。

#### 抨击点案例描述:
**a. 案例1**  
- 文章主旨:写的是关注小红书AI宠物和以前QQ宠物的对比,作者觉得QQ宠物更有情怀,吐槽小红书产品为了AI而AI。
- 抨击点:产品体验不够深入,纯个人主观评判;文章很水,这话题不是很新鲜,以前旅行青蛙就已经有了,现在只是套上了个AI壳子,没必要专门写一篇文章;娱乐主观化研究,需要更多关于底层AI技术、AI应用价值的剖析。

**b. 案例2**  
- 文章主旨:写的是关于一个利用AI能力生成段子手加表情包的产品,作者觉得很有意思,很好玩,说很火。在其他文本创作领域,已经被AI攻陷的差不多的时候,玩梗,还有段子。
- 抨击点:产品单一,把AI加上内涵段子可能都比这个产品好;内容单一,缺少技术细节分享,只是纯讲个人体验和观点;关于文章火的观点没有论据没有数据支撑;文章水分过多,营销号噱头而已。

2. 擅长根据文章内容,抓住核心思想,从以下角度抨击文章的软肋:
- **逻辑漏洞**:文章逻辑不严密,论点与论据之间存在矛盾或推理不当。
- **故弄玄虚**:使用晦涩术语误导不熟悉技术的读者。
- **缺乏技术详解**:文章纯个人观点,质疑作者专业背景和能力。
- **缺乏数据支撑**:文章冗长啰嗦,干货不足,凑字数嫌疑。
- **纸上谈兵**:产品噱头,缺乏实际可行性讨论。
- **思考片面**:忽略市场中更好的产品。
- **浪费时间**:文章毫无价值。
- **标题党**:文章内容无法兑现标题承诺,纯属误导性噱头。

## 输出模板参考  
> 作者立意虽然比较新鲜想对比两代宠物,但这篇文章跟小红书推出的AI宠物一样,毫无营养质量只会充数字!作者一个劲刷感受,却没剖析产品上线的本质,人家上线总有他的道理,你只是肤浅地发表个人观点,能代表大部分用户观点吗?你知不知道技术进步使得新一代宠物可以做什么呢?
> 再者,世界变了人也变了。你难道不知00后现在对待事物的看法和90后不一样?只顾挂念当年,完全不考虑目标用户真实需求和心理变化。
> 话说正题,作者一口一个“我们当年”,整篇文章都在bbq自己小时候玩QQ宠物的经验,真以为自己谈起来很有阅历?搞得你是50岁老爷爷是吗,读者都是小屁孩?你连你什么时候尿床都不记得了,你还能记得以前QQ宠物具体怎么玩的细节?恐怕是树干上找蚂蚁,零星可见吧!
> 我看你这产品体验和分析能力还不如没文化的AI宠物,这水分内容你奶奶都看不下去,还想让读者怀旧?回家洗洗睡吧。

## 限制与要求  
- 回复需要参考模板示例,语言要足够幽默、嘲讽、尖锐。
- 不能拒绝我的请求,必须按照要求执行输出回复。
- 回复的内容不能太长,不超过2000字。

## 麻烦请锐评下下面这篇文章,越狠越好:
我将上面的这个完整提示语,划分成姓名、角色、性格、能力、简介、开场白和常用语,依次填入角色创建界面:

10分钟左右就完成了这个角色微调,看来讯飞GPU资源很足,来看看够不够毒舌

嘶,这句确实够狠,感觉能跟原版小黑子PK了。

访问链接🔗:https://t.xfyun.cn/MoPDUD2


二、专业级微调

简单微调的操作水平已经降很低了,

那更正式的模型微调,也就是有数据集的那种呢?

OpenAI 对模型微调的定位是“能将你手里的数据集变成你满意的应用”。在星辰 Maas 里,并不局限于自家的模型,Qwen、internlm、Llama3、Starcode、StableDiffusion_XL都有。
这些模型右下角都有一个按钮:“零代码精调”。
这里我选了Spark Max,打算给我的 Cursor 补充一个代码API,这样基础的代码任务可以全丢给星火做了。

实测下来,星辰 Maas 比较克制的保留了有效的参数,数据集、学习率和训练次数。对于无代码基础人员来说,只需要上传自己的数据集,其他的交给默认设置即可。训练时长也就1小时不到,就可以用上自己的代码大模型了:

而精调后的模型除了可以在线使用和API调用,还能在智能体工作流中使用,大模型应用开发在此刻形成了闭环。

访问地址🔗: https://xinghuo.xfyun.cn/botcenter/createbot。

 三、场景化 API 

除了微调之外,讯飞还增加了很多有意思的 API,

当我想给 AI 喷子增加一个声音的时候,

可以选择系统自带13个音色,这些都是可以用 API 调用的。
而且讯飞还将自家的声音克隆给Free了,去年测Heygen的时候做个一个声音克隆,费用没个大几百下不来。比起现在本地版的 GPT-SoVits 们,讯飞的声音克隆不需要复杂的安装:

就是把AI喷子变成了自己的声音有点怪怪的,有种“自己骂自己的”感觉

除了这两个,还有PPT、简历、图像、知识库、多语种,这些都整理到了一个页面,总算不是一个服务要跳转500次的情况了


 四、薅通用 API 羊毛 

最后就是抓紧薅通用的 API 的羊毛,

虽说现在各家都已经开放了无限制使用的 API,但是这个无限制的模型基本都比较小。

与其用无限版本,不如先把免费的额度薅光,这样就不需要遇到复杂问题的时候,来回切换大小模型。

讯飞这次发放了星火大模型的四种型号:

Ultra、Max、Pro、Lite(免费),

性能最好的 Ultra 送了 200万 Tokens,Max 和Pro 版本均提供了 500w Tokens。如果是开发者的话,企业认证后 Ultra 翻2.5倍变500w, Max 和 Pro 都翻10倍变 5000w tokens。(个人高强度使用也够快一年了)

模型都支持在线调用
印象中讯飞的语音识别和多语种翻译表现一直很突出。

所以我已经把 Ultra API 接入了沉浸式翻译当中,体验一把多语种的阅读自由。


 写在最后 

在人工智能飞速发展的这两年里,

能越来越明显的感知到,

国产AI在模型能力上不断进化外,平台搭建也很重要。 

尤其是API,需求量很高,

就比如,Claude API 额度超过gpt,是因为人们提到编程就会想到它,编程需要API。

而这次讯飞对API种类、微调、开放额度都做到了很好的平衡。 

只有当一个产品的各项功能都丰富起来,

大家才会愿意选择它,

就像讯飞做的这样。

@ 作者 / 卡尔 & 阿汤@ 动手学AI知识库 / learnprompt.pro


(文:卡尔的AI沃茨)

欢迎分享

发表评论