国内外AI产品推荐榜(2025.1)

2025年AI产品推荐榜


不知不觉,我们的AI产品推荐榜,已经来到了第9期。

这期,除了继续给大家介绍新入榜的AI和推荐1月的AI外,还新增了年度AI产品推荐榜。每个领域,只选一款AI进行推荐(区分国服和海外服)。


以下是完整榜单。

有朋友可能会问:为什么ChatGPT、Runway、文心等没有上榜?


因为,在单选条件下,我选了个人去年用得最多的AI产品,精简到16个常用领域,共22款AI。可能会有遗漏,与你的预期不符,此榜单仅供参考。

另,本榜单不含任何充值。


AI产品推荐榜(2025.1)

所谓推荐,即代表可以直接上手使用,而非期货、内测版。


本期推荐榜,涉及大模型应用、API部署模型、世界模型、AI绘图、AI图片处理、AI视频、AI搜索、AI音乐、AI会议、AI写作、AI编程、Agent开发、智能体、数字人、声音克隆、AI办公、AI浏览器、系统级AI、AI翻译、AI导航网站、AI社交、AI财经、AI医疗、AI游戏、AI PPT等25个场景,国内外共127款AI。


推荐榜,分为国外、国内版。国外版,大部分需要魔法,付费居多。国内版,直接使用,免费为主(部分AI已开始收费)。

阅读提示:
1)加粗,为重点推荐产品。
2)标红为新产品(含新AI和新功能)。

入榜新AI

本月入榜新AI产品(红字部分),迎来不少变化。进入年底,各家养精蓄锐,纷纷推陈出新。以下是详细情况。


1、百度AI搜

新年第一天,百度上线「AI搜」功能,具备AI搜索、灵感探索、智能体对话、AI创作(图创/文创/AI阅读)等功能。灵感探索和智能体回答是其亮点,详见测评文

体验地址:chat.baidu.com

2、智谱Zero推理模型

2024年最后一天,智谱上线推理模型——GLM Zero预览版。实测来看,GLM Zero预览版在数理计算和逻辑推理方面,完全不输o1、R1、K0等模型。另外,在写代码方面也表现优秀,可用于信息交互设计。

比如,让静态图下雪(演示过程)。


体验地址:https://chatglm.cn

3、Kimi视觉思考版

12月16日,Kimi推出K1视觉推理模型,将Kimi数学版升级成了Kimi视觉思考版。不仅具备数理化计算、逻辑推理,还具备图像理解和思考能力。即使是有“噪声”场景,也能识别和推理。

体验路径:

https://kimi.moonshot.cn/kimiplus/crm40ee9e5jvhsn7ptcg

4、天工o1、4o

1月6日,天工AI发布「天工大模型4.0」,并同步上线天工o1版和4o版,不限次数,免费使用。国产AI,全面追上OpenAI。

体验地址:https://www.tiangong.cn

5、DeepSeek-V3

12月26日,DeepSeek发布新模型DeepSeek-V3,并上线web端,同时开源。DeepSeek-V3参数为671B,多项评测成绩超越Qwen2.5和Llama-3.1等开源模型,并在性能上和世界顶尖闭源模型4o以及Claude-3.5-Sonnet不分伯仲。

最近,我一直在用DeepSeek辅助写作,确实有点Claude-3.5-Sonnet的味道了。

体验地址:https://chat.deepseek.com

模型下载:

https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

6、豆包视觉模型

12月18日,豆包发布视觉理解模型,拥有视觉识别、理解和推理能力,可进行复杂计算,如图表分析、代码处理、专业问题解答等。

体验渠道:豆包PC和APP

此外,还发布了2款全新模型:veOmniverse物理世界模型+豆包3D生成模型。


7、扣子1.5

同一天,火山引擎还发布了扣子1.5版本。扣子1.5支持GUI搭建界面,并一键发布成小程序、H5、API 等多种应用形态。

体验网址:https://www.coze.cn

8、可灵1.6

12月19日,可灵1.6模型上线,在文本响应、画面美感和运动合理性方面有显著提升。从身边大量视频创作者跑的Case来看,可灵1.6较1.5有大幅提升,进入全球第一梯队。

提示词:这是一个城市末日废墟的场景,色调偏暗,以灰色和棕色为主,营造出一种荒凉、破败的氛围。画面中央是一条笔直的公路,一辆跑车在道路上高速行驶,道路两侧是残破的建筑、废弃的车辆和垃圾、碎片,远处有几栋高耸入云的大楼,天空被厚重的云层覆盖,光线昏暗。

体验地址:https://klingai.kuaishou.com

9、PixVerse V3.5

12月30日,PixVerse V3.5版上线。基础模型大更新,在语义理解、运动稳定性和细节表现方面有大幅升级。新增首尾帧、V2V(视频生视频)功能。生成速度特别快(全球第一),10s即可生成一支5s视频。

体验地址:https://app.pixverse.ai

10、海螺Audio

12月上旬,海螺海外版内测上线声音克隆功能,只需要30s即可克隆任何人的声音,支持12种语言。因监管问题,该功能目前仅在海外上线。

体验地址(需要魔法):

https://www.hailuo.ai/audio

11、支付宝“探一下”

12月30日,支付宝推出新功能「探一下」,能够“用AI之眼探索万物”,提供快速、有用、趣味的视觉搜索服务,可以探知识、探灵感、探文本。

体验路径:支付宝“扫一扫”界面或支小宝App。

12、理想同学

造车新势力来搞AI了。12月25日,「理想同学」上架苹果APP Store,支持知识问答、英文翻译与生成、视觉感知等功能。


13、CodeElo

CodeElo由Qwen团队推出,专门用于评估LLM编程能力的基准测试,通过与人类程序员的Elo评级系统进行比较,来衡量LLM的编程水平。

体验地址:https://codeelo-bench.github.io/

14、YouMind

前阿里前端第一人玉伯,离开蚂蚁、飞书后创办AI公司思维天空,于12月6日推出YouMind,一款服务全球创作者的AI工具。YouMind提供网页总结、翻译、ChatBot对话等功能,支持用户将任何模态的内容进行收藏、分类。

内测地址:youmind.ai

15、o3

12月21日,OpenAI在12天直播的最后一天,发布新一代推理模型o3,预计春节左右上线。在某些条件下,o3模型表现接近于AGI。


在ARC-AGI基准测试中得分87.5%,远超人类水平;在AIME数学竞赛中,得分96.7%,几乎满分;在Elo评分中拿到2727分,超过99.99%的人类程序员。

o3模型代表AI正式进入了博士级水平,详细分析见这篇文章

16、Gemini 2.0

12月12日,谷歌发布新模型Gemini 2.0。Gemini 2.0 flash是2.0家族的第一个模型,以多模态和Agent技术为核心,速度比1.5 Pro快两倍,性能全面超1.5 Pro。


新模型支持原生工具调用和实时音视频流输入,提供文本、音频和图像的集成响应,具备多语言音频输出能力。

项目介绍:

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/

17、LIama 3.3

12月6日,Meta开源最新模型Lama 3.3,参数量70B,性能与40B参数Llama3.1相当。Llama 3.3在多个行业基准测试中超越了Gemini 1.5 Pro、GPT-4o以及Nova Pro,在数学、常识、指令遵循和应用使用等领域带来大幅提升。

模型链接:

https://www.modelscope.cn/models/LLM-Research/Llama-3.3-70B-Instruct

18、Meta Motivo

12月,Meta推出Meta Motivo模型,希望打造更逼真的元宇宙体验。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。

项目官网:

https://metamotivo.metademolab.com

19、Sora

在鸽了近1年后,12月10日,Sora终于上线了。支持文生、图生以及V2V(视频生视频),最长时长20s,最高画质1080P。

从实测Case来看,Sora有一些自己的“新花样”,比如Storyboard、Re-Cut、Loop、Remix、Blend等剪辑工具和特效,但模型能力够不上第一梯队。相较可灵1.6、Veo 2还有差距。

体验地址:sora.com

20、Veo 2

年末,谷歌贴OpenAI脸开大,推出AI视频产品Veo 2,支持文生、图生(基于自家IMAGE3平台),最高4k分辨率、8s视频。


从实测Case来看,Veo 2在光影、镜头、运动、质感、语义遵循方面的表现非常优秀,超过Sora、Gen3以及luma等知名模型,接近可灵1.6。

提示词:镜头运动炫酷 + 在一座失重颠倒的城市中,巨大的旋转阶梯向天空无限延伸,身穿水手服的高中女生们以惊险的跑酷动作追逐跳跃,身体灵活旋转穿梭于高低不定的阶梯间,动作流畅自然,裙摆飞扬,细节真实,风力带动发丝飘动 + 描述真实感,好莱坞大片电影感。光线的微妙变化,灭世火焰从天际坠落,乌云映照着燃烧的火红光线,阴郁而紧张,增强了真实感和运动感,超现实摄影风格,真实的光影效果,色调灰暗神秘,hyper quality,high detail,好莱坞电影感 + 整座城市不断折叠旋转,建筑碎裂塌陷,天空云层扭曲翻滚,火光与尘埃交织,环境动感十足。 

体验网址:

https://deepmind.google/technologies/veo/veo-2

21、Apollo

Apollo是Meta联合斯坦福大学推出的大型多模态模型(LMMs),专注于视频理解。现在,AI也能“看懂”视频了。

项目官网:https://apollo-lmms.github.io

22、Cursor

Cursor是Anysphere公司推出的AI代码编辑器,基于ChatGPT、Claude等LLM,支持Python、Java、C#、Javascript等多语言,通过快捷键操作,提供代码自动生成、编辑、补全、优化、解释等功能。

12月,Cursor在程序员圈蹿红,很多程序员正在用Cursor平替VS Code。

体验地址:https://www.cursor.com

国产AI推荐


1、大模型应用
主要推荐:
1)豆包。依托字节资源,豆包用户正在快速增长中。目前,APP端下载量和月活排全国第一。12月,新增P图、写字和视觉理解模型。

体验网址:https://www.doubao.com
2)Kimi。定位生产力工具,擅长总结、搜索。目前,Web端月活排全国第一。近期,新增Kimi探索版、MV创作、视觉思考版等功能。
体验网址:kimi.moonshot.cn

3)智谱清言。智谱产品矩阵日益丰富,已陆续在文本、图片、视频、音频等多模态生态上建立起全家桶产品。12月,新增推理模型GLM-Zero预览版。而且,智谱一直走在开源的路上。

体验网址:https://chatglm.cn


4)DeepSeek。根据今日最新测评基准,DeepSeek V3进入全球前三,与Claude 3.5 Sonnet、GPT-4o不相伯仲。
最近,我一直在用它辅助我写作。唯一缺点就是功能比较单一,只能聊天。

体验路径:https://chat.deepseek.com
2、API部署、开源模型
今年,国产大模型大打价格战,多家厂商推出了免费或极低价的API模型。如Deepseek、GLM、Qwen、文心、豆包、讯飞、混元等。

主要推荐:
1)Deepseek。由幻方量化旗下深度求索公司研发,性能直追OpenAI,价格低到离谱,被称为AI届拼多多。
V3模型下载地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3-Base
2)GLM。智谱一直走在开源的路上,先后开源了多个模型。比如其最新多模态模型GLM-4V-Flash,同样开源。
体验中心:
https://www.bigmodel.cn/console/trialcenter

3、AI绘图

主要推荐:


1)Whee。Whee是美图推出的AI素材生成器,支持文生图和图生图。提供AI改图、风格模型训练、AI修复、AI扩图、AI消除、AI模特图以及提示词库训练等丰富功能。

体验地址:www.whee.com

2)即梦,字节剪映出品,国产AI绘图工具。提供多个生图模型供用户选择,新上线图片2.1模型,支持文字生成,以及动态海报(测评文)。

图由即梦AI生成。提示词:实景拍摄,在一栋写字楼上印“沃垠AI”4个字。

体验网址:dreamina.jianying.com

3)LiblibAI。哩布哩布是奇点星宇推出的AI绘图创作平台,支持SD图片生成、模型上传与分享、ComfyUI工作流以及LoRA训练等功能。
12月,Liblib联合星流推出新一代图像模型Star-3 Alpha,在图像精准度、色彩表现力、美学表达等方面有新的提升,高级感满满。
体验网址:www.liblib.art/
4、AI视频
主要推荐:

1)可灵1.6。经过数月迭代,最新的可灵1.6当之无愧全球No.1。支持文生、图生(首尾帧)、对口型、运动笔刷、人脸模型训练、API调用等功能。

使用网址:klingai.kuaishou.com
2)海螺AI。支持文生、图生、I2V,泛化能力强,想象力丰富,在海外很火。
体验链接:hailuoai.com

3)混元视频。由腾讯混元团队出品,目前仅支持文生,在指令遵循、镜头语言、画面和动态稳定性上表现较好(测评文)。

我用混元视频做了一首诗的视频版。

体验链接:https://video.hunyuan.tencent.com
4)PixVerse V3.5。基模更新,在语义理解、运动稳定性和细节表现方面大幅优化,新增首尾帧、V2V功能。生成速度全球第一快,10s即可生成一支5s视频。

体验地址:https://app.pixverse.ai


5、AI搜索
主要推荐:
1)天工AI搜索。主要定位AI搜索,支持一键生成内容大纲、思维导图、表格、PPT等。2024年11月,上线高级搜索、深度解析功能;2025年1月,上线天工o1、4o版,免费不限量。
使用网址:www.tiangong.cn

2)夸克。不仅是AI浏览器,还是系统级AI,可随时随处在电脑里唤起夸克AI,年轻用户特别多。

下载地址:www.quark.cn
3)百度“AI搜”。无广告,百度专为AI搜索打造(测评文),提供AI搜索、灵感探索、智能体回答、AI创作等功能。

体验网址:kimi.moonshot.cn
4)文小言APP。24年下半年,百度将文小言切换到搜索赛道,而非AI ChatBots,定位新搜索(测评文),提供搜、创、聊的新搜索。


6、AI会议
主要推荐:

1)百度网盘。听记功能,可一键整理各类音频,提供多种会议模板供用户选择。近期上线会议助手功能,可随时让助手参会。

体验地址:

https://pan.baidu.com/embed/listennote

2)通义“效率”工具。通义效率板块的“实时记录”助手,可辅助大家进行会议记录,会议音频整理,学习视频整理。

体验网址:
https://tongyi.aliyun.com/efficiency

7、AI音乐
主要推荐:豆包,生成时长支持3分钟。

8、Agent开发平台
主要推荐:扣子。简单易用、好上手,已支持豆包、moonshot、通义、MiniMax等模型,可发布到豆包、飞书、企微、公众号、掘金社区等平台。

使用网址:www.coze.cn

9、智能体

这里的智能体,更倾向于智能实体,而非通过Agent平台搭建的智能应用。能推荐的智能体并不多,目前只有3款:Claude推出的Computer use和智谱推出的AutoGLM家族以及荣耀Magic手机

这3个产品,目前都还有不少缺陷,但总算在真正的智能化方面迈出了第一步。

10、AI写作


主要推荐:ima copilot。由腾讯推出的AI智能工作台,可以搜索微信公众号、B站等平台,对其内容进行笔记记录,整理成知识库,支持即时编辑、扩写、润色。

下载网址:https://ima.qq.com/

11、AI编程
主要推荐:CodeQwen,由阿里推出的智能编程工具,已开源,拥有7B参数,支持92种编程语言,支持64K上下文。
代码网址:
https://modelscope.cn/models/qwen/CodeQwen1.5-7B-Chat/summary
12、AI办公
主要推荐:钉钉AI和飞书。2家公司均已在自家产品里全面接入了AI。

13、AI浏览器


主要推荐:夸克不仅是AI浏览器,还是系统级AI,可以随时随处在电脑里唤起夸克AI。

支持一键AI搜索、写作、PPT生成、视频总结、文件总结、截屏搜、划词搜等功能。

下载链接:quark.cn

14、AI PPT
主要推荐:Kimi PPT助手、AiPPT、百度文库、讯飞智文、腾讯文档清言PPT

关于AI PPT的使用攻略:一次性给大家讲透了,特别适合小白

15、AI财经

主要推荐:Reportify。查研报、读财报、解析财报非常方便,特别适合投资人士使用。

体验链接:https://reportify.cc


16、AI翻译


主要推荐:「Marco」。由阿里国际推出,支持全球15种主流语种,提供基于语境的精准翻译,面向全球用户开放使用。

体验地址:www.aidc-ai.com


17、AI医疗


主要推荐:紫荆AI医生,由清华团队研发,12月刚上线42位AI医生,目前处于内测期。

体验链接:
https://www.tairex.cn/agent-hospital

论文链接:
https://arxiv.org/pdf/2405.02957v1


18、AI产品网站


主要推荐:AI工具集。汇集了几乎市面上所有的AI产品,分类清晰、产品丰富,可随时查找需要的AI。

体验网址:ai-bot.cn


国外AI推荐


1、通用大模型
主要推荐:
1)GPT-4o、o1、o3

9月13日,OpenAI发布推理模型o1(mini、preview);12月5日,o1满血版上线;12月21日,OpenAI发布下一代模型o3。

o系列模型在推理能力上显著提升,进入博士级水平,我们离AGI越来越近了。

使用网址:www.chatgpt.com
2)Claude 3.5 Sonnet

作为OpenAI最强的竞争对手Anthropic,Claude 3.5 Sonnet在文本生成上表现非常优秀,超过4o。可视化功能Artifacts,特别好用。

使用路径:Claude.ai


3)Gemini 2.0。年末谷歌放大,推出Gemini 2.0模型,以多模态和Agent技术为核心,速度比1.5 Pro快两倍,性能全面超1.5 Pro。


2、API部署模型

主要推荐:Llama3.3。12月6日,Meta开源新模型Lama 3.3,参数量70B。在多个行业基准测试中超越了Gemini 1.5 Pro、GPT-4o以及Nova Pro。

模型下载链接:
https://www.modelscope.cn/models/LLM-Research/Llama-3.3-70B-Instruct

3、世界模型

主要推荐:李飞飞团队打造的“空间智能”模型,只需要一张图,就可以生成一个逼真的3D世界。

产品详情:

https://www.worldlabs.ai/blog

4、系统级AI
主要推荐:Copilot

9月,Copilot更新,开启Web+Work+Pages的工作流。推出Copilot Pages、办公全家桶以及Copilot智能体等产品。

5、AI绘图
主要推荐:
1)Midjourney。7月31日,更新到了V6.1版,30美刀/月。每1版都在进化,出图质量较高。

8月22日,Midjourney向所有用户开放了网页版。每个新用户,每天有25次免费的机会。

使用网址:www.midjourney.com
2)Recaft V3。11月,在人类盲选测试中打败Flux、Midjourney、Stable Diffusion等顶尖模型(测评文)。擅长长文字生成,对肢体完整度进一步优化,支持自由画布。
体验地址:https://www.recraft.ai
3)Flux。一款开源的生图模型,由前SD团队研发。拥有120亿参数,在视觉质量、图像细节和输出多样性方面展现了卓越的性能。

产品网址:
https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
4)Comfy。类似国内liblib,基于SD模型为用户提供模块化和节点化的工作流程设计。10月底,Comfy发布了桌面版。

内测地址:https://www.comfy.org/waitlist
6、AI视频
主要推荐:
1)Veo 2。谷歌出品,支持文生、图生,最高4k分辨率、8s视频,在光影、镜头、运动、质感、语义遵循等方面表现优秀,超过Sora、Gen3以及luma等知名模型。

体验网址:

https://deepmind.google/technologies/veo/veo-2


2)Gen 3,由Runway于6月29日推出,支持10s视频生成,电影质感,光影细节丰富。

8月,Gen3上线图生视频功能。允许用户以任何图片为起点生成最长11秒的视频。9月,上线对口型、视频转绘功能。10月,上线Act-One功能。11月,上线3D运镜控件

体验网址:

https://app.runwayml.com/login

3)Sora。12月10日,Sora正式上线。支持文生、图生以及V2V(视频生视频),最长时长20s,最高画质1080P。
体验地址:www.sora.com

7、Agent开发平台
主要推荐:
1)Coze国际版,字节出品,依托ChatGPT,可轻松创建AI智能体。
使用网址:www.coze.com
2)GPTs,ChatGPT官方智能体创建器,可根据GPT3.5/4.0/4o创建个人智能体。
8、AI搜索
主要推荐:Perplexity,新型对话式AI搜索的鼻祖,需科学上网。11月19日,Perplexity上线了“Buy with Pro”功能,与电商进行有机结合。

使用网址:www.perplexity.ai
此外,Felo、New Bing、SearchGPT等产品也值得一试。比如felo,可搜小红书、Reddit等封闭平台,还支持多模型调用。

9、数字人
主要推荐:HeyGen,收费,49~150美刀/月。用户只需输入脚本,即可在几分钟内生成用于营销、沟通、销售、学习等的视频。
HeyGen支持使用AI语音和口型同步为视频添加175种语言和地方方言,提供更加沉浸的体验。
使用网址:demo.heygen.com

10、声音克隆

主要推荐:海螺Audio。只需要30s,即可克隆任何人的声音,支持12种语言。该功能,目前仅在海外上线(需要魔法)。

体验地址:

https://www.hailuo.ai/audio


11、AI音乐
主要推荐:Suno 4,可一键写歌(先通过其他AI完成歌词创作),需要科学上网,目前免费。

目前,Suno升级到了5版,可生成最长4分钟歌曲,在音频质量、歌词创作和音乐结构等方面有显著提升。
使用网址:suno.com
12、AI写作
主要推荐:
1)Napkin。一款AI写作辅助工具,由前谷歌成员创立。

Napkin能够将文字以若干种结构图可视化,包括但不限于流程图、图表、树状图、棱锥图、矩阵图、结构图和维恩图

体验网址:

https://app.napkin.ai/signin

2)AI Scientist

由前谷歌研究员推出的一款新模型AI Scientist,自称全球首个全自动化科学研究AI系统,能实现从构思到撰写论文和同行评审的整个科学过程。

用户只要提供一个想法,就能够生成一篇论文,而论文成本不到15美元。相关研究于8月12日发布在预印平台arXiv上。

开源地址:http://github.com/SakanaAI/AI-Scientist

论文链接:https://arxiv.org/abs/2408.06292


13、AI医药
主要推荐:AlphaFold 3,谷歌DeepMind出品,可准确预测蛋白质、DNA、RNA以及配体等生命分子的结构。

10月,AlphaFold开发者获得诺贝尔化学奖。11月,谷歌将这个模型进行开源,造福人类。

模型网址:
https://golgi.sandbox.google.com/about
14、AI PPT
主要推荐:Gamma,不需科学上网,可用QQ邮箱注册,排版、配图质量较高,AI PPT的天花板。付费,个人版10美刀/月。

网址:https://gamma.app

15、AI编程

主要推荐:Cursor。基于ChatGPT、Claude等LLM,支持Python、Java、C#、Javascript等多语言,提供代码自动生成、编辑、补全、优化、解释等功能。
体验地址:https://www.cursor.com

16、AI游戏
主要推荐:Oasis。由两家初创公司Etched、Decart AI联合开发,推出世界上首个实时生成的AI游戏「Oasis」。

你在其中体验到的每一帧都来自扩散模型的实时预测,游戏画面持续以20帧每秒的速度实时渲染,零延迟。

体验地址:

https://oasis-model.github.io/

往期榜单:

AI产品推荐榜(2024.12)

AI产品推荐榜单(2024.11)

AI产品推荐榜单(2024.10)

AI产品推荐榜单(2024.9)

AI产品推荐榜单(2024.8)

AI产品推荐榜单(2024.7)

AI产品推荐榜单(2024.6)

AI产品推荐榜单(2024.5)

(文:沃垠AI)

欢迎分享

发表评论