2025年AI产品推荐榜
不知不觉,我们的AI产品推荐榜,已经来到了第9期。
这期,除了继续给大家介绍新入榜的AI和推荐1月的AI外,还新增了年度AI产品推荐榜。每个领域,只选一款AI进行推荐(区分国服和海外服)。
有朋友可能会问:为什么ChatGPT、Runway、文心等没有上榜?
因为,在单选条件下,我选了个人去年用得最多的AI产品,精简到16个常用领域,共22款AI。可能会有遗漏,与你的预期不符,此榜单仅供参考。
所谓推荐,即代表可以直接上手使用,而非期货、内测版。
本期推荐榜,涉及大模型应用、API部署模型、世界模型、AI绘图、AI图片处理、AI视频、AI搜索、AI音乐、AI会议、AI写作、AI编程、Agent开发、智能体、数字人、声音克隆、AI办公、AI浏览器、系统级AI、AI翻译、AI导航网站、AI社交、AI财经、AI医疗、AI游戏、AI PPT等25个场景,国内外共127款AI。
推荐榜,分为国外、国内版。国外版,大部分需要魔法,付费居多。国内版,直接使用,免费为主(部分AI已开始收费)。
本月入榜新AI产品(红字部分),迎来不少变化。进入年底,各家养精蓄锐,纷纷推陈出新。以下是详细情况。
1、百度AI搜
新年第一天,百度上线「AI搜」功能,具备AI搜索、灵感探索、智能体对话、AI创作(图创/文创/AI阅读)等功能。灵感探索和智能体回答是其亮点,详见测评文。
体验地址:chat.baidu.com
2、智谱Zero推理模型
2024年最后一天,智谱上线推理模型——GLM Zero预览版。实测来看,GLM Zero预览版在数理计算和逻辑推理方面,完全不输o1、R1、K0等模型。另外,在写代码方面也表现优秀,可用于信息交互设计。
比如,让静态图下雪(演示过程)。
3、Kimi视觉思考版
12月16日,Kimi推出K1视觉推理模型,将Kimi数学版升级成了Kimi视觉思考版。不仅具备数理化计算、逻辑推理,还具备图像理解和思考能力。即使是有“噪声”场景,也能识别和推理。
体验路径:
https://kimi.moonshot.cn/kimiplus/crm40ee9e5jvhsn7ptcg
4、天工o1、4o
1月6日,天工AI发布「天工大模型4.0」,并同步上线天工o1版和4o版,不限次数,免费使用。国产AI,全面追上OpenAI。
体验地址:https://www.tiangong.cn
5、DeepSeek-V3
12月26日,DeepSeek发布新模型DeepSeek-V3,并上线web端,同时开源。DeepSeek-V3参数为671B,多项评测成绩超越Qwen2.5和Llama-3.1等开源模型,并在性能上和世界顶尖闭源模型4o以及Claude-3.5-Sonnet不分伯仲。
最近,我一直在用DeepSeek辅助写作,确实有点Claude-3.5-Sonnet的味道了。
体验地址:https://chat.deepseek.com
模型下载:
https://huggingface.co/deepseek-ai/DeepSeek-V3-Base
6、豆包视觉模型
12月18日,豆包发布视觉理解模型,拥有视觉识别、理解和推理能力,可进行复杂计算,如图表分析、代码处理、专业问题解答等。
体验渠道:豆包PC和APP
此外,还发布了2款全新模型:veOmniverse物理世界模型+豆包3D生成模型。
7、扣子1.5
同一天,火山引擎还发布了扣子1.5版本。扣子1.5支持GUI搭建界面,并一键发布成小程序、H5、API 等多种应用形态。
体验网址:https://www.coze.cn
8、可灵1.6
12月19日,可灵1.6模型上线,在文本响应、画面美感和运动合理性方面有显著提升。从身边大量视频创作者跑的Case来看,可灵1.6较1.5有大幅提升,进入全球第一梯队。
提示词:这是一个城市末日废墟的场景,色调偏暗,以灰色和棕色为主,营造出一种荒凉、破败的氛围。画面中央是一条笔直的公路,一辆跑车在道路上高速行驶,道路两侧是残破的建筑、废弃的车辆和垃圾、碎片,远处有几栋高耸入云的大楼,天空被厚重的云层覆盖,光线昏暗。
体验地址:https://klingai.kuaishou.com
9、PixVerse V3.5
12月30日,PixVerse V3.5版上线。基础模型大更新,在语义理解、运动稳定性和细节表现方面有大幅升级。新增首尾帧、V2V(视频生视频)功能。生成速度特别快(全球第一),10s即可生成一支5s视频。
体验地址:https://app.pixverse.ai
10、海螺Audio
12月上旬,海螺海外版内测上线声音克隆功能,只需要30s即可克隆任何人的声音,支持12种语言。因监管问题,该功能目前仅在海外上线。
体验地址(需要魔法):
https://www.hailuo.ai/audio
11、支付宝“探一下”
12月30日,支付宝推出新功能「探一下」,能够“用AI之眼探索万物”,提供快速、有用、趣味的视觉搜索服务,可以探知识、探灵感、探文本。
体验路径:支付宝“扫一扫”界面或支小宝App。
12、理想同学
造车新势力来搞AI了。12月25日,「理想同学」上架苹果APP Store,支持知识问答、英文翻译与生成、视觉感知等功能。
13、CodeElo
CodeElo由Qwen团队推出,专门用于评估LLM编程能力的基准测试,通过与人类程序员的Elo评级系统进行比较,来衡量LLM的编程水平。
体验地址:https://codeelo-bench.github.io/
14、YouMind
前阿里前端第一人玉伯,离开蚂蚁、飞书后创办AI公司思维天空,于12月6日推出YouMind,一款服务全球创作者的AI工具。YouMind提供网页总结、翻译、ChatBot对话等功能,支持用户将任何模态的内容进行收藏、分类。
内测地址:youmind.ai
15、o3
12月21日,OpenAI在12天直播的最后一天,发布新一代推理模型o3,预计春节左右上线。在某些条件下,o3模型表现接近于AGI。
在ARC-AGI基准测试中得分87.5%,远超人类水平;在AIME数学竞赛中,得分96.7%,几乎满分;在Elo评分中拿到2727分,超过99.99%的人类程序员。
o3模型代表AI正式进入了博士级水平,详细分析见这篇文章。
16、Gemini 2.0
12月12日,谷歌发布新模型Gemini 2.0。Gemini 2.0 flash是2.0家族的第一个模型,以多模态和Agent技术为核心,速度比1.5 Pro快两倍,性能全面超1.5 Pro。
新模型支持原生工具调用和实时音视频流输入,提供文本、音频和图像的集成响应,具备多语言音频输出能力。
项目介绍:
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/
17、LIama 3.3
12月6日,Meta开源最新模型Lama 3.3,参数量70B,性能与40B参数Llama3.1相当。Llama 3.3在多个行业基准测试中超越了Gemini 1.5 Pro、GPT-4o以及Nova Pro,在数学、常识、指令遵循和应用使用等领域带来大幅提升。
模型链接:
https://www.modelscope.cn/models/LLM-Research/Llama-3.3-70B-Instruct
18、Meta Motivo
12月,Meta推出Meta Motivo模型,希望打造更逼真的元宇宙体验。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。
项目官网:
https://metamotivo.metademolab.com
19、Sora
在鸽了近1年后,12月10日,Sora终于上线了。支持文生、图生以及V2V(视频生视频),最长时长20s,最高画质1080P。
从实测Case来看,Sora有一些自己的“新花样”,比如Storyboard、Re-Cut、Loop、Remix、Blend等剪辑工具和特效,但模型能力够不上第一梯队。相较可灵1.6、Veo 2还有差距。
体验地址:sora.com
20、Veo 2
年末,谷歌贴OpenAI脸开大,推出AI视频产品Veo 2,支持文生、图生(基于自家IMAGE3平台),最高4k分辨率、8s视频。
从实测Case来看,Veo 2在光影、镜头、运动、质感、语义遵循方面的表现非常优秀,超过Sora、Gen3以及luma等知名模型,接近可灵1.6。
提示词:镜头运动炫酷 + 在一座失重颠倒的城市中,巨大的旋转阶梯向天空无限延伸,身穿水手服的高中女生们以惊险的跑酷动作追逐跳跃,身体灵活旋转穿梭于高低不定的阶梯间,动作流畅自然,裙摆飞扬,细节真实,风力带动发丝飘动 + 描述真实感,好莱坞大片电影感。光线的微妙变化,灭世火焰从天际坠落,乌云映照着燃烧的火红光线,阴郁而紧张,增强了真实感和运动感,超现实摄影风格,真实的光影效果,色调灰暗神秘,hyper quality,high detail,好莱坞电影感 + 整座城市不断折叠旋转,建筑碎裂塌陷,天空云层扭曲翻滚,火光与尘埃交织,环境动感十足。
体验网址:
https://deepmind.google/technologies/veo/veo-2
21、Apollo
Apollo是Meta联合斯坦福大学推出的大型多模态模型(LMMs),专注于视频理解。现在,AI也能“看懂”视频了。
项目官网:https://apollo-lmms.github.io
22、Cursor
Cursor是Anysphere公司推出的AI代码编辑器,基于ChatGPT、Claude等LLM,支持Python、Java、C#、Javascript等多语言,通过快捷键操作,提供代码自动生成、编辑、补全、优化、解释等功能。
12月,Cursor在程序员圈蹿红,很多程序员正在用Cursor平替VS Code。
体验网址:https://chatglm.cn
3、AI绘图
主要推荐:
1)Whee。Whee是美图推出的AI素材生成器,支持文生图和图生图。提供AI改图、风格模型训练、AI修复、AI扩图、AI消除、AI模特图以及提示词库训练等丰富功能。
2)即梦,字节剪映出品,国产AI绘图工具。提供多个生图模型供用户选择,新上线图片2.1模型,支持文字生成,以及动态海报(测评文)。
1)可灵1.6。经过数月迭代,最新的可灵1.6当之无愧全球No.1。支持文生、图生(首尾帧)、对口型、运动笔刷、人脸模型训练、API调用等功能。
3)混元视频。由腾讯混元团队出品,目前仅支持文生,在指令遵循、镜头语言、画面和动态稳定性上表现较好(测评文)。
体验地址:https://app.pixverse.ai
2)夸克。不仅是AI浏览器,还是系统级AI,可随时随处在电脑里唤起夸克AI,年轻用户特别多。
体验地址:
https://pan.baidu.com/embed/listennote
10、AI写作
主要推荐:ima copilot。由腾讯推出的AI智能工作台,可以搜索微信公众号、B站等平台,对其内容进行笔记记录,整理成知识库,支持即时编辑、扩写、润色。
13、AI浏览器
主要推荐:夸克。不仅是AI浏览器,还是系统级AI,可以随时随处在电脑里唤起夸克AI。
支持一键AI搜索、写作、PPT生成、视频总结、文件总结、截屏搜、划词搜等功能。
下载链接:quark.cn
关于AI PPT的使用攻略:我一次性给大家讲透了,特别适合小白。
体验链接:https://reportify.cc
16、AI翻译
主要推荐:「Marco」。由阿里国际推出,支持全球15种主流语种,提供基于语境的精准翻译,面向全球用户开放使用。
体验地址:www.aidc-ai.com
17、AI医疗
主要推荐:紫荆AI医生,由清华团队研发,12月刚上线42位AI医生,目前处于内测期。
18、AI产品网站
主要推荐:AI工具集。汇集了几乎市面上所有的AI产品,分类清晰、产品丰富,可随时查找需要的AI。
国外AI推荐
使用路径:Claude.ai
3)Gemini 2.0。年末谷歌放大,推出Gemini 2.0模型,以多模态和Agent技术为核心,速度比1.5 Pro快两倍,性能全面超1.5 Pro。
主要推荐:Llama3.3。12月6日,Meta开源新模型Lama 3.3,参数量70B。在多个行业基准测试中超越了Gemini 1.5 Pro、GPT-4o以及Nova Pro。
产品详情:
https://www.worldlabs.ai/blog
8月22日,Midjourney向所有用户开放了网页版。每个新用户,每天有25次免费的机会。
体验网址:
https://deepmind.google/technologies/veo/veo-2
8月,Gen3上线图生视频功能。允许用户以任何图片为起点生成最长11秒的视频。9月,上线对口型、视频转绘功能。10月,上线Act-One功能。11月,上线3D运镜控件。
体验网址:
https://app.runwayml.com/login
体验地址:
https://www.hailuo.ai/audio
Napkin能够将文字以若干种结构图可视化,包括但不限于流程图、图表、树状图、棱锥图、矩阵图、结构图和维恩图等。
体验网址:
https://app.napkin.ai/signin
2)AI Scientist
用户只要提供一个想法,就能够生成一篇论文,而论文成本不到15美元。相关研究于8月12日发布在预印平台arXiv上。
开源地址:http://github.com/SakanaAI/AI-Scientist
论文链接:https://arxiv.org/abs/2408.06292
体验地址:
往期榜单:
AI产品推荐榜(2024.12)
AI产品推荐榜单(2024.11)
AI产品推荐榜单(2024.10)
AI产品推荐榜单(2024.9)
AI产品推荐榜单(2024.8)
AI产品推荐榜单(2024.7)
AI产品推荐榜单(2024.6)
AI产品推荐榜单(2024.5)
(文:沃垠AI)