大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。
关于AI Weekly
马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”
AI Weekly回来了!
“AI Weekly”是AI领域的前沿资讯周报,相约每周,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。
省流版摘要
-
阿里发布通义万相2.1:文生视频,优化建模能力,提升1080P视频编解码效率。
-
阿里推出通义灵码AI程序员:支持多语言,支持VS Code、JetBrains IDEs,“面向对话编程”。
-
天工大模型4.0 o1/4o版上线:推理模型,实时语音功能。
-
Anthropic计划融资20亿美元:估值600亿美元,美国估值第五高的初创公司。
-
微软开源小模型Phi-4:140亿参数小模型,追求高“性价比”。
-
谷歌Gemini团队并入DeepMind:如题。
1. 阿里发布通义万相2.1
1月9日,阿里通义团队在其官方微信公众号上宣布推出通义万相的2.1版本。通义万相可以简单理解为AI生图和AI生视频版的“通义千问”,同样由阿里通义团队自研的文生图和文生视频模型提供支持。
本次的2.1版本中,阿里发布了最新的文生视频模型Wanx 2.1
。Wanx 2.1
发布不久就在AI视频模型排行榜VBench上夺得第一名,主要优化是:增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,并且首次实现了中文文字视频生成。
2. 阿里推出通义灵码AI程序员
1月8日,阿里云正式上线了一款名为“通义灵码AI程序员”的产品。通义灵码看名字就知道,和上面的通义万相一样,都是通义家族的,只不过这次是针对“编程”。通义灵码同时支持VS Code和JetBrains IDE;并且支持多种主流语言,比如Java、Python、Go、JavaScript、TypeScript、C/C++、C#等。使用方面则是“全程对话协作”,其实对标的就是 GitHub Copilot 这样的AI编程工具。
国产模型里,通义模型还是非常值得推荐的。单就Coding专项而言,qwen2.5-72b-instruct-turbo
和qwen2.5-coder-32b-instruct
分别位列LiveBench排行榜的第6名和第7名。
有一说一,通义灵码的官网挺漂亮的。
3. 天工大模型4.0 o1 版上线
1月6日,昆仑万维宣布正式上线天工大模型4.0的o1
版和4o
版,支持网页端和app端,面向所有用户开放。在此之前,天工4.0 o1
版处于邀请测试状态。
别的不说,昆仑万维这模型的名字起的真是太露骨了,太直接了。从名字就能看出,天工4.0 o1
版对标的是OpenAI的o1
,是一个推理模型;4o
则对标的是GPT-4o
,是一个通用模型。据官方介绍,天工4.0 4o
版有实时语音对话的多模态能力,这一功能和ChatGPT的高级语音模式是一样的。
4. Anthropic计划融资20亿美元
AI这一行,尤其是大模型,实在是太烧钱了!据传Anthropic(开发Claude的AI初创公司)正与投资者谈判,计划筹集20亿美元资金。此次融资由Lightspeed Venture Partners领投,若融资成功,Anthropic将以600亿美元的估值成为美国估值第五高的初创公司。此前,Anthropic已获得大佬亚马逊和谷歌的巨额投资。亚马逊向Anthropic投资了40亿美元,成为其主要云服务提供商。
网友:Anthropic快点融资吧,有钱了就能发布Claude 3.5 Opus
了!
5. 微软开源小模型Phi-4
1月8日,微软在Hugging Face平台正式开源了小模型Phi-4
。称Phi-4
为小模型的原因是其参数量小,仅有140亿,对计算资源的硬性要求小;从参数量可知,Phi-4
对标的是同样为小模型的GPT-4o mini
。Phi-4
首次亮相于2024年12月12日,训练时使用了合成数据和中期训练(midtraining)技术,主打质量和成本的平衡,也就是“性价比”。
然而,有网友表示,Phi-4
基准测试结果亮眼,但部署后实际体验不佳。具体效果还需要实测还能得知。
6. 谷歌Gemini应用团队并入DeepMind
近日,谷歌宣布将AI Studio和Gemini Developer API团队整体并入旗下的研究部门DeepMind。可能小伙伴们对谷歌Gemini比较熟悉,我之前也介绍过很多次了。DeepMind是谷歌内部另一个重量级的老牌AI研究团队,多年前击败围棋世界冠军的AlphaGo就是DeepMind团队开发的。
谷歌Gemini在生成式AI浪潮爆发后的这两年属于是“后来者居上”的典型了,最开始被GPT-4
吊打,结果在Gemini 1.0模型发布一年后凭借Gemini-Exp-1206
、Gemini-2.0-Flash
和推理模型Gemini-2.0-Flash-Thinking
华丽的逆袭了!
(文:AI信息Gap)