通义文生视频模型升级,天工推理模型正式上线,微软开源小模型Phi-4!AI Weekly『1月6-1月12日』

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。

关于AI Weekly

马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”

AI Weekly回来了!

AI Weekly”是AI领域的前沿资讯周报,相约每周,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。

省流版摘要

  1. 阿里发布通义万相2.1:文生视频,优化建模能力,提升1080P视频编解码效率。

  2. 阿里推出通义灵码AI程序员:支持多语言,支持VS Code、JetBrains IDEs,“面向对话编程”。

  3. 天工大模型4.0 o1/4o版上线:推理模型,实时语音功能。

  4. Anthropic计划融资20亿美元:估值600亿美元,美国估值第五高的初创公司。

  5. 微软开源小模型Phi-4:140亿参数小模型,追求高“性价比”。

  6. 谷歌Gemini团队并入DeepMind:如题。

1. 阿里发布通义万相2.1

1月9日,阿里通义团队在其官方微信公众号上宣布推出通义万相的2.1版本。通义万相可以简单理解为AI生图和AI生视频版的“通义千问”,同样由阿里通义团队自研的文生图和文生视频模型提供支持。

本次的2.1版本中,阿里发布了最新的文生视频模型Wanx 2.1Wanx 2.1发布不久就在AI视频模型排行榜VBench上夺得第一名,主要优化是:增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,并且首次实现了中文文字视频生成。

2. 阿里推出通义灵码AI程序员

1月8日,阿里云正式上线了一款名为“通义灵码AI程序员”的产品。通义灵码看名字就知道,和上面的通义万相一样,都是通义家族的,只不过这次是针对“编程”。通义灵码同时支持VS Code和JetBrains IDE;并且支持多种主流语言,比如Java、Python、Go、JavaScript、TypeScript、C/C++、C#等。使用方面则是“全程对话协作”,其实对标的就是 GitHub Copilot 这样的AI编程工具。

国产模型里,通义模型还是非常值得推荐的。单就Coding专项而言,qwen2.5-72b-instruct-turboqwen2.5-coder-32b-instruct分别位列LiveBench排行榜的第6名和第7名。

有一说一,通义灵码的官网挺漂亮的。

3. 天工大模型4.0 o1 版上线

1月6日,昆仑万维宣布正式上线天工大模型4.0的o1版和4o版,支持网页端和app端,面向所有用户开放。在此之前,天工4.0 o1版处于邀请测试状态。

别的不说,昆仑万维这模型的名字起的真是太露骨了,太直接了。从名字就能看出,天工4.0 o1版对标的是OpenAI的o1,是一个推理模型;4o则对标的是GPT-4o,是一个通用模型。据官方介绍,天工4.0 4o版有实时语音对话的多模态能力,这一功能和ChatGPT的高级语音模式是一样的。

4. Anthropic计划融资20亿美元

AI这一行,尤其是大模型,实在是太烧钱了!据传Anthropic(开发Claude的AI初创公司)正与投资者谈判,计划筹集20亿美元资金。此次融资由Lightspeed Venture Partners领投,若融资成功,Anthropic将以600亿美元的估值成为美国估值第五高的初创公司。此前,Anthropic已获得大佬亚马逊和谷歌的巨额投资。亚马逊向Anthropic投资了40亿美元,成为其主要云服务提供商。

网友:Anthropic快点融资吧,有钱了就能发布Claude 3.5 Opus了!

5. 微软开源小模型Phi-4

1月8日,微软在Hugging Face平台正式开源了小模型Phi-4。称Phi-4为小模型的原因是其参数量小,仅有140亿,对计算资源的硬性要求小;从参数量可知,Phi-4对标的是同样为小模型的GPT-4o miniPhi-4首次亮相于2024年12月12日,训练时使用了合成数据和中期训练(midtraining)技术,主打质量和成本的平衡,也就是“性价比”。

然而,有网友表示,Phi-4基准测试结果亮眼,但部署后实际体验不佳。具体效果还需要实测还能得知。

6. 谷歌Gemini应用团队并入DeepMind

近日,谷歌宣布将AI StudioGemini Developer API团队整体并入旗下的研究部门DeepMind。可能小伙伴们对谷歌Gemini比较熟悉,我之前也介绍过很多次了。DeepMind是谷歌内部另一个重量级的老牌AI研究团队,多年前击败围棋世界冠军的AlphaGo就是DeepMind团队开发的。

谷歌Gemini在生成式AI浪潮爆发后的这两年属于是“后来者居上”的典型了,最开始被GPT-4吊打,结果在Gemini 1.0模型发布一年后凭借Gemini-Exp-1206Gemini-2.0-Flash和推理模型Gemini-2.0-Flash-Thinking华丽的逆袭了!



(文:AI信息Gap)

欢迎分享

发表评论