腾讯混元A13B用130亿参数达到千亿级效果,Flash Attention作者点赞
腾讯混元团队发布的Hunyuan-A13B模型,仅通过激活130亿参数就展现了与千亿级大模型相抗衡的能力。该模型采用了细粒度MoE架构,在单张中端GPU上运行性能出色,已在腾讯云上线API服务。模型采用了高质量预训练和结构化后训练技术,并且支持多种推理框架。
腾讯混元团队发布的Hunyuan-A13B模型,仅通过激活130亿参数就展现了与千亿级大模型相抗衡的能力。该模型采用了细粒度MoE架构,在单张中端GPU上运行性能出色,已在腾讯云上线API服务。模型采用了高质量预训练和结构化后训练技术,并且支持多种推理框架。
Anthropic发布两款新AI模型Claude Opus 4和Claude Sonnet 4,旨在优化编程任务,并通过亚马逊Bedrock和谷歌Vertex AI提供API服务。Opus 4针对付费用户定价更高,而Sonnet 4免费开放。
亿万富翁埃隆·马斯克的人工智能公司xAI发布了旗舰模型Grok 3,通过其API提供两种版本供用户使用。尽管刚被OpenAI反诉,但Grok 3已在图像分析和问答能力方面对标OpenAI的GPT-4o和谷歌的Gemini。不过,Grok 3的实际支持上下文窗口远小于宣称的能力。
Skywork AI(昆仑万维)发布了Mureka O1和Mureka V6模型,作为首款音乐推理大型模型,超越了SunO。Mureka V6支持多种语言生成AI音乐,而Mureka O1引入了CoT技术,显著提高音乐质量、效率和灵活性。两款产品现已全面上市。
GPT-4.5 今日发布,仅限 ChatGPT Pro 用户使用,API服务价格高昂。它通过扩展无监督学习提升了推理能力、世界知识和对用户需求的理解,并支持联网搜索等新功能。
三天前发布的文章介绍了如何从字节火山引擎获取并使用满血版DeepSeek-R1 API服务,其中还包括了开启联网搜索功能的教程。今天的文章重点是分享了一个四步教程,详细说明了如何在字节火山平台创建关联应用、配置应用以实现联网搜索功能。
文章介绍了如何使用字节火山引擎版DeepSeek-R1模型,包括本地部署和API服务两种方式,并详细描述了获取API key及调用API的方法。文章还提到了火山引擎的模型广场、在线推理创建接入点等操作步骤。最后给出了一个简单的测试案例验证了模型的能力。