一手实测DeepSeek-V3-0324,AI编程大跃进
昨晚,DeepSeek发布新版本V3.0324,参数增至685B,在Hugging Face上开源且MIT许可。其网页生成能力显著提升,实测代码能力与Claude 3.7相当,但超越了Claude 3.7和GPT-4.5的数学能力和编程能力。
昨晚,DeepSeek发布新版本V3.0324,参数增至685B,在Hugging Face上开源且MIT许可。其网页生成能力显著提升,实测代码能力与Claude 3.7相当,但超越了Claude 3.7和GPT-4.5的数学能力和编程能力。
文章介绍了一篇关于对抗攻击的研究成果,该研究提出了一种新的方法M-Attack来提高对大型视觉语言模型的攻击成功率,并成功应用于多个商业模型中。
OpenAI再次指控DeepSeek存在重大风险,并要求美国政府采取行动禁用DeepSeek,同时其他国家如意大利、澳大利亚和韩国也对DeepSeek实施了禁令或限用措施。然而,DeepSeek通过开源模型打破了技术垄断,推动了AI普惠,成为人人可用的AI。
腾讯发布混元T1模型,在多项指标上超越GPT-4.5及DeepSeek R1,尤其在文化创意、文本总结和智能体能力方面表现突出。该模型采用创新架构Mamba-Transformer MoE,并实现了极高响应速度与高质量输出。
用一文记录AI大模型领域风云变幻的一月,LiveBench和LMSYS排行榜对比显示,Claude 3.7 Sonnet-Thinking荣登榜首,GPT-4.5紧随其后。LMSYS StyleCtrl排名中,GPT-4.5和Grok 3表现优异。
专注AIGC领域的专业社区分享了对最新模型GPT-4.5的评价。用户反馈其在创意写作、单口喜剧和歌词创作方面表现出色,并且具有更高的情商智能,能够更好地理解人类需求。OpenAI还展示了GPT-4.5在处理高风险内容时的安全性和鲁棒性。
OpenAI推出GPT-4.5语言模型,具备高情商和低幻觉特点。输入成本高达75美元/百万token,输出成本为150美元/百万token,成为最昂贵的模型之一。GPT-4.5通过无监督学习技术提升情感理解能力,并在捐赠诈骗测试中表现优秀。它仍然是OpenAI最后一个非思维链模型,但在医疗等领域具备深度共情和精准诊断能力。
OpenAI 最新发布的人工智能模型 GPT-4.5 因高昂成本和未能显著提升性能而受到质疑。其竞争对手DeepSeek等正在蚕食市场份额,导致盈利困难。此外,OpenAI面临人才流失、财务压力及领导力受质疑等问题。尽管首席研究Mark Chen表示GPT-5将取得重大突破,但现状仍需关注。