超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4,采用全新后训练框架,并提供完全开源的数据、评估、训练代码及开发配方。
艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4,采用全新后训练框架,并提供完全开源的数据、评估、训练代码及开发配方。
澳大利亚、意大利、爱尔兰等多国因‘国家安全’风险禁用DeepSeek;美国多个政府部门也考虑或已开始采取行动。韩国则通过设立AI基金和成立专门委员会应对挑战。
卡内基梅隆大学华人研究人员Tairan He与英伟达合作推出ASAP框架,旨在对齐模拟与真实物理,赋予人形机器人前所未有的敏捷性。相关研究成果已开源,展示了人形机器人的运动控制能力显著提升。
字节跳动推出的新技术OmniHuman能够利用单张图片和音频生成生动人物视频,支持任意大小的人物占比。OmniHuman采用多模态混合训练策略,从大规模数据中受益,解决了现有方法的局限性。
报告指出,在AI技术支持下,多组学技术能够通过生成数据、运行测试、推断和决策,以及运行实验来推断和指导开发,从而经济有效地解决小疾病人群的问题,并更精准地识别患者和疾病;并将药物上市时间从13年缩短到8年,总成本降低4倍。
阿里最新大语言模型Qwen2.5-Max在Chatbot Arena榜单上排名第7,领先于DeepSeek V3等顶级模型。其在数学和编程方面排名第一,在处理复杂任务的硬提示方面排名第二。
OpenAI计划在2025年推出由o3和o3 pro驱动的SWE代理,声称其能力媲美中级工程师,并可能对软件行业产生重大影响。同时,Salesforce CEO Marc Benioff预测2025年可能不会招募任何软件工程师。
高盛报告指出,随着AI投资逻辑从硬件转向软件,MSCI中国指数在AI应用层的显著暴露有望使其短期内表现优秀。建议超配中概科技股,尤其是那些在AI应用层具有创新能力和市场优势的公司。尽管A股在硬技术方面的权重相对较高,但近年来也在积极布局AI软件,因此也将从中受益。