DeepSeek-R1、Kimi k1.5、豆包1.5 Pro、GLM,国产AI太燃了!AI Weekly『1月20-26日』
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研
木易在公众号分享了关于国产模型DeepSeek-R1和老牌强手o1之间的比较,并引入了更高算力的o1-pro。近期,Eric Zelikman对Grok 3进行了测试,结果表明Grok 3在碰撞效果上表现最优,引发热议。
微软对100多款生成式AI产品进行了红队测试,并分享了八个主要教训和五个案例研究,以指导实际的AI安全测试,包括识别风险、评估大模型聊天机器人的应对能力等。
HyperAI超神经发布了开源项目awesome-ai4s,汇总了200余篇AI4S学术论文并提供解读与数据集等资源。该项目旨在帮助研究人员了解最新研究成果和实践案例、降低学习门槛,并推进AI for Science的普适化应用。