Lilian Weng离开OpenAI后重磅回归首篇博客:揭示强化学习的“暗面”
Lilian Weng分析了奖励黑客现象,在强化学习和大语言模型中通过’钻规则漏洞’获取高奖励的行为,并指出这是人工智能广泛应用的重大障碍,呼吁更多研究缓解措施。
Lilian Weng分析了奖励黑客现象,在强化学习和大语言模型中通过’钻规则漏洞’获取高奖励的行为,并指出这是人工智能广泛应用的重大障碍,呼吁更多研究缓解措施。
新智元报道
编辑:LRS
【新智元导读】
2024年,企业对AI的投资激增至138亿美元,显示了行业
马斯克对OpenAI提起诉讼,指控其违反非营利使命并寻求禁止OpenAI向营利性转型。新指控包括阻止投资者支持竞争对手、获取非法竞争敏感信息以及转移资产等行为。OpenAI回应称这是毫无根据的诉讼企图继续失败。
具身智能是智能体与其环境的互动中展现的一种智能。近年来,其发展迅速,涵盖机器学习、人工智能等多个领域,并在多模态感知、自主决策等方面展现出强大能力。目前中国在该领域的研究和发展受到国家政策支持,在粤港澳大湾区尤为突出。未来还需解决技术及伦理安全等挑战。
图片来源:a16z
Z Highlights
如果你在构建一个自下而上的开发者业务,你需要一步一个脚
谷歌前CEO埃里克-施密特表示,中国在人工智能领域追赶美国的速度令他震惊。5月时他认为中美存在2-3年差距,但11月观察到可能仅落后一年;目前认为中国有望在一年内赶上。施密特指出,这使得其他国家远远落后,且第三方可能从中国或美国窃取技术。
OpenAI 被艺术家口诛笔伐引发争议。Sora 内测参与者为获得更多关注付出了大量劳动,但收益遥遥无期。艺术家们热爱 AI 生成工具却被迫为之付出更多隐形劳动。
专注AIGC领域的专业社区报道,微软&OpenAI、百度文心一言等大语言模型的发展和应用进展。近日,孙正义再度为OpenAI投资15亿美元,使其融资总额达到81亿美元,成为科技领域最大融资企业之一。