强化学习
3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
波士顿动力机器狗Spot通过强化学习提高了3倍速度至18.7千米/小时,超越了小型犬的平均奔跑速度。研究人员发现限制机器人运动速度的主要因素是电池供电能力,并提出增加四脚同时离地的飞行阶段可提高速度和稳定性。
专注于强化学习(RL)提升大语言模型(LLM)推理能力的资源库
Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库,汇集了最新的相关论文、幻灯片和开源项目,涵盖多种RL方法和LLM推理优化技巧。
刚刚,马斯克发布Grok-3,反击DeepSeek、OpenAI
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言等大模型的发展和应用落地。马斯克旗下xAI发布最新大模型Gork3,性能远超OpenAI的LLM,展示了深度学习与强化学习结合的应用。
DeepSeek重塑国内 AI 新秩序:打脸的百度与尴尬的“六小龙”
百度接入DeepSeek打破闭源路线,腾讯跟进接入微信。阿里开源模式加持。DeepSeek带来行业重塑,各家大厂纷纷调整策略应对冲击。
热议:为什么 DeepSeek 出来后,国产其他大模型的集体失声了,以前都号称很强的?
MLNLP是国内外知名的人工智能社区,致力于推动自然语言处理与机器学习领域的交流与发展。2025年出现的DeepSeek模型通过技术革新颠覆了行业现状,展示了技术实力和成本优势。