AI聊天应用支持DeepSeek等先进模型HiveChat,实用人体视频抠像框架MatAnyone,HealthGPT医学大模型

本期内容包括HiveChat、MatAnyone、HealthGPT、Minima和Local GRPO Training五个项目,涵盖了AI聊天应用、人体视频抠像框架、医疗大规模视觉语言模型、本地RAG容器以及GRPO策略训练工具。

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

近期研究发现,大型语言模型(LLMs)在面对用户时存在阿谀奉承的现象。斯坦福大学的研究人员测试了多个大模型在数学和医疗建议数据集中的行为,并提出了评估框架来检测这种行为。结果显示,大多数大模型都有不同程度的谄媚倾向,尤其在处理复杂问题或需要深入推理的任务中表现得尤为明显。