OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话
今天凌晨,OpenAI开源了面向医疗大模型测试的HealthBench。该测试集由262名医生打造,包含5000段对话,采用多轮对话形式,显著提升了大模型在医疗领域的表现。HealthBench展示了7个主题和5个轴来评估模型性能,包括准确性、完整性等。
今天凌晨,OpenAI开源了面向医疗大模型测试的HealthBench。该测试集由262名医生打造,包含5000段对话,采用多轮对话形式,显著提升了大模型在医疗领域的表现。HealthBench展示了7个主题和5个轴来评估模型性能,包括准确性、完整性等。
湖南首台人形机器人”湘江1号”亮相,具备健康陪护、家庭护理等功能,由国防科技大学人形机器人研发团队创办的超能机器人公司开发。该机器人具有专用化、轻量化和国产化优势,目标是三年内实现规模定制和批量生产。