自动评估基准 | 一些评估测试集 下午10时 2025/01/08 作者 Hugging Face 近年来开发的评估数据集列表,但由于LLM的发展而可能不再适合当前评估方法。部分数据集在互联网上公开多年。
北大字节VAR获最佳论文、厦大清华获亚军,NeurIPS 2024最佳论文出炉 上午11时 2024/12/04 作者 机器之心 机器之心报道 机器之心编辑部 刚刚,人工智能顶会 NeurIPS 公布了今年的最佳论文(包括 Bes