团队归档 - 每时AI

性能准确率突破96%！上海算法创新研究院发布xVerify：面向推理模型的答案评估器

下午11时 2025/04/20 作者 PaperWeekly

展，但在长推理链、困难数学表达式、多语言等复杂场景下，答案抽取与验证仍面临以下挑战：
慢思考场景：

上午8时 2025/02/22 作者量子位

了？！
这是来自香港大学黄超教授实验室发布的最新研究成果——
VideoRAG
。
具体而言，Vid

MLNLP社区分享了对几个开源视觉大模型进行红绿色盲测试的结果，结果显示这些模型在识别图片中的数字上表现不佳，但在实际应用场景中（如识别红绿灯）还能正常工作。

下午10时 2025/01/02 作者硅谷科技评论

在这个信息爆炸的时代，视频已经成为我们获取信息、分享观点和表达创意的主要媒介。然而，传统视频制作依赖