性能准确率突破96%!上海算法创新研究院发布xVerify:面向推理模型的答案评估器 下午11时 2025/04/20 作者 PaperWeekly 展,但在长推理链、 困难数学表达式、多语言等复杂场景下,答案抽取与验证仍面临以下挑战: 慢思考场景:
单张3090让大模型“看”《黑悟空》,港大百度发布VideoRAG 上午8时 2025/02/22 作者 量子位 了?! 这是来自香港大学黄超教授实验室发布的最新研究成果—— VideoRAG 。 具体而言,Vid
开源多模态大模型是红绿色盲吗? 下午2时 2025/01/17 作者 机器学习算法与自然语言处理 MLNLP社区分享了对几个开源视觉大模型进行红绿色盲测试的结果,结果显示这些模型在识别图片中的数字上表现不佳,但在实际应用场景中(如识别红绿灯)还能正常工作。
AI+视频:改变创作规则的新引擎,谁能抓住百亿级市场新机遇? 下午10时 2025/01/02 作者 硅谷科技评论 在这个信息爆炸的时代,视频已经成为我们获取信息、分享观点和表达创意的主要媒介。然而,传统视频制作依赖