准确性归档 - 每时AI

智谱开源大模型冲上世界第一！

2025年7月9日23时作者路过银河AI

今天的huggingface第一名是智谱的GLM-4.1V-9B-Thinking。该模型在视觉语言任务中表现出色，参数量小但性能接近大模型，支持多模态和双语处理。

2025年5月28日16时作者量子位

代，
如何让模型在“难”的问题上展开推理，而不是无差别地“想个不停”
，成为当前智能推理研究的重要课

2025年5月27日16时作者量子位

复旦大学余海洋与字节的研究人员提出CAR自适应推理框架，根据模型困惑度动态选择短回答或长文本推理，在多模态视觉问答和关键信息提取任务中实现最佳平衡。

2025年5月4日23时作者新智元

新智元报道
编辑：定慧
OpenAI发布的新基准测试数据集MRCR，旨在检验模型在超长上下文中精准定位特定信息的能力。这比「大海捞针」的简单任务更具挑战性。通过MRCR测试，GPT-4.1展示了其强大的上下文理解和处理能力，但随着上下文长度和复杂度增加，准确性会迅速下降。

2025年4月22日23时作者量子位

是清华及英伟达研究人员最新提出的观点。
他们发现，作为离散扩散模型中性能最强的类别，掩码扩散模型可能

2025年4月22日16时作者机器之心

浙江大学团队揭示了推荐系统如何放大流行度偏差，并提出了一种基于正则项的纠偏方法ReSN，该方法显著提升推荐系统的公平性和准确性。

2025年1月24日16时作者新智元

新智元报道
编辑：编辑部 HYZ
【新智元导读】
医疗AI时代正式开启！百川刚刚用Baichuan-

2025年1月10日23时作者新智元

新智元报道
编辑：乔杨
【新智元导读】
2024年11月30日是ChatGPT上线两周年的日子。
这

2024年12月5日10时作者 GitHubStore

这个 MCP 服务器用于总结微信聊天消息。通过我们自己的机器人收集消息，并使用 MCP Server 解耦存储和查询功能。用户可以通过 Claude 桌面版随时查询和总结聊天内容，实现私有化部署和数据安全性。