大语言模型归档

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

2025年6月26日23时作者量子位

北京大学DS-Lab发布ScholarSearch数据集，评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳，仅凭推理无法解决复杂问题，需结合搜索功能以提高准确率。

2025年6月26日23时作者钛媒体AGI

出门问问发布全球首款AI硬件产品TicNote，厚度仅3mm，支持智能体AI技术。售价999-1499元。李志飞表示公司转型形成‘超级个体’结构，用一个硬件工程师就能做一款硬件产品。未来将推出更多AI硬件和软件应用。

2025年6月26日16时作者 APPSO

李志飞发布AI录音笔TicNote，内置Shadow智能体提供多样化生成服务。产品目标包括产品经理、设计师等跨语种沟通人士，支持多语言记录和解读，强调通过软件而非硬件竞争来获取优势。

2025年6月24日23时作者机器之心

本文提出了一种名为ToMAP的新模型，它结合了心智理论机制以增强语言模型在说服任务中的表现。通过引入反驳预测器和态度预测器两大模块，ToMAP能够预判对方可能提出的反论点并评估其态度变化，从而实现更具个性化、灵活性和逻辑性的说服过程。

2025年6月22日23时作者 APPSO

学生坐在麻省理工学院媒体实验室里，佩戴着复杂的脑电波（EEG）头盔，头上缠绕着银灰色的神经电极，32

2025年6月22日16时作者机器之心

— 哪怕最终答案是对的，只要中间某一步出现纰漏，整个证明就可能不成立。我们不禁提问：这些答案是模型通

2025年6月21日23时作者智东西

日消息，6月18日，前OpenAI联合创始人、深度学习专家安德烈·卡帕西（Andrej Karpat

2025年6月21日16时作者新智元

一个融合真实地理空间与AI生成技术的开放世界模拟平台Virtual Community由通用物理引擎Genesis驱动，支持人类与机器人在社区中共同互动、成长与演化。

2025年6月21日16时作者机器之心

、构建数学模型、发现科学规律
，正成为该领域亟待突破的关键问题。
近日，中国科学院自动化研究所的研究

2025年6月21日14时作者 AI技术研习社

2025年AI Agent元年来临，大模型进化成能‘干活’的智能体。Agent具备感知环境、理解目标、拆解任务、调用工具等能力，从被动等待指令到主动规划执行并学习反馈。