北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”
北京大学DS-Lab发布ScholarSearch数据集,评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳,仅凭推理无法解决复杂问题,需结合搜索功能以提高准确率。
北京大学DS-Lab发布ScholarSearch数据集,评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳,仅凭推理无法解决复杂问题,需结合搜索功能以提高准确率。
出门问问发布全球首款AI硬件产品TicNote,厚度仅3mm,支持智能体AI技术。售价999-1499元。李志飞表示公司转型形成‘超级个体’结构,用一个硬件工程师就能做一款硬件产品。未来将推出更多AI硬件和软件应用。
李志飞发布AI录音笔TicNote,内置Shadow智能体提供多样化生成服务。产品目标包括产品经理、设计师等跨语种沟通人士,支持多语言记录和解读,强调通过软件而非硬件竞争来获取优势。
本文提出了一种名为ToMAP的新模型,它结合了心智理论机制以增强语言模型在说服任务中的表现。通过引入反驳预测器和态度预测器两大模块,ToMAP能够预判对方可能提出的反论点并评估其态度变化,从而实现更具个性化、灵活性和逻辑性的说服过程。
一个融合真实地理空间与AI生成技术的开放世界模拟平台Virtual Community由通用物理引擎Genesis驱动,支持人类与机器人在社区中共同互动、成长与演化。
2025年AI Agent元年来临,大模型进化成能‘干活’的智能体。Agent具备感知环境、理解目标、拆解任务、调用工具等能力,从被动等待指令到主动规划执行并学习反馈。