北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”

北京大学DS-Lab发布ScholarSearch数据集,评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳,仅凭推理无法解决复杂问题,需结合搜索功能以提高准确率。

对话出门问问创始人李志飞:AI眼镜没有市场需求,硬件只是大模型载体

出门问问发布全球首款AI硬件产品TicNote,厚度仅3mm,支持智能体AI技术。售价999-1499元。李志飞表示公司转型形成‘超级个体’结构,用一个硬件工程师就能做一款硬件产品。未来将推出更多AI硬件和软件应用。

ToMAP:赋予大模型「读心术」,打造更聪明的AI说服者

本文提出了一种名为ToMAP的新模型,它结合了心智理论机制以增强语言模型在说服任务中的表现。通过引入反驳预测器和态度预测器两大模块,ToMAP能够预判对方可能提出的反论点并评估其态度变化,从而实现更具个性化、灵活性和逻辑性的说服过程。