大模型除了聊天还能做什么?关于大模型的分类和应用

文章介绍了大模型分类的复杂性及用户和技术两个角度的大模型应用,并强调了实际需求的重要性,建议根据任务需求选择合适的模型,同时指出当前大模型评估标准缺失的问题,鼓励多尝试和研究。

里程碑,GPT-4.5大模型正式通过图灵测试!

加州大学圣迭戈分校的研究学者首次提供了人工系统通过标准三方图灵测试的实证证据。GPT-4.5和LLaMa-3.1在相同提示下被判断为人类的比例分别为73%和56%,显著高于真实人类参与者被选中的比例,表明这些系统已经非常接近人类智能水平。