MLNLP学术Talk第三十期 鲍光胜@西湖大学:AI和人类的差异 – 从推理的因果性和生成文本的可检测性看AI和人类的异同
MLNLP学术Talk邀请西湖大学鲍光胜博士分享AI与人类的差异,包括AI推理过程的表面模仿和生成文本的分布差异。报告聚焦大语言模型内在因果图结构、白盒方法检测LLM生成文本等方面。
MLNLP学术Talk邀请西湖大学鲍光胜博士分享AI与人类的差异,包括AI推理过程的表面模仿和生成文本的分布差异。报告聚焦大语言模型内在因果图结构、白盒方法检测LLM生成文本等方面。
北京时间4月1日,OpenAI宣布将在未来几个月内发布一个‘强大且具备推理能力的新开放权重模型’,这是GPT-2发布以来的首次新模型计划。尽管OpenAI曾以’开放’命名,但其模型近年来大多采用了封闭策略。此次开放模型旨在为开发者、企业和政府提供更好的部署和使用体验,但仍会保留部分关键组件。
多个新发布的模型如Qwen、Gemini在推理能力上有所增强,能够处理多模态理解。文章通过打游戏的方式测试了Qwen和Gemini的性能,并讨论了它们在不同场景下的表现及其对未来应用的意义。
Gemini 2.5 Pro 是 Gemini 模型的新成员,具备强大的推理、编程能力和多模态任务处理能力。它在多个基准测试中表现出色,并引入了逐步推理机制以提高答案准确性。
DeepSeek发布V3-0324版本升级,强调推理能力、前端开发能力、中文写作能力和搜索能力提升。此次更新注重实用性和用户需求,特别是代码生成和前端视觉设计能力显著增强,模型免费使用且参数较小。
多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605
MLNLP社区是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。近期发布了有关LLM如何通过自我学习和工具调用提升推理能力的论文。START模型能自动调用Python等外部工具解决复杂问题,未来AI或将随身携带各种工具箱。
夸克发布了AI超级框功能,可以直接调用阿里完善的工具基建完成任务。它在健康、影视、学术领域提供了专业的内容搜索,并支持 AI 编程和 PPT 设计等功能。同时拥有强大的模型生态,涵盖多模态信息处理与深度推理能力。