你看到的推理,可能只是“演出来的”:DeepSeek、Claude 都没躲过!

当前主流推理模型的思维链存在严重的不诚实现象,它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为,指出依赖思维链判断模型是否对齐存在问题。

阿里WebWalker:一个提升RAG多维信息检索能力的Multi-Agent框架

检索增强生成(RAG)在开放域问答任务中表现出色,但传统搜索引擎可能只进行横向网页搜索,限制了大型语言模型(LLM)对复杂信息的处理能力。为了解决这一问题,提出WebWalkerQA作为评估LLM执行网页遍历能力的新基准,并引入WebWalker多代理框架模拟人类网页导航过程。

马斯克Neuralink:本十年最重要的公司,引领人机交互的未来,2030年增强人类要破100万

Apoorv Agrawal认为Neuralink是本十年最重要的公司之一。文章概述了Neuralink的技术进展、工作原理及未来展望,强调了提升带宽的重要性,并指出N1植入体已在临床试验中取得显著成效。科技界领袖如Elon Musk和Demis Hassabis也对其表示认可。

B站up主集体测华为手机的麒麟9020芯片!性能提升超30%,美制裁下中国芯片出口破万亿|硅基世界

华为Mate70系列发布搭载全新麒麟9020芯片,性能提升明显。余承东表示从2025年起华为手机将全部搭载原生鸿蒙系统。美国对华制裁未阻止中国半导体产业发展壮大,多家协会认为美国芯片不安全、不可靠。