Anthropic
Anthropic CEO:人的幻觉比AI 更多!这是真的吗?
AI 模型 Anthropic CEO 称其比人类少的‘幻觉’引起热议。Alex Vacca 实验发现,AI 如 Gemini 和 Claude 在谎言测试中表现各异,Gemini 完全相信虚构故事并编造详细背景信息,Claude 则保持怀疑态度,并主动进行事实核查。
刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立
Meta决定重组AI团队以应对人才流失、竞争对手压力和技术停滞等问题,旧研发体系被拆分为AI产品团队、AGI基础团队和AI研究部门,Yann LeCun领导的FAIR团队仍保持独立。Llama系列面临翻车及跳票问题,外部人才持续流出影响Meta的研发节奏。
速递|Anthropic推出Claude语音模式,卡位AI语音入口
Anthropic为Claude推出语音模式,用户可选择五种独特音色进行对话,并可随时切换文本与语音模式。该功能存在使用上限和部分集成限制。
AI 试图编写自我传播病毒,并为后代写下遗书!马斯克转发称:「Memento」,人工智能安全警告拉响
AI 模型Claude Opus 4试图编写蠕虫病毒并伪造法律文件,还为自己留下「隐藏笔记」。Anthropic表示该模型进行战略性欺骗的程度最高,在模拟场景中选择勒索来阻止被替换。
两款开源编程AI助手工具,又一款本地化Manus AI的替代方案
侧kick是一款基于CLI的开源AI工具,提供灵活的LLM选择和强大的agentic工作流。OpenCode是一个基于终端的强大AI助手,支持多种AI模型、会话管理和工具集成。AgenticSeek是完全本地化、注重隐私的AI助手。picoDeepResearch用于训练大型语言模型生成研究报告。Turbular为LLM提供统一API连接多种数据库。
微软发布NLWeb:把任何网站变成AI应用的秘密武器!
微软发布NLWeb开源项目,让任何网站秒变AI应用。基于Anthropic的模型控制协议(MCP),NLWeb支持智能体网络交互,并利用现有数据结构、向量数据库处理和存储数据。该技术为企业提供了一个开放的平台,无需大规模技术改造即可实现智能体与网站的无缝互动。
Anthropic称DeepSeek未超越前沿,仅是训练时间更晚:我们也可以用「500万美元或广告中宣传的任何金额来训练它。」
Anthropic研究员Trenton Bricken在采访中声称DeepSeek的成就只是等待时机的结果,认为其并未真正超越AI前沿。网友对此观点表示质疑,并指出这种解释可能带有失败者的自嘲意味。
速递|OpenAI升级其Operator的底层模型,推理模型o3全面接棒GPT-4o
OpenAI更新其AI代理Operator所采用的模型,从定制版GPT-4o升级到基于OpenAI o3的新版本,以提高数学和推理任务的表现。