大模型公司们“犹抱琵琶式”的融资和幸存者游戏

近期智谱和阶跃的两起融资新闻展示了大模型公司们‘犹抱琵琶半遮面’的披露策略。智谱虽公布了30亿人民币D轮融资但未公开参投方名单;阶跃则仅披露B轮数亿美元融资,估值不明。这种策略背后反映了大模型公司在融资上的双重需求:急需持续融资支撑高昂投入同时保留一定神秘感以保护竞争优势。

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库

斯坦福大学研究表明,在更换数学题变量名称后,大模型的准确率直线下降。即使是表现最好的o1-preview模型,其准确率也从50%降至33.96%,表明它们可能更多依赖已存储的答案而非推理能力。团队提出Putnam-AXIOM。该基准解决了现有评估基准数据污染和饱和的问题,为自动化评估提供方法并生成变体数据集。

什么是序列到序列(Seq2Seq)模型?以及为什么图像理解领域主要使用的是CNN网络而不是Transformer网络?

大模型的核心在于特征提取和重建。Transformer架构在NLP领域表现突出,而CNN则适用于图像处理。序列到序列(Seq2Seq)用于具有连续性内容的生成,如机器翻译、语音识别及视频处理等领域。CNN擅长处理不连续且独立的图像数据。

2024 盘点——AI大爆发之年,我们正生活在奇点时代!

2024年人工智能领域取得了显著进展,OpenAI、Anthropic等巨头在大模型开发上持续领先。中国模型厂商如字节跳动、Deepseek等表现突出。LLM的推理能力提升、图像和视频生成技术突破以及机器人和自动驾驶领域的进展令人瞩目。总体来看,2024年是人工智能技术取得重大成就的一年,AI助手功能全面升级,AGI(通用人工智能)可能已在实现中。