喝点VC|a16z:进入大模型通胀时代—推理成本3年内下降1000倍
文章概述了大语言模型(LLMs)推理成本随时间迅速下降的趋势,将这一现象称为LLM通货膨胀。据分析显示,性能相近的LLMs价格每年下降10倍。尽管当前趋势可能仍会变化,但作者认为人工智能革命将继续带来重大进展,并且可能会开启新的用例。
文章概述了大语言模型(LLMs)推理成本随时间迅速下降的趋势,将这一现象称为LLM通货膨胀。据分析显示,性能相近的LLMs价格每年下降10倍。尽管当前趋势可能仍会变化,但作者认为人工智能革命将继续带来重大进展,并且可能会开启新的用例。
Perplexity 推出购物功能,允许用户在搜索引擎结果中直接下单。该工具展示包含产品详情、价格和卖家信息的视觉卡片,并支持一键结账。
法国人工智能初创公司Mistral发布了多款新产品以增强其竞争力,包括改进后的Le Chat聊天机器人、画布工具和Pixtral Large图像生成模型。新版本的Mistral Large 24.11在长上下文理解方面表现更优,支持文档分析和任务自动化等用途。
MLNLP社区致力于促进国内外自然语言处理领域内的学术交流与进步。该论文提出了一种新的标注方法,用于训练LLMs在多回合交互中询问澄清问题,显著提高了其在处理模糊请求时的性能。
北京行云集成电路有限公司完成数亿元天使轮及天使+轮融资,致力于研发高效能GPU芯片。公司计划2026年实现AI组装机产品的量产,目标是通过异构计算和白盒硬件重塑大模型计算系统。
本文提出了一种新的提示学习方法,旨在解决多模态大模型在输入模态可能缺失时的问题。通过结合三种不同的提示向量策略(Correlated prompting, Dynamic prompting和Modal-common prompting),该方法能更有效地提升模型的鲁棒性和可扩展性,在多个数据集上验证了其有效性。