喝点VC|a16z:进入大模型通胀时代—推理成本3年内下降1000倍

文章概述了大语言模型(LLMs)推理成本随时间迅速下降的趋势,将这一现象称为LLM通货膨胀。据分析显示,性能相近的LLMs价格每年下降10倍。尽管当前趋势可能仍会变化,但作者认为人工智能革命将继续带来重大进展,并且可能会开启新的用例。

速递|欧洲大模型Mistral发布新AI模型和聊天机器人,测试阶段将保持免费

法国人工智能初创公司Mistral发布了多款新产品以增强其竞争力,包括改进后的Le Chat聊天机器人、画布工具和Pixtral Large图像生成模型。新版本的Mistral Large 24.11在长上下文理解方面表现更优,支持文档分析和任务自动化等用途。

LLM也怕你妈叫你回家吃饭这种模糊请求,纽大提出指导LLM澄清问题

MLNLP社区致力于促进国内外自然语言处理领域内的学术交流与进步。该论文提出了一种新的标注方法,用于训练LLMs在多回合交互中询问澄清问题,显著提高了其在处理模糊请求时的性能。

清华90后创立的国产GPU芯片公司获数亿元融资,计划2026年实现AI组装机量产|

北京行云集成电路有限公司完成数亿元天使轮及天使+轮融资,致力于研发高效能GPU芯片。公司计划2026年实现AI组装机产品的量产,目标是通过异构计算和白盒硬件重塑大模型计算系统。

NeurIPS 2024|天津大学提出:面向模态缺失情形的提示学习方法

本文提出了一种新的提示学习方法,旨在解决多模态大模型在输入模态可能缺失时的问题。通过结合三种不同的提示向量策略(Correlated prompting, Dynamic prompting和Modal-common prompting),该方法能更有效地提升模型的鲁棒性和可扩展性,在多个数据集上验证了其有效性。