清华90后创立的国产GPU芯片公司获数亿元融资,计划2026年实现AI组装机量产|
北京行云集成电路有限公司完成数亿元天使轮及天使+轮融资,致力于研发高效能GPU芯片。公司计划2026年实现AI组装机产品的量产,目标是通过异构计算和白盒硬件重塑大模型计算系统。
NeurIPS 2024|天津大学提出:面向模态缺失情形的提示学习方法
本文提出了一种新的提示学习方法,旨在解决多模态大模型在输入模态可能缺失时的问题。通过结合三种不同的提示向量策略(Correlated prompting, Dynamic prompting和Modal-common prompting),该方法能更有效地提升模型的鲁棒性和可扩展性,在多个数据集上验证了其有效性。
在「最难LLM评测榜单」上,阶跃万亿参数模型拿下中国第一
国内大模型创业公司阶跃星辰凭借万亿参数大语言模型 Step-2,在权威基准测试 LiveBench AI 中排名前十,展示了其在指令跟随任务中的出色表现。