LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
新加坡国立大学和得克萨斯大学奥斯汀分校的研究人员提出了一种名为Drag-and-Drop LLMs的新颖技术,它能够基于提示词快速生成任务专用的LoRA权重,大幅提高了大语言模型的效率,并且在零样本学习中展现出出色的泛化能力。
新加坡国立大学和得克萨斯大学奥斯汀分校的研究人员提出了一种名为Drag-and-Drop LLMs的新颖技术,它能够基于提示词快速生成任务专用的LoRA权重,大幅提高了大语言模型的效率,并且在零样本学习中展现出出色的泛化能力。
博通宣布开始出货其最新的数据中心交换机芯片Tomahawk 6,以太网交换容量达到每秒102.4太比特,是目前市场上任何以太网交换机带宽的两倍。这款芯片专为运行AI处理器集群的数据中心需求而设计,博通股价应声上涨近3.3%。
最新研究指出,聊天机器人竞技场存在不公平竞争环境问题。Quora团队发布报告分析了Poe订阅用户的数据,展示了2025年1月至5月AI应用市场份额的变化趋势。报告强调了推理、图像、视频和音频生成等领域的发展和竞争情况,同时指出了单个提供商旗舰模型的竞争态势以及新兴选手的快速崛起。
今天凌晨
1点,OpenAI发布了最新模型——GPT-4.1。支持100万 tokens 上下文,提升多模态处理、代码能力、指令遵循等性能,已上线Azure OpenAI。
中国研究员与DeepMind合作发布《Lavender》研究,仅需少量数据和注意力对齐技术便大幅提升多模态问答模型性能。
去年美股最火科技股AppLovin公布四季度业绩超预期,广告收入增长73%,股价盘后大涨近30%。公司表示AI模型改进仍处于早期阶段,未来将实现更个性化的广告投放。
用代码表示Agent行动显著提升OpenAI Deep Research系统性能,Hugging Face团队复现时采用代码Agent框架,使验证集准确率从46%提升至55.15%,未来可扩展更多文件格式和处理建议。
Logic-RL成功复现DeepSeek R1 Zero项目,支持多语言逻辑推理,准确率高达100%,平均模型输出长度降低30%。