LLMs归档 - 每时AI

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

下午4时 2025/05/28 作者量子位

阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径，显著提升了1.6B模型的性能，仅占用后者的1/22内存，并将延迟增加量减少至1/6。该方法无需从头训练现有模型（如Qwen-2.5），并在GSM8K数学推理任务中实现了34%的性能提升。

速递｜Alation收购Numbers Station欲破解LLM“幻觉”困局，工作流自动化落地企业的关键拼图

下午4时 2025/05/21 作者 Z Potentials

Alation 宣布收购 AI 初创公司 Numbers Station，计划将其产品整合至自有平台以提供更全面的数据管理和 AI 解决方案。

NLWeb：让网站轻松实现自然语言交互的开源项目

上午8时 2025/05/21 作者 NLP工程化

NLWeb：一款开源项目，支持多种平台和LLM/向量数据库，提供简单易用的REST API和用户界面。

谷歌发现LLM是Greedy Agent，提出用RL调教出理性决策

下午2时 2025/05/02 作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的机器学习与自然语言处理社区，旨在促进学术界、产业界和爱好者的交流与进步。最新论文揭示了大模型决策中的三大缺陷，并通过强化学习微调结合思维链技术提升其决策能力。

400万token新SOTA！英伟达UIUC联手：兼顾长短上下文顶尖性能

上午11时 2025/05/01 作者新智元

M上下文长度从128K扩展至惊人的400万token SOTA纪录！基于Llama3.1-Instr

R1-Zero的无监督版本来了！SFT不再是必须，EMPO重新定义大模型推理微调

下午4时 2025/04/30 作者 PaperWeekly

本文提出Entropy Minimized Policy Optimization (EMPO)方法，旨在实现完全无监督条件下大模型推理能力的提升。该方法不需要监督微调或人工标注的答案，仅通过强化学习训练从基模型中获得策略，并利用语义相似性聚类生成的多个回答作为奖励信号，从而在数学及其他通用推理任务上取得显著性能提升。

一篇介绍推理模型的 test-time scaling 技术的文章

上午8时 2025/04/25 作者 NLP工程化

文章介绍了测试时间缩放技术在提升大型语言模型推理性能方面的应用和方法，包括思维链、树形思维、自我一致性与集成投票等方法。

告别单一大模型依赖！北航领衔发布LLM Ensemble综述，探索多模型协作最优解

下午11时 2025/04/19 作者 PaperWeekly

综合考虑并利用多个大语言模型（每个模型都旨在处理用户查询），从而发挥它们各自的优势。
大语言模型的广

微软开源浏览器自动化功MCP服务playwright-mcp

上午8时 2025/03/29 作者 GitHubStore

使用Playwright提供浏览器自动化能力的模型上下文协议(MCP)服务器。该服务器允许LLMs通过结构化可访问性快照与网页交互，无需截图或视觉调整模型。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31