HumanEval 归档 - 每时AI

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

2025年5月28日16时作者量子位

阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径，显著提升了1.6B模型的性能，仅占用后者的1/22内存，并将延迟增加量减少至1/6。该方法无需从头训练现有模型（如Qwen-2.5），并在GSM8K数学推理任务中实现了34%的性能提升。

2025年4月12日8时作者极市干货

Stack Overflow QA Pairs、CodeSearchNet、CodeContests、HumanEval、BigCode Benchmark等数据集汇总，涵盖Python和SQL问题代码对、GitHub代码搜索数据集、机器学习编程数据集等多种类型。