无需标注数据!将Llama 3.3 70B调优到GPT-4o水平 上午8时 2025/03/31 作者 PyTorch研习社 Databricks的TAO方法利用测试时计算和强化学习优化无标签数据,无需人工标注即可提升模型质量,降低成本。它在多个企业任务上提升了LLM性能,接近昂贵专有模型水平。