ICML spotlight 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
张剑清提出PCEvolve框架,利用少量标注样本和隐私数据生成垂域数据集。该方法通过进化过程确保数据隐私保护,并在医学、工业制造等领域验证其有效性。
张剑清提出PCEvolve框架,利用少量标注样本和隐私数据生成垂域数据集。该方法通过进化过程确保数据隐私保护,并在医学、工业制造等领域验证其有效性。
硅谷新创公司Genesis AI获得1.05亿美元种子轮融资,旨在通过生成式物理引擎和大规模真实机器人数据整合,突破AI的’数据魔咒’,实现最高人才密度的创新组织,并推动物理智能领域的研究。
杨海波在具身智能产业大会上指出,合成数据是打通具身智能的关键。他认为物理交互和丰富场景对于机器人学习至关重要。他强调了具备足够真实的物理交互能力、有人示范在环以及丰富多样场景的必备条件。
MLNLP社区致力于促进自然语言处理领域的学术与产业交流合作。通过PromptCoT等方法生成高质量数据集,提高模型性能。近期实验表明基于PromptCoT合成的数据可用于零样本强化学习训练,提升效果接近官方预训练模型。