傅利叶开源全尺寸人形机器人数据集Fourier ActionNet
傅利叶17日发布全球首个全尺寸人形机器人数据集Fourier ActionNet和全流程工具链,提供高质量真机训练数据及一套从采集到部署的解决方案,助力开发者降低研发门槛。
傅利叶17日发布全球首个全尺寸人形机器人数据集Fourier ActionNet和全流程工具链,提供高质量真机训练数据及一套从采集到部署的解决方案,助力开发者降低研发门槛。
SmolDocling-256M-preview高效文档转换模型,支持多种元素识别和转换。OpenSearch-SQL无需额外训练提升文本到SQL生成准确性。MarkPDFDown精准将PDF转为Markdown格式。TxAgent利用多步骤推理提供个性化治疗方案。RDAgent自动化数据驱动研发流程,加速创新研究。
港科大Harry Yang团队联合Everlyn AI提出LightGen模型,仅需8张GPU训练即可实现近SOTA的高质量图像生成效果。该模型采用数据蒸馏和直接偏好优化策略,显著降低了数据规模与计算资源需求。
OpenAI 后训练负责人 William Fedus 离职,他表示希望以合作伙伴身份继续支持 OpenAI AI for Science 领域。Fedus 称未来将创立一家材料科学 AI 初创公司。
CLIP、DINO等图像级监督基座限制了细粒度密集预测任务,上交联合美团提出TokenIT、TokenFD和TokenVL新数据集及模型,实现图文对齐粒度突破。
LanPaint是一款无需额外训练的AI工具,能够与Stable Diffusion模型无缝对接进行高质量图像修复,支持‘思考模式’优化效果,并允许生成100%新内容。
Two years ago, Andrej Karpathy released an influential video on recreating GPT-2 from scratch.
csm-voice-cloning利用CSM-1B模型实现高质量声音克隆,支持本地GPU和云端Modal运行方式,并提供详细教程。