2025-03-18 - 第7页共8页 - 每时AI

傅利叶开源全尺寸人形机器人数据集Fourier ActionNet

上午11时 2025/03/18 作者机器人开放社区

傅利叶17日发布全球首个全尺寸人形机器人数据集Fourier ActionNet和全流程工具链，提供高质量真机训练数据及一套从采集到部署的解决方案，助力开发者降低研发门槛。

SmolDocling-256M多模态OCR识别，用于治疗推理的智能体TxAgent，

上午11时 2025/03/18 作者每日AI新工具

SmolDocling-256M-preview高效文档转换模型，支持多种元素识别和转换。OpenSearch-SQL无需额外训练提升文本到SQL生成准确性。MarkPDFDown精准将PDF转为Markdown格式。TxAgent利用多步骤推理提供个性化治疗方案。RDAgent自动化数据驱动研发流程，加速创新研究。

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

上午11时 2025/03/18 作者量子位

港科大Harry Yang团队联合Everlyn AI提出LightGen模型，仅需8张GPU训练即可实现近SOTA的高质量图像生成效果。该模型采用数据蒸馏和直接偏好优化策略，显著降低了数据规模与计算资源需求。

陶哲轩：o3-mini纠正了我一个数学错误，十分钟解决原本一小时才能完成的题目

上午11时 2025/03/18 作者量子位

大模型o3-mini和GPT-o1在数学方面表现出色，陶哲轩和罗博深分别对其进行了测试，并且给予了高度评价。

ChatGPT创始成员、后训练负责人官宣离职！自立门户并将获OpenAI投资

上午11时 2025/03/18 作者机器之心

OpenAI 后训练负责人 William Fedus 离职，他表示希望以合作伙伴身份继续支持 OpenAI AI for Science 领域。Fedus 称未来将创立一家材料科学 AI 初创公司。

模态GAP不存在了？图文领域首个token级大一统基座诞生

上午11时 2025/03/18 作者机器之心

CLIP、DINO等图像级监督基座限制了细粒度密集预测任务，上交联合美团提出TokenIT、TokenFD和TokenVL新数据集及模型，实现图文对齐粒度突破。

LanPaint：无需额外训练即可实现高质量图像修复的AI工具

上午8时 2025/03/18 作者 NLP工程化

LanPaint是一款无需额外训练的AI工具，能够与Stable Diffusion模型无缝对接进行高质量图像修复，支持‘思考模式’优化效果，并允许生成100%新内容。

注释版 NanoGPT

上午8时 2025/03/18 作者 NLP工程化

Two years ago, Andrej Karpathy released an influential video on recreating GPT-2 from scratch.

csm-mlx：为苹果芯片量身定制的对话语音模型实现

上午8时 2025/03/18 作者 NLP工程化

csm-mlx是一款为苹果芯片优化的对话语音模型，实现高效自然语音生成，支持上下文对话，提供CLI工具简化使用。