OpenAI 首席财务官:中美 AI “不是简单的口水战”,Agent 会在 2025 接替真实岗位
Agent 首批落地领域:软件开发、实验室研究、客户服务。
整理丨王启隆,陶志远
出品丨AI 科技大
开源AI零样本照片转舞蹈视频项目,可玩性极高,远超之前所有同类开源项目。
这是一款开源的零样本人像视频动画项目X-Dyna,它能够通过驱动面部表情和身体动作将单张人像图片动画化,并且还能让背景动起来。该技术由扩散模型、动态适配器模块、局部控制模块等组成,能够生成流畅的肢体动作和自然的环境效果。
不止免费无限次Claude 3.5:字节 Trae 能否颠覆 Cursor、WindSurf?小项目亲测体验
AI 编程工具 Trae 由字节跳动推出,界面友好且功能强大。与竞品相比,它支持全中文设计、预览功能和强大的上下文理解能力。其免费无限次使用 GPT-4 和 Claude-3.5 的优势吸引了众多开发者。
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版
DeepSeek-R1模型引发广泛关注,成本从数十万到几百元不等。其表现超越多种榜单和测试任务,包括LiveBench和PlanBench,在公开数据上甚至超过GPT-4和Gemini Flash。同时引发了关于构建新平台强化微调的兴趣。
正面硬刚OpenAI现役最强模型,国产AI一夜卷到硅谷
中国双子星DeepSeek和Kimi发布全新推理模型R1和k1.5,性能接近OpenAI o1,引发业界关注。Long2Short训练方案成为亮点,提升了短推理路径模型的性能。
在可以 RL 的地方,将迎来更多「李世石时刻」
Kimi 和 DeepSeek 通过 RL 技术分别在 short-CoT 和 long-CoT 模式下取得了出色表现,并提出了一些关键技术,如 Partial rollouts 来提升训练效率和长 CoT 数据涌现机制。该领域的发展显示了 AI 在复杂任务中的潜在能力。