刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了
新版DeepSeek-R1开源,性能几乎与o4-mini相当。编程能力超越Claude 4 Sonnet,网友称赞思考时间长且逻辑缜密。对比Gemini 2.5 Pro在特定任务上表现出色,引发广泛关注。
新版DeepSeek-R1开源,性能几乎与o4-mini相当。编程能力超越Claude 4 Sonnet,网友称赞思考时间长且逻辑缜密。对比Gemini 2.5 Pro在特定任务上表现出色,引发广泛关注。
北京人形发布RoboMIND数据集和‘天工’系列机器人后,推出X-Humanoid训练工具链解决跨框架适配问题。该工具链通过内置RoboMIND数据解析模块实现HDF5格式到LerobotDataset V2.1的转换,并提供模型训练配置文件指导用户进行高效开发。
DeepSeek即将发布R2的传闻持续发酵,HuggingFace创始人推荐“以不变应万变”。新模型R1T-Chimera由德国团队开发,结合了V3-0324和R1的优点,并已开源。该模型在解决特定问题上表现更优,但在理解三维空间方面仍需改进。
一款名为EasyControl Ghibli的开源替代方案横空出世,它基于Diffusion Transformer(DiT)架构,免费提供Ghibli风格图像生成功能,支持上传个人照片融入动画宇宙。
DeepSeek V3-0324是最新版本的小规模升级,它能够处理复杂问题如4维空间超立方体,并通过一句提示词生成完整产品页面。该模型在Xeophon的Benchmark测试中表现出色,解决了诸如“如何让7米长的甘蔗通过1米高、2米宽的门”等难题。其依然免费且开源。
一款名为SmolDocling的轻量级OCR模型,仅256M参数,支持文档中的标题、正文、图表等多任务识别,并能导出为Markdown、HTML等多种格式。
专注AIGC领域的专业社区报道了中国开源大模型DeepSeek-R1在huggingface平台上的成功表现。R1成为最受欢迎的开源大模型之一,点赞超过1万次。