炸裂!DeepSeek 的新春礼物——多模态模型Janus-Pro 详解

DeepSeek发布Janus-Pro模型,实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”,并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。

DeepSeek R1 6百万美元训练成本是否真实?

中国团队DeepSeek仅花费550万美元训练出媲美GPT-4的模型引发全球关注。该团队表示投入远超此数字,包括GPU投资超过10亿美元、运营成本每年数亿美元以及约150位顶级研究员参与。团队展示了五大关键技术突破,并在多项评测中表现优异。DeepSeek还展示了其高效的市场策略和成本优势,美国用户只需7美元即可使用。

哈佛医学院:AI 将治愈癌症,Sam Altman 没在吹牛!

白宫会议上的Sam Altman与Larry Ellison表示人工智能将治愈癌症。然而,哈佛医学院的研究显示癌症正在变化,并且尽管投入大量资金,癌症生存率提高有限。Simona Cristea指出,肿瘤像变色龙一样在治疗中产生耐药性。目前的模型无法有效处理真实数据,而AI有望解决这一问题。最新研究表明,AI在癌症影像学数据压缩和预测方面表现突出。专家认为,AI可能帮助找到某些类型癌症的治疗方法。但Cristea提醒,不存在包治百病的神药。

重磅!字节发布UI-TARS大模型,三句话搞定电脑操作!碾压GPT-4!

字节发布UI-TARS视觉语言模型,能像人一样操控电脑界面,并在多项测试中击败GPT-4等对手。它具备感知、推理及行动能力,支持点击、输入等多种操作。UI-TARS通过SFT和DPO训练,在多个GUI代理基准测试中达到最佳成绩,还开源了桌面版应用。