GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器,还有4o图像生成全面测评基准 上午11时 2025/04/09 作者 量子位 ”了! 最近一阵, “万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红 ,人们随之好奇: 4o图
精度飙升13.7%!复旦发布CAD参数化新基准,PHT-CAD框架精准解析工程图纸 下午4时 2025/04/02 作者 PaperWeekly 性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。 为了填补学术社区中这一
CVPR 2025高分论文!单图1秒变3D真人,全新方法IDOL解决数字人重建问题 下午11时 2025/03/24 作者 PaperWeekly 览 在虚拟现实、游戏和 3D 内容创作领域,从单张图像高保真重建可动画的 3D 人体一直是一项极具挑
海尔智家与星动纪元达成战略合作,将共推“小蛮腰”家庭服务机器人 下午11时 2025/03/21 作者 机器人大讲堂 海尔家庭机器人”)与北京星动纪元科技有限公司(以下简称“星动纪元”)在上海举行了战略签约仪式。 海尔
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 GTC 2025 下午4时 2025/03/21 作者 量子位 是Robotaxi ,而是 RoadAGI 。 在英伟达GTC 2025上,元戎启行CEO 周光 受
TPAMI 2025顶刊!基于脉冲驱动Transformer的高效且可扩展训练方法 下午4时 2025/03/13 作者 PaperWeekly 神经网络(ANN)的潜在替代方案。然而,SNN 在实际应用中面临性能差距和训练成本高的挑战。 为此我
ICLR 2025 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型 下午4时 2025/03/07 作者 PaperWeekly 小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏
只给一张图,AI找到对应合适BGM,央音清华等构建全球化音乐信息检索新范式 下午4时 2025/02/25 作者 量子位 一艘海上航行的海盗船,啪一下,就检索到了加勒比海盗经典配乐。 音乐信息检索(Music Inform
黄仁勋低调来华 对银河通用王鹤 、宇树王兴兴、帕西尼感知聂相如都说了些啥? 下午4时 2025/01/23 作者 机器人大讲堂 1月20日,美国第47任总统特朗普正式上任,这一历史性时刻吸引了全球的目光。 马斯克、贝佐斯和扎克伯
LM Studio自带CUDA llama.cpp (Windows) 支持DeepSeek R1 下午11时 2025/01/22 作者 NLP工程化 LM Studio支持CUDA llama.cpp (Windows)与DeepSeek R1的结合,欢迎关注知识星球获取更多资源。