日期: 2025 年 2 月 24 日
一文看懂 DeepSeek 刚刚开源的 FlashMLA,这些细节值得注意
今天正式推出DeepSeek开源周,FlashMLA在极短时间内收获超过3.5K Star。它是针对HopperGPU优化的高效MLA解码内核,支持变长序列处理。FlashMLA通过优化减轻了内存占用并加速计算过程。
如何让大模型感知知识图谱知识?蚂蚁联合实验室:利用多词元并行预测给它“上课”
蚂蚁联合实验室提出了一种名为K-ON的方法,利用多词元并行预测机制使大语言模型能够感知知识图谱知识。该方法通过实体层级的对比学习实现了高效的知识图谱补全任务,并在多个数据集上取得了优于现有方法的结果。
DeepSeek一夜把百度干回20年前,网友:还有这好事?
百度回归 ‘百度一下 你就知道’ 概念,结合AI技术提升了搜索结果的个性化和多模态内容。升级后的百度APP不仅提供了更精准的答案,还整合了语音、绘图等功能,并接入了DeepSeek-R1模型。这些变化反映了百度在向“内容化”转变的同时也在提升用户服务体验。
单提示生成「主体一致」图像,且无需训练!已斩获ICLR 2025 Spotlight
南开大学等机构提出的新方法1Prompt1Story无需额外训练即可实现人物形象一致的文图生成,通过整合多个提示、奇异值重加权和身份保持交叉注意力技术,解决了现有方法存在的问题。
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
南大钱超教授团队在DATE 2025发表的论文『Timing-Driven Global Placement by Efficient Critical Path Extraction』获最佳论文奖。该工作提出了一种新的时序驱动布局方法,显著提升芯片设计效率和精度。
国内AI大战高开疯走!阿里砸3800亿,腾讯猛铺硬广,字节人事变阵,百度转向开源
国内AI投资热潮持续升温,阿里巴巴宣布未来三年投入超3800亿元用于云和AI基础设施建设,腾讯也在大力推广其AI模型应用。科技巨头们正加速布局AI领域,推动产业发展。