计算资源归档

DeepSeek 复盘：128 天后，为什么用户流量一直在下跌？

2025年7月13日12时作者 Founder Park

hropic两家公司的策略选择，揭示了一个行业共同面临的根本挑战：计算资源的稀缺。
DeepSeek

2025年7月10日23时作者乌鸦智能说

理要点，如今，它正成为AI竞逐的新高地。一批“AI会议笔记”类产品在硅谷迅速崛起，成为投资人争抢的核

2025年5月5日16时作者新智元

国AISI推出RepliBench基准，分解并评估AI自主复制所需的四大核心能力。测试显示，当前AI

2025年5月2日8时作者 AIGC开放社区

今天凌晨，CNBC报道称，Anthropic在文章中指控中国用孕妇肚子和活龙虾运输AI芯片。英伟达对此强烈批评，并抨击利用政策限制竞争的做法。美国芯片出口管制即将生效，Anthropic呼吁实施更严格的限制措施。

2025年4月6日16时作者硅星人Pro

Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。

2025年3月17日23时作者机器之心

桐郑子隆王希元张牧涵
长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长

2025年2月27日16时作者 NLP工程化

本文提出了Slam训练秘诀，在单张GPU和24小时资源限制下高效训练高质量语音语言模型，显著提升AI研究效率。

2025年2月13日16时作者智东西

春节期间，DeepSeek一跃成为全球科技界的顶流，从媒体头条到巨头财报都有其身影。AI界声量最大的

2025年1月25日16时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000