大模型归档 - 第73页共112页

解锁AI绘画新境界：照片级人像大模型

下午12时 2025/02/11 作者路过银河AI

在AI绘画的世界里，DEMON CORE与Colossus Project XL的完美融合带来了更强的艺术创作潜力。这款模型不仅继承了DEMON CORE的细节表现力，还提高了稳定性，并且能够理解并执行复杂的艺术指令。

ICLR 2025 性能与效率的更优平衡！哈工深等提出极性感知线性自注意力机制

下午4时 2025/02/10 作者 PaperWeekly

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制（Polarity-aware Linear Attention），解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题，并在多个视觉任务上取得了精度与效率的平衡。

ICML 2025杀疯了！

下午4时 2025/02/10 作者 PaperWeekly

ICML投稿创纪录，咕泡科技提供一站式论文辅导服务。随着学术竞争加剧，高质量论文成为保研、申博和就业的重要凭证。咕泡科技汇聚顶尖导师资源，覆盖AI全方向和交叉学科，从选题到发表全程指导，助力学员克服挑战，提升论文质量与发表成功率。

清华刘知远硬核解读DeepSeek：大模型强化学习技术原理与大模型技术发展研判

下午7时 2025/02/10 下午4时 2025/02/10 作者 PaperWeekly

k：技术原理与未来方向“的线上研讨会。清华大学长聘副教授、面壁智能首席科学家刘知远老师作为主讲嘉宾之

再看增强大模型推理能力的四种范式及蒸馏微调范式具体实现

下午2时 2025/02/10 作者老刘说NLP

文章介绍了增强大模型推理能力的四种范式，并探讨了使用蒸馏微调方式进行数据集和工具的选择。强调了监督微调（SFT）加上强化学习（RL）的重要性，同时提到了不同蒸馏方法及其应用。

全球大戏：美国玩ChatGPT耍宝，中国DeepSeek亮绝招——印度到底在搞哪出？

下午2时 2025/02/10 作者 AI技术研习社

推出了风靡全球的ChatGPT，活脱脱一台“智能逗比机器人”，既能写诗填词又能编程解难；而中国则不甘

硬核教程！手把手教你在本地跑 DeepSeek-R1，零门槛上手！

下午2时 2025/02/10 作者 AI技术研习社

在AI浪潮中，逻辑推理能力成为衡量智能水平的关键。DeepSeek-R1作为开源模型引领变革，在本地运行带来了隐私、安全等优势。本教程手把手教你完成Ollama环境配置，并展示如何结合R1模型、LangChain和Gradio创建轻量级RAG应用。通过Ollama快速启动并集成到应用程序中，支持从大模型技术落地的实践指南。

OpenAI掌门人Sam Altman：预见未来的AGI经济学三大定律！

下午2时 2025/02/10 作者 AI信息Gap

Sam Altman关于AI的三个观察中提到，AGI能够解决复杂问题，当前模型智能程度与训练资源对数值相关；成本每12个月降低约10倍，推动更多使用；智能线性增长带来超指数级经济价值。未来将出现虚拟同事（AI Agent），影响广泛，包括提高自主性和意志力价值、科技加速进步等长期变革。

Sam Altman最新博客：AGI很快会来，你需要拥抱变化。

下午2时 2025/02/10 作者 AI大模型实验室

Sam Altman 在其博客中探讨了 AGI 的前景及其对社会经济的影响。他提出世界不会在短时间内发生巨大变化，但长远来看将带来新的工作方式和竞争形式。AGI 将使智力成本下降，引发科技和社会进步。他认为 AGI 的影响将不均衡，科学领域可能进步显著，而奢侈品价格则会上涨。

DeepSeek-R1的15个官方平替，总有一个适合你！

下午2时 2025/02/10 作者 AI信息Gap

受大家喜爱的
DeepSeek-深度思考
模式，即
DeepSeek-R1
。连续提问到第二个问题就

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30