跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

LORA

文末赠书 微信、百度都接入的 DeepSeek,企业靠啥玩转其私有化与垂直训练?

2025年2月24日23时 作者 AI前线

具实力的大模型代表,正引领着众多企业迈向智能化变革的新征程。从教育领域到金融行业,再到互联网巨头的核

分类 资讯 标签 DeepSeek、 In-training Optimization、 LORA、 Prompt Engineering、 低算力优化、 微调整解 发表评论

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

2025年2月22日16时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 LORA、 S-LORA、 Triton、 低秩适配、 大型语言模型、 混合专家 发表评论

X-R1: 3B中文推理开源, 支持LoRA训练

2025年2月19日14时 作者 PaperAgent

X-R1更新日志包括支持LoRA训练、发布中文训练配置及模型,成功进行大规模强化学习训练,增加标准实验脚本,支持3B模型的中文推理,并在Ascend 910B上运行成功。

分类 分享 标签 7500、 LORA、 X-R1-1.5B、 X-R1-3B、 华为Ascend 910B、 奖励曲线 发表评论

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

2025年2月15日16时 作者 机器之心

AIxiv专栏介绍及最新研究成果MakeAnything通过Diffusion Transformer与非对称LoRA,实现了从结果到过程的转化,并在多个实验任务中取得了良好的效果。

分类 学术、 资讯 标签 LORA、 MakeAnything、 Recraft、 图文一致性、 泛化性能、 逻辑连贯性 发表评论

不容错过!Oumi 平台,集训练、评估、部署于一体的 AI 神器

2025年2月15日14时 作者 小兵的AI视界

据准备、模型训练到评估和部署,每一个环节都充满挑战,如何简化整个
AI
模型开发生命周期,是亟待解决

分类 开源 标签 LORA、 Oumi、 oumi-ai、 SFT、 模型训练、 科研探索 发表评论

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

2025年2月7日16时 作者 机器之心

版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。
自

分类 学术、 资讯 标签 gradient_accumulation_steps、 GRPO、 LORA、 max_completion_length、 max_prompt_length、 Num Generations 发表评论

字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘

2025年2月3日23时 作者 机器之心

字节跳动首次披露其内部代码审查系统BitsAI-CR的技术细节,通过两阶段评论生成架构实现75%的审查准确率和26.7%的评论过时率。

分类 学术、 资讯 标签 BitsAI-CR、 LORA、 Tree-sitter、 代码审查系统、 外部验证、 字节跳动 发表评论

从智能体到世界模型,2025年AI行业还会发生哪些大事?

2025年1月13日22时 作者 AI新榜

今日头图使用豆包创作,提示
词“像素风,电脑屏幕上显示文字’2025 AI趋势’,科技感,蓝紫色主题

分类 资讯 标签 3D模型、 LLM、 LORA、 世界模型、 多模态预训练、 就业市场 发表评论

一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」

2025年1月9日23时 作者 新智元

新智元报道
编辑:LRS
【新智元导读】
10个AI领域,50篇精品论文,每周看一篇,到2026就能

分类 资讯 标签 DPO、 LORA、 Orca、 PRM800k、 QLORA、 ReFT 发表评论

当红炸子鸡 LoRA,是当代微调 LLMs 的正确姿势?

2024年12月30日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨
CW不要無聊的風格
编辑丨极市平台
极市导读
对炼丹界的当红炸

分类 学术 标签 LORA、 原型验证、 可控性、 可解释性、 效率、 灵活性 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • AI有味觉了:分辨可乐和咖啡,只需“尝一尝”丨Nature
  • 对话 Ruby on Rails 之父:发自内心恨透 Copilot,手凿代码才是程序员的乐趣
  • 12人团队打造AI陪伴神器,半年内斩获3000万美元投资
  • 实测爸妈着迷的AI问诊:竟用广告证明曾被罚“特效药”的疗效
  • 具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×