跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

数据集

揭秘!如何微调 DeepSeek-R1 推理模型,提升 AI 性能到极致

2025年2月11日14时 作者 AI技术研习社

据的主导地位。
最令人兴奋的是,这些革命性的模型完全免费使用,没有任何限制,任何人都可以随时访问并利

分类 大模型 标签 trl、 unsloth、 大型语言模型、 微调、 数据集、 训练参数 发表评论

推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体

2025年2月9日23时 作者 机器之心

CEO Sam Altman 正在进行他的东京之旅。
与软银创始人孙正义敲定 5000 亿美元的巨

分类 学术、 资讯 标签 OpenAI、 创业、 差异化、 持久价值、 数据集、 马斯克 发表评论

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

2025年2月7日16时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 CoMCTS、 基准模型、 多模态语言模型、 推理路径、 数学可视化、 数据集 发表评论

“鹏城·脑海”大模型多语言版:打破中文与低资源语言藩篱,引领多语言智能新时代

2025年2月5日14时 作者 机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企

分类 学术 标签 GPU/NPU、 PengCheng.mind、 Transformer、 数据集、 模型更新、 跨语言问答 发表评论

AAAI 2025高分论文:基于真实世界雾霾驾驶视频的视频去雾和深度估计

2025年1月17日16时 作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
樊俊凯
单位 |
南京理工大学(PCA Lab)
本文

分类 大模型、 学术 标签 CG-IDN、 DCL、 数据集、 深度学习、 视频去雾、 重建损失 1 条评论

北邮团队发布百家(BaiJia)大模型:用AI对话古人,开启沉浸式历史体验

2025年1月14日16时 作者 PaperWeekly

百家是首个专注于低资源历史人物的智能体大模型,目前包含 2 万个中国历史人物 AI 智能体,旨在用

分类 大模型、 学术 标签 BaiJia、 历史人物分析、 改进模型性能、 数据集、 文化适应性、 角色一致性 发表评论

整理和提供用于构建通用语音、音频和音乐基础模型的数据集列表

2025年1月14日8时 作者 NLP工程化

整理和提供了用于构建通用语音、音频和音乐基础模型的数据集列表及其元数据和获取途径,来自sarulab-speech/audio-foundation-model-dataset GitHub。

分类 开源 标签 sarulab-speech/audio-foundation-model-dataset、 数据集、 整理与分享、 语音、 音乐、 音频 发表评论

刚刚!世界最快GPU RTX 5090官宣售价超1.4万元,国行阉割版5090 D定价超1.6万元

2025年1月13日12时 作者 HyperAI超神经

作者:十九,李宝珠
编辑:李姝
转载请联系本公众号获得授权,并标明来源
英伟达 RTX 5090 正

分类 学术 标签 GPU配置、 RTX 5090 D、 外部资源、 安全性、 数据集、 隐私泄露 发表评论

从计算机视觉走向医疗AI,对话上海交大谢伟迪:定义问题比解决问题更重要

2025年1月9日12时 作者 HyperAI超神经

作者:十九
编辑:李宝珠
转载请联系本公众号获得授权,并标明来源
HyperAI超神经与上海交大谢伟

分类 学术 标签 AI、 前沿研究、 数据集、 有价值的研究、 科学研究、 谢伟迪 发表评论

在线运行 Llama 3.3 唯一开源 70B 模型,性能堪比 405B!LaTeX OCR 数据集上线,助力数学公式识别

2024年12月30日12时 作者 HyperAI超神经

就在本月,Meta 发布了 Llama 3.3 唯一开源模型 Llama-3.3-70B-Instr

分类 学术 标签 教师支持材料、 教程资源、 数据科学家、 数据集、 研究人员、 论文解读 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面4 页面5 页面6 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 登顶全球第一!英伟达市值突破4万亿美元创造历史,AI让老黄身价超1400亿美元,下周访京
  • 基于多智能体AI模型的中文「金融交易决策」开源框架,支持A股、港股、新三板等中国金融市场。
  • 智元机器人回应拟港股IPO:不属实
  • 筹备港股IPO?智元机器人:暂无明确计划
  • Grok 4刷新ARC-AGI-2纪录:15.9%碾压所有公开模型,我们离AGI还有多远?

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×