跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

NeurIPS 2024|哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

下午10时 2024/12/08 作者 极市干货

本文提出了一种名为Optimus-1的智能体框架,结合知识引导规划器和经验驱动反思器,在Minecraft环境中实现了对长序列任务的成功率显著提升。

分类 学术 标签 Minecraft、 Optimus-1、 开源模型、 摘要经验库、 知识图谱、 长序列任务 发表评论

实践教程|PyTorch框架Faster RCNN算法实现小麦麦穗检测

下午1时 2024/12/07 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨Ctrl CV
来源丨笑傲算法江湖
编辑丨极市平台
极市导读
本

分类 学术 标签 Faster R-CNN、 OpenCV、 PyTorch、 ReduceLROnPlateau、 ResNet-50、 交叉熵损失 发表评论

大模型轻量化系列解读(一):无需训练、高精度、通用后训练量化解决方案PTQ

下午1时 2024/12/07 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
本文提出的 SmoothQu

分类 学术 标签 Llm.int8()、 Outlier Suppression、 大规模语言模型、 自回归解码优化、 资源扩展、 超低精度量化 发表评论

位置编码背后的理论解释——傅里叶特征 (Fourier Feature)与核回归

下午11时 2024/12/05 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨天才程序员周弈帆
来源丨天才程序员周弈帆
编辑丨极市平台
极市导

分类 学术 标签 NS Property、 仿射变换、 位置编码、 傅里叶特征、 大模型、 频率稀疏采样 发表评论

扩散模型部署有新解,直接量化为4bit?韩松团队等提出SVDQuant:16GB笔记本上加速8.7 倍

下午11时 2024/12/05 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
在 12B FLUX.1-d

分类 学术 标签 Playground v2.5、 QLORA、 对抗性扩散蒸馏、 扩散模型、 混合精度训练、 量化 发表评论

实践教程|Transformer Decoder-Only 模型批量生成 Trick

下午11时 2024/12/04 作者 极市干货

本文介绍了如何通过调整输入向量的位置和掩码,使得Transformer模型在批量生成时能够更好地模拟训练过程中的情况,从而解决生成与训练阶段的不匹配问题。

分类 学术 标签 Andy、 padding、 pos_ids、 Transformer decoder、 位置对齐、 极市平台 发表评论

NeurIPS 2024|DiffGS:首个通用三维高斯生成模型

下午11时 2024/12/04 作者 极市干货

清华大学提出DiffGS生成式模型,实现无预处理三维高斯生成,支持多种任务如图生3DGS、文生3DGS等。该模型利用函数化方法表示三维高斯,并通过扩散生成式模型进行训练和生成。

分类 学术 标签 DiffGS、 Octree优化、 VAE + LDM、 三维高斯、 清华大学、 高斯生成式模型 发表评论

无需微调即可适应20多种视觉任务!爱诗科技与悉尼大学联合推出LaVin-DiT:大规模视觉扩散Transformer

下午11时 2024/12/04 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨王兆卿博士 悉尼大学,爱诗科技
研究方向|视觉表征学习,多模态表

分类 学术 标签 J-DiT、 LaVin-DiT、 ST-VAE、 上下文学习、 下游任务、 高维视觉数据 发表评论

NeurIPS 2024|JHU 提出首个可渲染 HDR 场景的 3DGS

下午11时 2024/12/03 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨phantom@知乎(已授权)
来源丨https://zhuan

分类 学术 标签 3D Gaussian、 HDR-GS、 HDR图像、 SfM算法、 合成数据、 实际场景 发表评论

从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

下午11时 2024/12/03 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨Derrick Mwiti
来源丨AI公园
编辑丨极市平台
极市

分类 学术 标签 医学影像处理、 后处理、 图像识别、 学习率调试、 数据增强、 集成方法 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面26 页面27 页面28 … 页面30 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 从打分器到思考者:RM-R1用推理重塑模型价值判断
  • SSM+扩散模型,竟造出一种全新的「视频世界模型」
  • 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
  • 一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
  • 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×