跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

CLIP

自回归+扩散!Salesforce开源统一多模态模型BLIP3-o,图像理解与生成全拿下

下午11时 2025/05/22 作者 机器之心

OpenAI的GPT-4o展示了顶级图像理解与生成能力。BLIP3-o采用自回归+扩散框架,研究者对比了三种设计选择,并最终选择了CLIP + Flow Matching方案和顺序训练策略构建BLIP3-o模型。

分类 学术、 资讯 标签 BLIP3-o、 CLIP、 flow matching、 GPT-4o、 Salesforce Research、 VAE 发表评论

视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知

下午4时 2025/04/03 作者 机器之心

研究者提出了一种新的视觉自监督学习模型Web-SSL,它能够在不依赖语言监督的情况下,在大规模数据集上与CLIP模型媲美,并在多种视觉问题解答任务中表现出色。

分类 学术、 资讯 标签 CLIP、 VQA、 Web-SSL、 Yann LeCun、 视觉自监督学习、 谢赛宁 发表评论

本科学历但创造出GPT,奥特曼盛赞为「爱因斯坦级」天才,OpenAI总裁:他想要的,我们都给

下午4时 2025/01/01 作者 量子位

Alec Radford离职OpenAI后揭示更多细节,他在Jupyter notebooks上发明了GPT和CLIP。尽管未取得博士学位,他仍对人工智能研究做出了重大贡献,包括参与多项重大突破并作为一作发表论文。

分类 资讯 标签 AGI、 Alec Radford、 CLIP、 GPT、 Jupyter notebooks、 OpenAI 发表评论

MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

下午2时 2024/12/25 作者 新智元

新智元报道
编辑:编辑部 HYZ
【新智元导读】
Sakana AI联合MIT、OpenAI等机构提

分类 资讯 标签 ALife系统、 CLIP、 Illuminating Entire Substrates、 启发式搜索算法、 基础模型、 定量分析 发表评论

首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招

下午12时 2024/12/25 作者 机器之心

机器之心报道
编辑:Panda
2024 临近尾声,AI 又给了所有人一个大惊喜,这次可以用来自动发

分类 学术、 资讯 标签 CLIP、 可视化工具、 基础模型、 复杂动态系统、 潜在应用领域、 跨学科应用 发表评论

GPT系列开创者,人工智能大神Alec Radford 从OpenAI离职

下午12时 2024/12/20 作者 AI寒武纪

Alec Radford从OpenAI离职,并计划独立进行研究。他以GPT、DALL-E、CLIP等项目知名,推动了自然语言处理、多模态技术和语音识别领域的革新。

分类 国际、 资讯 标签 Alec Radford、 CLIP、 DALL-E、 GPT、 OpenAI、 谷歌 发表评论

自动给视频配音效MMAudio

上午8时 2024/12/17 作者 GitHubStore

MMAudio 是一个用于生成同步音频的项目,利用多模式联合训练从给定视频和/或文本输入中生成音频。它允许对广泛的数据集进行训练,并将生成的音频与视频帧对齐。

分类 开源 标签 CLIP、 demo.py、 miniforge、 MMAudio、 PyTorch、 Synchformer 发表评论

3D具身基础模型!北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

下午2时 2024/12/09 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 3D位姿预测、 CLIP、 Lift3D、 机器人操作策略、 泛化能力、 真实场景 发表评论

甲小姐对话张钹:中国大模型的死与生|

下午4时 2024/12/02 作者 甲子光年

“在中国,光搞大模型很难活下去,必须与应用相结合。”
作者|
甲小姐 王博 王艺
“这些地方必须能有

分类 资讯 标签 AGI、 CLIP、 中国未来、 多模态模型、 张钹、 统一理论 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 提示工程101第十四课:处理歧义与提升清晰度
  • 未来属于AI SaaS,这8个开源工具必不可少!
  • 95%的人不知道什么是AGI,也不知道他们将很快失业
  • 再见Latex,基于Markdown的多功能排版系统Quarkdown
  • 中美史诗级大团结,在一款被玩家狂喷的游戏里实现了

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×