跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

MoE语言模型

Kimi-VL 开源

下午7时 2025/04/12 作者 机器学习算法与自然语言处理

MLNLP社区介绍其致力于促进国内外机器学习与自然语言处理的交流与发展,近期开源了Kimi-VL-A3B-Instruct等视觉理解大模型。该模型参数规模较大且上下文长度长。社区还提供了技术交流群邀请函和简介。

分类 学术 标签 16.4亿参数、 kimi、 MoE语言模型、 MoonViT、 图像生成对话、 联合长文本激活阶段 发表评论

多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption?OMNICAPTIONER实现思路

下午2时 2025/04/10 作者 老刘说NLP

度依赖开源,开源大多数只能赶凑合,能快速上线,但是带来的风险是会黑盒化,不可控。我们如果要开发自己的

分类 大模型 标签 MoE语言模型、 MoonViT、 SigLIP-SO-400M、 强化学习、 老刘、 长上下文激活 发表评论

DeepSeek V3论文细节:如何绕开CUDA的垄断!

下午10时 2025/01/29 作者 Datawhale

DeepSeek 使用英伟达 PTX 编程技术,在硬件受限条件下训练出高性能语言模型,展示了在减少对算力需求的同时提升性能的可能。

分类 分享 标签 10倍效率、 20流处理器、 CUDA壁垒、 DeepSeek、 H800 GPU、 MoE语言模型 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 再见Latex,基于Markdown的多功能排版系统Quarkdown
  • 中美史诗级大团结,在一款被玩家狂喷的游戏里实现了
  • 新品发布|我们和先锋建筑事务所联名,做了一款艺术品
  • 中兴星云拿下推理总分榜一!SuperCLUE 5月成绩出炉
  • 美国开始吊销,中国学生签证

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×