从零搭一套可复现、可教学、可观察的RL for VLM训练流程,我们试了试
MAYE 是一个从零实现的 RL for VLM 框架与标准化评估方案,旨在提升透明度和可复现性。它通过简化架构、提供标准评估体系及实证研究支持,帮助学者更清晰理解模型训练过程及其行为变化。
MAYE 是一个从零实现的 RL for VLM 框架与标准化评估方案,旨在提升透明度和可复现性。它通过简化架构、提供标准评估体系及实证研究支持,帮助学者更清晰理解模型训练过程及其行为变化。
怪怪的TTS让作者关掉公众号的朗读功能,直到体验到新的TTS模型后才改变看法。MiniMax Audio模型具备顶尖TTS技术、高精度声音克隆和丰富的音色效果等亮点,支持多个语种,并且海外版具有更出色的效果。
在本期AGIHunt播客中,智子和John讨论了Llama 4的表现差异、硬件优化、AI对编程领域的革命性影响以及AI应用的多样化发展等内容。
文章介绍了AI技术在教育领域的应用,特别是通过AI阿祖模仿吴彦祖声音进行语言学习。MiniMax公司利用其语音大模型技术成功复制了吴彦祖的声音和情绪,并且可以切换多种语言和感知不同情绪,提供更真实的学习体验。
文章介绍了AI视频工具海螺AI的快速崛起及其核心优势:极致画面质感和运镜能力、自然表情生成技术提升情绪表现连贯性以及静态图像动态化功能。海螺AI连续5个月全球和国内增速榜双榜单TOP1,受到了国内外创作者的高度认可与推崇。
上海大模型独角兽MiniMax收购深圳AI视频生成创企鹿影科技,双方已敲定收购意向。鹿影科技成立于2023年9月,估值约1亿人民币。创始人团队来自名校,包括香港中文大学和芝加哥大学的博士。MiniMax此前推出的人工智能产品海螺AI在全球热度持续攀升。
DeepSeek-R1 开源且功能强大,MiniMax 官方已将其接入自家 AI 助手平台 MiniMax Chat 并提供限时免费服务。用户可通过选择 ‘模型选择’ 下拉列表中的 ‘DeepSeek-R1’ 来使用该模型,支持回答各种问题和评论 OpenAI。但目前仅限基于训练数据的问答功能,未来将增加联网搜索能力。