阿里巴巴达摩院归档

阿里达摩院开源多模态医学大模型—灵枢

2025年7月12日8时作者 AIGC开放社区

专注AIGC领域的专业社区，聚焦大语言模型在医疗领域的应用研究。目前大模型面临三大难题：医疗知识覆盖不足、幻觉风险高及推理能力欠缺。阿里达摩院开源统一多模态医学大模型灵枢，并详细介绍数据构建与训练方法。

2025年7月10日16时作者 AI前线

sor 搭配 MCP，有可能在毫不知情的情况下，把你的整个 SQL 数据库泄露出去——而攻击者仅靠一

2025年7月9日14时作者小兵的AI视界

光、
CT
、
MRI
、超声、病理等
，并在医疗多模态
/
文本问答和报告生成任务上达到
SOT

2025年6月23日16时作者机器之心

斯坦福大学 CS336 课程发布，引领学生从零开始开发自己的语言模型，涵盖基础、系统等多个单元。

2025年6月18日11时作者量子位

MiniMax发布海螺2.0版本，支持1080P视频生成。新模型提升指令遵循、生成质量，并在光影处理和细节描绘上表现优异。

2025年5月14日23时作者量子位

OmniAudio团队发布了一项研究，能够直接从360°视频生成空间音频。该技术解决了现有视频到音频转换中的方向信息缺失问题，为虚拟现实和沉浸式娱乐提供了新的可能性。

2025年4月28日23时作者极市干货

关注极市平台公众号，获取多模态大模型解读专栏、Transformer系列等技术综述文章。

2025年3月15日8时作者 NLP工程化

研究团队通过大规模训练和超参数优化发现了大语言模型的最优学习率与数据规模呈幂律变化的缩放法则。

2025年3月8日8时作者开源星探

Spark-TTS 是一款全新的高质量语音合成系统，支持零样本语音克隆、细粒度语音控制、跨语言生成等功能。它结合了 BiCodec 编解码器和 Qwen-2.5 思维链技术，实现自然且高效的语音生成，适用于多种场景如有声读物、多语言内容及AI角色配音。