钉钉上跑出的第一个行业专属大模型落地:准确率超 90% 的妇科专业大模型

  作者 | 褚杏娟

近日,钉钉企业专属 AI 平台上成功训练出了首个高准确度、高实用性的专业领域大模型——由壹生检康 (杭州) 生命科技有限公司研发的“豆蔻妇科大模型”,其在专业测试中准确率达 90.2%。

钉钉方面表示,妇科大模型的落地,意味着钉钉生态已经从 SaaS 生态、服务商生态、咨询生态、交付生态,拓展到 AI 创业者。

与专业医生诊断吻合度达 90.2%

当前,各行各业都在努力将大模型与自身业务场景深度融合,打造行业或专业大模型,实现运营管理的降本增效。

壹生检康是一家深耕女性精准检测及健康服务的生命科技公司,创业团队大多来自知名互联网企业、妇产科医疗机构、生物医药公司。基于技术趋势和行业判断,王强宇团队认为,通过训练妇科专业大模型打造 AI 医生,将有效缓解专业妇科医生、医疗服务不足的难题,对医美机构和女性用户都会带来巨大的行业和社会价值。

专业性强的“妇科 AI 医生”并不是采用通用大模型就能简单训练出来。启动豆蔻妇科大模型研发以来,壹生检康团队以开源大模型为基础,通过行业数据训练,第一个版本将模型诊断准确率做到 77.1% 左右。“77.1% 的准确率虽达到行业基础标准,但对于直接关乎健康安全的医疗 AI 而言,仍需继续突破,实现从“通用知识覆盖”到“垂直领域专精”,王强宇说到道。

为了解决专属模型训练过程中数据工程难度大、技术能力要求高、数据安全等问题,钉钉构建了行业 / 企业大模型建设支持体系,来帮助企业从数据标注到训练推理再到部署应用全流程构建大模型应用。

在豆蔻妇科大模型的性能提升遇到瓶颈后,壹生检康将豆蔻妇科大模型训练平台转移到了钉钉企业专属 AI 平台。在钉钉的支持下,壹生检康团队从数据处理、算力增加、模型优化等环节进行了多方位调整。一个月内,双方就将豆蔻妇科大模型诊断准确率提升到了 90.2%。

“豆蔻妇科大模型就像妇科 AI 医生,能为更多女性提供预问诊和健康管理服务”,壹生检康创始人王强宇说,“用户只要在闺蜜医生 App 对话界面勾选症状,就会得到专业的自诊结果,涵盖主诊断 + 其他潜在诊断 + 检查项目建议 + 处置方案建议 + 注意事项说明等专业内容。相比传统在线问诊平均 30 分钟的等待时间,闺蜜医生能在数秒内生成专业建议,帮助女性快速判断是否需要紧急就医,尤其适合职场女性、偏远地区用户。

后续,壹生检康将继续提升性能以及准确率,并迭代于自有产品“闺蜜医生”中,通过“AI 医生”智能体,服务更多用户。王强宇表示,“通过这样的实践,未来不仅是妇科,皮肤科等更多领域的垂直模型也可以训练出来,走进日常生活,让普通人在家就能获得接近专业医疗机构的初步健康指导。”

钉钉帮助行业开发的第一个专属大模型

钉钉表示,豆蔻妇科大模型是钉钉帮助行业开发的 第一个垂类专属 大模型,而类似的垂直行业大模型及 AI 专业应用,是 AI 技术落地的下一个趋势。

“将行业大模型的准确率从 77.1 分提升到 90 分,是很大的进步”,钉钉 CTO 朱鸿表示,“相当于将一个什么都懂一点的通才,短时间内训练成堪比专家的专才高才,这里面涉及到对数据安全有效的预处理、算力的高效调度、模型评估机制的构建,以及训练算法和模型参数的精细调优,展示了钉钉和行业伙伴共创打造行业大模型的全链路能力”。

随着如 Qwen,DeepSeek、GPT 等 AI 通用大模型逐渐变成基础设施,很多企业通过构建知识库,已经能够获得相对标准化的 AI 服务。然而,由于不同行业的业务知识不同、场景不同、工作流程不同,将大模型技术、能力应用于自身业务场景中,解决具体专业的问题,依然还缺少实践经验和落地路径。

“企业要构建、部署并应用专属大模型,从需求定位、数据准备等初始阶段,就会存在‘不知从何下手、最后也不能保证结果’的难题”,朱鸿认为,“对于在云端训练和部署大模型,数据流通中存在的风险会很高”。

为此,钉钉选择为企业或合作伙伴提供包括数据采集、清洗、标注、基础模型选择、模型训练、效果评估、模型调优、模型工程化部署等全流程平台产品支撑和服务支持,此外还将提供行业 AI 解决方案咨询,行业大模型方案咨询,以及 AI 人才培训及考核服务。

钉钉也进行了一次生态体系的重构:从传统的 SaaS 生态、服务商生态、咨询生态、交付生态,扩展到通过钉钉平台聚合更多的 AI 创业者。

钉钉表示,豆蔻妇科大模型只是一个起点,针对垂直行业的生态合作伙伴,钉钉将依托开放平台,帮助众多掌握行业数据的合作伙伴、开发者从零开始构建行业大模型和 AI 智能体,并通过钉钉的应用市场,服务钉钉上更多同行业中小企业的智能化需求。

(文:AI前线)

发表评论