阿里放出了一款情感识别模型:R1-Omni

阿里放出了一款情感识别模型:R1-Omni,它能通过看视频来识别人的情绪,像人在看电视剧时能感受到演员的喜怒哀乐一样。R1-Omni是一款基于强化学习与可验证奖励的全模态大模型,利用视觉和音频信息来识别情感,它把RLVR用于模型中,来提高模型在情感识别方面的推理、理解和泛化能力,能看、能听、会分析、能生成详细且可解释的推理过程。

参考文献:
[1] github:https://github.com/HumanMLLM/R1-Omni



(文:NLP工程化)

欢迎分享

发表评论