聋哑人的春天来了!谷歌重磅开源最强手语翻译模型:SignGemma

Google DeepMind 终于攻下了手语AI!

Google DeepMind刚刚宣布了一个让人激动的消息——SignGemma!

他们号称是「最具能力的手语转文本模型」正式登场:

值得注意的是,这将是一个开源模型,将在今年晚些时候加入Gemma模型家族。

从演示视频可以看到,SignGemma能够实时识别手语动作,并将其转换为屏幕上的英文文字「Google works」。

这背后的技术并不简单——

需要精确捕捉手部的每一个微妙动作,理解手语的语法结构,再转换成自然语言文本

Google在官方说明中借助手语强调:「Google works hard to build and make technology」——

这不仅仅是在展示技术能力,更是在传达他们的使命感。

SignGemma的目标很明确:让技术变得更加无障碍,为所有人服务

虽然这个模型被训练为大规模多语言支持,但目前主要专注于美国手语(ASL)和英语的翻译

这有多厉害?

从技术角度来看,手语识别一直是AI领域的「硬骨头」。

为什么?

手语不仅仅是手势的简单组合,它有着复杂的语法结构、空间关系和表情辅助

每个手语使用者的动作习惯也不完全相同,这让模型训练变得极其困难。

但SignGemma能够做到实时识别和转换,这意味着Google在数据训练、模型优化和推理速度上都有了重大突破。

开源策略的深意

值得注意的是,Google选择将SignGemma作为开源模型发布。

这个决定背后有什么考量呢?

——开源意味着全球的开发者、研究人员,特别是聋哑人社区都能参与到这个项目中来。

不同国家的手语体系不同,仅靠Google一家公司很难覆盖所有语种和方言。

通过开源,SignGemma可以被适配到更多手语体系,真正实现「为所有人服务」的目标。

社区反响热烈

这个消息一出,立刻引起了广泛关注。

Sam 称:

干得好,不过你刚刚杀死了3 家我认识的公司。

vittorio(@IterIntellectus) 直接表示:

这太令人难以置信了!

Carolina(@CarolinAramburo) 则从投资角度点评:

这是Google「dying」的完美例子😂,对$GOOG如此看涨🚀,我听到很多人说他们不再使用Google,这就是他们看跌的全部理由😂

Riyan Mendonsa(@RiyanMendonsa) 更是展望了应用前景:

恭喜!这太酷了!迫不及待地想在新眼镜中使用这些功能!有了其他翻译功能,语言不再是障碍…唯一的障碍就是文化了。我们正朝着真正的地球村前进!

will depue(@willdepue) 评价:

太棒了!

Kol Tregaskes(@koltregaskes) 则认为:

令人惊叹的Google,这应该得到更多报道。

Sam Woods(@samuelwoods_) 从包容性角度评价:

这对于促进AI真正包容性沟通来说是极具影响力的工作

yung(@iamyungswag) 更是直接点出了核心:

Google在AGI竞赛中正在腾飞

mourad(@Mourad2322) 还询问了技术细节:

有没有反向的文本转手语功能?

Abhijeet singh(@Abhijeetxo) 表达了感谢:

感谢你们做的这项崇高工作

Masood(@MasoodMohamed90) 回应称:

令人难以置信!

参与测试

Google已经开放了SignGemma反馈问卷,邀请开发者、研究人员和聋哑人社区参与早期测试。

问卷涵盖了多个维度的需求调研:

  • 早期测试参与:想要帮助测试SignGemma的用户

  • 应用开发:计划使用SignGemma构建用户应用

  • 数据扩展:希望为新任务或手语语种扩展数据

  • 学术研究:使用SignGemma进行研究

  • 最终用户:可能使用基于SignGemma开发的手语应用

  • 意见反馈:仅想为SignGemma提供建议

从问卷中细致的需求分类,也可以看出Google对这个项目的重视程度——他们希望真正了解不同用户群体的具体需求。

链接在此:

goo.gle/SignGemma

真正的「为全人类服务」

SignGemma的推出,标志着AI辅助技术进入了一个新阶段

这不仅仅是技术的进步,更是科技公司社会责任感的体现。

而有趣的是,当某些公司高喊着「为全人类开发AGI」却把模型藏得严严实实,甚至连API 都要超高价收费/各种区域限制时,Google却悄悄地把真正服务弱势群体的AI 模型开源了

这值得我们思考:

什么才是真正的「为全人类服务」?

是华丽的宣传口号,还是实实在在的行动?

SignGemma的开源策略,也体现出Google对真正普惠AI 的理解。

当AI开始真正服务于社会的弱势群体,并且以开源的方式让全世界都能参与改进时,我们才能说技术真正实现了「普惠」的目标。

或许,「Don’t be evil」的Google,正强势回归成为AGI 的主角。

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往