1秒转录1小时音频,英伟达重磅开源语音识别最强模型Parakeet!
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。
考模式/非思考模式」的无缝切换、八款不同大小模型,从0.6B到235B,包含 MoE 和 Dense
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
推出轻量版 Deep Research
:基于
o4-mini
模型,首次向免费用户开放,每月 5
Manus母公司蝴蝶效应完成7500万美元融资,投后估值近5亿美元,Benchmark领投。Manus打造的AI Agent能自主执行任务,并与阿里云达成合作。新资金将用于扩展美国、日本和中东市场服务。
甲子光年将于4月28日举办大会发布《AI共潮生:2025人工智能产业30条判断》,征集各赛道代表性企业,涵盖L1-L4四个阶段。