3.4k星星!开源超低延迟实时语音转文本SST,支持语音活动检测、唤醒词激活。

今天介绍的是RealtimeSTT项目,它是基于Whisper的基础上做的SST功能。其主要特点是流式输出、实时纠错机制和语音活动检测等功能,适用于需要快速精准转换的应用场景。

重磅!微软新AI能直接「想象」出新材料,实验室已验证成功

微软发布的新材料生成模型MatterGen能够直接根据需求生成新材料,避免了传统试错实验。它使用扩散模型从随机结构开始调整原子位置、元素种类和周期晶格来生成新材料。该模型还可以根据多种属性条件进行条件生成,目前已开源用于研究和实际应用。