日期: 2025 年 3 月 21 日
一款药物治疗AI助手:TxAgent,可以辅助医生做个性化的药物治疗方案策略
TxAgent是用于个性化药物治疗的AI助手,其准确率比GPT-4高出25.8%,能够分析多种因素并实时检索生物医学知识。
一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!
Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。
英国国家犯罪局:每月超100起AI 性勒索案件!
英国国家犯罪局报告称,每月超过110起针对未成年人的性勒索案件中,犯罪分子正在大量使用AI技术。NCA数据显示过去三年中性勒索犯罪中人工智能的使用大幅增加。
刚刚,OpenAI 一口气发布三个新模型!还为此做了一个新网站
OpenAI发布全新一代音频模型,包括语音转文本和文本转语音功能。gpt-4o-transcribe单词错误率显著降低,gpt-4o-mini-tts支持可引导性合成。定价分别为每分钟0.006美元与0.015美元。
刚刚,OpenAI首发语音Agent,智能体实现重大突破
专注AIGC领域,关注微软、百度文心一言等大语言模型及应用。近日,OpenAI发布三款全新语音模型,涵盖转写与合成技术,API集成噪声消除和语义活动检测优化体验。
英伟达发布世界最小AI工作站DGX Spark
专注AIGC领域的专业社区报道了NVIDIA发布的DGX Spark和DGX Station两款工作站,前者为小型AI超级计算机,后者为高端桌面系统,介绍其硬件性能及预装的完整AI软件套件。
重磅!OpenAI推出语音智能体全家桶:可以实现前所未有的精细化教AI说话
OpenAI发布了三种新的先进音频模型:两款语音转文本模型表现优于Whisper,新TTS模型可教AI说话。为了让开发者构建强大的‘语音智能体’,OpenAI推出了三项重要功能:全新语音转文本模型、文本转语音模型和升级版Agent SDK。