速递|AI语音独角兽ElevenLabs发布类似NotebookLM功能,挑战谷歌AI生成播客
ElevenLabs 推出GenFM功能,允许用户通过上传文本、视频或文档创建多语音播客。该功能支持32种语言,目前可在其iOS应用程序中找到。
速递|AI安卓出世!前安卓负责人首轮融资5600万美元,打造AI时代的操作系统
一群前谷歌和Stripe高管领导的新公司/dev/agents宣布完成5600万美元种子轮融资,估值达5亿美元。该公司旨在构建一个基于云的操作系统以支持人工智能代理,并与苹果iOS类似。
十年再登巅峰!刚刚,Ilya和GAN之父斩获NeurIPS 2024时间检验奖
NeurIPS 2024时间检验奖公布,Ilya Sutskever的Seq2Seq和Ian Goodfellow的GAN分别获奖。Seq2Seq论文提出编码器-解码器架构,影响基础模型研究;GAN被广泛引用超过85,000次,推动了生成式建模的发展。
是宣传还是事故OpenAI Sora泄露API,完全开放语言模型OLMo 2,anthropic开放MCP旨在连接万物
本期内容涵盖了SoraVids、OLMo 2、StableAnimator、OneDiffusion和Model Context Protocol等五个AI项目。其中,SoraVids由desuAnon发布在Hugging Face平台,提供OpenAI视频生成模型Sora的视频及提示;OLMo 2是Ai2开发的完全开源语言模型;StableAnimator致力于高质量的人像动画生成,保持身份一致性并无需后处理;OneDiffusion是一个多功能的大规模扩散模型,支持双向图像合成和理解。Model Context Protocol则提供了一个新的标准连接AI助手与数据源,优化响应质量。