速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频
Stability AI发布名为Stable Audio Open Small的音频生成AI模型,声称其为市场上速度最快的且能在智能手机上运行。该模型基于Free Music Archive和Freesound中的歌曲训练,并由Arm优化,支持英文提示输入和短音频样本生成。但仅限免费使用年收入低于100万美元的研究人员、爱好者和企业,年收入超过的需购买企业许可证。
Stability AI发布名为Stable Audio Open Small的音频生成AI模型,声称其为市场上速度最快的且能在智能手机上运行。该模型基于Free Music Archive和Freesound中的歌曲训练,并由Arm优化,支持英文提示输入和短音频样本生成。但仅限免费使用年收入低于100万美元的研究人员、爱好者和企业,年收入超过的需购买企业许可证。
一款名为Lovart的AI设计助手,能够生成高质量海报、品牌VI等视觉内容。用户只需简单描述需求,它就能在几分钟内完成创作,并提供多种二次编辑功能。
Perplexity AI chatbot now offers PayPal and Venmo payment buttons for easier transactions, integrating with Shopify and working with Firms to improve product visibility.
AI驱动的笔记工具Granola用户基数增长10%,在5月14日宣布完成B轮融资,筹集到4300万美元。它不仅用于会议自动记录,还扩展至个人笔记和企业应用,支持共享笔记、自定义文件夹以及跨不同来源的知识检索。
字节Seed团队提出AttentionInfluence方法,利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性,最终在多个基准测试中提高了模型性能。
OpenAI正式将GPT-4.1模型上线ChatGPT,并开放给Plus、Pro及Team用户使用。新版本擅长编码任务,生成速度更快;但仍有部分网友表示不满未包含超长上下文窗口版本。
阿里开源的通义万相Wan2.1-VACE模型展示了强大的视频生成与编辑功能,包括基础的文生视频、图生视频和视频生视频等初级玩法;加入编辑功能如局部抹除或替换、视频重绘、时长或背景延展等中阶玩法;高阶玩法则能将各种能力花式组合。