10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一
西北工业大学和香港中文大学提出新型AI音乐生成模型DiffRhythm,在10秒内生成4分45秒完整歌曲,支持本地部署,仅需8G显存。其简洁高效的全diffusion架构只需歌词和风格提示即可创作,速度和便捷性得到提升。
西北工业大学和香港中文大学提出新型AI音乐生成模型DiffRhythm,在10秒内生成4分45秒完整歌曲,支持本地部署,仅需8G显存。其简洁高效的全diffusion架构只需歌词和风格提示即可创作,速度和便捷性得到提升。
AI Toolkit 是一款开源工具包,专注于Stable Diffusion模型训练,提供优化的训练脚本、FLUX.1训练方案、多平台支持以及可视化操作界面等特性。
Nanobrowser 是一个开源的 Chrome 浏览器扩展,支持通过大语言模型驱动的多代理协作实现网页自动化任务,具备灵活的 LLM 支持、实时交互界面和历史记录功能,无需订阅费用且本地运行保障数据安全。
一键生成完整故事视频的AI工具Story-Flicks,支持多种文本及图像生成模型和TTS服务。通过输入故事主题即可自动生成包含剧情、图片、音频和字幕的高清视频,极大地简化了短视频创作过程。
Anthropic CEO预测未来3到6个月内AI将接管90%编码工作。Vibe编程是一种全新开发范式,强调利用AI工具快速迭代代码,但仍需人类在判断质量、调试和架构方面发挥作用。
OpenAI 发布了新工具和 API,旨在简化构建 AI Agents 的过程,让开发者能更容易创建执行任务的智能体。这些新工具包括 Responses API、Web 搜索工具、文件搜索工具以及计算机使用工具等。