开源
亚马逊推出的新一代基础模型Nova,AIMedia帮助用户自动抓取热点新闻、生成新闻内容,并自动发布到各大平台
亚马逊Nova推出新一代基础模型提升AI应用智能性和成本效益;AgentLab为网页代理研究提供开放框架;ComfyUI为HunyuanVideo提供包装节点简化使用;TinyFusion优化扩散变换器结构提高训练效率和性能;AIMedia是一款全自动AI媒体软件,实现热点新闻抓取及自动发布。
微软开源多语言翻译工具Co-op Translator
Co-op Translator 是一个Python包,利用Azure AI服务和先进的大语言模型自动翻译项目中的多语言文本及图像。它简化了技术文档的本地化过程,支持多种语言的技术开发、学习与研究。
李飞飞AI巨制:一张图生成3D世界,玩家可自由探索,沉浸式人机对话Dippy,专为长视频描述而设计的系统StoryTeller
文章介绍了五项创新技术与工具,包括World Labs的3D场景生成、Dippy Empathetic Speech Subnet用于沉浸式对话、StoryTeller针对长视频描述的技术、ComfyUI-KLingAI-API让用户直接使用KLing AI API以及Flow作为轻量级任务引擎简化AI代理构建。
ChatRex是一个多模态大语言模型,FreysaAI 智能体黑客比赛尝试说服AI释放奖金, 快速构建MCP服务器
本期介绍多模态大语言模型ChatRex、3D物体物理材质生成方法Material Anything、简洁高效Python库FastMCP、开源AI语音处理工具包ClearerVoice-Studio以及对抗性人工智能代理游戏Freysa。
高速文本转语音引擎Auralis,支持声音克隆功能
Auralis 是一种高效的文本转语音引擎,能在 10 分钟内生成《哈利·波特》全文语音,并支持多种语言和自定义微调。主要特点包括快速处理长文本、并行请求处理、流式传输功能以及内置音频增强等。
Docker镜像分析工具Dive
Dive 是一个用于分析 Docker 镜像的工具,支持通过 div 或 docker run 命令分析镜像内容。它能细分显示每个图层的内容及其变化,并估计图像效率,帮助优化 Docker 镜像大小。