日期: 2025 年 3 月 16 日
如何使用 Gemma 3 本地部署免费的深度研究 AI 助手
Google 发布的 Gemma 3 是一款轻量级的大语言模型,支持多模态输入、长上下文和多种语言。Gemma 3 在性能与规模之间取得了良好平衡,并且可以在普通笔记本电脑上流畅运行,为用户提供了私密且低成本的 AI 解决方案。
Open Manus 具有 Manus 的核心功能,支持网页分析、SEO 报告等任务
OpenManus 是一个开源的平替工具,支持网页分析和SEO报告等任务,并且可以免费本地部署。它整合了浏览器使用等Python工具包,具有多个协同工作的AI智能体。
转录工具SoftWhisper
该项目使用Whisper.cpp将音频/视频中的音频转为文字,兼容多种平台且性能优越。相较于传统方法,使用Whisper.cpp可以在大约2-3分钟内转录2小时的音频。
人大和阿里开源支持十万级节点图谱生成的框架GraphAgentGenerator
人大和阿里开源的GraphAgent是一个利用大型语言模型来模拟人类行为并生成动态社交图的框架,适用于在线社交媒体、电子商务和论文创作等场景。它通过生成带有文本属性的社会图,揭示网络中的互动,并在多个指标上优于现有方法。
声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
Sesame 发布逼真语音助手 Maya,通过情感智能、上下文记忆和高保真语音生成技术成功跨越了语音恐怖谷效应。CSM-1B 基础模型公开,拥有 10 亿参数规模,并允许商业用途。